WikiConecta/O Wikidata/Inserindo dados: como usar o Zotero/script

Como vimos na unidade anterior, os dados precisam existir no Wikidata para serem recuperados pelo Wikidata Query Service ou visualizados no Scholia. Graças ao trabalho de muitos voluntários, em pouco mais de uma década de existência, o Wikidata conta com cerca de 110 milhões de itens na sua base de dados[1].

Mapa animado mostrando o aumento do número de itens no Wikidata (pontos luminosos) por localização geográfica, entre 2014 e 2017. Autor: Denis Schroeder (WMDE).

Na visualização de Denis Schroeder (WMDE), mostrada ao lado, vemos o aumento de itens por região, entre 2014 e 2017. No mapa animado, cada item disponível no Wikidata é representado por um ponto luminoso. Ao longo dos anos, vemos os pontos aumentarem exponencialmente. Contudo, ainda faltam muitas informações para que a base do Wikidata seja capaz de cobrir todas as páginas da Wikipédia – muito mais para cobrir itens que ainda nem existem nos projetos Wikimedia. Há regiões que seguem "apagadas" no mapa, ou seja, que têm pouca representatividade na base de dados.

Mapa animado mostrando o aumento de itens no Wikidata (pontos luminosos) entre outubro de 2018 e maio de 2019. Autor: Addshore.

Nesta outra visualização, de Addshore, fica mais evidente o quanto há regiões apagadas no mapa – incluindo o Brasil e nossos vizinhos latino-americanos.

Essa falta de representatividade é prejudicial e perigosa, principalmente porque a internet que acessamos não corresponde à realidade que vivenciamos e segue dando visibilidade àqueles que historicamente estiveram visíveis. A boa notícia é que podemos contribuir com o aumento do número de itens relacionados ao Brasil – à América Latina e outras regiões – junto com os seus estudantes, de forma simples e massiva.

Nesta unidade, ensinamos como fazer o upload de artigos acadêmicos para o Wikidata em grande escala utilizando o Zotero – um software livre de gerenciamento de referências bibliográficas, bastante popular entre pesquisadores e professores brasileiros. Essa é uma oportunidade de povoar o Wikidata, e a internet como um todo, com a produção acadêmica e científica nacional, regional e local, dando visibilidade internacional ao trabalho dos pesquisadores e cientistas brasileiros. Ao disponibilizar dados de uma temática ou perfil específico, também contribuímos para a diminuição de lacunas de conhecimento e representação.

Wikipedia and Academic Libraries chapter 17 Portuguese (page 4 crop) - Figura 1 pag 4
Número de artigos acadêmicos no Wikidata. Fonte: Alves, Burley e Peschanski (2021), retirada de https://doi.org/10.3998/mpub.11778416.ch17.pt

Tal atividade é especialmente poderosa porque criar referências baseadas em um identificador de Wikidata (QID) na Wikipédia permite que essas referências sejam reutilizadas independentemente em Wikipédias em diferentes idiomas. De acordo com a figura ao lado, retirada de trabalho publicado por Alves, Burley e Peschanski (2021)[2], em 2020 o Wikidata contava com 151 mil artigos acadêmicos brasileiros em comparação a 7,8 milhões de artigos estadunidenses. Como falamos na unidade 2 do módulo 2, as citações da Wikipédia são sugeridas como métricas alternativas para complementar as citações acadêmicas e demostrar o impacto de pesquisas, agregando valor ao trabalho[3]. Disponibilizar artigos acadêmicos de pesquisadores nacionais significa, portanto, atuar diretamente na valorização e circulação da pesquisa produzida no Brasil e por brasileiros.

De acordo com Alves, Burley e Peschanski (2021)[2], o processo descrito a seguir "demonstra uma estratégia de como democratizar a contribuição sobre a produção acadêmica no Wikidata e como ampliar a diversidade de origem cultural e regional do conhecimento disponível no projeto". A combinação das ferramentas e dos processos apresentados a seguir "forma um catalisador para promover a equidade do conhecimento no Wikidata e, em um contexto mais amplo, a descoberta e o acesso bibliográfico" (ibidem), "sem depender de um conjunto de habilidades avançadas, de uma tecnologia cara de informação ou mesmo de dados bem estruturados" (ibidem).

Os oito passos descritos a seguir detalham o processo de inserção de artigos acadêmicos no Wikidata usando o Zotero, um software de código livre para gerenciar dados bibliográficos.

Passo a passo: do Zotero para o Wikidata

editar
 
De cima para baixo: capturas de tela do Zotero Desktop e do Zotero Connector, mostrando o uso dos botões “Adicionar item(ns) segundo identificador” e “Save to Zotero”, respectivamente. Fonte: Alves, Burley e Peschanski (2021), retirada de https://doi.org/10.3998/mpub.11778416.ch17.pt

Este manual foi produzido a partir da parceria ratificada entre o Wiki Movimento Brasil e o Museu Paulista, em 2020, que gerou na inserção de um conjunto de artigos dos Anais do Museu Paulista no Wikidata. O passo a passo foi descrito em capítulo de livro[2] publicado pela Maize Books, em 2021.

Passo 1: Baixe o Zotero[2]

editar

A combinação entre o Zotero Desktop (versão desktop) e o Zotero Connector (extensão para navegadores da web) faz com que as referências bibliográficas sejam totalmente integradas, interoperáveis e sincronizadas. Essas ferramentas estão disponíveis para download em www.zotero.org/download/ . Caso não saiba usar o Zotero, neste link você encontra um tutorial do software.

Passo 2: Importe um conjunto de artigos para o Zotero[2]

editar

Para importar todos os arquivos de uma vez, crie uma lista de identificadores e use o botão “Adicionar item(ns) segundo identificador” na ferramenta Zotero Desktop (veja o topo da figura ao lado[2]). Você tem duas alternativas para esse passo: produzir uma lista de identificadores em um arquivo de texto ou tabela, ou adicioná-los individualmente. Caso a ferramenta não reconheça o tipo identificador do artigo (ou ele não tenha um identificador), é possível adicioná-lo manualmente usando a extensão Zotero Connector no seu navegador – clique no botão “Save to Zotero” (“Salvar no Zotero”, em português) no canto superior direito da página de apresentação do artigo (veja a base da figura ao lado[2]).

Passo 3: Faça login nos projetos Wikimedia e se torne um usuário(a) autoconfirmado(a)[2]

editar

É provável que você já tenha criado uma conta de usuário nos projetos Wikimedia (clique aqui se precisar criar uma conta). Para fazer a importação de conjuntos de dados em lote é preciso ser um usuário experiente. Para isso, faça pelo menos cinquenta edições válidas e aguarde, no mínimo, quatro dias. Isso irá te estabelecer como um usuário auto confirmado e permitirá que você utilize ferramentas mais avançadas no Wikidata.

Passo 4: Baixe, instale, e configure o tradutor do QuickStatements[2]

editar

O Zotero e o Wikidata são integrados através do uso de um tradutor – um script que converte metadados armazenados de um formato para o outro. O tradutor chamado Wikidata QuickStatements.js é parte da extensão para o Zotero (chamada zotkat) e gera um conjunto de comandos de texto a serem importados para o QuickStatements – uma ferramenta online que pode ler e executar comandos para criar ou editar um item do Wikidata.

Baixe o arquivo Wikidata QuickStatements.js em https://github.com/UB-Mannheim/zotkat, e cole o arquivo no diretório “translators” da sua instalação do Zotero (veja figura abaixo, do lado esquerdo) .

Depois disso, reinicie o Zotero e abra “Preferências” no menu "Editar". Para completar este passo, na aba “Exportação” selecione “Wikidata QuickStatements” no menu descendente “Formato padrão” (tal qual indicado na figura abaixo, do lado direito).

 
Da esquerda para a direita, capturas de tela do diretório da instalação do Zotero e do diretório “translators”. Fonte: Alves, Burley e Peschanski (2021), retirada de https://doi.org/10.3998/mpub.11778416.ch17.pt.
 
Captura de tela da janela de preferências do Zotero, mostrando o formato Wikidata QuickStatements escolhido no menu “Formato padrão”. Fonte: Alves, Burley e Peschanski (2021), retirada de https://doi.org/10.3998/mpub.11778416.ch17.pt.

Passo 5: Verifique duplicatas no Wikidata [2]

editar
 
Comandos da consulta para gerar uma lista de identificadores dos artigos dos Anais do Museu Paulista. Fonte: Alves, Burley e Peschanski (2021), retirada de https://doi.org/10.3998/mpub.11778416.ch17.pt.

É muito importante não criar itens duplicados no Wikidata. Então, antes de importar seus itens, verifique se há duplicatas. Existem diversas estratégias para isso, uma delas é consultar o Wikidata em busca de itens de artigos acadêmicos da publicação na qual você está trabalhando. Para isso, use o Wikidata Query Service, uma interface amigável para construção e execução de consultas ao Wikidata que fornece uma visão geral das declarações de um conjunto de itens (conforme visto na unidade 2 do módulo 3).

Veja um exemplo de como realizar consultas a artigos acadêmicos dos Anais do Museu Paulista em https://w.wiki/bYF. Para rodar uma consulta similar para outra publicação, mude o número do QID do item Wikidata da revista brasileira na linha 11 (Q50426299), como mostrado na figura ao lado, para o número do QID do item Wikidata da sua publicação-alvo.

Após fazer a consulta, os dados podem ser baixados em diversos formatos e comparados à sua lista no Zotero. Baixe os resultados da consulta em formato .csv e abra-os em um software de planilhas. Importe sua lista de identificadores em outra aba da mesma planilha. Escreva uma função CORRESP para comparar e reconciliar os identificadores da sua lista com os identificadores do resultado da consulta (aqui você encontra um exemplo de função de correspondência no Google Sheets/Google Planilhas). E, por fim, exclua os artigos com correspondência da sua biblioteca do Zotero.

Passo 6: Carregue os itens para o Wikidata através do QuickStatements[2]

editar

Para carregar as referências para o Wikidata, utilize a ferramenta QuickStatements junto com o Zotero.

Para começar, vá ao Zotero e selecione todas as referências que você importou para a biblioteca e que deseja carregar para o Wikidata. Para copiar os comandos para a área de transferência, clique em “Editar” e depois em “Copiar como Wikidata QuickStatements”.

Em seguida, na ferramenta QuickStatements, clique em “Autenticar-se” no canto superior direito para logar na sua conta. Clique em “Novo lote” e cole os comandos no campo de texto. Clique em “Importar comandos da Versão 1”. Antes de clicar em “Executar” verifique os primeiros artigos a serem carregados para garantir que está tudo certo.

Pode levar um tempo até que o QuickStatements carregue as referências para o Wikidata, isso vai depender do número de comandos e do servidor.

Tenha cuidado com os seguintes erros e armadilhas:

  • Se o website de origem da sua referência não é bem estruturado, o Zotero pode importar os itens com informações duplicadas;
  • O tradutor do Zotkat ainda não está totalmente desenvolvido e alguns campos não são propriamente traduzidos para comandos QuickStatements, por exemplo, a licença;
  • Algumas propriedades presentes no Zotero ainda não existem no Wikidata e portanto não são importadas.

Passo 7: Verifique a completude das propriedades dos itens usando o Wikidata Query Service[2]

editar

Para verificar a completude dos dados importados para o Wikidata como parte de um projeto, construa um painel de controle para propriedades do Wikidata.

Fizemos um modelo para os Anais do Museu Paulista usando o Wikidata Query Service (clique aqui). Para replicar o painel de controle para uma publicação diferente, usando esse exemplo, mude o número do QID na linha 39 da consulta.

A ferramenta do Zotkat não importa a declaração “publicado em” para o Wikidata. Os itens criados, portanto, inicialmente não possuem essa declaração no Wikidata. Para monitorá-los, construa uma consulta usando os identificadores únicos associados a eles. Um exemplo de consulta de exemplo para um subconjunto dos Anais do Museu Paulista está disponível aqui. Para replicar o processo para um conjunto diferente de artigos, substitua seus identificadores na linha 42 da consulta.

 
De cima para baixo, capturas de tela da ferramenta PetScan, destacando os campos SPARQL e Lista de comandos e a lista de resultados. Fonte: Alves, Burley e Peschanski (2021), retirada de https://doi.org/10.3998/mpub.11778416.ch17.pt.

Passo 8: Adicione a declaração “publicado em” usando PetScan[2]

editar

Para adicionar a declaração “publicado em” aos itens criados, use o PetScan, uma ferramenta baseada num código de consulta que lista os itens e permite adicionar declarações a eles no Wikidata.

Adicione os identificadores dos artigos criados na linha 42 da consulta disponível aqui. Depois, copie o código da consulta e cole-o no campo SPARQL na aba “Outras fontes” no PetScan (veja o topo da figura ao lado). Clique em “Executar!” e espere até que os resultados apareçam.

No começo da lista de resultados (veja a base da figura ao lado), inclua a declaração “publicado em” que precisa ser adicionada em larga escala no canto superior direito.

Para incluir a revista em que foram publicados alguns artigos dos Anais do Museu Paulista, incluímos a P1433 (propriedade para “publicado em”) e o Q50426299 (item para “Anais do Museu Paulista). Clique em “Executar QS” para abrir uma janela do Quick Statements com os comandos e siga as instruções indicadas anteriormente no passo 6.




*O conteúdo desta unidade foi baseado no capítulo "Estruturando referências bibliográficas: levando a revista Anais do Museu Paulista para o Wikidata", de autoria de Éder Porto Ferreira Alves, Paul R. Burley e João Alexandre Peschanski.[2]

Referências

  1. Estatísticas Wikidata. https://www.wikidata.org/wiki/Wikidata:Statistics/pt-br. Acesso em 29 de setembro de 2023.
  2. 2,00 2,01 2,02 2,03 2,04 2,05 2,06 2,07 2,08 2,09 2,10 2,11 2,12 2,13 ALVES, Éder Porto Ferreira; BURLEY, Paul R.; PESCHANSKI, João Alexandre. CAPÍTULO 17 ESTRUTURANDO REFERÊNCIAS BIBLIOGRÁFICAS: LEVANDO A REVISTA ANAIS DO MUSEU PAULISTA PARA O WIKIDATA. Disponível em:https://doi.org/10.3998/mpub.11778416.ch17.pt
  3. Zheng, Xiang, et al. "Gender and country biases in Wikipedia citations to scholarly publications." Journal of the Association for Information Science and Technology (2022). https://doi.org/10.1002/asi.24723