Recomendações para a gestão de dados de pesquisa dirigidas aos pesquisadores (2019)

A imagem pode conter: texto

É consenso que dados de pesquisa adquiriram grande importância em anos recentes. Sua relevância tem aumentado dia a dia, à medida que pesquisadores, bibliotecas, universidades e financiadores têm adotado políticas e procedimentos de descrição, armazenamento e preservação desses dados.

O documento intitulado Recomendaciones para la gestión de datos de investigación dirigidas a investigadores, de autoria de Remedios Melero [1], faz parte dos resultados da Rede Espanhola de Dados Abertos de Pesquisa MareData [2] e fornece um total de 17 recomendações para o gerenciamento de dados de pesquisa, precedido por uma introdução para contextualizar a importância do compartilhamento, para facilitar o acesso e reutilização de dados de pesquisa e sua preservação. Nesta matéria, reproduzimos algumas destas recomendações. 

Existem inúmeras razões para compartilhar os dados da pesquisa:
• Promover a inovação e a reutilização de dados que possam potencialmente ter novos usos.
• Facilitar a colaboração entre usuários de dados, criadores de dados e reutilizadores.
• Maximizar a transparência e confiabilidade dos dados.
• Favorecer a reprodutibilidade de testes experimentais.
• Permitir a verificação dos resultados da pesquisa.
• Reduzir os custos evitando a duplicação de dados.
• Aumentar o impacto e a visibilidade da pesquisa.
• Promover os projetos de pesquisa de onde provêm os dados e suas publicações.
• Gerar um reconhecimento direto dos pesquisadores que produzem
dados, como em qualquer outro resultado de pesquisa.

Segundo o modelo sugerido pelo grupo de especialistas da Comissão sobre os dados FAIR, o ecossistema de dados é composto: pelas políticas que regulam e definem os dados, os planos de gestão de dados, os identificadores, os padrões, os repositórios de confiança e os serviços em nuvem onde são armazenados os dados. Estes componentes devem se desenvolver a partir de quatro elementos chave: competências,  métricas (metrics), o sistema de reconhecimento (recompensas) e investimentos que tornam tudo isso possível (Figura 1) [3].

Nesse ecossistema, os objetos de dados FAIR são compostos por seus arquivos de dados, por um identificador persistente, por uma descrição dos padrões e formatos usados ​​na obtenção, representação, visualização de dados, etc., e os metadados que descrevem os conjuntos de dados que permitem sua interpretação e reutilização (figura 2) [4].

REC1. Adotar os princípios do programa FAIR e facilitar a produção científica aberta, de forma legal e reutilizável. A adoção dos princípios do FAIR implica que o dado de pesquisa:

Seja localizável (localizável):
• F1 Atribuir um identificador exclusivo e persistente aos dados e metadados.
• F2 Descrever dados com metadados ricos (isto é, adicionar declarações semânticas, anotações, etc.) aos dados que eles descrevem, o que melhora a qualidade dos metadados).
• F3 Registrar e indexar dados e metadados em um sistema (repositório, serviço, etc.) que possui um mecanismo de pesquisa.
• F4. Incluir um elemento de metadados específico para o identificador persistente dos dados.

Seja acessível (acessível):
• A1. Usar protocolos padronizados para recuperar dados e metadados
pelo seu identificador.
• A1.1 Os protocolos devem ser abertos, gratuitos e universalmente aplicáveis.
• A1.2 Os protocolos também devem permitir um procedimento de autenticação e autorização, se necessário.
• A2. Garantir a disponibilidade de acessibilidade aos metadados, mesmo que os dados não estejam mais disponíveis. 

Seja interoperável (interoperável):
• I1 Usar linguagens formais (acessíveis, compartilhadas e padronizadas) para representam dados e metadados.
• I2 Descrever dados e metadados com vocabulários (esquemas, ontologias,
etc.) que também seguem os princípios do FAIR.
• I3 Incluir referências cruzadas e links entre dados e metadados.

Seja reutilizável (reutilizável):
• R1 Assegurar-se de que os dados e metadados utilizados tenham uma variedade de elementos ou atributos precisos e relevantes.
• R1.1. Publicar dados e metadados com uma licença de reutilização clara e acessível.
• R1.2. Usar critérios de proveniência (criação, atribuição e histórico de versão) para associar metadados aos dados durante seu ciclo de vida.
• R1.3. Garantir que os dados e os padrões de metadados utilizados estejam de acordo com os padrões comuns da área de conhecimento a que os dados se referem.

Algumas recomendações selecionadas: 

REC. Selecione os dados que tenham interesse para usos futuros.
• Às vezes, não é necessário preservar todos os dados gerados ao longo de um projeto de pesquisa: “limpe seus dados” e escolha aqueles que possam ser úteis.
REC. Aplique os princípios do FAIR também aos metadados e ao plano de gerenciamento de dados.
• Os metadados que descrevem seus dados, bem como o próprio plano de gerenciamento de dados, no qual documenta todo o processo de gerenciamento que o projeto seguirá para os dados, eles também devem ser localizáveis, acessíveis, interoperáveis ​​e reutilizáveis ​​em si mesmos.

REC. Indique no plano de gerenciamento de dados se os dados foram consultados ou reutilizados já existente em vez de obtê-los novamente (evitar a redundância).

REC. Forneça uma descrição detalhada das condições em que os experimentos tenham sido feitos, para que possam ser reproduzidos. 
• Não esqueça de considerar também os resultados negativos, pois é relevante conhecê-los para evitar repetições desnecessárias.

REC. Identifique o repositório de confiança mais apropriado (repositório confiável) para depositar os dados. 

REC. Verifique os termos ou requisitos das políticas referentes aos dados de pesquisa. Agências de financiamento, centros de pesquisa e universidades e, cada vez mais, também revistas científicas, têm suas próprias políticas em relação aos dados da pesquisa.

REC. Promova a citação de conjuntos de dados como qualquer outro recurso bibliográfico.

REC. Leve em consideração, especialmente nas disciplinas que envolvem trabalhar com seres vivos, os códigos de conduta apropriados e internacionalmente reconhecidos.

== Referências ==

[1] MELERO, Remedios. Recomendaciones para la gestión de datos de investigación dirigidas a investigadores. MareData, 2019. Disponível emhttp://hdl.handle.net/10261/173801 Acesso em: 11 jan. 2019.

[2] MareDatahttp://www.maredata.net – é uma rede temática financiada pelo Ministério da Economia Competitividade no âmbito do convite à apresentação de Ações de dinamização «Redes de Excelência» do Programa Estadual para a Promoção da Pesquisa Científica e Técnica de Excelência, Subprograma Estadual de Geração de Conhecimento, no âmbito do Plano Estadual de Pesquisa e Inovação Científica e Técnica 2013-2016 (CSO2015-
71867-REDT). A rede foi criada e gerenciada por sete grupos de trabalho de pesquisa de diferentes instituições (Instituto de Agroquímica y Tecnología de Alimentos-CSIC, Instituto de Gestión de la Innovación y el Conocimiento-CSIC, Universidad de Alicante, Universitat de Barcelona, Universidad Carlos III de Madrid, Universitat Oberta de Catalunya y Universitat Politècnica de València) cujas linhas de pesquisa estão relacionadas à gestão de dados de pesquisa: interoperabilidade, publicação, acesso, localização, preservação e métricas de impacto.

[3] HODSON, Simon; JONES, Sarah; COLLINS, Sandra; [et al.] FAIR Data Action Plan: interim recommendations and actions from the European Commission Expert Group on FAIR data. June. 2018a. 21 p. Disponível em: https://zenodo.org/record/1285290#.WyOWGSB9jt4 Acesso em: 11 fev. 2019.

[4] HODSON, Simon; JONES, Sarah; COLLINS, Sandra; [et al.] Turning FAIR data into reality: interim report from the European Commission Expert Group on FAIR data. June. 2018b https://zenodo.org/record/1285272#.W7uasPmYSCg Acesso em 11 fev. 2019.