Planos de Gestão de Dados de Investigação

Um Plano de Gestão de Dados (PGD, Data Management Plan ou DMP) é um documento formal que descreve o ciclo de vida dos dados a ser gerados/colhidos no âmbito da investigação. Descreve os diferentes aspetos desde a criação/recolha e tratamento dos dados durante e após um projeto de investigação, identificando como é que serão criados e documentados, quem poderá aceder aos mesmos, como reutilizá-los e onde serão armazenados e preservados.
Os Planos de Gestão de Dados são documentos vivos que evoluem e se adaptam à medida que a investigação segue o seu curso. São fundamentais para uma boa gestão de dados de investigação pois permitem a compreensão dos dados e das circunstâncias em que foram gerados, quem poderá aceder aos mesmos, como reutilizá-los e onde serão armazenados e preservados o que poderá permitir a sua reutilização/replicação.

  • Que dados serão criados ou recolhidos?
  • Como é que os dados vão ser criados ou gerados?
  • Métodos e normas utilizadas no seu tratamento;
  • Como serão manipulados ao longo de todo o processo;
  • Que documentação ou metadados integrar nos dados?
  • Como lidar com as questões éticas?
  • Como lidar com questões de direito de autor e propriedade intelectual?
  • Como é que os dados serão armazenados e criadas cópias de segurança durante o projeto?
  • Como identificar níveis de acesso e segurança dos dados?
  • Que dados deverão ser mantidos e preservados?
  • O que é um plano de preservação de dados a longo prazo?
  • Que conjuntos serão disponibilizados em Acesso Aberto?
  • Como serão partilhados os dados?
  • Existem orientações para atribuição de restrições ou acesso aberto aos dados?
  • Quem é responsável pela gestão dos dados?
  • Que recursos são necessários para a implementação do plano?

A elaboração de um Plano de Gestão de Dados, o tratamento dos mesmos, a sua partilha e disponibilização é condição quando falamos de Acesso Aberto. As linhas orientadoras da União Europeia – UE, através do European Research Council – ERC e dos projetos financiados pelo Horizonte 2020, assumem este requisito como desejável, disponibilizando instrumentos para o efeito. O processo de incentivo à disponibilização dos dados de investigação no âmbito do Horizonte 2020 está a ser feito através do Open Research Data Pilot (ORD Pilot), que segue os princípios FAIR, de que os dados deverão ser pesquisáveis (findable), acessíveis (accessible), interoperáveis (interoperable) e reutilizáveis (reuzable).

Dados FAIR são dados que são geridos em linha com os princípios FAIR – Findable, Accessible, Interoperable and Reutilizable.
Os princípios FAIR têm como objetivo orientar a gestão dos dados de investigação permitindo a sua localização, acesso, interoperabilidade e reutilização.
Cada letra do acrónimo FAIR corresponde a um conjunto de 15 princípios.

Os princípios FAIR são princípios orientadores, não normas. Os FAIR descrevem qualidades ou comportamentos necessários para tornar os dados reutilizáveis ao máximo. (ex., descrição, citação).
Ao contrário de iniciativas similares que se concentram no investigador, os princípios FAIR dão ênfase ao aumento da capacidade das máquinas automaticamente encontrarem e usarem os dados ou qualquer objeto digital, além de apoiar a sua reutilização por pessoas.

No âmbito de um projeto financiado:

    • Primeira versão nos primeiros 6 meses do projeto;
    • Atualização sempre e quando alguma mudança importante o justifique, ou novos datasets forem adicionados;
    • A meio ou nos estágios finais do projeto;
    • O DMP não é um documento fixo; evolui e ganha mais precisão e substância ao longo do projeto, uma vez que nem todos os dados ou potenciais usos são claros desde o princípio.

Fora do âmbito de um projeto (por exemplo, no âmbito de uma dissertação de mestrado ou tese de doutoramento):

    • Plano minimal na fase de conceptualização ou de pedido de bolsa;
    • Core plan: atualização e desenvolvimento abrangendo todas as etapas antecipáveis;
    • Full plan no final da investigação.

Sugerem-se duas ferramentas:

    • ARGOSFerramenta de suporte a processos automatizados para criação, gestão, partilha e ligação de Planos de Gestão de Dados com os resultados de investigação a que correspondem.  Para além da ligação às entidades financiadoras e projetos de investigação, o ARGOS permite a utilização de modelos pré-definidos para a criação de um PGD, bem como a criação de novos modelos parametrizados de acordo com as especificações da Instituição, Projeto, Entidade financiadora, entre outros. Mais informação aqui.
    • DMPonlineEsta ferramenta integra uma grande variedade de financiadores de projetos, pelo que facilita em muito os investigadores na organização do seu processo de recolha de dados, edição, atualização, partilha com outros investigadores das diferentes versões do projeto e, para cada uma das fases, é sempre possível a sua exportação em diferentes formatos (pdf, docx, csv, html, etc.). Mais informação aqui .

Um grande número de entidades financiadoras de ciência tem vindo a emitir recomendações e mandatos para a disponibilização dos dados de investigação.

A Comissão Europeia recomenda o acesso aos dados que validam as publicações científicas, bem como a todos os outros dados que seja possível disponibilizar, com vista a maximizar o acesso e a reutilização dos dados de investigação gerados pelos projetos.

Os projetos podem optar por não partilhar os dados, na fase de proposta ou durante a execução (com a devida justificação no plano de projeto), com base nos seguintes pressupostos:

      • Se o projeto não gerar/recolher dados;
      • Em caso de conflito com a obrigação de proteção dos resultados (se é expectável que os resultados sejam comercial ou industrialmente explorados);
      • Se a realização do objetivo principal do projeto (ação) ficar comprometido com a disponibilização aberta dos dados;
      • Em caso de conflito com as obrigações de confidencialidade;
      • Em caso de conflito com as obrigações nacionais de segurança;
      • Em caso de conflito com as regras em matéria de proteção de dados pessoais.

Os requisitos típicos exigidos são que se elabore um plano de gestão de dados e que se disponibilize os dados de investigação em acesso aberto, sempre que possível. Este requisito aplica-se a dados necessários para a validação dos resultados em publicações científicas, bem como a outros dados resultantes do projeto e especificados no Plano de Gestão de Dados.

As entidades financiadoras reconhecem razões válidas para justificar a não partilha dos dados de investigação: se o projeto não gerar dados, se estes forem comercialmente explorados, por razões de confidencialidade, privacidade, segurança nacional, ou se a partilha comprometer o objetivo principal do projeto. É por estas razões que a Comissão Europeia adotou a máxima “As open as possible, as closed as necessary”.

O cumprimento destas diretrizes tem impacto na (boa) avaliação do projeto, desde a fase da proposta.

Sim. As entidades financiadoras requerem a partilha dos datasets que servem de base às publicações, sendo que os restantes não têm obrigatoriedade de partilha. Também pode acontecer que inicialmente se planeie disponibilizar alguns datasets, mas depois mudar essa decisão, por exemplo, se se descobrir que se enquadram nas exceções previstas (por exemplo, se puderem ser explorados comercialmente). Nesses casos, a decisão deve ser justificada no seu plano de gestão de dados.

 

Saiba mais:

HORIZON 2020:

OPENAIRE | Guides for Researchers: