No dia 23 de novembro, a Academia Brasileira de Ciências (ABC) realizou o webinário “Considerações sobre a Ciência Aberta”, ocasião em que lançou oficialmente o documento Open Science: Overview and Recommendations. A publicação de 72 páginas é a síntese de um trabalho de quatro anos realizado pelo grupo de trabalho da ABC em Open Science (GT-OS), coordenado pela Acadêmica Claudia Bauzer Medeiros (Unicamp).

Além de Medeiros, participaram do webinário os membros titulares da ABC Carlo da ABCs Henrique de Brito Cruz (Unicamp) e Iscia Lopes-Cendes (Unicamp); o ex-afiliado Ulisses Barres de Almeida (CBPF) e o cientista da computação Fabio Kon (USP), todos co-autores da publicação. A mediação do debate ficou por conta do vice-presidente da ABC para São Paulo, Glaucius Oliva (USP).

Ciência aberta no Brasil: de pioneiro a ameaçado

O Brasil é um dos países que correm mais risco com a transição para o acesso aberto de artigos científicos. A eliminação dos custos de pagar-para-ler aumenta consideravelmente os de pagar-para-publicar, gerando taxas de publicação impraticáveis para países em desenvolvimento.

É curioso que o impulso para a Ciência Aberta gere efeitos colaterais tão graves para o país, considerando que uma das iniciativas de acesso aberto de maior sucesso no mundo começou aqui. Criada em 1997, a Biblioteca Eletrônica Científica Online (SciELO) é um repositório gratuito que dispõe de grande parte do mercado editorial do Brasil e de 16 outros países – a maioria do Sul Global – e é financiada com recursos de agências públicas de fomento. Graças à SciELO, em 2002 o Brasil era o primeiro colocado mundial em publicações em acesso aberto, com 35% dos artigos totais. Desde então, esse percentual cresceu para 58%, mas o país caiu para 22º lugar. Essa ultrapassagem ocorreu quando o movimento pelo acesso aberto ganhou tração, sobretudo na Europa com o Plano S, que requer a todo cientista financiado por dinheiro público que publique nesse modelo.

Porcentagem de publicações em acesso aberto por país. Aumento nas publicações brasileiras em open access foi muito menor que no resto do mundo nos últimos 20 anos. Dados: Elsevier/SCOPUS

Para Carlos Henrique de Brito Cruz, ex-presidente e ex-diretor científico da Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp), hoje vice-presidente de redes de pesquisa da Elsevier, cabe às instituições científicas brasileiras acompanharem essa transição. Ele apontou o atraso das universidades brasileiras na criação de repositórios abertos de qualidade.

“O papel da biblioteca mudou. Antes, era guardar o conhecimento produzido na universidade, ter uma grande coleção. Hoje, nas boas universidades internacionais, é facilitar que o mundo tenha acesso ao conhecimento daquela universidade, é ganhar visibilidade institucional”, argumentou. “Quantas vezes eu já não consegui achar um trabalho de um pesquisador no repositório de sua universidade, mas achei num repositório estrangeiro da universidade de algum co-autor”.

Brito defende que agências de fomento também precisam estar preparadas para a transição, oferecendo mais estímulo à publicação em acesso aberto. Nesse sentido, elogiou a intenção da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes) de criar um plano nacional para o acesso aberto, mas destacou que é importante ter em mente que Ciência Aberta vai além do acesso aberto à publicações, deve alcançar todas as etapas do processo científico.

Dados abertos

No mundo inteiro existe um movimento pela Ciência Aberta, conceito que consiste não apenas no acesso aberto aos artigos e publicações científicas, mas também, e cada vez mais, aos dados, infraestruturas, pareceres e softwares utilizados durante as pesquisas. Esse impulso visa um ecossistema científico mais dinâmico, em que o conhecimento produzido por um grupo esteja facilmente disponível para outro, acelerando todo o processo produtivo de ciência.

Em 2021, a Organização das Nações Unidas para a Educação, a Ciência e a Cultura (Unesco) aprovou um conjunto de recomendações  com dois princípios: ciência é um bem público e um direito básico da humanidade; e resultados de pesquisa com financiamento público devem ser divulgados o mais cedo possível abertamente. Para isso, adverte Claudia Bauzer Medeiros, é necessário planejamento de todo o ecossistema científico, pois as mudanças não são triviais. “É preciso entender que Ciência Aberta é cara, tem custos inerentes para quem publica, para as editoras, para quem financia ciência. A economia vem no longo prazo, no reuso de dados e softwares, na aceleração dos processos”.

A cientista da computação, especialista em gerenciamento de dados científicos, defende que é preciso ter cada vez mais repositórios de dados abertos e padronizados, seguindo as diretrizes expressas pelo acrônimo FAIRFindable, Accessible, Interoperable, Reusable (encontráveis, acessíveis, interoperáveis e reutilizáveis).

“Na hora de depositarmos os dados, devemos ter o mesmo cuidado que temos para publicar. Assim como artigos, dados também têm DOI (Digital Object Identifier) e devem ser citados nas referências. Nos EUA e Europa o depósito de dados já conta em avaliações de carreira, quando estará também na Plataforma Lattes?”, indagou a pesquisadora. “Precisamos parar de enterrar o resultado de nossas pesquisas. Não podemos fazer túmulos de dados, que, por não conseguirem ser reutilizados, acabam perdidos”, finalizou.

Dados Perdidos. Conforme pesquisas envelhecem, as chances de seus dados brutos estarem disponíveis caiem dramaticamente. Fonte: Gibney, E., Van Noorden, R. Scientists losing data at a rapid rate. Nature (2013).

Softwares livres

Assim como a sociedade, a ciência contemporânea se acostumou a lidar com um volume de informação que cresce exponencialmente. O trabalho do cientista, em todas as áreas do conhecimento, é cada vez mais mediado por softwares computacionais indispensáveis para tirar sentido desse oceano de dados. “Assegurar o acesso aos softwares utilizados numa pesquisa é assegurar a reprodutibilidade da ciência”, defendeu o cientista da computação do Instituto de Matemática e Estatística da Universidade de São Paulo (IME-USP) Fábio Kon.

Ele apresentou o conceito de Software Livre, que precisa ter quatro características: uso irrestrito, aceso ao código-fonte, permissão para alterar o código e permissão para redistribuir o código alterado. Para se disponibilizar um software nesse modelo, é preciso escolher uma licença adequada e disponibilizá-lo em um repositório público (ex. GitHub, GitLab, SourceForge). Além disso, é necessário torná-lo user friendly, mantendo um código-fonte limpo, bem construído e auto-explicativo, com manuais e documentação apropriada para desenvolvedores e usuários.

Mas para garantir tudo isso, é preciso ir além do cientista, já que a maioria dos pesquisadores não é especialista em sistemas. Fábio Kon defende que instituições científicas contratem engenheiros de software capacitados em oferecer esse suporte. “Ainda não temos essa cultura. O financiamento de projetos deve prever a participação desses profissionais desde o início e as universidades também precisam tê-los de forma permanente. Eles precisam ter entendimento da área de aplicação, trabalhando e interagindo diariamente com os cientistas. É um esforço contínuo, software que não é atualizado morre”, avaliou.

Transparência de dados e Ciência Cidadã

O astrofísico Ulisses Barres de Almeida, do Centro Brasileiro de Pesquisas Físicas (CBPF), tem experiência com o compartilhamento não apenas de dados, mas de toda a infraestrutura com que faz sua pesquisa. Isso porque a astronomia é uma área que depende de observatórios espalhados pelo mundo, os quais precisam estar disponíveis a todos, estimulando a colaboração internacional.

O pesquisador defende que o acesso aberto a dados é crucial para a chamada Ciência Cidadã, feita com a participação crítica da sociedade, que colabora com o trabalho dos cientistas. Nesse sentido, a Ciência Aberta se torna não apenas um meio de acelerar a produção de conhecimento, mas de capacitar pessoas. Para isso, entretanto, é necessário que esses dados sejam preparados para o acesso aberto. “Não basta que os dados sejam simplesmente abertos, eles precisam ter um alto grau de disponibilidade e têm de ser facilmente acessíveis e utilizáveis. Dados ‘não-espertos’, mesmo que disponíveis, terminam por ser opacos para a maior parte das pessoas”.

Um exemplo de Ciência Cidadã gerando capacitação de pessoas se deu através do portal Firmamento, mantido pela New York University in Abu Dhabi. O alto grau de transparência nos dados depositados permitiu que fossem trabalhados por estudantes de ensino médio. Em janeiro deste ano, um grupo de estudantes italianos, orientados por astrônomos, publicou um catálogo bastante valioso de novos candidatos a blazares (corpos celestes associados a buracos negros).

Ética no uso de dados

Outra área que se beneficia muito do compartilhamento de dados é a Saúde, mas seu uso deve, mais do que nunca, se atentar à questões éticas. A geneticista Iscia Lopes-Cendes trabalha com genômica médica e precisa de bancos de dados robustos para produzir análises precisas. “Um exemplo é o sequenciamento do exoma de um paciente, técnica incorporada em 2019 ao Sistema Único de Saúde (SUS). Quanto mais informações sobre a população brasileira estiver em nossos bancos de dados, melhor será o diagnóstico”, explicou a pesquisadora.

Por se tratarem de informações sensíveis, dados médicos precisam ter a privacidade assegurada. A Lei Geral de Proteção de Dados Pessoais (LGPD), de 2019, destaca os princípios de anonimato dos dados e consentimento informado para o compartilhamento. Outro ponto que Lopes-Cendes destaca é a existência de diferentes níveis de acesso aos bancos de dados em saúde.

“Minha experiência como pesquisadora é de que, com a devida explicação e transparência, a quase totalidade dos pacientes aceita o compartilhamento, mas para isso os objetivos do pesquisador precisam se fazer claros. ‘Se for para ajudar outras pessoas, eu aceito’ é a resposta padrão”, avalia.

A Acadêmica defende também uma maior padronização dos prontuários de hospitais do país, de forma a facilitar a centralização dos dados pelo SUS. “Imaginem quando todo o sistema estiver integrado, um banco de dados de quase 200 milhões de brasileiros. Em escala, será algo único no mundo”, finalizou.


Acesse o documento:

Open Science: Overview and General Recommendations


Assista ao webinário completo: