
O número de materiais possíveis é praticamente infinito, o desafio é identifica-los. É com base nessa premissa que o físico teórico Matthias Scheffler, professor emérito do Instituto Fritz Haber na Sociedade Max Planck, trabalha aplicando sistemas de Inteligência Artificial para encontrar quais os melhores materiais para desempenhar uma determinada função. Ele apresentou seu trabalho durante a Reunião Magna de 2024 da Academia Brasileira de Ciências (ABC).
Para explicar, Scheffler pega emprestado um conceito da biologia, descrevendo o que chama de “genes materiais”. Um gene é uma unidade molecular fundamental que serve como um manual, uma parte do projeto que virá a ser um ser vivo. São os genes em nosso DNA que definem a probabilidade de desenvolvermos um câncer, ou qual vai ser a cor da nossa pele. Da mesma forma, um “gene material” é uma propriedade fundamental do material, definida pelas características de seus átomos e suas estruturas mais basais, que dita quais serão suas características. Por exemplo, um determinado material será capaz de conduzir eletricidade ou calor?
Descobrir esses “genes materiais” não é algo trivial. Pelo contrário, o palestrante afirma que esse tipo de pesquisa está inserida no que chama de quarto paradigma da pesquisa científica. A ciência começou puramente empírica, observando e descrevendo fenômenos naturais; depois tornou-se teórica, exemplificada nas leis da mecânica clássica de Newton. Conforme as leis teóricas se tornaram cada vez mais complexas – e com o advento da computação – cada vez mais os cientistas começaram a fazer simulações para descrever os fenômenos, gerando dados simulacionais que hoje pouco se distinguem dos dados observacionais.
O quarto paradigma contemporâneo descreve uma ciência cada vez mais baseada nesse volume imenso de dados. Não mais se sustenta numa relação clássica de causa e efeito, mas nas correlações observadas nos dados. “É uma nova forma de pensar. A relação entre esses ‘genes materiais’ e a propriedade de interesse não está descrita por leis científicas, mas por probabilidade. Nós reconhecemos que existe uma complexidade maior no mundo que não pode ser descrita pela matemática clássica, pois não há só um processo em curso. Por isso, trabalhamos com correlações e regras probabilísticas”, explica o palestrante.
Esse tipo de abordagem só é possível porque, ao redor do mundo, uma quantidade imensa de informação está sendo gerada todos os dias na ciência dos materiais, a maior parte das quais nunca verá a luz do sol. Pensando nisso, Scheffler desenvolveu a plataforma NOMAD, que se tornou a maior base de dados em materiais da Europa. “Convidamos os cientistas a depositarem seus dados em nosso repositório de forma simples e sem barreiras. Nós pedimos apenas que depositem também os metadados gerados durante o processo, para que possam ser reproduzidos. Lá seus dados são processados e disponibilizados de forma utilizável para outros cientistas”, descreveu Scheffler.
Navegar manualmente por todo esse oceano de informação é impossível mesmo unindo os esforços de todos os engenheiros do planeta, e é aí que a IA entra em cena. Ela cria “mapas de materiais”, a partir das propriedades de interesse. Cada material testado será representado por uma função que se encaixará em uma região diferente de um gráfico. Dessa forma, é possível descobrir quais materiais melhor correlacionam as propriedades buscadas. “Por exemplo, fizemos um projeto com 732 materiais possíveis e descobrimos 16 na região de interesse para baixa condutividade elétrica. Mas é sempre bom lembrar, A IA é um método estatístico que te dá previsões, a partir dela é preciso olhar com cuidado para cada material”, frisou.

Isso porque os algoritmos não são infalíveis e estão em constante aperfeiçoamento. Por ser um trabalho estatístico, há sempre uma incerteza estimada e é preciso lidar com ela. Há também os chamados eventos raros, alterações detectadas quando os materiais são observados por um longo período de tempo, podendo gerar falsos negativos no algoritmo ou, inversamente, falsos positivos podem ser interpretados como eventos raros. Por tudo isso, repetições são fundamentais. “Quando você gera vários modelos é possível entender em que regiões há mais incerteza. Acende um sinal de alerta que te leva a fazer novos cálculos. Fica mais caro, mas é melhor do que não ter ideia do nível de incerteza”, explicou o palestrante.
Todo esse trabalho se sustenta num ecossistema em que os dados são abertos e acessíveis para qualquer pesquisador. A ideia é que dados irrelevantes gerados em uma pesquisa podem ser fundamentais para outra. Reduzir o desperdício e aumentar a velocidade da geração de conhecimento é uma das maiores oportunidades que a IA nos oferece. Na ciência dos materiais, isso significa que temos uma chance antes inimaginável de encontrar materiais ótimos para quase todas as aplicações que pensarmos, seja para melhorar a saúde, a eficiência energética ou a sustentabilidade.
“A história da coleta e análise de dados é bem capturada pela relação tensa entre Tycho Brahe e Johannes Kepler. Por volta do ano 1600, Brahe tinha os melhores dados sobre o movimento planetário, mas não gostava de compartilhá-los, enquanto Kepler era o melhor matemático, mas não tinha acesso. Só quando Brahe morreu que Kepler pôde analisar seus dados e revolucionou a forma como compreendemos os astros. Hoje, estátuas de ambos estão erguidas lado a lado na República Tcheca”, resumiu o palestrante.

Assista à palestra a partir do minuto 7: