Publicidade
Tech by VICE

Uma IA treinada com artigos científicos antigos fez descobertas que passaram ao lado dos humanos

Cientistas usaram "machine learning" para revelar novos conhecimentos científicos escondidos em investigações antigas.

Por Madeleine Gregory; Traduzido por Marina Schnoor
16 Julho 2019, 2:45pm

Imagem via Shutterstock.

Este artigo foi originalmente publicado na Motherboard - Tech by VICE.

Utilizando apenas a linguagem de milhões de artigos científicos antigos, um algoritmo de machine learning conseguiu fazer novas descobertas científicas. Num estudo publicado a 3 de Julho na Nature, investigadores do Lawrence Berkeley National Laboratory usaram um algoritmo chamado Word2vec para peneirar artigos científicos em busca de conexões que os humanos não tivessem visto. O algoritmo fazia previsões para possíveis materiais termoeléctricos, que convertem calor em energia e são usados para muitas aplicações de aquecimento e arrefecimento.

Mas, o algoritmo não sabia a definição de termoelectricidade. Não recebeu treino em material científico. Usando apenas associação de palavras, o algoritmo conseguiu prever candidatos para futuros materiais termoeléctricos, podendo mesmo alguns deles ser melhores do que aqueles que utilizamos actualmente. “O algoritmo pode ler qualquer material de uso cientifico e consegue fazer conexões que nenhum cientista poderia fazer”, explica o investigador Anubhav Jain. E acrescenta: “Às vezes faz o que um investigador faria; outras vezes faz associações interdisciplinares”.


Vê: "A matemática que previu a Primavera Árabe"


Para treinar o algoritmo, os cientistas avaliaram a linguagem de 3,3 milhões de resumos relacionados com material científico, acabando com um vocabulário de cerca de 500 mil palavras. Colocaram os resumos no Word2vec, que usa machine learning para analisar relações entre palavras. “Esse algoritmo Word2vec treina um modelo de rede neural para remover cada palavra e prever quais serão as próximas palavras”, realça Jain. E conclui: “Ao treinar uma rede neural com uma palavra, obténs representações das palavras que podem na verdade conferir conhecimento”.

Usando apenas as palavras encontradas nos resumos científicos, o algoritmo conseguiu entender conceitos como a tabela periódica e estruturas químicas das moléculas. O algoritmo ligou palavras que eram encontradas próximas umas das outras, criando vectores para palavras relacionadas que ajudavam a definir conceitos. Em alguns casos, palavras eram ligadas a conceitos termoeléctricos, mas nunca tinham sido escritas para termoelectricidade em nenhum resumo que tivessem observado. Esse vácuo no conhecimento é difícil de ser descoberto por olhos humanos, mas um algoritmo repara nele facilmente.

Depois de mostrar a sua capacidade na previsão de futuros materiais, os investigadores levaram o algoritmo para uma viagem no tempo, virtualmente. Descartaram dados recentes e testaram o algoritmo em artigos antigos, observando de que forma podia prever descobertas científicas antes de estas acontecerem. E, mais uma vez, o algoritmo funcionou. Numa experiência em particular, os cientistas analisaram apenas artigos publicados antes de 2009 e conseguiram prever um dos melhores materiais termoeléctricos modernos quatro anos antes dele ser descoberto em 2012.

Esta nova aplicação para a Inteligência Artificial vai além dos materiais científicos. Como o algoritmo não é treinado numa base de dados especificamente científica, pode facilmente ser aplicado a outras disciplinas, retreinado em literatura ou qualquer outra área que se quiser. Vahe Tshitoyan, o principal autor do estudo, garante que há outros cientistas já a entrarem em contacto para saber mais.

“Esre algoritmo não é supervisionado e constrói as suas próprias conexões”, realça Tshitoyan. E conclui: “Podes usá-lo em coisas relacionadas com investigação médica ou descobertas de drogas. A informação está aqui. Ainda não fizemos essas conexões, porque ninguém consegue ler todos os artigos”.


Segue a VICE Portugal no Facebook, no Twitter e no Instagram.

Vê mais vídeos, documentários e reportagens em VICE VÍDEO.

Tagged:
Tech
Motherboard
AI
Features
Futuro
Noticias
inteligencia artificial
conhecimento
humanidade
Sociedade
cientistas
descobertas científicas
futuro da humanidade
Destaques
machine learning