Sim, Por Favor: um Algoritmo para Checagem de Fatos na Internet

Quebrar afirmações em pedaços menores e transformá-las em grafos pode acabar com o reino da besteira online.

Por Michael Byrne

27.1.15

Crédito: Wikipédia

Apesar do que diz a velha guarda do jornalismo impresso, a checagem de fatos não se desfez ante o brilho da veloz escrita online. Pelo contrário, essa rapidez tem forçado editores e jornalistas a acelerar ainda mais a precisão obsessiva porque a tempestade de besteira hoje em dia é escandalosa e ininterrupta.

Assim, ainda tem besteira rolando por aí, mas é complicado reclamar realmente sobre a ausência na checagem dos dados porque os distribuidores da besteira online passam a acreditar que eles estão mandando cada vez mais besteira na rede. E eles sabem que seus consumidores na internet, ou ao menos parte deles, vai se atracar a essas besteiras porque é o tipo de besteira que eles curtem. Elas servem a alguma perspectiva ou ideia popular e besta.

Sites como o Snope realmente fazem o trabalho sujo revelando o que é e o que não é baboseira, mas isso é apenas uma gota em um oceano. E se a internet pudesse fazer a checagem nela mesma? Talvez um dia possamos apertar um ícone de cocô no Chrome e toda a merda na página estaria sinalizada. É uma possibilidade, de acordo com um recente estudo publicado por uma equipe de cientistas da computação do Instituto Gulbenkian de Ciência, em Portugal e da Indiana University, nos EUA.

"Checagem computadorizada de fatos em redes de conhecimento" é um trabalho que destaca uma abordagem de detecção de mentiras a partir do problema do caminho mínimo da teoria dos grafos. Primeiro, uma afirmação questionável é quebrada em três partes: um sujeito, um predicado e um objeto. Algo parecido com "Sócrates", "é uma", "pessoa".

Depois, o sujeito e o objeto da afirmação ("Sócrates" e "pessoa") são atrelados a nódulos. Na teoria dos grafos, eles se conectam por "arestas" que são, na verdade, linhas. Elas são os predicados. Dessa maneira você constroi um grafo de conhecimento, uma coleção de itens (sujeitos e objetos) conectados por vários predicados (relações).

Um grafo de conhecimento deveria se parecer com isso (ainda que para um outro fim):

Coisas e relações. Se você pegasse, digamos, tópicos da Wikipédia e fizesse a mesma coisa, você teria um grafo muito, muito grande. E foi assim aqui os pesquisadores responsáveis por esse estudo abordaram o problema: construindo um grafo do conhecimento da Wikipédia que possa ser usado como referência para o sistema de checagem dos fatos.

Basicamente, o esquema tomaria afirmações a serem checadas, separaria seus sujeitos e objetos e encontraria onde eles estão localizados no grafo de conhecimento da Wikipédia. Se eles se conectarem por uma única aresta, bem, estrela dourada. Do contrário, a precisão é determinada pela distância entre dois nódulos sobre o grafo.

"A partir de uma nova afirmação, esperamos que ela seja real caso exista uma aresta ou uma rota mínima ligando seu sujeito a seu objeto no grafo do conhecimento", afirma o estudo. "Se, contudo, a afirmação for falsa, não haverá nem arestas nem rotas mínimas conectando o sujeito ao objeto." Parece razoável.

E funcionou… algumas vezes. Você pode ver os resultados graficamente abaixo, onde a diagonal representa a afirmação verdadeira e o restante corresponde a resultados experimentais: quão próximo da verdade o sistema foi capaz de auto-classificar afirmações verdadeiras.

No mundo perfeito, a internet estaria com muito menos besteira e talvez algum plugin do Chrome nos aproxime disso. Há esperança.

Tagged:algoritmosmotherboard showdescobertasCiência da computaçãoGrafosTechMotherboard