FYI.

This story is over 5 years old.

Actualidad

Un algoritmo podría detectar información falsa en internet

¿Cansados de tanta manipulación periodística y verdades a medias en la red? Un equipo de ingenieros está diseñando el gadget que estábamos esperando.
11.2.15

A pesar de los reclamos ansiosos de la vieja guardia del periodismo impreso, la rigurosidad del oficio no se ha evaporado bajo la luminosa y rápida escritura en bits de la era digital. Para evitar perder calidad los escritores y editores se han tenido que volver más obsesivos, porque la cantidad de basura que se lanza a diario en la web es asombrosa e incesante.

Sí, todavía hay información falsa en la red. Pero es difícil quejarse por la falta de verificación porque los promotores de mentiras tienden a saber que están difundiendo mentiras. Y también saben que los usuarios de internet, o una parte de ellos, van aferrarse a esa sarta de idioteces porque son el tipo de mentiras que sirven a una determinada perspectiva popular y engañosa.

Publicidad

Snopes ( un portal que es algo así como un cazador de mitos en la web) realmente hace un trabajo celestial a la hora de desmentir falsedades, pero ese es un pequeño rayo de luz en medio de un mar oscuro y profundo. ¿Qué tal si internet pudiera verificarse a sí mismo? Tal vez algún día podamos incluir en nuestros navegadores un pequeño ícono con la forma de un pedazo de caca que, al oprimirse, señalara todo aquello que fuera mentira. Que esto suceda es una posibilidad, o al menos así lo advierte un estudio publicado recientemente por un equipo de ingenieros de sistemas de la Universidad de Indiana y el Instituto Gulbenkian de Ciencia en Portugal.

El artículo, titulado "Verificación computarizada basada en redes de conocimiento", describe un acercamiento a la detección de mentiras en la web usando un modelo que es la resolución más corta de problemas que se enuncia en la teoría grafos (una teoría matemática que trata de unir de formas sencillas nodos distantes). Primero se divide una afirmación dudosa en tres partes: sujeto, predicado y objeto. El resultado es algo así: "Sócrates", "es una", "persona".

Luego se toma al sujeto y al objeto de la afirmación (Sócrates, persona) y se les asignan dos nodos (puntos). En la teoría de grafos, los nodos están conectados por líneas, dichas líneas son los predicados es decir (es una). Así se construye una gráfica de conocimiento: un conjunto de puntos (sujetos y objetos) conectados por una serie de lineas o predicados (relaciones).

Publicidad

Teniendo en cuenta lo anterior, así se vería una gráfica de conocimiento (aunque esta se refiere a un tema distinto):

El secreto está en pensar en términos de cosas y relaciones. Si, por ejemplo, alguien tomara todos las páginas de Wikipedia y las graficara de esta manera, obtendría una gráfica muy, muy grande. Y precisamente este fue el enfoque que los investigadores le dieron al problema: construyeron una gráfica de conocimiento de Wikipedia que puede ser usada como una referencia para su sistema de verificación.

Básicamente el sistema toma una afirmación, identifica su sujeto y objeto y luego busca dónde se encuentran en el gráfico de conocimiento de Wikipedia. Si están conectados por una sola linea directa, la afirmación es correcta. Si no es así, la precisión del enunciado es determinada por la distancia entre los dos nodos en la gráfica.

"Al analizar un enunciado, esperamos que sea cierto si este existe como una línea en la gráfica de conocimiento o si existe un atajo que una al sujeto con el objeto en la gráfica", explica el artículo. "Si la afirmación no es cierta, no existirán líneas ni atajos que conecten el sujeto y el objeto". Parece razonable.

Y funcionó… a veces. Pueden ver los resultados expresados gráficamente abajo, la diagonal significa un enunciado verdadero y el resto son resultados experimentales que evalúan qué tan acertado fue el sistema a la hora de autoclasificar enunciados verdaderos.

Idealmente habrá menos basura en Internet y quizá algún plug-in bloquea-mierda de Chrome nos llevará a eso en un futuro. Eso es lo que esperamos.