Tecnología

Millones de publicaciones antiguas de internet están disponibles en línea

Jozef Jarosciak acaba de colocar millones de publicaciones de Usenet en un archivo navegable por primera vez.
Alguien que usa una computadora retro.
Imagen vía Getty Images

Artículo publicado originalmente por VICE en Inglés.

Décadas antes de los hilos de Twitter, los foros de Reddit o los grupos de Facebook, existía Usenet: un sistema de discusión del internet temprano, anterior a la Web, en el que se podía iniciar y unirse a conversaciones muy parecidas a los foros de mensajes actuales. Lanzado en 1980, Usenet es la creación de dos estudiantes de la Universidad de Duke que querían comunicarse a través de servidores locales descentralizados, y todavía está activo en la actualidad.

Publicidad

En Usenet, la gente habla de todo, desde la ciencia nanotecnológica hasta las telenovelas, el vino y los ovnis. Jozef Jarosciak, un arquitecto de sistemas que vive en Ontario, tuvo su primer encuentro con Usenet en el año 2000, cuando encontró un empleo de tiempo completo en Canadá gracias a una oferta de trabajo que encontró allí.

Esta semana, Jarosciak subió algunas de las publicaciones de Usenet más antiguas disponibles en internet. Alrededor de 2,1 millones de publicaciones entre febrero de 1981 y junio de 1991 del Archivo UTZOO NetNews de Henry Spencer están archivadas en el archivo de Usenet para cualquiera que desee consultarlas.

Este último paquete de información archivada es parte de un proyecto aún mayor de Jarosciak. El mes pasado, Jarosciak lanzó el sitio Usenet Archive como una forma de albergar grupos de una manera que fuera independiente de Google Groups, que también alberga archivos de grupos de noticias como Usenet. Actualmente posee un archivo de 317 millones de publicaciones en 10.000 grupos únicos de noticias de Usenet, según el sitio. Jarosciak estima que eventualmente tendrá cerca de 1.000 millones de publicaciones.

Henry Spencer, miembro del Departamento de Zoología de la Universidad de Toronto, guardaba archivos de los grupos en 141 cintas magnéticas. “Las cintas de Usenet UTZOO-Wiseman son esencialmente las primeras discusiones disponibles publicadas en internet por personas que trabajaban en varias universidades y que ya estaban conectadas a internet”, me dijo Jarosciak.

Spencer y algunos colegas lograron transferir los datos de las cintas magnéticas al formato .TAR (Tape ARchive), y Jarosciak, quien ha archivado publicaciones de Usenet durante años, convirtió esas cintas en una base de datos PostgreSQL con capacidad de búsqueda completa, que luego subió al sitio Usenet Archive. En el camino, además de crear los analizadores sintácticos para el archivo de cinta magnética de Utzoo, también desarrolló convertidores en PHP, JavaScript, Java y Python, y los puso a disposición de todo el mundo en su Github como recursos de código abierto que cualquiera puede usar.

De los grupos de Utzoo, ha subido casi 26.300.000 publicaciones y contando.

“Este tesoro de publicaciones antiguas debe estar disponible para las generaciones futuras”, dijo Jarosciak. “Estos cientos de millones de publicaciones pueden ser divertidas de leer, pero lo que es más importante, arrojan luz sobre el proceso de pensamiento de la comunidad de internet en sus primeras etapas. Es una gran cantidad de importante contenido histórico e investigativo. Sería una negligencia por mi parte y por parte de otros archivistas dejar pasar la oportunidad de llevar estos viejos grupos de texto de Usenet de los archivos al público”.