14 January 2019
¿Viste una información en una web y luego la borraron? Conoce una posibilidad para recuperarla
Las herramientas con las que cuentan los periodistas de investigación son cada vez más, tanto en cantidad como en sofisticación. Existen bases de datos, web especializadas a las que se suscriben, entre otros.
Hoy les hablaremos de una página web que ofrece información gratuita de versiones antiguas de páginas web, entre otras informaciones digitalizadas.
Se trata del “WaybackMachine”, una organización sin fines de lucro que construyó una biblioteca digital de sitios de Internet. Hoy su archivo contiene:
- 330 mil millones de páginas web
- 20 millones de libros y textos
- 5 millones de grabaciones de audio (incluyendo 180.000 conciertos en vivo)
- 4 millones de videos (incluyendo 1.6 millones de programas de noticias de televisión)
- 3 millones de imágenes
- 200.000 programas de software
Entonces, si por ejemplo quieres ver cómo lucía la versión antigua de El País de España entras al sitio y colocas el url en la casilla de búsquedas. Ves las fechas y eliges una, por ejemplo, la captura del 13 de diciembre de 2004 y obtendrás esto:
¿Interesante verdad? Sobre todo si comparamos con la actual:
En este ejemplo podemos ver tendencias noticiosas de otrora en comparación con la actual, o variaciones en los diseños, entre otros. Pero, sin duda que podemos usarlo para temas más complejos que requieran de investigación de contenido.
Acerca de la organización
Según se desprende de su sitio web, The Wayback Machine comenzó en 1996 archivando páginas de Internet, en un momento en que el contenido publicado en la web era efímero y nadie lo guardaba. Hoy tienen más de 20 años de historial web accesibles y trabajan con más de 450 bibliotecas y otros socios a través de su programa Archive-It para identificar páginas web importantes.
Cualquier persona que tenga una cuenta gratuita puede cargar contenido multimedia en Internet Archive. Trabajan con miles de socios en el mundo para guardar copias de su trabajo en colecciones especiales.
Porque son una biblioteca, prestan especial atención a los libros. No todos tienen acceso a una biblioteca pública o académica con una buena colección, por lo que para proporcionar acceso universal proporcionan versiones digitales de libros.
Comenzaron un programa para digitalizar libros en 2005 y hoy escanean 1.000 libros por día en 28 ubicaciones del planeta. Los libros publicados antes de 1923 están disponibles para descargar, y cientos de miles de libros modernos pueden ser prestados a través de su sitio de Open Library. Algunos de sus libros digitalizados solo están disponibles para la impresión deshabilitada.
Al igual que Internet, la televisión es también un medio efímero. Comenzaron a archivar programas de televisión a fines de 2000, y su primer proyecto público de televisión fue un archivo de noticias televisivas sobre los eventos del 11 de septiembre de 2001.
En 2009, comenzaron a realizar transmisiones de noticias de televisión seleccionadas de los EE.UU. en su archivo de noticias de televisión. Este servicio permite a los investigadores y al público utilizar la televisión como una referencia citable y compartida.
La organización sirve a millones de personas cada día y es uno de los 300 sitios web más importantes del mundo. Una sola copia de la colección de su biblioteca ocupa más de 30 Petabytes de espacio en el servidor (y almacenan al menos dos copias de todo).
Se financian a través de donaciones, subvenciones y al proporcionar servicios de archivo web y digitalización de libros para sus socios. Dicen valorar la privacidad de sus usuarios, por lo tanto, evitan mantener las direcciones IP (Protocolo de Internet) de sus lectores, ofreciendo un protocolo seguro (https).
Para mayor información:
@waybackmachine en las redes sociales.