Pasaron casi cinco años en la vida de Internet antes de que alguien hiciera un esfuerzo concertado para archivarlo
Gran parte de nuestra primera actividad en línea ha desaparecido, así como las primeras páginas web.
En 2005, el estudiante Alex Tew tuvo una idea genial de un millón de dólares. El joven de 20 años estaba jugando con ideas para pagar su inminente título de negocios de tres años; Tew ya estaba preocupado de que el sobrecoste que tenía se multiplicara. Así que garabateó en una libreta: «Cómo convertirse en millonario».Veinte minutos después tenía lo que creía que era la respuesta.
The Million Dollar Homepage
Tew creó un sitio web llamado Million Dollar Homepage. El modelo del sitio era casi obscenamente simple: en él había un millón de píxeles de espacio publicitario, los píxeles disponibles para comprar en bloques de 100 a un dólar por píxel. Una vez que los compraste, eran tuyos para siempre. Cuando se vendiera el millón de píxeles, Tew era millonario. Al menos, ese era el plan.
Su lanzamiento
La página web de Million Dollar Homepage se lanzó el 26 de agosto de 2005, después de que Tew hubiera gastado la gran suma de 50 euros en el registro del dominio y la configuración del hosting. Los anunciantes compraban píxeles y proporcionaban un enlace, una pequeña imagen y una pequeña cantidad de texto para cuando el cursor flotaba sobre su imagen.
Después de poco más de un mes, gracias al boca a boca y a la creciente atención de los medios de comunicación, la página web de Tew había recaudado más de 250.000 dólares. En enero de 2006, los últimos 1.000 píxeles se vendieron en una subasta por 38.100 dólares (21.500 libras esterlinas); Tew había ganado su millón.
La página de inicio del Millón de Dólares todavía está online, casi una década y media después de su creación. Muchos de los clientes -entre los que se encuentran el periódico británico The Times, el servicio de viajes Cheapflights.com, el portal en línea Yahoo! y el dúo de rock Tenacious D- han tenido 15 años de publicidad por ese pago único. El sitio todavía tiene varios miles de visitantes cada día; probablemente ha sido una muy buena inversión.
La página de inicio del Millón de Dólares está ahora llena de enlaces a sitios que ya no existen. Tew, que ahora dirige la aplicación de meditación y atención plena Calma, se convirtió en millonario. Pero la página de inicio que creó también se ha convertido en otra cosa: un museo vivo de una era de Internet anterior.
Quince años pueden no parecer mucho tiempo, pero en términos de Internet es como una era geológica. Alrededor del 40% de los enlaces en la página de inicio de Un Millón de Píxeles ahora enlazan a sitios muertos. Muchos de los otros ahora apuntan a dominios completamente nuevos, su URL original ha sido vendida a nuevos propietarios.
La página de inicio del Millón de Dólares muestra que la decadencia de este primer período de Internet es casi invisible. En el mundo offline, el cierre de, digamos, un periódico local es a menudo ampliamente reportado. Pero los sitios en línea mueren, a menudo sin fanfarria, y el primer indicio de que ya no existen es cuando se hace clic en un enlace que se encuentra con una página en blanco.
El archivo de Internet
Hace aproximadamente una década, pasé dos años trabajando en un blog de música rock y en la sección de música de AOL, el pionero de Internet que ahora es propiedad de la compañía telefónica estadounidense Verizon. He editado o escrito cientos de reseñas en vivo, noticias musicales, entrevistas a artistas y listados. Facebook y Twitter ya eran conductores masivos de audiencia, y los teléfonos inteligentes nos conectaban a la Web entre el trabajo y el hogar; navegar por la Web se había convertido en una actividad las 24 horas del día.
Si no hubiera creado el Archivo de Internet y comenzado a guardar cosas sin esperar el permiso de nadie, lo habríamos perdido todo.
Podría, razonablemente, asumir que si alguna vez necesitara mostrar pruebas de mi tiempo allí, sólo estaría a una búsqueda en Google. Pero estaría equivocado. En abril de 2013, AOL cerró abruptamente todos sus sitios de música – y el trabajo colectivo de docenas de editores y cientos de colaboradores durante muchos años desapareció. Poco queda, aparte de un puñado de artículos guardados por el Archivo de Internet, una fundación sin fines de lucro con sede en San Francisco creada a finales de los años 90 por el ingeniero informático Brewster Kahle.
Es la más prominente de una serie de organizaciones de todo el mundo que intentan rescatar algunos de los últimos vestigios de la primera década de presencia de la humanidad en Internet antes de que desaparezca por completo.
Dame Wendy Hall, directora ejecutiva del Instituto de Ciencias Web de la Universidad de Southampton, es inequívoca sobre el trabajo del archivo: «Si no fuera por ellos no tendríamos nada» del material inicial, dice. «Si Brewster Kahle no hubiera creado el Archivo de Internet y empezado a guardar cosas – sin esperar el permiso de nadie – lo habríamos perdido todo.»
La llegada y el crecimiento de Internet nos cogió por sorpresa
Dame Wendy dice que los archivos y las bibliotecas nacionales tienen experiencia en el mantenimiento de libros, periódicos y revistas porque la impresión ha existido durante mucho tiempo. Pero la llegada de Internet -y la rapidez con la que se convirtió en una forma masiva de comunicación y expresión– puede haberlos cogido por sorpresa. Los intentos de archivar Internet, en muchas áreas, que han estado jugando a ponerse al día desde entonces. «La Biblioteca Británica tenía que tener una copia de todos los periódicos locales publicados en Reindo unido», dice. Como los periódicos han pasado de la impresión a la Web, el archivo toma una forma diferente. ¿Son estos sitios web un recurso tan vital como los documentos que los precedieron?
Los archivos de periódicos también son vulnerables a perderse cuando las publicaciones se cierran o se fusionan con otros títulos. «Me imagino que la mayoría de los periódicos tendrán algún tipo de archivo«, dice. «Pero eso se puede perder si no se archiva correctamente.»
¿Quién va a pagar por ello? Producimos mucho más contenido que antes
Un problema importante al intentar archivar Internet es que nunca se queda quieto. Cada minuto – cada segundo – más fotos, entradas de blog, vídeos, noticias y comentarios se añaden a la pila. Aunque el precio del almacenamiento digital ha bajado drásticamente, archivar todo este material sigue costando dinero. «¿Quién va a pagar por ello?», pregunta Dame Wendy. «Producimos mucho más material que antes.»
En el Reino Unido, por ejemplo, el papel de la conservación digital ha recaído en parte en la Biblioteca Británica. La biblioteca gestiona el Web Archive del Reino Unido, que ha estado recopilando sitios web con permiso desde 2004. Jason Webber, gerente del archivo, dice que el problema es mucho mayor de lo que la mayoría de la gente cree.
«No es sólo el material inicial. La mayor parte de Internet no está siendo almacenada», dice.
«El Archivo de Internet comenzó a crear páginas de archivos en 1996. Eso es cinco años después de que se crearan las primeras páginas web. No hay nada de esa época que haya sido copiado de la web en vivo». Incluso la primera página web creada en 1991 ya no existe; la página que se puede ver en el World Wide Web Consortium es una copia hecha un año después.
Durante gran parte de los primeros cinco años de la Web, gran parte del material publicado en España terminó con la designación .com. Fue sólo en 1996 que la Web comenzó a ver la creación de sitios más generales, ya que los sitios web comerciales empezaron a ser más numerosos que los académicos.
Creo que ha habido un nivel muy bajo de conciencia de que falta algo. La Biblioteca Británica hace un «rastreo de dominios» cada año – guardando todo lo que se publica en el Reino Unido. «Tratamos de conseguirlo todo, pero sólo lo hacemos una vez al año. Pero el tope para muchos de estos sitios está fijado en 500MB; eso cubre muchos sitios más pequeños, pero sólo tienes que tener unos pocos vídeos allí y ese límite se alcanza bastante rápido». Sin embargo, los sitios web de noticias como BBC News se rastrean con más frecuencia. La biblioteca, dice Webber, ha tratado de construir una imagen lo más completa posible de eventos como Brexit, los Juegos Olímpicos de Londres 2012 y el centenario de la Primera Guerra Mundial.
«Creo que ha habido un nivel muy bajo de conciencia de que falta algo«, dice Webber. «El mundo digital es muy efímero, miramos nuestros teléfonos, las cosas cambian y realmente no pensamos en ello. Pero ahora la gente se está dando cuenta de lo mucho que podríamos estar perdiendo«.
Pero, dice Webber, las únicas organizaciones materiales que tienen derecho a reunirse son visibles al público; una cantidad aún mayor de datos de importancia cultural o histórica se encuentran en los archivos de la gente, como sus discos duros. Pero pocos de nosotros los guardamos para la posteridad.
«La Biblioteca Británica está llena de cartas entre personas. Hay intercambios entre políticos, o cartas de amor, y estas cosas son muy importantes para algunas personas«.
El material digital no se tuvo tanto en cuenta
Los archivadores conocían la importancia de salvar los periódicos, pero reaccionaron con más lentitud ante el aumento del material digital.
Consideramos el material que publicamos en las redes sociales como algo que siempre estará ahí, a sólo un clic de distancia. Pero la reciente pérdida de unos 12 años de música y fotos en el sitio social pionero MySpace -que una vez fue el sitio web más popular de los EE.UU.- muestra que incluso el material almacenado en el más grande de los sitios puede no ser seguro.
E incluso los servicios de Google no son inmunes. Google+, el intento del gigante de la búsqueda de una red social rival en Facebook, cerró el 2 de abril. ¿Todos sus usuarios hicieron copias de seguridad de las fotos y recuerdos que compartieron en él?
«Poner tus fotos en Facebook no es archivarlas, porque un día Facebook no existirá», dice Webber. Si tiene alguna duda sobre la naturaleza temporal de la Web, tómese unos minutos para navegar a través de la página principal del Millón de Dólares. Es el testimonio de lo rápido que nuestro pasado en línea se está desvaneciendo.
Información selectiva
Hay otra cara de la pérdida de datos. Dame Wendy señala que el hecho de no archivar historias de sitios web de noticias podría conducir a una visión selectiva de la historia: por ejemplo, los nuevos gobiernos optan por no guardar las historias o los archivos que las han arrojado bajo una mala praxis.
«Tan pronto como hay un cambio de gobierno o una reestructuración se cierran los sitios», dice Jane Winters, profesora de humanidades digitales en la Universidad de Londres. «O mira como ejemplo las páginas web de las campañas electorales, que por su naturaleza son temporales.»
A veces los sitios que se pierden se hacen eco de más cambios sísmicos; las muertes y nacimientos de las propias naciones. «Sucedió con Yugoslavia; .yu era el dominio de primer nivel para Yugoslavia, y eso terminó cuando se derrumbó políticamente el país. Hay un investigador que está tratando de reconstruir lo que había antes de la ruptura», nos cuenta.
Hay, tal vez, un pequeño resquicio de esperanza. «Vengo de un pasado histórico, y siempre hemos tenido que lidiar con vacíos en los registros históricos, algunos de los cuales conocemos, y otros de los que no tenemos ni idea.»
Dame Wendy Hall también ve paralelismos con lo físico. Cuando tenía 15 años, a finales de los 60, apareció como parte del público en una grabación del programa de música de la BBC Top of the Pops.
El espectáculo se presentó el día de Navidad. «La televisión estaba encendida, y mi madre dijo: ‘¡Ahí estás! Pero me lo perdí. Y desde entonces he ido a la BBC y he intentado conseguir una copia de ella, pero grabaron encima de lo grabado… Nunca llegué a verlo.»