Más de 340 medios de comunicación locales en Estados Unidos están limitando la capacidad del Internet Archive de acceder a sus contenidos y preservarlos.[s] No se trata de una disputa técnica menor. Es la preservación de archivos periodísticos colapsando en tiempo real, impulsada por una respuesta desesperada al raspado de datos por parte de la inteligencia artificial, que podría causar más daño a largo plazo que el propio raspado.
La postura es clara: los medios que bloquean al Internet Archive están sacrificando su propio registro histórico a cambio de la ilusión de protección contra la IA. Están acelerando el mismo borrado que deberían combatir. Los periodistas independientes que entienden esto están construyendo infraestructura alternativa, y serán ellos cuyos trabajos sobrevivan a la próxima década.
La crisis de preservación de archivos periodísticos
En enero de 2026, Nieman Lab informó que 241 sitios de noticias de nueve países bloqueaban explícitamente al menos a uno de los bots de rastreo del Internet Archive.[s] Para mayo, la muestra actualizada de Nieman Lab había crecido a 382 sitios con bloqueos, 342 de ellos locales. Muchos pertenecen a cinco de los siete mayores editores de noticias locales: USA Today Co., McClatchy, Advance Local, MediaNews Group y Tribune Publishing. Los dos últimos son subsidiarias de Alden Global Capital, el fondo de cobertura infame por desmantelar redacciones.
La razón esgrimida es el raspado de datos por IA. The New York Times afirmó que bloqueaba al bot del Internet Archive porque la Wayback Machine proporciona acceso no autorizado a sus contenidos, incluso a empresas de IA.[s]
Este razonamiento tiene un fallo fatal. Como señaló el científico informático Michael Nelson: «Common Crawl e Internet Archive son ampliamente considerados los ‘buenos’ y son utilizados por los ‘malos’ como OpenAI. En la aversión de todos a no ser controlados por los modelos de lenguaje, creo que los buenos están sufriendo daños colaterales».[s]
El daño colateral es la propia preservación de archivos periodísticos. Cuando un periódico local cierra o cambia de sistema de gestión de contenidos, la Wayback Machine suele ser un registro crucial que sobrevive. En 2024, miles de artículos desaparecieron de periódicos del oeste de Massachusetts durante una migración de CMS. Cuando The Hook, un semanario de Charlottesville, cerró en 2012, su sitio archivado dejó de estar en línea una década después, borrando más de 22,000 historias.[s]
«Bloquear a los rastreadores web del Internet Archive amenaza uno de los métodos más efectivos que tenemos para capturar y almacenar contenido periodístico a largo plazo», dijo Edward McCain, bibliotecario de periodismo en la Universidad de Missouri. «En el presente podemos tener algunas soluciones alternativas, pero a la larga, esto debilita un eslabón vital en los materiales de fuentes primarias que necesitamos para entender de dónde venimos y hacia dónde queremos ir».[s]
La historia se repite: archivos destruidos por negligencia gradual
El patrón es conocido. Como la Biblioteca de Alejandría, cuyas colecciones fueron archivos destruidos gradualmente por negligencia en lugar de por un incendio dramático, el registro digital del periodismo se está erosionando con miles de pequeñas decisiones. Cada medio que bloquea a la Wayback Machine, cada migración de CMS que pierde enlaces, cada cierre sin traspaso archivístico, va minando el registro público.
Brewster Kahle, fundador del Internet Archive, advirtió que «si los editores limitan a las bibliotecas, como el Internet Archive, el público tendrá menos acceso al registro histórico».[s]
Meredith Broussard, profesora de la Universidad de Nueva York, señaló el problema de fondo: «Todos los medios de comunicación, especialmente los locales, suelen lanzarse pensando: ‘vamos a publicar cosas en internet y estarán ahí para siempre’, y eso no es cierto. Quien le dijo que internet es para siempre, le mintió».[s]
La respuesta descentralizada
Mientras las cadenas corporativas limitan el acceso a los archivos, los periodistas independientes están construyendo infraestructura alternativa. El informe de impacto 2025 de FFDW señala que la Filecoin Foundation for the Decentralized Web se asoció con Fasila para preservar periodismo crítico, apoyando a más de 20 periodistas y archivando reportajes importantes junto con sus registros digitales asociados. Estos materiales se almacenan en la red Filecoin y se hacen accesibles mediante IPFS a través del archivo Alive-In de Fasila.[s]
No se trata de un experimento marginal. El proyecto «presenta las historias archivadas en una plataforma dedicada, rica en metadatos, que facilita su descubrimiento y uso por parte de periodistas, investigadores, educadores y cineastas, demostrando un modelo replicable para salvaguardar la memoria cultural mediante almacenamiento descentralizado».[s]
En el mismo informe de 2025, FFDW indicó que su trabajo con la Freedom of the Press Foundation apoyó mejoras en infraestructura, experiencia de usuario y seguridad para herramientas descentralizadas utilizadas por periodistas en todo el mundo.[s] Esta colaboración incluye SecureDrop, el sistema de código abierto que usan las redacciones para el intercambio seguro de documentos y la comunicación entre periodistas y fuentes.
La lógica es sencilla: si las plataformas pueden bloquearle, y si los archivos pueden excluirle, entonces un camino duradero para la preservación de archivos periodísticos es la infraestructura que usted controla.
La independencia de las plataformas como estrategia de supervivencia
La tendencia general apunta hacia infraestructura autogestionada. «Las redacciones recuperarán el control sobre la tecnología», predijo Ben Werdmuller de ProPublica. «La colaboración y los equipos independientes de código abierto, alineados con la misión, crearán herramientas que satisfagan las necesidades básicas de las redacciones, incluyendo comunicación segura, analíticas que preserven la privacidad y distribución sostenible».[s]
LaSharah S. Bunting, de The 19th, argumentó que «las redacciones más sólidas en 2026 no serán las que persigan cada cambio de plataforma o tendencia empresarial, sino las que estén preparadas para sobrevivir a múltiples futuros a la vez».[s]
Para los periodistas individuales, esto significa replantearse la dependencia de las plataformas. Un profesional advirtió que, a medida que Substack se popularizaba, evolucionó hacia una plataforma social más completa y comenzó a encerrar a los usuarios en un entorno cerrado del que es más difícil salir.[s]
La alternativa es infraestructura de código abierto y bajo control propio. El mismo crítico enumeró las ventajas de Ghost: software de código abierto, control del usuario sobre los datos y soporte para Fediverse.[s] WordPress, WriteFreely y otras opciones autogestionadas ofrecen una independencia similar.
Lo que está en juego es político
No se trata solo de un problema técnico o empresarial. El contexto es la gran consolidación mediática. La FCC aprobó la fusión Nexstar-Tegna eximiendo las normas que prohíben a cualquier cadena llegar a más del 39 por ciento de los hogares estadounidenses; la entidad resultante alcanzará el 80 por ciento.[s]
«La fusión, si sobrevive a los desafíos legales, consolidaría aún más las noticias de televisión y cable en manos de propietarios afines a Trump y con inclinaciones de derecha», señaló Investigative Post.[s]
La periodista y autora Nora Benavidez, citada por Investigative Post, argumentó que las mayores empresas de medios propiedad de multimillonarios buscan el favor de Trump para proteger intereses financieros y empresariales que pueden chocar con las misiones periodísticas.[s]
Cuando la captura por parte de los propietarios y la dependencia de las plataformas se combinan con el bloqueo de archivos, el resultado es un periodismo que puede ser borrado, redirigido o silenciado a voluntad. Los reporteros que reconocen esto, como los periodistas asesinados por su trabajo en países donde la libertad de prensa ya se ha derrumbado, entienden que la infraestructura no es neutral.
El contraargumento
Los editores que bloquean al Internet Archive no actúan sin motivo. Las empresas de IA han raspado agresivamente contenido protegido por derechos de autor. Mike Reed, director ejecutivo de Gannett, dijo que OpenAI envió unos 70 millones de solicitudes de bots a las plataformas locales y de USA Today de Gannett en septiembre de 2025.[s] La presión financiera sobre los medios es real, y los acuerdos de licencia representan una posible fuente de ingresos.
Nick Thompson, director ejecutivo de The Atlantic, explicó la lógica: «Debido a los daños que pueden ocasionarse cuando se permite que todo su contenido sea raspado, y debido a toda la influencia que se pierde, habrá productos valiosos a los que antes proporcionaba sus datos y ahora ya no puede».[s]
Esto es comprensible. Pero también es miope. La influencia que se preserva es la que se ejerce en las negociaciones de licencias con IA. El costo es el propio registro público. Los editores están optimizando para obtener un flujo de ingresos que puede materializarse o no, mientras socavan la preservación de archivos periodísticos de la que dependen sus lectores.
Mientras tanto, las filtraciones de datos gubernamentales exponen a millones de ciudadanos al robo de identidad y la vigilancia, demostrando que la infraestructura digital centralizada es inherentemente frágil. La lección se extiende al periodismo: confiar en un único mecanismo de preservación es un riesgo.
Qué debería cambiar
En primer lugar, los medios de comunicación deberían separar las negociaciones de licencias con IA del acceso a los archivos. Bloquear al Internet Archive no impide el raspado de datos por IA; debilita la preservación de archivos periodísticos. Son problemas distintos que requieren soluciones diferentes.
En segundo lugar, los periodistas independientes deberían construir infraestructura que controlen. Esto significa sitios web autogestionados, listas de correo propias y archivos en almacenamiento descentralizado. Ghost, WordPress, IPFS: las herramientas existen.
En tercer lugar, los financiadores y fundaciones deberían apoyar directamente la preservación de archivos periodísticos. En diciembre de 2025, el Internet Archive se asoció con el Poynter Institute y Investigative Reporters and Editors en una iniciativa que busca capacitar a 300 redacciones en preservación digital y en el uso de los servicios del Internet Archive para fines de 2027.[s] Es necesario escalar este esfuerzo.
En cuarto lugar, las redacciones deberían tratar sus archivos como activos institucionales. El Reuters Institute documentó cómo The Economist, Charlie Hebdo y Archivi.ng de Nigeria están revitalizando sus archivos como herramientas editoriales. «Lo primero que pueden hacer las redacciones es facilitar ridículamente a sus propios periodistas el descubrimiento de sus archivos internos», dijo Fu’ad Lawal de Archivi.ng.[s]
Charlie Hebdo utiliza sus archivos para incorporar a nuevos periodistas, conectándolos con la historia y la identidad editorial de la publicación. «Muchos de nuestros lectores han seguido el periódico durante décadas. A menudo conocen el periódico mejor que nosotros. Así que cuando recibimos críticas, ayuda entender de dónde vienen, históricamente».[s]
La oportunidad
En el caos hay una oportunidad estructural. El colapso de credibilidad de las redes sociales está generando demanda de periodismo verificado y arraigado en la comunidad. «En 2026, las plataformas de redes sociales enfrentarán un problema significativo de oferta: la oferta es cada vez más falsa, y lo falso es cada vez más indistinguible de lo real», escribió Jonas Kaiser, profesor de la Universidad de Suffolk.[s]
Kaiser argumentó que, a medida que las redes sociales adoptan la inautenticidad, el periodismo centrado en la comunidad encontrará tanto una audiencia como un renovado propósito democrático.[s]
Este es el momento para que la preservación de archivos periodísticos se convierta en una prioridad del movimiento, no en un pensamiento posterior. Los periodistas que controlan su propia infraestructura, que mantienen sus propios archivos, que construyen relaciones directas con sus comunidades: serán ellos quienes sigan publicando cuando las plataformas hayan seguido adelante.
Cuando el registro desaparece, la capacidad de exigir cuentas al poder desaparece con él.
La elección no es entre proteger el contenido de la IA y preservarlo para la historia. La elección es si poseer su infraestructura o alquilarla a entidades que, en última instancia, optimizarán en contra de sus intereses. El periodismo independiente siempre ha requerido independencia. Ahora requiere archivos independientes.



