Confidentialité numérique Intemporel 10 min de lecture

L’ère numérique obscure efface notre histoire

Cet article a été traduit automatiquement de l'anglais par une IA. Lire la version originale en anglais →
Salle de serveurs illustrant une infrastructure vulnérable à l’ère numérique obscure
🎧 Écouter
Apr 18, 2026
Mode de lecture

L’ère numérique obscure a déjà commencé. En deux mille dix-neuf, MySpace a annoncé avoir perdu douze années de musique et de photos, affectant plus de quatorze millions d’artistes et cinquante millions de titres[s]. Les données n’ont pas été volées. Elles se sont tout simplement évaporées lors d’une migration de serveurs, et l’entreprise n’a pas jugé utile de les récupérer.

Ce n’était pas un incident isolé. Une analyse du Pew Research Center publiée en deux mille vingt-quatre révèle que trente-huit pour cent des pages web existant en deux mille treize ne sont plus accessibles aujourd’hui[s]. Cela représente plus d’un tiers des archives historiques d’Internet, disparues en seulement dix ans. L’étude montre également que cinquante-quatre pour cent des pages Wikipédia contiennent au moins un lien brisé, et que vingt-trois pour cent des sites d’actualités renvoient vers des sources qui n’existent plus. Dans cette ère numérique obscure, la préservation des données devient un défi majeur.

Comprendre l’ère numérique obscure

Le terme « ère numérique obscure » a été popularisé par le spécialiste de l’information Terry Kuny en mille neuf cent quatre-vingt-dix-sept. Il mettait en garde contre le fait que « nous entrons dans une époque où une grande partie de ce que nous savons aujourd’hui, de ce qui est codé et écrit électroniquement, sera perdu à jamais »[s]. L’ironie est cruelle : nous produisons plus de données que n’importe quelle civilisation dans l’histoire, pourtant les historiens du futur en sauront peut-être moins sur notre époque que nous n’en savons sur la Rome antique.

Le problème n’est pas que les fichiers numériques se dégradent comme le papier. Le problème, c’est qu’ils nécessitent des logiciels et du matériel spécifiques pour être lus. Les manuscrits de la mer Morte, fabriqués sur parchemin et papyrus, restent lisibles près de deux millénaires après leur création. Un DVD a une durée de vie estimée à environ cent ans[s]. Mais même ce siècle suppose que vous aurez encore un lecteur DVD et un logiciel capable d’interpréter le format du disque.

Quand le nuage s’évapore

Le passage au stockage dans le cloud a accéléré ce problème. Quand vous stockez des photos sur Instagram, de la musique sur Spotify ou des documents sur Google Drive, vous ne possédez pas vraiment ces fichiers. Vous louez simplement un accès. Et cet accès peut être révoqué à tout moment.

Prenez l’exemple des clients de Revolv, une entreprise spécialisée dans les maisons intelligentes. Un matin, ils se sont réveillés pour découvrir que toutes leurs fonctionnalités domotiques étaient hors service[s]. L’entreprise avait été rachetée par Nest, qui avait décidé de fermer les serveurs de Revolv. Les appareils physiques, achetés par les clients, sont devenus inutilisables du jour au lendemain parce qu’ils dépendaient d’une infrastructure cloud qui n’existait plus.

Une enquête Harris Poll de deux mille vingt-deux a révélé que cinquante-quatre pour cent des propriétaires d’ordinateurs ont déjà perdu des données[s]. Parmi eux, quarante-huit pour cent ont subi une panne de disque dur externe, et quarante-quatre pour cent ont perdu l’accès à des données lorsque un disque partagé ou synchronisé a été supprimé. Pourtant, environ vingt pour cent des gens n’ont jamais sauvegardé leur ordinateur.

La récupération Warhol

Parfois, les données peuvent être sauvées, mais cela demande des efforts exceptionnels. En deux mille quatorze, des enseignants et étudiants de l’université Carnegie Mellon ont récupéré une douzaine d’œuvres d’art inconnues d’Andy Warhol[s]. Les images étaient prisonnières de disquettes Amiga vieillissantes datant de mille neuf cent quatre-vingt-cinq. Ces créations purement numériques étaient restées dans les archives d’un musée pendant près de trente ans, illisibles parce qu’aucun ordinateur moderne ne pouvait interpréter leur format obsolète.

La récupération a nécessité que des experts en criminalistique inversent le format inconnu, révélant finalement vingt-huit images numériques jamais vues auparavant. La plupart des archives ne disposent pas du département d’informatique de Carnegie Mellon. La plupart des données disparaissent simplement dans cette ère numérique obscure.

Que faire face à l’ère numérique obscure ?

L’ère numérique obscure n’est pas une fatalité, mais l’éviter demande des efforts. Conservez plusieurs copies de vos fichiers importants sur différents supports et formats. Ne comptez pas uniquement sur les services cloud. Les disques durs externes tombent en panne, tout comme les fournisseurs de cloud. La solution la plus sûre combine sauvegardes locales et cloud.

Envisagez des alternatives analogiques pour les documents vraiment irremplaçables. Imprimez les photos importantes. Conservez les documents critiques sur papier. Cela peut sembler démodé, mais le papier a fait ses preuves en matière de survie sur des siècles. Votre compte Google Photos, lui, ne durera pas aussi longtemps dans cette ère numérique obscure.

L’ère numérique obscure a déjà commencé, et les mécanismes techniques qui l’alimentent sont bien plus complexes qu’une simple perte de données. En deux mille dix-neuf, MySpace a signalé la perte de douze années de contenu téléchargé par les utilisateurs, soit environ cinquante millions de titres de quatorze millions d’artistes, lors de ce que l’entreprise a qualifié de « migration de serveurs »[s]. Le journaliste technologique Andy Baio a publiquement mis en doute le caractère accidentel de cette perte : « Une incompétence flagrante peut nuire à l’image, mais cela reste préférable à avouer qu’on ne peut pas se donner la peine d’assumer l’effort et le coût de la migration et de l’hébergement de cinquante millions de vieux fichiers MP3. »

Une analyse du Pew Research Center publiée en deux mille vingt-quatre a quantifié l’ampleur de la dégradation du web dans cette ère numérique obscure : trente-huit pour cent des pages web existant en deux mille treize ne sont plus accessibles, et même les pages de deux mille vingt-et-un affichaient un taux d’inaccessibilité d’environ vingt pour cent seulement deux ans plus tard[s]. En compilant des pages échantillonnées entre deux mille treize et deux mille vingt-trois via Common Crawl, les chercheurs ont constaté que vingt-cinq pour cent n’étaient plus accessibles : seize pour cent étaient individuellement inaccessibles alors que leur domaine racine restait fonctionnel, et neuf pour cent avaient disparu parce que leur domaine racine entier était hors ligne.

Comprendre les mécanismes de l’ère numérique obscure

Les échecs de préservation des données se répartissent en trois catégories : la longévité du matériel, l’accessibilité des formats et la compréhensibilité[s]. Le matériel tombe en panne avec le temps. L’accessibilité des formats est compromise lorsque des supports comme les disquettes cinq pouces et quart deviennent physiquement illisibles par les équipements modernes. La compréhensibilité échoue lorsque les formats de fichiers deviennent impossibles à interpréter par un quelconque logiciel, même si les bits bruts restent intacts.

L’ampleur de l’accumulation des données aggrave ces problèmes. Le stockage mondial de données atteint des centaines de zettaoctets, et Deloitte prévoit que les centres de données consommeront cinq cent trente-six térawattheuresUnité d'énergie électrique égale à mille milliards de wattheures, utilisée pour mesurer la consommation d'électricité à grande échelle. d’électricité en deux mille vingt-cinq, soit environ deux pour cent de la consommation mondiale, avec un potentiel doublement à mille soixante-cinq térawattheures d’ici deux mille trente[s]. Cette infrastructure nécessite un approvisionnement continu en électricité, un refroidissement et une maintenance. Toute interruption menace les données qu’elle abrite.

Dépendance au cloud et arrêt des services

Le modèle d’abonnement crée des incitations structurelles à l’obsolescence programméeLa pratique de concevoir et fabriquer des produits pour qu'ils défaillent, se dégradent ou deviennent fonctionnellement inutilisables après une période prédéterminée, indépendamment de leur durabilité physique ou de la capacité technique du fabricant à prolonger leur durée de vie.. Comme le soulignent les chercheurs de PIRG, « pour vous facturer mensuellement l’activation et la désactivation d’une fonctionnalité, l’appareil doit se connecter à Internet et exécuter cette fonctionnalité via un logiciel »[s]. Ce choix architectural rend les appareils dépendants de serveurs externes pour leur fonctionnement de base. Lorsque les serveurs de Revolv ont été mis hors ligne, le matériel acheté est devenu aussi utile que des presse-papiers.

Même les institutions dédiées à la préservation se heurtent à des contraintes légales. En décembre deux mille vingt-quatre, l’Internet Archive a annoncé qu’elle ne chercherait pas à obtenir un réexamen de l’affaire Hachette contre Internet Archive par la Cour suprême[s]. Le jugement a rendu inaccessibles plus de cinq cent mille livres via le programme de prêt numérique contrôlé de l’Archive. L’organisation qui préserve plus de sept cents milliards de pages web grâce à sa Wayback Machine se voit désormais restreinte dans la préservation des livres, un défi supplémentaire dans cette ère numérique obscure.

Obsolescence des formatsQuand un format de fichier ne peut plus être lu par aucun logiciel disponible, rendant les données inaccessibles même si le support est intact. et récupération

La récupération des œuvres de Warhol en deux mille quatorze illustre à la fois la possibilité et la difficulté de sauver des données issues de formats obsolètes[s]. Les experts en criminalistique du Computer Club de Carnegie Mellon ont découvert des fichiers portant des noms comme « campbells.pic » et « marilyn1.pic » sur des disquettes Amiga, mais ces fichiers étaient stockés dans un format totalement inconnu, non reconnu par aucun utilitaire. L’équipe a dû rétroconcevoir le format et extraire vingt-huit images, dont au moins onze arboraient la signature de Warhol.

Cette récupération a nécessité des ressources institutionnelles, des connaissances expertes et la préservation physique des supports pendant trente ans. La Long Now Foundation a forgé le terme « ère numérique obscure » lors d’une conférence sur la continuité numérique en mille neuf cent quatre-vingt-dix-huit et explore depuis des solutions comme le Rosetta Disk, un disque en nickel gravé de textes microscopiques lisibles sans appareil électronique[s]. Le Project Silica de Microsoft stocke les données dans du verre de quartz, avec une durée de vie potentielle de dizaines de milliers d’années. Le Arctic Code Vault de GitHub conserve des instantanés de dépôts dans le pergélisol arctique.

Stratégies d’atténuation

L’enquête deux mille vingt-deux de Backblaze a révélé des comportements préoccupants en matière de sauvegarde : seulement dix pour cent des utilisateurs effectuent des sauvegardes quotidiennes, tandis que vingt pour cent n’en ont jamais fait[s]. Parmi ceux qui utilisent des services de sauvegarde, soixante-et-un pour cent expriment une faible confiance dans le fait que leur système protège réellement toutes leurs données. L’enquête a également montré que cinquante-sept pour cent des utilisateurs qui sauvegardent « dans le cloud » utilisent des services de synchronisation plutôt que de véritables solutions de sauvegarde, une distinction cruciale puisque les services de synchronisation propagent les suppressions et les corruptions plutôt que de préserver les états historiques.

L’atténuation technique exige la stratégie de sauvegarde trois-deux-un : trois copies des données, sur deux types de supports différents, avec une copie stockée hors site. Au-delà de la redondance, la migration des formats doit intervenir avant que les supports ne deviennent illisibles. Dans cette ère numérique obscure, le défi n’est pas principalement un problème de stockage ; c’est un problème de maintenance. Sans un effort continu pour migrer les formats, rafraîchir les supports et maintenir l’infrastructure d’accès, les données deviennent inaccessibles, quelle que soit la rigueur de leur préservation initiale.

Qu'avez-vous pensé de cet article ?
Partager cet article

Une erreur ? Signalez-la

Sources