Wikipedia a banni Archive.today de ses sources fiables. La décision, prise en février 2026 par les éditeurs de l’encyclopédie anglophone, fait suite à deux découvertes troublantes : le service d’archivage web menait une attaque DDoS contre un blogueur, et certaines de ses captures avaient été modifiées après coup.

Comment un archiveur du web est devenu attaquant

Tout commence en août 2023. Jani Patokallio, développeur finlandais basé à Sydney, publie sur son blog Gyrovague une enquête sur le mystérieux fondateur d’Archive.today. L’article passe relativement inaperçu. Deux ans plus tard, en novembre 2025, le FBI lance une assignation auprès du registraire Tucows pour identifier le propriétaire du domaine. Ars Technica et Heise Online couvrent l’affaire, et citent tous deux le billet de Patokallio.

La suite dérape vite. Le 8 janvier 2026, Patokallio reçoit une plainte GDPR réclamant le retrait de son article. Deux jours plus tard, un mail poli du webmaster d’Archive.today lui demande de retirer temporairement le billet. Il répond, mais n’obtient pas de réponse.

Le 14 janvier, un utilisateur de Hacker News signale un comportement étrange : la page CAPTCHA d’Archive.today contient un script JavaScript qui envoie des requêtes toutes les 300 millisecondes vers Gyrovague.com. Concrètement, chaque visiteur d’Archive.today qui tombait sur un CAPTCHA devenait, sans le savoir, un relais d’attaque DDoS contre le blog de Patokallio.

Des captures trafiquées, le vrai déclencheur

Pour Wikipedia, l’attaque DDoS est grave. Mais c’est un autre constat qui a motivé le bannissement : des preuves montrent que du contenu archivé sur Archive.today avait été modifié. Sur une encyclopédie qui repose sur la vérifiabilité des sources, c’est rédhibitoire.

Les éditeurs anglophones ont voté le retrait du service comme source acceptable. Les liens Archive.today ne sont plus autorisés comme références dans les articles Wikipedia.

Qui archive les archives ?

La question dépasse largement Wikipedia. Archive.today, contrairement à l’Internet Archive (Wayback Machine), est géré par un individu anonyme. On ne connaît pas son identité réelle, malgré l’enquête du FBI. Le service ne respecte pas le fichier robots.txt et revendique cette position ouvertement.

L’Internet Archive, lui, fonctionne comme une bibliothèque numérique à but non lucratif, avec une gouvernance connue, des comptes publiés, un conseil d’administration identifié. Deux philosophies radicalement différentes.

Le problème de fond, c’est la confiance. Quand un outil censé préserver le web commence à modifier ce qu’il conserve, la chaîne de vérification s’effondre. Les chercheurs, les journalistes, les éditeurs Wikipedia s’appuyaient sur ces archives comme preuve. Si la preuve peut être altérée, elle ne vaut plus rien.

Et la concentration des outils d’archivage amplifie le risque. Deux services dominent le marché : l’Internet Archive et Archive.today. Si l’un des deux tombe, ou triche, c’est la moitié de la mémoire du web qui vacille.

Un précédent inquiétant pour le web ouvert

L’épisode pose aussi la question des représailles numériques. Utiliser ses propres utilisateurs comme vecteur d’attaque DDoS contre un blogueur, c’est transformer un service public en arme. Ars Technica et Heise Online ont rapporté l’affaire FBI. Patokallio a documenté l’attaque avec captures d’écran et code source à l’appui. Le post Hacker News sur le sujet a dépassé les 350 points et 160 commentaires.

Wikipedia a tranché. Reste à voir si d’autres plateformes suivront, ou si Archive.today continuera de fonctionner comme si de rien n’était. Faut-il un cadre légal pour les services d’archivage web ? La question est posée.