Archive.today
Archive.today (anciennement archive.is) est un site web dont le but est d'archiver des pages web et dont le centre de données est situé en France, dans le Nord-Pas-de-Calais. Il fonctionne en utilisant Apache Hadoop et Apache Accumulo.
Adresse | Site officiel |
---|---|
Publicité | non |
Type de site | Archivage web |
Langue | anglais |
Inscription | non |
Lancement | 2012 |
État actuel | actif |
Particularité
Sa particularité est de capturer à la demande les pages web page par page afin de ne pas être affecté par l'éventuelle présence d'un fichier robots.txt[1]. Il est donc impossible d'interdire l'archivage de son site web, ce qui explique pourquoi ce site est fréquemment critiqué.
Références
- (en) « Comparison of web archiving services », sur dandascalescu.com, (consulté le ).
Voir aussi
Articles connexes
Liens externes
- (en) « Create publicly available web page archives with Archive.is », sur ghacks.net.
Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.