Aspirateur de site web
Un aspirateur de site Web est un type de logiciel qui tĂ©lĂ©charge toutes les donnĂ©es contenues par un site web pour les sauvegarder sur un support de mĂ©moire local de l'utilisateur (typiquement, un disque dur), ce qui permet de consulter les pages correspondantes sans ĂȘtre connectĂ© Ă Internet.
Description
Le principe de ce type de logiciel repose sur l'analyse des pages web du site Ă rĂ©cupĂ©rer : un index des Ă©lĂ©ments composant chacune d'elles est Ă©tabli (texte HTML de la page, images, sons, vidĂ©os, animations, etc.) et la profondeur d'analyse peut ĂȘtre paramĂ©trĂ©e pour tĂ©lĂ©charger plus ou moins de fichiers, selon qu'ils se trouvent ou non sur le mĂȘme site par exemple.
Une fois ces fichiers enregistrés sur le disque dur, l'ouverture d'un fichier HTML dans un navigateur s'accompagne du chargement des éléments associés.
Cette pratique peut ĂȘtre utilisĂ©e pour effectuer une copie de sauvegarde d'un site (ou crĂ©er un site miroir), pour importer des Ă©lĂ©ments Ă publier par ailleurs ou encore pour archiver des pages qui, enregistrĂ©es sur une unitĂ© de sauvegarde (disque externe, clĂ© USB, etc.), pourront ensuite ĂȘtre consultĂ©es sur un ordinateur dĂ©pourvu de connexion Ă Internet.
Aspects juridiques
Ces logiciels sont inĂ©galement apprĂ©ciĂ©s des concepteurs de sites web et des webmasters dans la mesure oĂč ils faussent les statistiques de visite et peuvent contribuer Ă violer les droits d'auteurs et les droits liĂ©s Ă la propriĂ©tĂ© intellectuelle[1]. Ils peuvent aussi consommer abusivement les ressources du serveur web.
La loi Godfrain du ne couvre que les systĂšmes d'information faisant l'objet d'une protection technique. Ainsi, l'aspiration de lâarborescence d'un site ne sera pas considĂ©rĂ©e comme une attaque informatique en droit français au sens de lâarticle 323-1 du Nouveau Code PĂ©nal si aucune mesure technique d'interdiction d'accĂšs n'a Ă©tĂ© mise en place (exemple : fichier robots.txt) sauf si cette exploration entrave le fonctionnement « normal » dudit systĂšme[2]. Alors, il serait condamnable au sens de l'article 462-3 de cette mĂȘme loi[3].
Notes et références
Voir aussi
- Robot d'indexation (Web crawler en anglais)
- Web scraping
- Page web
- Site web
- Conception de site web
- Archivage Ă©lectronique
- Logiciels