AccueilđŸ‡«đŸ‡·Chercher

World Wide Web

Le World Wide Web (/ˌwɝld waÉȘd ˈwɛb/[alpha 1] ; littĂ©ralement la « toile (d’araignĂ©e) mondiale », abrĂ©gĂ© www ou le Web), la toile mondiale ou la toile[1], est un systĂšme hypertexte public fonctionnant sur Internet. Le Web permet de consulter, avec un navigateur, des pages accessibles sur des sites. L’image de la toile d’araignĂ©e vient des hyperliens qui lient les pages web entre elles[alpha 2].

Logo historique du World Wide Web par Robert Cailliau.
OĂč la toile est nĂ©e, plaque commĂ©morant la crĂ©ation du World Wide Web dans les locaux du CERN.

Le Web est une des applications d’Internet[2], distincte d’autres applications comme le courrier Ă©lectronique, la visioconfĂ©rence et le partage de fichiers en pair Ă  pair. InventĂ© en 1989-1990 par Tim Berners-Lee suivi de Robert Cailliau, c'est le Web qui a rendu les mĂ©dias grand public attentifs Ă  Internet. Depuis, le Web est frĂ©quemment confondu avec Internet[3] ; en particulier, le mot toile est souvent utilisĂ© dans les textes non techniques sans qu'il soit clair si l'auteur dĂ©signe le Web ou Internet.

Terminologie

Synonymes de World Wide Web

Le World Wide Web est dĂ©signĂ© par de nombreux noms et abrĂ©viations synonymes : WorldWideWeb, World Wide Web, World-wide Web, Web, WWW, W3, Toile d’araignĂ©e mondiale, Toile mondiale, Toile. Certains ont disparu. Le nom du projet originel « WorldWideWeb » est mentionnĂ© pour la premiĂšre fois dans une publication de 1990[4]. Les mots ont Ă©tĂ© rapidement sĂ©parĂ©s en World Wide Web pour amĂ©liorer la lisibilitĂ©. Le nom World-Wide Web a Ă©galement Ă©tĂ© utilisĂ© par les inventeurs du Web, mais le nom dĂ©sormais prĂ©conisĂ© par le World Wide Web Consortium (W3C) sĂ©pare les trois mots sans trait d’union[5]. Bien que « mondial » s’écrive world-wide ou worldwide en anglais, l’orthographe World Wide Web et l’abrĂ©viation Web sont maintenant bien Ă©tablies. Le terme World Wide Web est une allitĂ©ration appartenant au domaine des virelangues[6].

En inventant le Web, Tim Berners-Lee avait aussi pensĂ© Ă  d’autres noms, comme Information Mesh (maillage d’informations), Mine of Information ou encore The Information Mine (la mine d’informations, dont le sigle serait Tim). Le sigle WWW a Ă©tĂ© largement utilisĂ© pour abrĂ©ger World Wide Web avant que l’abrĂ©viation Web prenne le pas. WWW se prononce souvent trois double V, triple double V, vĂ©vĂ©vĂ© ou wĂ©wĂ©wĂ© (en Belgique). La prononciation laborieuse (en français comme en anglais) de WWW a sans doute prĂ©cipitĂ© son dĂ©clin Ă  l’oral. À l’écrit, les lettres www restent trĂšs utilisĂ©es dans les adresses Web et quelques autres conventions techniques. WWW est parfois abrĂ©gĂ© en W3, abrĂ©viation qu’on retrouve dans le sigle W3C du World Wide Web Consortium. Dans la seconde moitiĂ© des annĂ©es 1990, une blague rĂ©pandue prĂ©tendait que WWW signifiait World Wide Wait, soit « attente mondiale », car le rĂ©seau Internet Ă©tait engorgĂ© par la popularitĂ© grandissante du Web.

Pour Ă©crire « le web », l’usage de la minuscule est de plus en plus courant. L’Office quĂ©bĂ©cois de la langue française prĂ©conise l'emploi de la majuscule dans ses propres communications, mais reconnait tout de mĂȘme explicitement la validitĂ© de la minuscule initiale[7]. En France, la Commission gĂ©nĂ©rale de terminologie prĂ©conise Ă  partir de 1999 l'usage de la traduction « toile d’araignĂ©e mondiale[8] », puis Ă  partir de 2018 les termes de « toile » et « toile mondiale »[1].

Termes rattachés au web

L’expression « en ligne » signifie « connectĂ© Ă  un rĂ©seau », en l’occurrence le rĂ©seau informatique Internet. Cette expression n’est donc pas propre au web, mais Ă  Internet dans sa globalitĂ©, on la retrouve Ă©galement Ă  propos des rĂ©seaux tĂ©lĂ©phoniques.

Un hÎte est un ordinateur en ligne. Chaque hÎte d'Internet est identifié par une adresse IP à laquelle correspondent zéro, un ou plusieurs noms d'hÎte.

Une ressource du World Wide Web est une entitĂ© informatique (texte, image, forum Usenet, boĂźte aux lettres Ă©lectronique, etc.) accessible indĂ©pendamment d’autres ressources. Une ressource en accĂšs public est librement accessible depuis tout Internet. Lorsqu’une ressource est prĂ©sente sur l’hĂŽte de l’utilisateur, elle est dite locale ; par opposition elle est distante si elle est prĂ©sente sur un hĂŽte diffĂ©rent. Lorsque celle-ci est connectĂ©e et disponible au rĂ©seau, elle est en ligne. On ne peut accĂ©der Ă  une ressource distante qu’en respectant un protocole de communication. Les fonctionnalitĂ©s de chaque protocole varient : rĂ©ception, envoi, voire Ă©change continu d’informations.

HTTP (pour HyperText Transfer Protocol) est le protocole de communication communément utilisé pour transférer les ressources du Web. HTTPS est la variante avec authentification et chiffrement.

Une URL (pour Uniform Resource Locator, signifiant littĂ©ralement « localisateur de ressource uniforme ») est une chaĂźne de caractĂšres dĂ©crivant l’emplacement d’une ressource.

Elle contient gĂ©nĂ©ralement dans l’ordre[9] :

  • le nom du protocole ;
  • un deux-points (:) ;
  • deux barres obliques (//) ;
  • un nom d’hĂŽte ;
  • une barre oblique (/) ;
  • un chemin composĂ© de texte sĂ©parĂ©s par des barres obliques.

Exemple :https://www.example.com/un/chemin/page.html Dans la langue courante informelle, on parle aussi d'adresse web au lieu d'URL. En outre, lorsque l'on donne une adresse web, on omet généralement la partie initiale en http:// ou https:// des URL.

Un hyperlien (ou dans le langage courant, un lien) est un Ă©lĂ©ment dans une ressource qui est associĂ© Ă  une URL. Les hyperliens du web sont orientĂ©s : ils permettent d’aller d’une source Ă  une destination. Seule la ressource Ă  la source contient les donnĂ©es dĂ©finissant l’hyperlien. Ainsi, il est possible d’établir un hyperlien sans la moindre intervention, ni coopĂ©ration, de la ressource cible de l’hyperlien. Ce modĂšle unilatĂ©ral adoptĂ© par le Web ne se retrouve pas dans tous les systĂšmes hypertextes. Il a l’avantage prĂ©pondĂ©rant, dans un rĂ©seau public mondial, de permettre la crĂ©ation d’innombrables hyperliens entre partenaires dĂ©centralisĂ©s et non coordonnĂ©s.

HTML (pour HyperText Markup Language) et XHTML (Extensible HyperText Markup Language) sont les langages informatiques permettant de dĂ©crire le contenu d’un document (titres, paragraphes, disposition des images, etc.) et d’y inclure des hyperliens. Un document HTML est un document dĂ©crit avec le langage HTML.

Dans un mode de communication client-serveur, un serveur est un hĂŽte sur lequel fonctionne un logiciel serveur auquel peuvent se connecter des logiciels clients fonctionnant sur des hĂŽtes clients, un seul hĂŽte peut contenir les deux.

Serveur HTTP

Un serveur HTTP (ou service web) est un logiciel utilisé pour servir des ressources à travers le protocole HTTP. Un client HTTP est un logiciel utilisé pour manipuler ces ressources[10].

Un serveur web est un hĂŽte sur lequel fonctionne un serveur HTTP (ou service web). Un serveur web peut hĂ©berger les ressources qu’il dessert, peut les rĂ©cupĂ©rer sur des hĂŽtes distants, dĂ©livrer ces ressources telles quelles (on parlera alors de ressources statiques), ou bien les modifier en fonction de diffĂ©rents critĂšres, on parlera alors de ressources dynamiques. Il est courant sur les services de grosse taille que les ressources soient rĂ©parties sur diffĂ©rents serveurs Web et Ă©ventuellement diffĂ©rents types de serveurs HTTP, certains ayant de meilleures performances pour servir des ressources stockĂ©es dans des fichiers, d’autres plus de souplesse pour calculer les ressources Ă  la demande. Un serveur web peut ĂȘtre un hĂŽte spĂ©cialisĂ©, une partie d’une infrastructure spĂ©cialisĂ©e ou bien encore un hĂŽte plus gĂ©nĂ©raliste. On appelle site web, l’ensemble des ressources HTTP associĂ©es Ă  un nom de domaine et un ou plusieurs noms d’hĂŽte.

Client HTTP

Un client HTTP est un outil permettant d’utiliser les ressources fournies par un serveur HTTP[11]. Il est chargĂ©, en relation avec diffĂ©rents services, de faire traduire le nom d’hĂŽte en adresse IP par un DNS, d'entrer en contact avec le serveur HTTP et de lui fournir diffĂ©rentes informations telles que le nom du site, et la ressource dĂ©sirĂ©e, ainsi que ses capacitĂ©s (gestion de diffĂ©rents types de ressource, capacitĂ© d’affichage, possibilitĂ© de compression de donnĂ©es, etc.) ou sa volontĂ© (choix des langues, protection de la vie privĂ©e) dans l’utilisation des donnĂ©es fournies.

Un navigateur web est un type de logiciel client HTTP Ă  interface homme-machine et conçu pour accĂ©der aux ressources du web. Sa fonction de base est de permettre la consultation des documents HTML disponibles sur les serveurs HTTP. Le support d’autres types de ressources et d’autres protocoles de communication dĂ©pend du type de navigateur.

Un robot d’indexation est, dans le domaine du web, un type de logiciel client HTTP, utilisĂ© pour indexer les diffĂ©rentes ressources de sites web.

Un agrégateur est, dans le domaine du web, un type de logiciel client HTTP, permettant de regrouper les fils de syndication de différents sites web.

Un aspirateur de site web est un client HTTP permettant de rĂ©cupĂ©rer l’intĂ©gralitĂ© d’un site web, pour le consulter ensuite hors-ligne ou en conserver une archive.

Documents

Une page web (ou page) est un document destinĂ© Ă  ĂȘtre consultĂ© avec un navigateur web. Une page web est toujours constituĂ©e d’une ressource centrale (gĂ©nĂ©ralement un document HTML ou XHTML) et d’éventuelles ressources liĂ©es, automatiquement accessibles (par exemple, des images, des feuilles de style, des scripts javascript ou des fontes de caractĂšres). Il n’est pas exceptionnel qu’un seul document HTML fasse appel Ă  entre quelques dizaines et une centaine de ressources annexes.

Un Ă©diteur HTML (ou Ă©diteur web) est un logiciel conçu pour faciliter l’écriture de documents HTML et de pages web en gĂ©nĂ©ral.

Un site web (ou site) est un ensemble de pages web et d’éventuelles autres ressources, liĂ©es dans une structure cohĂ©rente, publiĂ©es par un propriĂ©taire (une entreprise, une administration, une association, un particulier, etc.) et hĂ©bergĂ©es sur un ou plusieurs serveurs web. La page correspondant Ă  l'URL racine d'un site Web est la page d'accueil.

Un systÚme de gestion de contenu (Content Management System, abrégé CMS) est un logiciel permettant de gérer le contenu d'un site.

Consultation et mesure

Visiter un site web signifie « consulter ses pages ». Le terme visite vient du fait que l’on consulte gĂ©nĂ©ralement plusieurs pages d’un site, comme on visite les piĂšces d’un bĂątiment. La visite est menĂ©e par un utilisateur (visiteur ou internaute).

L’expression « surfer sur le web » signifie « consulter le web ». Elle a Ă©tĂ© inventĂ©e pour mettre l’accent sur le fait que consulter le web consiste Ă  suivre de nombreux hyperliens de page en page. Elle est principalement utilisĂ©e par les mĂ©dias ; elle n’appartient pas au vocabulaire technique.

On appelle rĂ©fĂ©rent, la ressource ayant conduit un visiteur Ă  une ressource servie. Elles sont donnĂ©es par dĂ©faut par la majoritĂ© des clients HTTP, mais peuvent ĂȘtre bloquĂ©es.

La mesure de l’audience est l’étude des consultations effectuĂ©es sur un site, elle vise Ă  comprendre les dĂ©sirs des utilisateurs, en fonction des ressources les plus utilisĂ©es et du fil d’Ariane de ceux-ci.

La mesure d’audience peut se faire de diffĂ©rentes maniĂšres :

  • analyse des journaux du serveur. Les calculs de mesure de l’audience peuvent alors ĂȘtre effectuĂ©s en temps rĂ©el au moment de la visite, ou bien en diffĂ©rĂ© ;
  • utilisation de scripts sur le serveur web lui-mĂȘme ;
  • utilisation d’images invisibles dĂ©portĂ©es sur un serveur web tiers (mesure d’audience simple) ;
  • utilisation de script en langage JavaScript et envoi des informations au serveur web ou Ă  un serveur tiers (mesure d’audience plus complĂšte).

MĂ©tiers du web

On appelle hébergeur web une personne physique ou morale qui propose des serveurs Web à la location.

Une agence web est une entreprise de services informatiques réalisant des sites web pour ses clients.

Un développeur web est un programmeur spécialisé dans les technologies du Web.

Types de services web

Un service web est une technologie client-serveur fondée sur les protocoles du web.

Un annuaire web est un site web répertoriant des sites web.

Un moteur de recherche est un site permettant de rechercher des mots dans l’ensemble des sites web.

Un portail web est un site web tentant de regrouper la plus large palette d’informations et de services possibles dans un site web. Certains portails sont thĂ©matiques.

Un agrégateur web est un site web qui sélectionne, organise et, éventuellement, valide des pages concernant un sujet précis, et les met en forme de façon ergonomique ou attractive.

Un blog est une partie de site web oĂč sont rĂ©guliĂšrement publiĂ©s des articles personnels.

Un webmail est site web fournissant les fonctionnalités d'un client de messagerie de courrier électronique.

Un wiki est un site web Ă©ditable par les utilisateurs.

Histoire

Tim Berners-Lee travaille comme informaticien dans le bĂątiment 31, localisĂ© en France[12] (46° 13â€Č 57″ N, 6° 02â€Č 42″ E[13]) de l’Organisation europĂ©enne pour la recherche nuclĂ©aire (CERN) dans le dĂ©partement de l'Ain[14] et dont le siĂšge est situĂ© en Suisse, Ă  proximitĂ© de GenĂšve, lorsqu’il propose, en 1989, de crĂ©er un systĂšme hypertexte distribuĂ© sur le rĂ©seau informatique pour que les collaborateurs puissent partager les informations au sein du CERN[15].

Cette mĂȘme annĂ©e, les responsables du rĂ©seau du CERN dĂ©cident d’utiliser le protocole de communication TCP/IP et le CERN ouvre sa premiĂšre connexion extĂ©rieure avec Internet[16]. L’annĂ©e suivante, l’ingĂ©nieur systĂšme Robert Cailliau se joint au projet d’hypertexte au CERN, immĂ©diatement convaincu de son intĂ©rĂȘt, et se consacre Ă©nergiquement Ă  sa promotion[17]. Tim Berners-Lee et Robert Cailliau sont souvent reconnus comme les deux personnes Ă  l’origine du World Wide Web en qualitĂ© de co-inventeurs, bien que Robert Cailliau ne se soit jamais attribuĂ© la paternitĂ© du Web[18] - [19]. Tim Berners-Lee crĂ©e le premier navigateur et Ă©diteur web, appelĂ© WorldWideWeb et le premier serveur HTTP appelĂ© CERN httpd.

Vers 1992, Tim Berners-Lee souhaite lĂ©guer son invention (spĂ©cifications et code sources) au domaine public. Robert Cailliau l’aide Ă  obtenir l’accord du CERN et y arrive en 1993. Jusque-lĂ , le web est essentiellement dĂ©veloppĂ© sous l’impulsion de Tim Berners-Lee et Robert Cailliau, mais les choses changent avec l’apparition de NCSA Mosaic, un navigateur web dĂ©veloppĂ© par Eric Bina et Marc Andreessen au National Center for Supercomputing Applications (NCSA), dans l’Illinois. NCSA Mosaic jette les bases de l’interface graphique des navigateurs modernes en intĂ©grant les images au texte et cause un accroissement exponentiel de la popularitĂ© du web. Certains dĂ©veloppeurs de Mosaic, crĂ©eront ensuite Netscape Navigator qui apporte le parallĂ©lisme, permettant Ă©galement d’utiliser les pages avec image sur des connexions bas dĂ©bit. Celui-ci, d’évolutions en Ă©volutions, est devenu aujourd’hui Mozilla Firefox. Le NCSA produit Ă©galement le NCSA HTTPd, un serveur HTTP qui Ă©voluera en Apache HTTP Server, le serveur HTTP le plus utilisĂ© depuis 1996. Le , le CERN verse dans le domaine public ses logiciels Web afin de promouvoir la diffusion Web[20].

En 1994, Netscape Communications Corporation est fondĂ©e avec une bonne partie de l’équipe de dĂ©veloppement de NCSA Mosaic. Sorti fin 1994, Netscape Navigator supplante NCSA Mosaic en quelques mois. En 1995, Microsoft essaie de concurrencer Internet avec The Microsoft Network (MSN) et Ă©choue. Fin 1995, aprĂšs la sortie de Windows 95 sans le moindre navigateur web prĂ©installĂ©, Microsoft lance avec Internet Explorer la guerre des navigateurs contre Netscape Navigator.

Chronologie

Les premiÚres années de cet historique sont largement issues de A Little History of the World Wide Web (Une petite histoire du World Wide Web)[21].

  • 1989
    • Le 13 mars, Tim Berners-Lee, engagĂ© au CERN Ă  GenĂšve en 1984 pour travailler sur l’acquisition et le traitement des donnĂ©es[22], propose de dĂ©velopper un systĂšme hypertexte organisĂ© en Web, afin d’amĂ©liorer la diffusion des informations internes : Information Management: A Proposal[15].
  • 1990
    Le premier serveur web, un NeXT Cube.
    • Robert Cailliau rejoint le projet et collabore Ă  la rĂ©vision de la proposition : WorldWideWeb: Proposal for a HyperText Project[4].
    • Étendue : Le premier serveur web est nxoc01.cern.ch ; la premiĂšre page web est http://nxoc01.cern.ch/hypertext/WWW/TheProject.html[23] ; la plus ancienne page conservĂ©e en l'Ă©tat date du 13 novembre[24].
    • Logiciels : Le premier navigateur web, appelĂ© WorldWideWeb (plus tard rebaptisĂ© Nexus) est dĂ©veloppĂ© en Objective C sur NeXT[25]. En plus d’ĂȘtre un navigateur, WorldWideWeb est un Ă©diteur web. Le navigateur mode texte line-mode est dĂ©veloppĂ© en langage C pour ĂȘtre portable sur les nombreux modĂšles d’ordinateurs et simples terminaux de l’époque.
    • Technologies : Les trois technologies Ă  la base du web, URL, HTML et HTTP, sont Ă  l’Ɠuvre. Sur NeXT, des feuilles de style simples sont Ă©galement utilisĂ©es, ce qui ne sera plus le cas jusqu’à l’apparition des Cascading Style Sheets.
  • 1991
    • Le 6 aoĂ»t, Tim Berners-Lee rend le projet WorldWideWeb public dans un message sur Usenet[26] - [27].
    • Étendue : premier serveur web hors d’Europe au SLAC ; passerelle avec WAIS[28].
    • Logiciels : fichiers dĂ©veloppĂ©s au CERN disponibles par FTP.
  • 1992
    • Le World Wide Web fait l’objet d’une prĂ©sentation d’ensemble datĂ©e du [29] - [30].
    • Étendue : 26 sites web « raisonnablement fiables »[31], dont le premier site français[32].
    • Logiciels : navigateurs Erwise[33], ViolaWWW[34] ; serveur NCSA HTTPd.
  • 1993
    • Le 30 avril, le CERN renonce aux droits d’auteur sur les logiciels du World Wide Web et permet leur mise dans le domaine public[35]. À la fin de l’annĂ©e, les mĂ©dias grand public remarquent Internet et le WWW.
    • Étendue : 130 sites web en juin, 623 en dĂ©cembre[36] ; l’usage croĂźt d’un rythme annuel de 341 634 %.
    • Logiciels : Apparitions des navigateurs NCSA Mosaic et Lynx. Disponible d’abord sur X Window, puis sur Windows et MacOS, Mosaic cause un phĂ©nomĂ©nal accroissement de la popularitĂ© du web.
    • Technologies : images dans les pages web (Mosaic 0.10) ; formulaires interactifs (Mosaic 2.0pre5).
  • 1994
  • 1995
  • 1996
    • Étendue : 100 000 sites en janvier, environ 230 000 en juin.
    • Logiciels : Netscape Navigator 2.0 et 3.0 ; Internet Explorer 3.0 ; Opera 2.1.
    • Standards : RFC 1945 (HTTP/1.0) ; CSS level 1.
    • Sites : Internet Archive commence Ă  archiver le web.
  • 1997
    • Étendue : plus de 1 000 000 sites en avril selon Netcraft.
    • Logiciels : Netscape Navigator 4.0 ; Internet Explorer 4.0.
    • Standards : HTML 3.2 ; HTML 4.0.
  • 1998
    • America Online rachĂšte Netscape qui a perdu la guerre des navigateurs pour 4 milliards US$.
    • Étendue : plus de 2 000 000 sites en mars.
    • Logiciels : Netscape Navigator 4.5 ; projet Mozilla.
    • Sites : Google.
    • Standards : XML 1.0 ; CSS level 2 ; DOM level 1, WAP level 1.
  • 1999
    • Étendue : plus de 4 000 000 de sites en janvier, plus de 7 400 000 en aoĂ»t.
    • Logiciels : Internet Explorer 5.0.
    • Standards : HTML 4.01 ; RFC 2616 (HTTP/1.1).
  • 2000
    • Étendue : 11 161 854 sites en fĂ©vrier, 19 823 296 en aoĂ»t selon Netcraft[37].
    • Standards : XHTML 1.0.
  • 2001
    • Étendue : 27 585 719 sites en janvier, 30 775 624 en aoĂ»t.
    • Logiciels : Internet Explorer 6.
    • Sites : WikipĂ©dia.
  • 2002
    • Étendue : 36 689 008 sites en janvier, 35 991 815 en aoĂ»t.
    • Logiciels : Mozilla 1.0.
  • 2003
    • Étendue : 35 863 952 sites en fĂ©vrier, 42 807 275 en aoĂ»t.
    • Logiciels : Safari.
  • 2004
  • 2005
    • Étendue : 59 100 880 sites en fĂ©vrier, 70 392 567 en aoĂ»t
    • Logiciels : Mozilla Firefox 1.5.
  • 2006
    • Étendue : 85 507 314 sites en juin[38], 76 184 000 sites en fĂ©vrier, 92 615 362 en aoĂ»t.
    • Logiciels : Internet Explorer 7, Mozilla Firefox 2.0.
  • 2007
    • Étendue : 108 810 358 sites en fĂ©vrier[39], 127 961 479 en aoĂ»t[40].
    • Logiciels : Safari sur Windows.
    • Standards : Le W3C dĂ©cide de poursuivre le travail sur HTML5 commencĂ© au WHATWG.
  • 2008
  • 2009
  • 2010
  • 2011
    • Étendue : 284 842 077 sites en fĂ©vrier[44] 312 693 296 sites en avril[37]
    • Logiciels : Google Chrome 9 (fĂ©vrier), 10 (mars), 11 (avril), 12 (juin), 13 (aoĂ»t), 14 (septembre), 15 (octobre), 16 (dĂ©cembre) ; Mozilla Firefox 4 (mars), 5 (fin juin), 6 (fin aoĂ»t) et 7 (fin septembre) ; Internet Explorer 9 ; Opera 11
  • 2012
  • 2013
    • Dans un projet de restauration historique[45], le CERN remet en ligne la page prĂ©sentant le projet du web : http://info.cern.ch/hypertext/WWW/TheProject.html.
    • Logiciels : Internet Explorer 11
  • 2014
  • 2015

Évolution de l’usage

En crĂ©ant le logiciel WorldWideWeb, Tim Berners-Lee a crĂ©Ă© Ă  la fois le premier navigateur web et le premier Ă©diteur web, car il voulait faire du web un mĂ©dia collaboratif, dans lequel tous les acteurs consultent et crĂ©ent l’information. Cependant, le web s’est immĂ©diatement orientĂ© en un mĂ©dia de diffusion d’information global plutĂŽt que de collaboration[47].

Dans la premiĂšre moitiĂ© des annĂ©es 1990, le concept de site web Ă  la racine d’un nom de domaine stable n’était pas Ă©tabli, Ă  commencer par la premiĂšre page web dont l’adresse Ă©tait http://nxoc01.cern.ch/hypertext/WWW/TheProject.html. Les sites Ă©taient souvent mis en place dans des dĂ©partements techniques par des employĂ©s et des Ă©tudiants, et les URL changeaient au grĂ© des changements de personnes et d’infrastructure. En outre, il n’existait pas de moteur de recherche efficace. Aussi de nombreuses pages Ă©taient des listes de liens sur les pages prĂ©fĂ©rĂ©es de l’auteur de la page. Cette propriĂ©tĂ© du web sera d’ailleurs exploitĂ©e plus tard par les crĂ©ateurs de Google pour calculer la pertinence des pages, puis dĂ©tournĂ©e par les fermes de liens. Mais bien avant cela, en janvier 1994, Yahoo! est crĂ©Ă© et devient rapidement le plus grand annuaire web. Comme les crĂ©ateurs de Yahoo! Ă©taient des Ă©tudiants de l’universitĂ© Stanford, L’URL originale Ă©tait http://akebono.stanford.edu/yahoo, et ce n’est qu’en janvier 1995 que le domaine yahoo.com est crĂ©Ă©.

Dans la seconde moitiĂ© des annĂ©es 1990, le web devient populaire, et toutes les grandes entreprises, organisations, Ă©coles, administrations, ouvrent un site web. Les moteurs de recherche deviennent efficaces, notamment avec l’apparition d’Altavista[alpha 3] en dĂ©cembre 1995, et pour finir Google en 1998. Dans cette phase de dĂ©veloppement du mĂ©dia, un flot d’information top-down prĂ©domine : un site web est fait pour diffuser les informations de son propriĂ©taire. Les interactions s’arrĂȘtent souvent Ă  la recherche et au commerce en ligne. Bien sĂ»r, le courrier Ă©lectronique, la messagerie instantanĂ©e, et les forums de discussion existaient depuis plus longtemps que le web, mais ils fonctionnaient principalement avec des protocoles et logiciels spĂ©cifiques (voir CatĂ©gorie:Logiciel de messagerie instantanĂ©e, CatĂ©gorie:Logiciel de courrier Ă©lectronique, CatĂ©gorie:Client Usenet).

Web 2.0

Avec les annĂ©es 2000 les notions de blog, de wiki (en 2001, lancement de la WikipĂ©dia en anglais) et de rĂ©seautage social (Myspace en 2003, Facebook en 2004) deviennent populaires. Le contenu gĂ©nĂ©rĂ© par les utilisateurs se rĂ©pand (WikipĂ©dia, YouTube en 2005, Twitter en 2006). La technologie Ajax (1998, thĂ©orisĂ©e en 2005) commence Ă  ĂȘtre largement utilisĂ©e pour crĂ©er des applications complĂštes qui tiennent dans une seule page web (Google Maps en 2004). L’expression Web 2.0, largement popularisĂ©e au milieu des annĂ©es 2000, dĂ©signe cette transition dans le flux de l’information et la maniĂšre d’utiliser le web. Le succĂšs de l’expression « Web 2.0 » a conduit de nombreuses personnes Ă  appeler « Web 2.5 », 3.0, 4.0, etc. leur vision du Web de l’avenir.

Architecture

ModÚle mathématique

Le World Wide Web, en tant qu’ensemble de ressources hypertextes, est modĂ©lisable en graphe orientĂ© possĂ©dant des cycles avec les ressources pour sommets et les hyperliens pour arcs. Comme le graphe est orientĂ©, certaines ressources peuvent constituer des puits, ou moins formellement des culs-de-sac[48] : il n’existe aucun chemin vers le reste du web. À l’inverse, certaines ressources peuvent constituer des sources : il n’existe aucun chemin depuis le reste du web.

Les analyses ont montrĂ© que la structure du web rĂ©pondait au modĂšle des rĂ©seaux invariants d’échelle prĂ©sent dans la plupart des rĂ©seaux sociaux. Cela se traduit par la prĂ©sence de moyeux, les hubs, vers lesquels convergent les liens hypertextes : ce sont les sites les plus importants qui constituent le squelette du web.

Techniquement, rien ne distingue le World Wide Web d’un quelconque autre web utilisant les mĂȘmes technologies. Ainsi, d’innombrables webs privĂ©s existent. Dans la pratique, on considĂšre qu’une page d’un site web populaire, comme un annuaire web, fait partie du web. Le web peut alors ĂȘtre dĂ©fini comme Ă©tant l’ensemble des ressources et des hyperliens que l’on peut rĂ©cursivement dĂ©couvrir Ă  partir de cette page, ce qui exclut les sources et les webs privĂ©s.

Exploration du web et web profond

L’exploration rĂ©cursive du web Ă  partir de ressources bien choisies est la mĂ©thode de base programmĂ©e dans les robots d’indexation des moteurs de recherche. En 2004, les moteurs de recherche indexent environ quatre milliards de ressources.

Le web profond, ou web invisible, est la partie du web qui n’est pas indexĂ©e et donc introuvable avec les moteurs de recherche gĂ©nĂ©ralistes. Une Ă©tude publiĂ©e en 2001 indiquait que la partie invisible du web reprĂ©sente plus de 99 % du web[49]. Le web profond comprend notamment les ressources suivantes :

  • les ressources inaccessibles au public, donc aux robots, notamment les pages administratives ou payantes, protĂ©gĂ©es par un mot de passe ;
  • les ressources qui ne sont pas communiquĂ©es par des protocoles de communication pris en charge par les robots (souvent ils ne prennent en charge que HTTP et HTTPS) ;
  • les ressources dont le format de donnĂ©es n’est pas pris en charge par le robot ;
  • les ressources listĂ©es dans un fichier d’exclusion des robots ;
  • les ressources exclues par le robot car elles sont conçues pour abuser du rĂ©fĂ©rencement (spamdexing) ;
  • les ressources exclues par le robot car elles sont considĂ©rĂ©es comme trop peu pertinentes (par exemple si un site contient des millions de ressources qui ne sont liĂ©es par aucun autre site) ;
  • les ressources vers lesquelles les hyperliens sont crĂ©Ă©s dynamiquement en rĂ©ponse aux interrogations des visiteurs.
Ces derniÚres ressources proviennent généralement de bases de données et constituent la partie la plus importante du web profond.

Serveurs publics

L’exploration rĂ©cursive n’est pas le seul moyen utilisĂ© pour indexer le web et mesurer sa taille. L’autre solution consiste Ă  mesurer l’infrastructure informatique connectĂ©e Ă  Internet pour hĂ©berger des sites web. Au lieu de suivre des hyperliens, cette mĂ©thode consiste Ă  utiliser les noms de domaine enregistrĂ©s dans le Domain Name System et essayer de se connecter Ă  tous les serveurs web potentiels. C’est notamment la mĂ©thode utilisĂ©e par la sociĂ©tĂ© Netcraft, qui publie rĂ©guliĂšrement les rĂ©sultats de ses explorations, dont les mesures de popularitĂ© des serveurs HTTP. Cette mesure porte plus sur l’utilisation des technologies du web que sur le web lui-mĂȘme. Elle permet notamment de trouver des sites publics qui ne sont pas liĂ©s au World Wide Web.

Intranets et webs privés

Un site web mis en ligne sur un intranet est privé, car le public ne peut pas accéder à un intranet.

En outre, si l’on met en ligne un site web sur Internet en omettant de crĂ©er des liens depuis au moins une page existante du World Wide Web, alors ce site constitue un web isolĂ©. Il est virtuellement privĂ©, car le public ne peut pas le dĂ©couvrir en suivant des hyperliens.

Archivage

Le web change constamment : les ressources ne cessent d’ĂȘtre crĂ©Ă©es, modifiĂ©es et supprimĂ©es. Il existe quelques initiatives d’archives du web dont le but est de permettre de retrouver ce que contenait un site Ă  une date donnĂ©e. Le projet Internet Archive est l’un d’eux.

Types de ressource

Les divers types de ressource du web ont des usages assez distincts :

Documents HTML

Le document HTML est la principale ressource d’une page web, celle qui contient les hyperliens, qui contient et structure le texte, qui lie et dispose les ressources multimĂ©dias. Un document HTML contient uniquement du texte : le texte consultĂ©, le texte en langage HTML plus d’éventuels autres langages de script ou de style.

La prĂ©sentation de documents HTML est la principale fonctionnalitĂ© d’un navigateur web. HTML laisse au navigateur le soin d’exploiter au mieux les capacitĂ©s de l’ordinateur pour prĂ©senter les ressources. Typiquement, la police de caractĂšre, la longueur des lignes de texte, les couleurs, etc, doivent ĂȘtre adaptĂ©es au pĂ©riphĂ©rique de sortie (Ă©cran, imprimante, etc).

Multimédia

Les Ă©lĂ©ments multimĂ©dias proviennent gĂ©nĂ©ralement de ressources indĂ©pendantes du document HTML. Les documents HTML contiennent des hyperliens pointant sur les ressources multimĂ©dias, qui peuvent donc ĂȘtre Ă©parpillĂ©es sur Internet. Les Ă©lĂ©ments multimĂ©dias liĂ©s sont automatiquement transfĂ©rĂ©s pour prĂ©senter une page web.

Seul l’usage des images et des petites animations est standardisĂ©. Le support du son, de la vidĂ©o, d’espaces tridimensionnels ou d’autres Ă©lĂ©ments multimĂ©dias repose encore sur des technologies non standardisĂ©es. De nombreux navigateurs web proposent la possibilitĂ© de greffer des logiciels (plugin) pour Ă©tendre leurs fonctionnalitĂ©s, notamment le support de types de mĂ©dia non standard.

Les flux (audio, vidĂ©o) nĂ©cessitent un protocole de communication au fonctionnement diffĂ©rent de HTTP. C’est une des raisons pour lesquelles ce type de ressource nĂ©cessite souvent un plugin et est mal intĂ©grĂ© aux pages web.

Images

Ce chapitre concerne les images intĂ©grĂ©es aux pages web. L’usage du format de donnĂ©es JPEG est indiquĂ© pour les images naturelles, principalement les photographies.

L’usage du format de donnĂ©es PNG est indiquĂ© pour les images synthĂ©tiques (logos, Ă©lĂ©ments graphiques). Il est aussi indiquĂ© pour les images naturelles, mais uniquement lorsque la qualitĂ© prime totalement sur la durĂ©e du transfert. L’usage du format de donnĂ©es GIF est indiquĂ© pour les petites animations. Pour les images synthĂ©tiques, la popularitĂ© ancienne de GIF le fait souvent prĂ©fĂ©rer Ă  PNG. Cependant, GIF souffre de quelques dĂ©savantages, notamment la limitation du nombre de couleurs et un degrĂ© de compression gĂ©nĂ©ralement moindre. En outre une controverse a entourĂ© l’usage de GIF de 1994 Ă  2004 car Unisys a fait valoir un brevet couvrant la mĂ©thode de compression. L’usage d’images de format de donnĂ©es XBM est obsolĂšte.

Vidéo

Jusque dans les annĂ©es 2000, la consultation de musique et vidĂ©o demandait l’installation d’un programme ad hoc (un plugin) pour Ă©tendre les fonctionnalitĂ©s du navigateur web. La trĂšs grande diffusion du plugin Flash Player a finalement rendu la consultation vidĂ©o aussi simple que celle des images. Finalement, la cinquiĂšme version langage HTML (HTML 5) a intĂ©grĂ© la vidĂ©o.

Scripts et animations

Un langage de script permet d’écrire le texte d’un programme directement exĂ©cutĂ© par un logiciel. Dans le cadre du web, un script est exĂ©cutĂ© par un navigateur web et programme des actions rĂ©pondant Ă  l’usage que le visiteur fait de la page web consultĂ©e. Un script peut ĂȘtre intĂ©grĂ© au document HTML ou provenir d’une ressource liĂ©e. Le premier langage de script du web fut JavaScript, dĂ©veloppĂ© par Netscape. Ensuite Microsoft a dĂ©veloppĂ© une variante concurrente sous le nom de JScript. Finalement, la norme ECMAScript a Ă©tĂ© proposĂ©e pour la syntaxe du langage, et les normes DOM pour l’interface avec les documents.

De technologie aux capacitĂ©s d’actions trĂšs limitĂ©es Ă  ses dĂ©buts, le langage JavaScript est devenu capable d’exĂ©cuter toutes les applications imaginables : traitement de texte, jeu vidĂ©o, Ă©mulateur, etc.

Encore plus que pour la vidĂ©o, le plugin Adobe Flash Player est devenu trĂšs largement utilisĂ© pour la diffusion d’animations. Parfois, des sites entiers sont rĂ©alisĂ©s en Flash. Il est cependant en voie de disparition car les navigateurs souhaitent en bannir l’usage[50].

Styles

Le langage CSS a Ă©tĂ© dĂ©veloppĂ© pour gĂ©rer en dĂ©tail la prĂ©sentation des documents HTML. Le texte en langage CSS peut ĂȘtre intĂ©grĂ© au document HTML ou provenir de ressources liĂ©es, les feuilles de style. Cette sĂ©paration permet une gestion sĂ©parĂ©e de l’information (contenue dans des documents HTML) et de sa prĂ©sentation (contenue dans des feuilles de style). On parle aussi de « sĂ©paration du fond et de la forme ».

Autres

La gestion des autres types de ressource dĂ©pend des logiciels installĂ©s sur l’hĂŽte client et de leurs rĂ©glages.

Lorsque le logiciel correspondant est disponible, les documents et images de tout type sont gĂ©nĂ©ralement automatiquement prĂ©sentĂ©s, selon des modalitĂ©s (fenĂȘtrage, dialogues) dĂ©pendant du navigateur web et du logiciel gĂ©rant le type. Lorsque le type de la ressource n’est pas gĂ©rĂ©, il est gĂ©nĂ©ralement possible de la sauver dans un fichier local.

Pour gĂ©rer les ressources de systĂšmes diffĂ©rents du web comme le courrier Ă©lectronique, les navigateurs font habituellement appel Ă  des logiciels sĂ©parĂ©s. Si aucun logiciel ne gĂšre un type de ressource, un simple message d’erreur l’indique.

Conception

Universalité

Le web a Ă©tĂ© conçu pour ĂȘtre accessible avec les Ă©quipements informatiques les plus divers : station de travail, terminal informatique en mode texte, ordinateur personnel, tĂ©lĂ©phone portable, etc. Cette universalitĂ© d’accĂšs dĂ©pend en premier lieu de l’universalitĂ© des protocoles Internet. En second lieu, elle dĂ©pend de la flexibilitĂ© de prĂ©sentation des pages web, offerte par HTML. En outre, HTTP offre aux navigateurs la possibilitĂ© de nĂ©gocier le type de chaque ressource. Enfin, CSS permet de proposer diffĂ©rentes prĂ©sentations, sĂ©lectionnĂ©es pour leur adĂ©quation avec l’équipement utilisĂ©.

Le W3C a pour cela crĂ©Ă© des normes dans le but de permettre l’indĂ©pendance des outils qui servent Ă  crĂ©er du contenu avec ceux qui servent Ă  le lire. On appelle cela l’interopĂ©rabilitĂ©.

L’accessibilitĂ© du web pour les individus handicapĂ©s est aussi l’objet d’attentions particuliĂšres comme la Web Accessibility Initiative.

DĂ©centralisation

Les technologies du web n’imposent pas d’organisation entre les pages web, ni Ă  fortiori entre les sites web. Toute page du web peut contenir des hyperliens vers toute autre ressource accessible d’Internet. L’établissement d’un hyperlien ne requiert absolument aucune action du cĂŽtĂ© de la ressource pointĂ©e. Il n’y a pas de registre centralisĂ© d’hyperliens, de pages ou de sites. Le seul registre utilisĂ© est celui du DNS ; c’est une base de donnĂ©es distribuĂ©e qui rĂ©pertorie les hĂŽtes, permet de traduire en adresse IP le nom de domaine contenu dans certains hyperliens et qui est utilisĂ©e par tous les systĂšmes accĂ©dant Ă  Internet.

Cette conception dĂ©centralisĂ©e devait favoriser, et a favorisĂ©, une augmentation rapide de la taille du web. Elle a aussi favorisĂ© l’essor de sites spĂ©cialisĂ©s dans les informations sur les autres sites : les annuaires et les moteurs de recherche. Sans ces sites, la recherche d’information dans le web serait extrĂȘmement laborieuse. La dĂ©marche inverse, le portail web, tente de concentrer un maximum d’informations et de services dans un seul site.

Une faiblesse de la dĂ©centralisation est le manque de suivi lorsqu’une ressource est dĂ©placĂ©e ou supprimĂ©e : les hyperliens qui la pointaient se retrouvent cassĂ©s. Et cela n’est visible qu’en suivant l’hyperlien, le rĂ©sultat le plus courant Ă©tant le message d’erreur 404.

Technologies

Préexistantes

Le web repose sur les technologies d’Internet, notamment TCP/IP pour assurer le transfert des donnĂ©es, DNS pour convertir les noms d’hĂŽte en adresses IP et MIME pour indiquer le type des donnĂ©es. Les standards de codage des caractĂšres et les formats d’image numĂ©rique GIF et JPEG ont Ă©tĂ© dĂ©veloppĂ©s indĂ©pendamment.

Spécifiques

Trois technologies ont dĂ» ĂȘtre dĂ©veloppĂ©es pour le World Wide Web :

Ces premiĂšres technologies ont Ă©tĂ© normalisĂ©es comme les autres technologies d’Internet : en utilisant le processus des Request for Comments. Cela a donnĂ© le RFC 1738 pour les URL, le RFC 1866 pour HTML 2.0 et le RFC 1945 pour HTTP/1.0.

Le World Wide Web Consortium (W3C) a Ă©tĂ© fondĂ© en 1994 pour dĂ©velopper et promouvoir les nouveaux standards du web. Son rĂŽle est notamment de veiller Ă  l’universalitĂ© des nouvelles technologies. Des technologies ont Ă©galement Ă©tĂ© dĂ©veloppĂ©es par des entreprises privĂ©es.

Actuelles

Les principaux standards actuels sont :

Technologies serveur

Outre les protocoles de communication et formats de donnĂ©es utilisĂ©s dans le Web, plusieurs techniques propres au Web sont mises en Ɠuvre pour faire fonctionner les serveurs HTTP (ou serveurs web). Comme ces techniques ne concernent pas les logiciels client du Web, elles ne sont pas standardisĂ©es par le World Wide Web Consortium.

Serveur HTTP

Le serveur HTTP est chargĂ© de recevoir les requĂȘte des agents HTTP, et de rĂ©pondre avec la ressource demandĂ©e. Il peut s’agir d'informations existantes, aussi appelĂ©es statiques, souvent enregistrĂ©es dans des fichiers, ou d'informations Ă  produire Ă  la volĂ©e, aussi appelĂ©es dynamiques. La fourniture des pages dynamiques est dĂ©lĂ©guĂ©e Ă  des applications autonomes sur le serveur. Il doit Ă©galement ĂȘtre capable de gĂ©rer les erreurs, si les ressources ne sont pas trouvĂ©es ou s’il y a une erreur dans la production de la ressource, en retournant le message adĂ©quat. Le premier serveur HTTP fut CERN httpd et est rapidement tombĂ© en dĂ©suĂ©tude. En 2014, les principaux serveurs Web utilisĂ©s sont Apache HTTP Server, serveur dominant du marchĂ© depuis des annĂ©es, Nginx utilisĂ© sur les sites Ă  plus forte audience, mais aussi Microsoft IIS, Google Web Server ou encore Lighttpd[51].

Le standard Common Gateway Interface (CGI) est un protocole de communication inter-processus entre le serveur HTTP et des applications externes situĂ©es Ă©galement sur le serveur. Ce standard est gĂ©rĂ© par l’IETF. Le standard FastCGI permet de sĂ©parer plus efficacement le serveur HTTP des applications et de mieux contrĂŽler le nombre d’instances d'applications du cĂŽtĂ© serveur.

Certains langages couramment utilisĂ©s avec les services HTTP, comme PHP, Java et Ruby, utilisent Ă©galement des technologies particuliĂšres pour la communication avec le serveur. Pour PHP, mod_php pour Apache a souvent Ă©tĂ© utilisĂ©. En Java, le projet Apache Jakarta a permis de rĂ©unir plusieurs outils. Dans cette architecture, le module Apache mod jk permet de faire la liaison avec le serveur d’application Tomcat qui exĂ©cute les Java Servlet et JavaServer Pages. En Ruby, Phusion Passenger, fonctionnant avec Apache et Nginx est un des principaux outils de communication entre le service HTTP et les applications.

Langages d’application dynamiques cĂŽtĂ© serveur

En pratique, CGI et fastCGI permettent d’utiliser n’importe quel langage, cependant, on peut citer certains langages de script qui sont devenus les plus populaires, utilisant du CGI ou une autre technique pour communiquer avec le serveur.

Le langage de programmation PHP (PHP: Hypertext Preprocessor) a Ă©tĂ© dĂ©veloppĂ© pour gĂ©nĂ©rer les pages web. Il jouit d’une forte intĂ©gration avec le serveur HTTP et les langages HTML. C’est aujourd’hui le langage le plus utilisĂ© cĂŽtĂ© serveur avec presque 70 % des sites en 2010[52]. Le moteur ASP (Active Server Pages) a Ă©tĂ© dĂ©veloppĂ© par Microsoft pour interprĂ©ter du langage de script dans le serveur IIS (Internet Information Services), il est le second langage le plus utilisĂ© avec un peu moins de 30 % des sites en 2010[52].

Le langage Java, dont les pages sont servies par Apache Tomcat est ensuite trĂšs utilisĂ©, particuliĂšrement dans le domaine bancaire, la tendance est Ă  y inclure du langage Ruby via le module jRuby. Java Ă©tait utilisĂ© sur un peu moins de 1 % des serveurs en 2010[52]. Le langage Ruby, avec principalement le serveur d’application Ruby on Rails avec 0,5 % en 2010[52]. Devant la popularitĂ© grandissante de JavaScript cĂŽtĂ© client, liĂ©e Ă  Ajax puis HTML5, le cĂŽtĂ© serveur a suivi avec la plateforme logicielle Node.js, dĂ©diĂ©e aux applications serveur.

Au début des CGI, Perl était trÚs utilisé cÎté serveur, en raison de ses affinités avec les administrateurs systÚme et réseau, et de sa dominance dans ce domaine.

Bases de données

Les bases de données sont également une partie importante de la génération des sites à contenu dynamique.

Les principaux types de base de données sont :

Notes et références

Notes

  1. Prononciation en anglais américain retranscrite selon la norme API.
  2. L’image de l’araignĂ©e est parfois utilisĂ©e par les anglophones, on la retrouve ainsi dans l’expression web spider pour le robot d’indexation.
  3. Le moteur Altavista est apparu sous le domaine altavista.digital.com, et de nombreux visiteurs allaient par erreur sur altavista.com qui n'avait rien à voir. Le domaine altavista.com a finalement été racheté par le propriétaire du moteur de recherche pour des millions de dollars, démontrant l'importance d'un nom de domaine bien choisi dÚs l'apparition d'un site.

Références

  1. Vocabulaire de l'informatique et de l'internet (liste de termes, expressions et définitions adoptés), legifrance.gouv.fr, JORF no 0285 du , consulté le
  2. Pourquoi il ne faut pas confondre Web et Internet , 01net.com du 12 mars 2019, consulté le 25 février 2023
  3. Le web libre et ouvert fĂȘte ses 20 ans Numerama 30 avril 2013
  4. (en) WorldWideWeb: Proposal for a HyperText Project, T. Berners-Lee/CN, R. Cailliau/ECP,
  5. (en) Frequently asked questions by the Press - Tim BL - Spelling of WWW
  6. Google Books "Le bon usage de la répétition dans l'expression écrite et orale" page 46
  7. « Web », Grand Dictionnaire terminologique, Office québécois de la langue française (consulté le )]
  8. Journal officiel du 16 mars 1999 - Vocabulaire de l’informatique et de l’internet
  9. RFC3983 sur ietf.org
  10. « C'est quoi un serveur HTTP ou serveur Web ? », sur culture-informatique.net (consulté le )
  11. « Client HTTP », sur www.standard-du-web.com (consulté le )
  12. Site challenges.fr, article "Tim Berners-Lee: "Oui, le Web est né en France....", consulté le 28 novembre 2021.
  13. (en) Tim Berners-Lee's account of the exact locations at CERN where the Web was invented, sur le site davidgalbraith.org.
  14. Site saint-genis-pouilly.fr, page "Histoire du CERN".
  15. (en)Tim Berners-Lee, Information Management: A Proposal, CERN, .
  16. James Gillies, Robert Cailliau, How the Web was born: the story of the World Wide Web, Oxford, Oxford University Press, 2000, (ISBN 0-19-286207-3), p. 87.
  17. (en) Tim Berners-Lee, Mark Fischetti, Weaving the Web: the past, present and future of the World Wide Web by its inventor, Londres, Texere, , 272 p. [dĂ©tail de l’édition] (ISBN 1-58799-018-0), p. 27.
  18. (en) Interview de Robert Cailliau par Andrew Talons en 2010.
  19. (en)Frequently Asked Questions - Robert Cailliau's role.
  20. « The document that officially put the World Wide Web into the public domain on 30 April 1993. », sur cds.cern.ch.
  21. A Little History of the World Wide Web sur le site du W3C.
  22. (en) Tim Berners-Lee, Mark Fischetti, Weaving the Web : the past, present and future of the World Wide Web by its inventor, Londres, Texere, , 272 p. [dĂ©tail de l’édition] (ISBN 1-58799-018-0), p. 15.
  23. (en) « The World Wide Web project », sur info.cern.ch (consulté le )
  24. Selon https://www.w3.org/History.html, la page archivée à http://www.w3.org/History/19921103-hypertext/hypertext/WWW/Link.html a été modifiée la derniÚre fois le 13 novembre 1990 à 15:17:00 GMT.
  25. Présentation du navigateur sur le site du W3C.
  26. (en) « Re: Qualifiers on Hypertext links... », copie du message news:6484@cernvax.cern.ch originellement posté dans news:alt.hypertext, sur w3.org (consulté le ).
  27. (en) Tim Berners-Lee et Mark Fischetti, Weaving the Web, (ISBN 1-58799-018-0), p. 51.
  28. « archives sur ksi.cpsc.ucalgary.ca »(Archive.org ‱ Wikiwix ‱ Archive.is ‱ Google ‱ Que faire ?).
  29. (en) A Little History of the World Wide Web, sur le site W3C.
  30. Page de présentation du projet.
  31. (en) « World-Wide Web Servers », sur w3.org (consulté le ).
  32. « Comment le premier site web français a vu le jour au CNRS », sur CNRS Le journal (consulté le ).
  33. Présentation sur le site du W3C.
  34. Présentation sur le site du W3C.
  35. Annonce sur le site du CERN.
  36. (en) « Internet Statistics: Web Growth, Internet Growth », sur mit.edu (consulté le ).
  37. (en) « Web Server Survey », sur news.netcraft.com (consulté le ).
  38. (en) « Total number of Websites », sur internetlivestats.com (consulté le ).
  39. (en) « February 2007 Web Server Survey », sur news.netcraft.com (consulté le ).
  40. (en) « August 2007 Web Server Survey », sur news.netcraft.com (consulté le ).
  41. (en) « February 2008 Web Server Survey », sur news.netcraft.com (consulté le ).
  42. (en) « August 2008 Web Server Survey », sur news.netcraft.com (consulté le ).
  43. février 2009, sur le site netcraft.com.
  44. février 2011, sur le site netcraft.com.
  45. « About this project | Restoring the first website », sur first-website.web.cern.ch (consulté le ).
  46. (en) « Total number of Websites », sur internetlivestats.com (consulté le ).
  47. (en) Tim Berners-Lee, Mark Fischetti, Weaving the Web: the past, present and future of the World Wide Web by its inventor, Londres, Texere, , 272 p. [dĂ©tail de l’édition] (ISBN 1-58799-018-0), p. 62.
  48. comme http://perdu.com
  49. (en) The Deep Web: Surfacing Hidden Value, Michael K. Bergman, The Journal of Electronic Publishing, August, 2001, Volume 7, Issue 1.
  50. (en-US) Benjamin Smedberg, « Reducing Adobe Flash Usage in Firefox », sur Future Releases (consulté le )
  51. « Serveurs web : les géants aiment de plus en plus NGINX », sur ZDNet France (consulté le ).
  52. (en) https://www.acunetix.com/blog/web-security-zone/articles/statistics-from-the-top-1000000-websites/https://www.acunetix.com/blog/web-security-zone/articles/statistics-from-the-top-1000000-websites/ Statistics from the top 1,000,000 websites]

Voir aussi

Concepts généraux

Concepts du web

Technologies

Logiciels serveurs

Logiciels clients

Acteurs

Applications

Liens externes

Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplĂ©mentaires peuvent s’appliquer aux fichiers multimĂ©dias.