World Wide Web
Le World Wide Web (/ËwÉld waÉȘd ËwÉb/[alpha 1] ; littĂ©ralement la « toile (dâaraignĂ©e) mondiale », abrĂ©gĂ© www ou le Web), la toile mondiale ou la toile[1], est un systĂšme hypertexte public fonctionnant sur Internet. Le Web permet de consulter, avec un navigateur, des pages accessibles sur des sites. Lâimage de la toile dâaraignĂ©e vient des hyperliens qui lient les pages web entre elles[alpha 2].
Le Web est une des applications dâInternet[2], distincte dâautres applications comme le courrier Ă©lectronique, la visioconfĂ©rence et le partage de fichiers en pair Ă pair. InventĂ© en 1989-1990 par Tim Berners-Lee suivi de Robert Cailliau, c'est le Web qui a rendu les mĂ©dias grand public attentifs Ă Internet. Depuis, le Web est frĂ©quemment confondu avec Internet[3] ; en particulier, le mot toile est souvent utilisĂ© dans les textes non techniques sans qu'il soit clair si l'auteur dĂ©signe le Web ou Internet.
Terminologie
Synonymes de World Wide Web
Le World Wide Web est dĂ©signĂ© par de nombreux noms et abrĂ©viations synonymes : WorldWideWeb, World Wide Web, World-wide Web, Web, WWW, W3, Toile dâaraignĂ©e mondiale, Toile mondiale, Toile. Certains ont disparu. Le nom du projet originel « WorldWideWeb » est mentionnĂ© pour la premiĂšre fois dans une publication de 1990[4]. Les mots ont Ă©tĂ© rapidement sĂ©parĂ©s en World Wide Web pour amĂ©liorer la lisibilitĂ©. Le nom World-Wide Web a Ă©galement Ă©tĂ© utilisĂ© par les inventeurs du Web, mais le nom dĂ©sormais prĂ©conisĂ© par le World Wide Web Consortium (W3C) sĂ©pare les trois mots sans trait dâunion[5]. Bien que « mondial » sâĂ©crive world-wide ou worldwide en anglais, lâorthographe World Wide Web et lâabrĂ©viation Web sont maintenant bien Ă©tablies. Le terme World Wide Web est une allitĂ©ration appartenant au domaine des virelangues[6].
En inventant le Web, Tim Berners-Lee avait aussi pensĂ© Ă dâautres noms, comme Information Mesh (maillage dâinformations), Mine of Information ou encore The Information Mine (la mine dâinformations, dont le sigle serait Tim). Le sigle WWW a Ă©tĂ© largement utilisĂ© pour abrĂ©ger World Wide Web avant que lâabrĂ©viation Web prenne le pas. WWW se prononce souvent trois double V, triple double V, vĂ©vĂ©vĂ© ou wĂ©wĂ©wĂ© (en Belgique). La prononciation laborieuse (en français comme en anglais) de WWW a sans doute prĂ©cipitĂ© son dĂ©clin Ă lâoral. Ă lâĂ©crit, les lettres www restent trĂšs utilisĂ©es dans les adresses Web et quelques autres conventions techniques. WWW est parfois abrĂ©gĂ© en W3, abrĂ©viation quâon retrouve dans le sigle W3C du World Wide Web Consortium. Dans la seconde moitiĂ© des annĂ©es 1990, une blague rĂ©pandue prĂ©tendait que WWW signifiait World Wide Wait, soit « attente mondiale », car le rĂ©seau Internet Ă©tait engorgĂ© par la popularitĂ© grandissante du Web.
Pour Ă©crire « le web », lâusage de la minuscule est de plus en plus courant. LâOffice quĂ©bĂ©cois de la langue française prĂ©conise l'emploi de la majuscule dans ses propres communications, mais reconnait tout de mĂȘme explicitement la validitĂ© de la minuscule initiale[7]. En France, la Commission gĂ©nĂ©rale de terminologie prĂ©conise Ă partir de 1999 l'usage de la traduction « toile dâaraignĂ©e mondiale[8] », puis Ă partir de 2018 les termes de « toile » et « toile mondiale »[1].
Termes rattachés au web
Lâexpression « en ligne » signifie « connectĂ© Ă un rĂ©seau », en lâoccurrence le rĂ©seau informatique Internet. Cette expression nâest donc pas propre au web, mais Ă Internet dans sa globalitĂ©, on la retrouve Ă©galement Ă propos des rĂ©seaux tĂ©lĂ©phoniques.
Un hÎte est un ordinateur en ligne. Chaque hÎte d'Internet est identifié par une adresse IP à laquelle correspondent zéro, un ou plusieurs noms d'hÎte.
Une ressource du World Wide Web est une entitĂ© informatique (texte, image, forum Usenet, boĂźte aux lettres Ă©lectronique, etc.) accessible indĂ©pendamment dâautres ressources. Une ressource en accĂšs public est librement accessible depuis tout Internet. Lorsquâune ressource est prĂ©sente sur lâhĂŽte de lâutilisateur, elle est dite locale ; par opposition elle est distante si elle est prĂ©sente sur un hĂŽte diffĂ©rent. Lorsque celle-ci est connectĂ©e et disponible au rĂ©seau, elle est en ligne. On ne peut accĂ©der Ă une ressource distante quâen respectant un protocole de communication. Les fonctionnalitĂ©s de chaque protocole varient : rĂ©ception, envoi, voire Ă©change continu dâinformations.
HTTP (pour HyperText Transfer Protocol) est le protocole de communication communément utilisé pour transférer les ressources du Web. HTTPS est la variante avec authentification et chiffrement.
Une URL (pour Uniform Resource Locator, signifiant littĂ©ralement « localisateur de ressource uniforme ») est une chaĂźne de caractĂšres dĂ©crivant lâemplacement dâune ressource.
Elle contient gĂ©nĂ©ralement dans lâordre[9] :
- le nom du protocole ;
- un deux-points (:) ;
- deux barres obliques (//) ;
- un nom dâhĂŽte ;
- une barre oblique (/) ;
- un chemin composé de texte séparés par des barres obliques.
Exemple :https://www.example.com/un/chemin/page.html
Dans la langue courante informelle, on parle aussi d'adresse web au lieu d'URL. En outre, lorsque l'on donne une adresse web, on omet généralement la partie initiale en http://
ou https://
des URL.
Un hyperlien (ou dans le langage courant, un lien) est un Ă©lĂ©ment dans une ressource qui est associĂ© Ă une URL. Les hyperliens du web sont orientĂ©s : ils permettent dâaller dâune source Ă une destination. Seule la ressource Ă la source contient les donnĂ©es dĂ©finissant lâhyperlien. Ainsi, il est possible dâĂ©tablir un hyperlien sans la moindre intervention, ni coopĂ©ration, de la ressource cible de lâhyperlien. Ce modĂšle unilatĂ©ral adoptĂ© par le Web ne se retrouve pas dans tous les systĂšmes hypertextes. Il a lâavantage prĂ©pondĂ©rant, dans un rĂ©seau public mondial, de permettre la crĂ©ation dâinnombrables hyperliens entre partenaires dĂ©centralisĂ©s et non coordonnĂ©s.
HTML (pour HyperText Markup Language) et XHTML (Extensible HyperText Markup Language) sont les langages informatiques permettant de dĂ©crire le contenu dâun document (titres, paragraphes, disposition des images, etc.) et dây inclure des hyperliens. Un document HTML est un document dĂ©crit avec le langage HTML.
Dans un mode de communication client-serveur, un serveur est un hĂŽte sur lequel fonctionne un logiciel serveur auquel peuvent se connecter des logiciels clients fonctionnant sur des hĂŽtes clients, un seul hĂŽte peut contenir les deux.
Serveur HTTP
Un serveur HTTP (ou service web) est un logiciel utilisé pour servir des ressources à travers le protocole HTTP. Un client HTTP est un logiciel utilisé pour manipuler ces ressources[10].
Un serveur web est un hĂŽte sur lequel fonctionne un serveur HTTP (ou service web). Un serveur web peut hĂ©berger les ressources quâil dessert, peut les rĂ©cupĂ©rer sur des hĂŽtes distants, dĂ©livrer ces ressources telles quelles (on parlera alors de ressources statiques), ou bien les modifier en fonction de diffĂ©rents critĂšres, on parlera alors de ressources dynamiques. Il est courant sur les services de grosse taille que les ressources soient rĂ©parties sur diffĂ©rents serveurs Web et Ă©ventuellement diffĂ©rents types de serveurs HTTP, certains ayant de meilleures performances pour servir des ressources stockĂ©es dans des fichiers, dâautres plus de souplesse pour calculer les ressources Ă la demande. Un serveur web peut ĂȘtre un hĂŽte spĂ©cialisĂ©, une partie dâune infrastructure spĂ©cialisĂ©e ou bien encore un hĂŽte plus gĂ©nĂ©raliste. On appelle site web, lâensemble des ressources HTTP associĂ©es Ă un nom de domaine et un ou plusieurs noms dâhĂŽte.
Client HTTP
Un client HTTP est un outil permettant dâutiliser les ressources fournies par un serveur HTTP[11]. Il est chargĂ©, en relation avec diffĂ©rents services, de faire traduire le nom dâhĂŽte en adresse IP par un DNS, d'entrer en contact avec le serveur HTTP et de lui fournir diffĂ©rentes informations telles que le nom du site, et la ressource dĂ©sirĂ©e, ainsi que ses capacitĂ©s (gestion de diffĂ©rents types de ressource, capacitĂ© dâaffichage, possibilitĂ© de compression de donnĂ©es, etc.) ou sa volontĂ© (choix des langues, protection de la vie privĂ©e) dans lâutilisation des donnĂ©es fournies.
Un navigateur web est un type de logiciel client HTTP Ă interface homme-machine et conçu pour accĂ©der aux ressources du web. Sa fonction de base est de permettre la consultation des documents HTML disponibles sur les serveurs HTTP. Le support dâautres types de ressources et dâautres protocoles de communication dĂ©pend du type de navigateur.
Un robot dâindexation est, dans le domaine du web, un type de logiciel client HTTP, utilisĂ© pour indexer les diffĂ©rentes ressources de sites web.
Un agrégateur est, dans le domaine du web, un type de logiciel client HTTP, permettant de regrouper les fils de syndication de différents sites web.
Un aspirateur de site web est un client HTTP permettant de rĂ©cupĂ©rer lâintĂ©gralitĂ© dâun site web, pour le consulter ensuite hors-ligne ou en conserver une archive.
Documents
Une page web (ou page) est un document destinĂ© Ă ĂȘtre consultĂ© avec un navigateur web. Une page web est toujours constituĂ©e dâune ressource centrale (gĂ©nĂ©ralement un document HTML ou XHTML) et dâĂ©ventuelles ressources liĂ©es, automatiquement accessibles (par exemple, des images, des feuilles de style, des scripts javascript ou des fontes de caractĂšres). Il nâest pas exceptionnel quâun seul document HTML fasse appel Ă entre quelques dizaines et une centaine de ressources annexes.
Un Ă©diteur HTML (ou Ă©diteur web) est un logiciel conçu pour faciliter lâĂ©criture de documents HTML et de pages web en gĂ©nĂ©ral.
Un site web (ou site) est un ensemble de pages web et dâĂ©ventuelles autres ressources, liĂ©es dans une structure cohĂ©rente, publiĂ©es par un propriĂ©taire (une entreprise, une administration, une association, un particulier, etc.) et hĂ©bergĂ©es sur un ou plusieurs serveurs web. La page correspondant Ă l'URL racine d'un site Web est la page d'accueil.
Un systÚme de gestion de contenu (Content Management System, abrégé CMS) est un logiciel permettant de gérer le contenu d'un site.
Consultation et mesure
Visiter un site web signifie « consulter ses pages ». Le terme visite vient du fait que lâon consulte gĂ©nĂ©ralement plusieurs pages dâun site, comme on visite les piĂšces dâun bĂątiment. La visite est menĂ©e par un utilisateur (visiteur ou internaute).
Lâexpression « surfer sur le web » signifie « consulter le web ». Elle a Ă©tĂ© inventĂ©e pour mettre lâaccent sur le fait que consulter le web consiste Ă suivre de nombreux hyperliens de page en page. Elle est principalement utilisĂ©e par les mĂ©dias ; elle nâappartient pas au vocabulaire technique.
On appelle rĂ©fĂ©rent, la ressource ayant conduit un visiteur Ă une ressource servie. Elles sont donnĂ©es par dĂ©faut par la majoritĂ© des clients HTTP, mais peuvent ĂȘtre bloquĂ©es.
La mesure de lâaudience est lâĂ©tude des consultations effectuĂ©es sur un site, elle vise Ă comprendre les dĂ©sirs des utilisateurs, en fonction des ressources les plus utilisĂ©es et du fil dâAriane de ceux-ci.
La mesure dâaudience peut se faire de diffĂ©rentes maniĂšres :
- analyse des journaux du serveur. Les calculs de mesure de lâaudience peuvent alors ĂȘtre effectuĂ©s en temps rĂ©el au moment de la visite, ou bien en diffĂ©rĂ© ;
- utilisation de scripts sur le serveur web lui-mĂȘme ;
- utilisation dâimages invisibles dĂ©portĂ©es sur un serveur web tiers (mesure dâaudience simple) ;
- utilisation de script en langage JavaScript et envoi des informations au serveur web ou Ă un serveur tiers (mesure dâaudience plus complĂšte).
MĂ©tiers du web
On appelle hébergeur web une personne physique ou morale qui propose des serveurs Web à la location.
Une agence web est une entreprise de services informatiques réalisant des sites web pour ses clients.
Un développeur web est un programmeur spécialisé dans les technologies du Web.
Types de services web
Un service web est une technologie client-serveur fondée sur les protocoles du web.
Un annuaire web est un site web répertoriant des sites web.
Un moteur de recherche est un site permettant de rechercher des mots dans lâensemble des sites web.
Un portail web est un site web tentant de regrouper la plus large palette dâinformations et de services possibles dans un site web. Certains portails sont thĂ©matiques.
Un agrégateur web est un site web qui sélectionne, organise et, éventuellement, valide des pages concernant un sujet précis, et les met en forme de façon ergonomique ou attractive.
Un blog est une partie de site web oĂč sont rĂ©guliĂšrement publiĂ©s des articles personnels.
Un webmail est site web fournissant les fonctionnalités d'un client de messagerie de courrier électronique.
Un wiki est un site web Ă©ditable par les utilisateurs.
Histoire
Tim Berners-Lee travaille comme informaticien dans le bĂątiment 31, localisĂ© en France[12] (46° 13âČ 57âł N, 6° 02âČ 42âł E[13]) de lâOrganisation europĂ©enne pour la recherche nuclĂ©aire (CERN) dans le dĂ©partement de l'Ain[14] et dont le siĂšge est situĂ© en Suisse, Ă proximitĂ© de GenĂšve, lorsquâil propose, en 1989, de crĂ©er un systĂšme hypertexte distribuĂ© sur le rĂ©seau informatique pour que les collaborateurs puissent partager les informations au sein du CERN[15].
Cette mĂȘme annĂ©e, les responsables du rĂ©seau du CERN dĂ©cident dâutiliser le protocole de communication TCP/IP et le CERN ouvre sa premiĂšre connexion extĂ©rieure avec Internet[16]. LâannĂ©e suivante, lâingĂ©nieur systĂšme Robert Cailliau se joint au projet dâhypertexte au CERN, immĂ©diatement convaincu de son intĂ©rĂȘt, et se consacre Ă©nergiquement Ă sa promotion[17]. Tim Berners-Lee et Robert Cailliau sont souvent reconnus comme les deux personnes Ă lâorigine du World Wide Web en qualitĂ© de co-inventeurs, bien que Robert Cailliau ne se soit jamais attribuĂ© la paternitĂ© du Web[18] - [19]. Tim Berners-Lee crĂ©e le premier navigateur et Ă©diteur web, appelĂ© WorldWideWeb et le premier serveur HTTP appelĂ© CERN httpd.
Vers 1992, Tim Berners-Lee souhaite lĂ©guer son invention (spĂ©cifications et code sources) au domaine public. Robert Cailliau lâaide Ă obtenir lâaccord du CERN et y arrive en 1993. Jusque-lĂ , le web est essentiellement dĂ©veloppĂ© sous lâimpulsion de Tim Berners-Lee et Robert Cailliau, mais les choses changent avec lâapparition de NCSA Mosaic, un navigateur web dĂ©veloppĂ© par Eric Bina et Marc Andreessen au National Center for Supercomputing Applications (NCSA), dans lâIllinois. NCSA Mosaic jette les bases de lâinterface graphique des navigateurs modernes en intĂ©grant les images au texte et cause un accroissement exponentiel de la popularitĂ© du web. Certains dĂ©veloppeurs de Mosaic, crĂ©eront ensuite Netscape Navigator qui apporte le parallĂ©lisme, permettant Ă©galement dâutiliser les pages avec image sur des connexions bas dĂ©bit. Celui-ci, dâĂ©volutions en Ă©volutions, est devenu aujourdâhui Mozilla Firefox. Le NCSA produit Ă©galement le NCSA HTTPd, un serveur HTTP qui Ă©voluera en Apache HTTP Server, le serveur HTTP le plus utilisĂ© depuis 1996. Le , le CERN verse dans le domaine public ses logiciels Web afin de promouvoir la diffusion Web[20].
En 1994, Netscape Communications Corporation est fondĂ©e avec une bonne partie de lâĂ©quipe de dĂ©veloppement de NCSA Mosaic. Sorti fin 1994, Netscape Navigator supplante NCSA Mosaic en quelques mois. En 1995, Microsoft essaie de concurrencer Internet avec The Microsoft Network (MSN) et Ă©choue. Fin 1995, aprĂšs la sortie de Windows 95 sans le moindre navigateur web prĂ©installĂ©, Microsoft lance avec Internet Explorer la guerre des navigateurs contre Netscape Navigator.
Chronologie
Les premiÚres années de cet historique sont largement issues de A Little History of the World Wide Web (Une petite histoire du World Wide Web)[21].
- 1989
- Le 13 mars, Tim Berners-Lee, engagĂ© au CERN Ă GenĂšve en 1984 pour travailler sur lâacquisition et le traitement des donnĂ©es[22], propose de dĂ©velopper un systĂšme hypertexte organisĂ© en Web, afin dâamĂ©liorer la diffusion des informations internes : Information Management: A Proposal[15].
- 1990 Le premier serveur web, un NeXT Cube.
- Robert Cailliau rejoint le projet et collabore à la révision de la proposition : WorldWideWeb: Proposal for a HyperText Project[4].
- Ătendue : Le premier serveur web est
nxoc01.cern.ch
; la premiĂšre page web esthttp://nxoc01.cern.ch/hypertext/WWW/TheProject.html
[23] ; la plus ancienne page conservĂ©e en l'Ă©tat date du 13 novembre[24]. - Logiciels : Le premier navigateur web, appelĂ© WorldWideWeb (plus tard rebaptisĂ© Nexus) est dĂ©veloppĂ© en Objective C sur NeXT[25]. En plus dâĂȘtre un navigateur, WorldWideWeb est un Ă©diteur web. Le navigateur mode texte line-mode est dĂ©veloppĂ© en langage C pour ĂȘtre portable sur les nombreux modĂšles dâordinateurs et simples terminaux de lâĂ©poque.
- Technologies : Les trois technologies Ă la base du web, URL, HTML et HTTP, sont Ă lâĆuvre. Sur NeXT, des feuilles de style simples sont Ă©galement utilisĂ©es, ce qui ne sera plus le cas jusquâĂ lâapparition des Cascading Style Sheets.
- 1991
- 1992
- 1993
- Le 30 avril, le CERN renonce aux droits dâauteur sur les logiciels du World Wide Web et permet leur mise dans le domaine public[35]. Ă la fin de lâannĂ©e, les mĂ©dias grand public remarquent Internet et le WWW.
- Ătendue : 130 sites web en juin, 623 en dĂ©cembre[36] ; lâusage croĂźt dâun rythme annuel de 341 634 %.
- Logiciels : Apparitions des navigateurs NCSA Mosaic et Lynx. Disponible dâabord sur X Window, puis sur Windows et MacOS, Mosaic cause un phĂ©nomĂ©nal accroissement de la popularitĂ© du web.
- Technologies : images dans les pages web (Mosaic 0.10) ; formulaires interactifs (Mosaic 2.0pre5).
- 1994
- Ătendue : 2 738 sites en juin, 10 022 en dĂ©cembre.
- Sites : Yahoo! créé par deux étudiants ; apparition de la publicité sur HotWired.
- Logiciels : Netscape Navigator 1.0.
- Standards : fondation du World Wide Web Consortium ; RFC 1738 (Uniform Resource Locators).
- 1995
- Microsoft crĂ©e MSN pour concurrencer Internet et le web, puis change dâavis et lance la guerre des navigateurs.
- Ătendue : 23 500 sites en juin (18 957 en aoĂ»t selon la premiĂšre mesure de Netcraft[37]).
- Logiciels : serveur HTTP Apache ; Microsoft Internet Explorer 1.0 et 2.0.
- Sites : moteur de recherche AltaVista.
- Technologies : formatage tabulaire (Netscape Navigator 1.1b1), documents multi-cadres (Netscape Navigator 2.0b1), Java, JavaScript (Netscape Navigator 2.0b3), PHP.
- Standards : RFC 1866 (HTML 2.0).
- 1996
- Ătendue : 100 000 sites en janvier, environ 230 000 en juin.
- Logiciels : Netscape Navigator 2.0 et 3.0 ; Internet Explorer 3.0 ; Opera 2.1.
- Standards : RFC 1945 (HTTP/1.0) ; CSS level 1.
- Sites : Internet Archive commence Ă archiver le web.
- 1997
- Ătendue : plus de 1 000 000 sites en avril selon Netcraft.
- Logiciels : Netscape Navigator 4.0 ; Internet Explorer 4.0.
- Standards : HTML 3.2 ; HTML 4.0.
- 1998
- 1999
- Ătendue : plus de 4 000 000 de sites en janvier, plus de 7 400 000 en aoĂ»t.
- Logiciels : Internet Explorer 5.0.
- Standards : HTML 4.01 ; RFC 2616 (HTTP/1.1).
- 2000
- 2001
- Ătendue : 27 585 719 sites en janvier, 30 775 624 en aoĂ»t.
- Logiciels : Internet Explorer 6.
- Sites : Wikipédia.
- 2002
- Ătendue : 36 689 008 sites en janvier, 35 991 815 en aoĂ»t.
- Logiciels : Mozilla 1.0.
- 2003
- Ătendue : 35 863 952 sites en fĂ©vrier, 42 807 275 en aoĂ»t.
- Logiciels : Safari.
- 2004
- Le concept de Web 2.0 (désignant un phénomÚne préexistant) apparaßt.
- Ătendue : 46 067 743 sites en janvier, 53 341 867 en aoĂ»t.
- Standards : création du Web Hypertext Application Technology Working Group (WHATWG).
- Sites : Facebook
- Logiciels : Mozilla Firefox 1.0.
- 2005
- Ătendue : 59 100 880 sites en fĂ©vrier, 70 392 567 en aoĂ»t
- Logiciels : Mozilla Firefox 1.5.
- 2006
- Ătendue : 85 507 314 sites en juin[38], 76 184 000 sites en fĂ©vrier, 92 615 362 en aoĂ»t.
- Logiciels : Internet Explorer 7, Mozilla Firefox 2.0.
- 2007
- 2008
- Ătendue : 158 209 426 sites en fĂ©vrier[41], 176 748 506 en aoĂ»t[42].
- Logiciels : Mozilla Firefox 3.0 ; Google Chrome 0.2.
- 2009
- Ătendue : 216 000 000 sites en fĂ©vrier[43]
- Logiciels : Internet Explorer 8 ; Mozilla Firefox 3.5, qui inclut TraceMonkey, premier moteur dâexĂ©cution JavaScript avec compilation Ă la volĂ©e ; Safari 4 ; Opera 10
- 2010
- Logiciels : Mozilla Firefox 3.6 ; Google Chrome 4 ; Safari 5
- 2011
- Ătendue : 284 842 077 sites en fĂ©vrier[44] 312 693 296 sites en avril[37]
- Logiciels : Google Chrome 9 (février), 10 (mars), 11 (avril), 12 (juin), 13 (août), 14 (septembre), 15 (octobre), 16 (décembre) ; Mozilla Firefox 4 (mars), 5 (fin juin), 6 (fin août) et 7 (fin septembre) ; Internet Explorer 9 ; Opera 11
- 2012
- Logiciels : Mozilla Firefox 16 (octobre) ; Google Chrome 19 (mai) ; Safari 6.0 (juillet)
- 2013
- Dans un projet de restauration historique[45], le CERN remet en ligne la page présentant le projet du web :
http://info.cern.ch/hypertext/WWW/TheProject.html
. - Logiciels : Internet Explorer 11
- Dans un projet de restauration historique[45], le CERN remet en ligne la page présentant le projet du web :
- 2014
- Ătendue : 1 000 000 000 sites en septembre[46]
- Logiciels : Mozilla Firefox 29
- 2015
- Logiciels : Microsoft Edge
Ăvolution de lâusage
En crĂ©ant le logiciel WorldWideWeb, Tim Berners-Lee a crĂ©Ă© Ă la fois le premier navigateur web et le premier Ă©diteur web, car il voulait faire du web un mĂ©dia collaboratif, dans lequel tous les acteurs consultent et crĂ©ent lâinformation. Cependant, le web sâest immĂ©diatement orientĂ© en un mĂ©dia de diffusion dâinformation global plutĂŽt que de collaboration[47].
Dans la premiĂšre moitiĂ© des annĂ©es 1990, le concept de site web Ă la racine dâun nom de domaine stable nâĂ©tait pas Ă©tabli, Ă commencer par la premiĂšre page web dont lâadresse Ă©tait http://nxoc01.cern.ch/hypertext/WWW/TheProject.html
. Les sites Ă©taient souvent mis en place dans des dĂ©partements techniques par des employĂ©s et des Ă©tudiants, et les URL changeaient au grĂ© des changements de personnes et dâinfrastructure. En outre, il nâexistait pas de moteur de recherche efficace. Aussi de nombreuses pages Ă©taient des listes de liens sur les pages prĂ©fĂ©rĂ©es de lâauteur de la page. Cette propriĂ©tĂ© du web sera dâailleurs exploitĂ©e plus tard par les crĂ©ateurs de Google pour calculer la pertinence des pages, puis dĂ©tournĂ©e par les fermes de liens. Mais bien avant cela, en janvier 1994, Yahoo! est crĂ©Ă© et devient rapidement le plus grand annuaire web. Comme les crĂ©ateurs de Yahoo! Ă©taient des Ă©tudiants de lâuniversitĂ© Stanford, LâURL originale Ă©tait http://akebono.stanford.edu/yahoo
, et ce nâest quâen janvier 1995 que le domaine yahoo.com
est créé.
Dans la seconde moitiĂ© des annĂ©es 1990, le web devient populaire, et toutes les grandes entreprises, organisations, Ă©coles, administrations, ouvrent un site web. Les moteurs de recherche deviennent efficaces, notamment avec lâapparition dâAltavista[alpha 3] en dĂ©cembre 1995, et pour finir Google en 1998. Dans cette phase de dĂ©veloppement du mĂ©dia, un flot dâinformation top-down prĂ©domine : un site web est fait pour diffuser les informations de son propriĂ©taire. Les interactions sâarrĂȘtent souvent Ă la recherche et au commerce en ligne. Bien sĂ»r, le courrier Ă©lectronique, la messagerie instantanĂ©e, et les forums de discussion existaient depuis plus longtemps que le web, mais ils fonctionnaient principalement avec des protocoles et logiciels spĂ©cifiques (voir CatĂ©gorie:Logiciel de messagerie instantanĂ©e, CatĂ©gorie:Logiciel de courrier Ă©lectronique, CatĂ©gorie:Client Usenet).
Web 2.0
Avec les annĂ©es 2000 les notions de blog, de wiki (en 2001, lancement de la WikipĂ©dia en anglais) et de rĂ©seautage social (Myspace en 2003, Facebook en 2004) deviennent populaires. Le contenu gĂ©nĂ©rĂ© par les utilisateurs se rĂ©pand (WikipĂ©dia, YouTube en 2005, Twitter en 2006). La technologie Ajax (1998, thĂ©orisĂ©e en 2005) commence Ă ĂȘtre largement utilisĂ©e pour crĂ©er des applications complĂštes qui tiennent dans une seule page web (Google Maps en 2004). Lâexpression Web 2.0, largement popularisĂ©e au milieu des annĂ©es 2000, dĂ©signe cette transition dans le flux de lâinformation et la maniĂšre dâutiliser le web. Le succĂšs de lâexpression « Web 2.0 » a conduit de nombreuses personnes Ă appeler « Web 2.5 », 3.0, 4.0, etc. leur vision du Web de lâavenir.
Architecture
ModÚle mathématique
Le World Wide Web, en tant quâensemble de ressources hypertextes, est modĂ©lisable en graphe orientĂ© possĂ©dant des cycles avec les ressources pour sommets et les hyperliens pour arcs. Comme le graphe est orientĂ©, certaines ressources peuvent constituer des puits, ou moins formellement des culs-de-sac[48] : il nâexiste aucun chemin vers le reste du web. Ă lâinverse, certaines ressources peuvent constituer des sources : il nâexiste aucun chemin depuis le reste du web.
Les analyses ont montrĂ© que la structure du web rĂ©pondait au modĂšle des rĂ©seaux invariants dâĂ©chelle prĂ©sent dans la plupart des rĂ©seaux sociaux. Cela se traduit par la prĂ©sence de moyeux, les hubs, vers lesquels convergent les liens hypertextes : ce sont les sites les plus importants qui constituent le squelette du web.
Techniquement, rien ne distingue le World Wide Web dâun quelconque autre web utilisant les mĂȘmes technologies. Ainsi, dâinnombrables webs privĂ©s existent. Dans la pratique, on considĂšre quâune page dâun site web populaire, comme un annuaire web, fait partie du web. Le web peut alors ĂȘtre dĂ©fini comme Ă©tant lâensemble des ressources et des hyperliens que lâon peut rĂ©cursivement dĂ©couvrir Ă partir de cette page, ce qui exclut les sources et les webs privĂ©s.
Exploration du web et web profond
Lâexploration rĂ©cursive du web Ă partir de ressources bien choisies est la mĂ©thode de base programmĂ©e dans les robots dâindexation des moteurs de recherche. En 2004, les moteurs de recherche indexent environ quatre milliards de ressources.
Le web profond, ou web invisible, est la partie du web qui nâest pas indexĂ©e et donc introuvable avec les moteurs de recherche gĂ©nĂ©ralistes. Une Ă©tude publiĂ©e en 2001 indiquait que la partie invisible du web reprĂ©sente plus de 99 % du web[49]. Le web profond comprend notamment les ressources suivantes :
- les ressources inaccessibles au public, donc aux robots, notamment les pages administratives ou payantes, protégées par un mot de passe ;
- les ressources qui ne sont pas communiquées par des protocoles de communication pris en charge par les robots (souvent ils ne prennent en charge que HTTP et HTTPS) ;
- les ressources dont le format de donnĂ©es nâest pas pris en charge par le robot ;
- les ressources listĂ©es dans un fichier dâexclusion des robots ;
- les ressources exclues par le robot car elles sont conçues pour abuser du référencement (spamdexing) ;
- les ressources exclues par le robot car elles sont considérées comme trop peu pertinentes (par exemple si un site contient des millions de ressources qui ne sont liées par aucun autre site) ;
- les ressources vers lesquelles les hyperliens sont créés dynamiquement en réponse aux interrogations des visiteurs.
- Ces derniÚres ressources proviennent généralement de bases de données et constituent la partie la plus importante du web profond.
Serveurs publics
Lâexploration rĂ©cursive nâest pas le seul moyen utilisĂ© pour indexer le web et mesurer sa taille. Lâautre solution consiste Ă mesurer lâinfrastructure informatique connectĂ©e Ă Internet pour hĂ©berger des sites web. Au lieu de suivre des hyperliens, cette mĂ©thode consiste Ă utiliser les noms de domaine enregistrĂ©s dans le Domain Name System et essayer de se connecter Ă tous les serveurs web potentiels. Câest notamment la mĂ©thode utilisĂ©e par la sociĂ©tĂ© Netcraft, qui publie rĂ©guliĂšrement les rĂ©sultats de ses explorations, dont les mesures de popularitĂ© des serveurs HTTP. Cette mesure porte plus sur lâutilisation des technologies du web que sur le web lui-mĂȘme. Elle permet notamment de trouver des sites publics qui ne sont pas liĂ©s au World Wide Web.
Intranets et webs privés
Un site web mis en ligne sur un intranet est privé, car le public ne peut pas accéder à un intranet.
En outre, si lâon met en ligne un site web sur Internet en omettant de crĂ©er des liens depuis au moins une page existante du World Wide Web, alors ce site constitue un web isolĂ©. Il est virtuellement privĂ©, car le public ne peut pas le dĂ©couvrir en suivant des hyperliens.
Archivage
Le web change constamment : les ressources ne cessent dâĂȘtre crĂ©Ă©es, modifiĂ©es et supprimĂ©es. Il existe quelques initiatives dâarchives du web dont le but est de permettre de retrouver ce que contenait un site Ă une date donnĂ©e. Le projet Internet Archive est lâun dâeux.
Types de ressource
Les divers types de ressource du web ont des usages assez distincts :
- les ressources constituant les pages web : documents HTML, images JPEG ou PNG ou GIF, scripts JavaScript, feuilles de style CSS, sons, animations, vidéo ;
- les ressources accessibles depuis une page web mais consultables avec une interface particuliĂšre : applet ;
- les ressources conçues pour ĂȘtre consultĂ©es sĂ©parĂ©ment : documents (PDF, PostScript, Word, etc.), fichier texte, images de tout type, morceaux de musique, vidĂ©o, fichiers Ă sauvegarder ;
- les ressources appartenant à des systÚmes qui ont une existence indépendante du web, mais vers lesquelles il est possible de créer un hyperlien : forums Usenet, boßtes aux lettres électroniques, fichiers locaux.
Documents HTML
Le document HTML est la principale ressource dâune page web, celle qui contient les hyperliens, qui contient et structure le texte, qui lie et dispose les ressources multimĂ©dias. Un document HTML contient uniquement du texte : le texte consultĂ©, le texte en langage HTML plus dâĂ©ventuels autres langages de script ou de style.
La prĂ©sentation de documents HTML est la principale fonctionnalitĂ© dâun navigateur web. HTML laisse au navigateur le soin dâexploiter au mieux les capacitĂ©s de lâordinateur pour prĂ©senter les ressources. Typiquement, la police de caractĂšre, la longueur des lignes de texte, les couleurs, etc, doivent ĂȘtre adaptĂ©es au pĂ©riphĂ©rique de sortie (Ă©cran, imprimante, etc).
Multimédia
Les Ă©lĂ©ments multimĂ©dias proviennent gĂ©nĂ©ralement de ressources indĂ©pendantes du document HTML. Les documents HTML contiennent des hyperliens pointant sur les ressources multimĂ©dias, qui peuvent donc ĂȘtre Ă©parpillĂ©es sur Internet. Les Ă©lĂ©ments multimĂ©dias liĂ©s sont automatiquement transfĂ©rĂ©s pour prĂ©senter une page web.
Seul lâusage des images et des petites animations est standardisĂ©. Le support du son, de la vidĂ©o, dâespaces tridimensionnels ou dâautres Ă©lĂ©ments multimĂ©dias repose encore sur des technologies non standardisĂ©es. De nombreux navigateurs web proposent la possibilitĂ© de greffer des logiciels (plugin) pour Ă©tendre leurs fonctionnalitĂ©s, notamment le support de types de mĂ©dia non standard.
Les flux (audio, vidĂ©o) nĂ©cessitent un protocole de communication au fonctionnement diffĂ©rent de HTTP. Câest une des raisons pour lesquelles ce type de ressource nĂ©cessite souvent un plugin et est mal intĂ©grĂ© aux pages web.
Images
Ce chapitre concerne les images intĂ©grĂ©es aux pages web. Lâusage du format de donnĂ©es JPEG est indiquĂ© pour les images naturelles, principalement les photographies.
Lâusage du format de donnĂ©es PNG est indiquĂ© pour les images synthĂ©tiques (logos, Ă©lĂ©ments graphiques). Il est aussi indiquĂ© pour les images naturelles, mais uniquement lorsque la qualitĂ© prime totalement sur la durĂ©e du transfert. Lâusage du format de donnĂ©es GIF est indiquĂ© pour les petites animations. Pour les images synthĂ©tiques, la popularitĂ© ancienne de GIF le fait souvent prĂ©fĂ©rer Ă PNG. Cependant, GIF souffre de quelques dĂ©savantages, notamment la limitation du nombre de couleurs et un degrĂ© de compression gĂ©nĂ©ralement moindre. En outre une controverse a entourĂ© lâusage de GIF de 1994 Ă 2004 car Unisys a fait valoir un brevet couvrant la mĂ©thode de compression. Lâusage dâimages de format de donnĂ©es XBM est obsolĂšte.
Vidéo
Jusque dans les annĂ©es 2000, la consultation de musique et vidĂ©o demandait lâinstallation dâun programme ad hoc (un plugin) pour Ă©tendre les fonctionnalitĂ©s du navigateur web. La trĂšs grande diffusion du plugin Flash Player a finalement rendu la consultation vidĂ©o aussi simple que celle des images. Finalement, la cinquiĂšme version langage HTML (HTML 5) a intĂ©grĂ© la vidĂ©o.
Scripts et animations
Un langage de script permet dâĂ©crire le texte dâun programme directement exĂ©cutĂ© par un logiciel. Dans le cadre du web, un script est exĂ©cutĂ© par un navigateur web et programme des actions rĂ©pondant Ă lâusage que le visiteur fait de la page web consultĂ©e. Un script peut ĂȘtre intĂ©grĂ© au document HTML ou provenir dâune ressource liĂ©e. Le premier langage de script du web fut JavaScript, dĂ©veloppĂ© par Netscape. Ensuite Microsoft a dĂ©veloppĂ© une variante concurrente sous le nom de JScript. Finalement, la norme ECMAScript a Ă©tĂ© proposĂ©e pour la syntaxe du langage, et les normes DOM pour lâinterface avec les documents.
De technologie aux capacitĂ©s dâactions trĂšs limitĂ©es Ă ses dĂ©buts, le langage JavaScript est devenu capable dâexĂ©cuter toutes les applications imaginables : traitement de texte, jeu vidĂ©o, Ă©mulateur, etc.
Encore plus que pour la vidĂ©o, le plugin Adobe Flash Player est devenu trĂšs largement utilisĂ© pour la diffusion dâanimations. Parfois, des sites entiers sont rĂ©alisĂ©s en Flash. Il est cependant en voie de disparition car les navigateurs souhaitent en bannir lâusage[50].
Styles
Le langage CSS a Ă©tĂ© dĂ©veloppĂ© pour gĂ©rer en dĂ©tail la prĂ©sentation des documents HTML. Le texte en langage CSS peut ĂȘtre intĂ©grĂ© au document HTML ou provenir de ressources liĂ©es, les feuilles de style. Cette sĂ©paration permet une gestion sĂ©parĂ©e de lâinformation (contenue dans des documents HTML) et de sa prĂ©sentation (contenue dans des feuilles de style). On parle aussi de « sĂ©paration du fond et de la forme ».
Autres
La gestion des autres types de ressource dĂ©pend des logiciels installĂ©s sur lâhĂŽte client et de leurs rĂ©glages.
Lorsque le logiciel correspondant est disponible, les documents et images de tout type sont gĂ©nĂ©ralement automatiquement prĂ©sentĂ©s, selon des modalitĂ©s (fenĂȘtrage, dialogues) dĂ©pendant du navigateur web et du logiciel gĂ©rant le type. Lorsque le type de la ressource nâest pas gĂ©rĂ©, il est gĂ©nĂ©ralement possible de la sauver dans un fichier local.
Pour gĂ©rer les ressources de systĂšmes diffĂ©rents du web comme le courrier Ă©lectronique, les navigateurs font habituellement appel Ă des logiciels sĂ©parĂ©s. Si aucun logiciel ne gĂšre un type de ressource, un simple message dâerreur lâindique.
Conception
Universalité
Le web a Ă©tĂ© conçu pour ĂȘtre accessible avec les Ă©quipements informatiques les plus divers : station de travail, terminal informatique en mode texte, ordinateur personnel, tĂ©lĂ©phone portable, etc. Cette universalitĂ© dâaccĂšs dĂ©pend en premier lieu de lâuniversalitĂ© des protocoles Internet. En second lieu, elle dĂ©pend de la flexibilitĂ© de prĂ©sentation des pages web, offerte par HTML. En outre, HTTP offre aux navigateurs la possibilitĂ© de nĂ©gocier le type de chaque ressource. Enfin, CSS permet de proposer diffĂ©rentes prĂ©sentations, sĂ©lectionnĂ©es pour leur adĂ©quation avec lâĂ©quipement utilisĂ©.
Le W3C a pour cela crĂ©Ă© des normes dans le but de permettre lâindĂ©pendance des outils qui servent Ă crĂ©er du contenu avec ceux qui servent Ă le lire. On appelle cela lâinteropĂ©rabilitĂ©.
LâaccessibilitĂ© du web pour les individus handicapĂ©s est aussi lâobjet dâattentions particuliĂšres comme la Web Accessibility Initiative.
DĂ©centralisation
Les technologies du web nâimposent pas dâorganisation entre les pages web, ni Ă fortiori entre les sites web. Toute page du web peut contenir des hyperliens vers toute autre ressource accessible dâInternet. LâĂ©tablissement dâun hyperlien ne requiert absolument aucune action du cĂŽtĂ© de la ressource pointĂ©e. Il nây a pas de registre centralisĂ© dâhyperliens, de pages ou de sites. Le seul registre utilisĂ© est celui du DNS ; câest une base de donnĂ©es distribuĂ©e qui rĂ©pertorie les hĂŽtes, permet de traduire en adresse IP le nom de domaine contenu dans certains hyperliens et qui est utilisĂ©e par tous les systĂšmes accĂ©dant Ă Internet.
Cette conception dĂ©centralisĂ©e devait favoriser, et a favorisĂ©, une augmentation rapide de la taille du web. Elle a aussi favorisĂ© lâessor de sites spĂ©cialisĂ©s dans les informations sur les autres sites : les annuaires et les moteurs de recherche. Sans ces sites, la recherche dâinformation dans le web serait extrĂȘmement laborieuse. La dĂ©marche inverse, le portail web, tente de concentrer un maximum dâinformations et de services dans un seul site.
Une faiblesse de la dĂ©centralisation est le manque de suivi lorsquâune ressource est dĂ©placĂ©e ou supprimĂ©e : les hyperliens qui la pointaient se retrouvent cassĂ©s. Et cela nâest visible quâen suivant lâhyperlien, le rĂ©sultat le plus courant Ă©tant le message dâerreur 404.
Technologies
Préexistantes
Le web repose sur les technologies dâInternet, notamment TCP/IP pour assurer le transfert des donnĂ©es, DNS pour convertir les noms dâhĂŽte en adresses IP et MIME pour indiquer le type des donnĂ©es. Les standards de codage des caractĂšres et les formats dâimage numĂ©rique GIF et JPEG ont Ă©tĂ© dĂ©veloppĂ©s indĂ©pendamment.
Spécifiques
Trois technologies ont dĂ» ĂȘtre dĂ©veloppĂ©es pour le World Wide Web :
- les URL pour pouvoir identifier toute ressource dans un hyperlien ;
- le langage HTML pour Ă©crire des pages web contenant des hyperliens ;
- le protocole de communication HTTP utilisĂ© entre les navigateurs et les serveurs web, qui permet dâindiquer le type MIME des ressources transfĂ©rĂ©es.
Ces premiĂšres technologies ont Ă©tĂ© normalisĂ©es comme les autres technologies dâInternet : en utilisant le processus des Request for Comments. Cela a donnĂ© le RFC 1738 pour les URL, le RFC 1866 pour HTML 2.0 et le RFC 1945 pour HTTP/1.0.
Le World Wide Web Consortium (W3C) a Ă©tĂ© fondĂ© en 1994 pour dĂ©velopper et promouvoir les nouveaux standards du web. Son rĂŽle est notamment de veiller Ă lâuniversalitĂ© des nouvelles technologies. Des technologies ont Ă©galement Ă©tĂ© dĂ©veloppĂ©es par des entreprises privĂ©es.
Actuelles
Les principaux standards actuels sont :
- ASCII et UTF-8 pour le codage des caractĂšres ;
- HTML 4 fondé sur SGML ;
- XHTML fondé sur XML ;
- HTML5 fondé sur la pratique courante des années 2000 ;
- le RFC 3986 (Uniform Resource Identifier (URI): Generic Syntax), qui recouvre les URL ;
- les RFC 7230 (HTTP/1.1 Message Syntax and Routing), RFC 7231 (Hypertext Transfer Protocol (HTTP/1.1): Semantics and Content), RFC 7232 (Hypertext Transfer Protocol (HTTP/1.1): Conditional Requests), RFC 7233 (Hypertext Transfer Protocol (HTTP/1.1): Range Requests), RFC 7234 (Hypertext Transfer Protocol (HTTP/1.1): Caching), RFC 7235 (Hypertext Transfer Protocol (HTTP/1.1): Authentication), anciennement RFC 2616 (HTTP/1.1) ;
- les feuilles de styles en cascade CSS level 1, level 2.1, level 3 ;
- les modĂšles de document DOM level 1 et level 2 ;
- le langage de script JavaScript pour manipuler les documents ;
- le format de donnée JSON, dérivé de JavaScript
- les formats dâimage numĂ©rique PNG, JPEG et GIF ;
- Scalable Vector Graphics (SVG) pour les images vectorielles ;
- WebGL pour la synthĂšse d'image 3D.
Technologies serveur
Outre les protocoles de communication et formats de donnĂ©es utilisĂ©s dans le Web, plusieurs techniques propres au Web sont mises en Ćuvre pour faire fonctionner les serveurs HTTP (ou serveurs web). Comme ces techniques ne concernent pas les logiciels client du Web, elles ne sont pas standardisĂ©es par le World Wide Web Consortium.
Serveur HTTP
Le serveur HTTP est chargĂ© de recevoir les requĂȘte des agents HTTP, et de rĂ©pondre avec la ressource demandĂ©e. Il peut sâagir d'informations existantes, aussi appelĂ©es statiques, souvent enregistrĂ©es dans des fichiers, ou d'informations Ă produire Ă la volĂ©e, aussi appelĂ©es dynamiques. La fourniture des pages dynamiques est dĂ©lĂ©guĂ©e Ă des applications autonomes sur le serveur. Il doit Ă©galement ĂȘtre capable de gĂ©rer les erreurs, si les ressources ne sont pas trouvĂ©es ou sâil y a une erreur dans la production de la ressource, en retournant le message adĂ©quat. Le premier serveur HTTP fut CERN httpd et est rapidement tombĂ© en dĂ©suĂ©tude. En 2014, les principaux serveurs Web utilisĂ©s sont Apache HTTP Server, serveur dominant du marchĂ© depuis des annĂ©es, Nginx utilisĂ© sur les sites Ă plus forte audience, mais aussi Microsoft IIS, Google Web Server ou encore Lighttpd[51].
Le standard Common Gateway Interface (CGI) est un protocole de communication inter-processus entre le serveur HTTP et des applications externes situĂ©es Ă©galement sur le serveur. Ce standard est gĂ©rĂ© par lâIETF. Le standard FastCGI permet de sĂ©parer plus efficacement le serveur HTTP des applications et de mieux contrĂŽler le nombre dâinstances d'applications du cĂŽtĂ© serveur.
Certains langages couramment utilisĂ©s avec les services HTTP, comme PHP, Java et Ruby, utilisent Ă©galement des technologies particuliĂšres pour la communication avec le serveur. Pour PHP, mod_php pour Apache a souvent Ă©tĂ© utilisĂ©. En Java, le projet Apache Jakarta a permis de rĂ©unir plusieurs outils. Dans cette architecture, le module Apache mod jk permet de faire la liaison avec le serveur dâapplication Tomcat qui exĂ©cute les Java Servlet et JavaServer Pages. En Ruby, Phusion Passenger, fonctionnant avec Apache et Nginx est un des principaux outils de communication entre le service HTTP et les applications.
Langages dâapplication dynamiques cĂŽtĂ© serveur
En pratique, CGI et fastCGI permettent dâutiliser nâimporte quel langage, cependant, on peut citer certains langages de script qui sont devenus les plus populaires, utilisant du CGI ou une autre technique pour communiquer avec le serveur.
Le langage de programmation PHP (PHP: Hypertext Preprocessor) a Ă©tĂ© dĂ©veloppĂ© pour gĂ©nĂ©rer les pages web. Il jouit dâune forte intĂ©gration avec le serveur HTTP et les langages HTML. Câest aujourdâhui le langage le plus utilisĂ© cĂŽtĂ© serveur avec presque 70 % des sites en 2010[52]. Le moteur ASP (Active Server Pages) a Ă©tĂ© dĂ©veloppĂ© par Microsoft pour interprĂ©ter du langage de script dans le serveur IIS (Internet Information Services), il est le second langage le plus utilisĂ© avec un peu moins de 30 % des sites en 2010[52].
Le langage Java, dont les pages sont servies par Apache Tomcat est ensuite trĂšs utilisĂ©, particuliĂšrement dans le domaine bancaire, la tendance est Ă y inclure du langage Ruby via le module jRuby. Java Ă©tait utilisĂ© sur un peu moins de 1 % des serveurs en 2010[52]. Le langage Ruby, avec principalement le serveur dâapplication Ruby on Rails avec 0,5 % en 2010[52]. Devant la popularitĂ© grandissante de JavaScript cĂŽtĂ© client, liĂ©e Ă Ajax puis HTML5, le cĂŽtĂ© serveur a suivi avec la plateforme logicielle Node.js, dĂ©diĂ©e aux applications serveur.
Au début des CGI, Perl était trÚs utilisé cÎté serveur, en raison de ses affinités avec les administrateurs systÚme et réseau, et de sa dominance dans ce domaine.
Bases de données
Les bases de données sont également une partie importante de la génération des sites à contenu dynamique.
Les principaux types de base de données sont :
- de type SQL ; MySQL est la plus populaire, suivie de Microsoft SQL Server, PostgreSQL, SQLite, Berkeley DB et Oracle ;
- de type NoSQL ; MongoDB est la plus utilisée, mais on peut également citer CouchDB, Amazon SimpleDB ou BigTable utilisé par Google.
Notes et références
Notes
- Prononciation en anglais américain retranscrite selon la norme API.
- Lâimage de lâaraignĂ©e est parfois utilisĂ©e par les anglophones, on la retrouve ainsi dans lâexpression web spider pour le robot dâindexation.
- Le moteur Altavista est apparu sous le domaine
altavista.digital.com
, et de nombreux visiteurs allaient par erreur suraltavista.com
qui n'avait rien Ă voir. Le domainealtavista.com
a finalement été racheté par le propriétaire du moteur de recherche pour des millions de dollars, démontrant l'importance d'un nom de domaine bien choisi dÚs l'apparition d'un site.
Références
- Vocabulaire de l'informatique et de l'internet (liste de termes, expressions et définitions adoptés), legifrance.gouv.fr, JORF no 0285 du , consulté le
- Pourquoi il ne faut pas confondre Web et Internet , 01net.com du 12 mars 2019, consulté le 25 février 2023
- Le web libre et ouvert fĂȘte ses 20 ans Numerama 30 avril 2013
- (en) WorldWideWeb: Proposal for a HyperText Project, T. Berners-Lee/CN, R. Cailliau/ECP,
- (en) Frequently asked questions by the Press - Tim BL - Spelling of WWW
- Google Books "Le bon usage de la répétition dans l'expression écrite et orale" page 46
- « Web », Grand Dictionnaire terminologique, Office québécois de la langue française (consulté le )]
- Journal officiel du 16 mars 1999 - Vocabulaire de lâinformatique et de lâinternet
- RFC3983 sur ietf.org
- « C'est quoi un serveur HTTP ou serveur Web ? », sur culture-informatique.net (consulté le )
- « Client HTTP », sur www.standard-du-web.com (consulté le )
- Site challenges.fr, article "Tim Berners-Lee: "Oui, le Web est né en France....", consulté le 28 novembre 2021.
- (en) Tim Berners-Lee's account of the exact locations at CERN where the Web was invented, sur le site davidgalbraith.org.
- Site saint-genis-pouilly.fr, page "Histoire du CERN".
- (en)Tim Berners-Lee, Information Management: A Proposal, CERN, .
- James Gillies, Robert Cailliau, How the Web was born: the story of the World Wide Web, Oxford, Oxford University Press, 2000, (ISBN 0-19-286207-3), p. 87.
- (en) Tim Berners-Lee, Mark Fischetti, Weaving the Web: the past, present and future of the World Wide Web by its inventor, Londres, Texere, , 272 p. [dĂ©tail de lâĂ©dition] (ISBN 1-58799-018-0), p. 27.
- (en) Interview de Robert Cailliau par Andrew Talons en 2010.
- (en)Frequently Asked Questions - Robert Cailliau's role.
- « The document that officially put the World Wide Web into the public domain on 30 April 1993. », sur cds.cern.ch.
- A Little History of the World Wide Web sur le site du W3C.
- (en) Tim Berners-Lee, Mark Fischetti, Weaving the Web : the past, present and future of the World Wide Web by its inventor, Londres, Texere, , 272 p. [dĂ©tail de lâĂ©dition] (ISBN 1-58799-018-0), p. 15.
- (en) « The World Wide Web project », sur info.cern.ch (consulté le )
- Selon https://www.w3.org/History.html, la page archivée à http://www.w3.org/History/19921103-hypertext/hypertext/WWW/Link.html a été modifiée la derniÚre fois le 13 novembre 1990 à 15:17:00 GMT.
- Présentation du navigateur sur le site du W3C.
- (en) « Re: Qualifiers on Hypertext links... », copie du message news:6484@cernvax.cern.ch originellement posté dans news:alt.hypertext, sur w3.org (consulté le ).
- (en) Tim Berners-Lee et Mark Fischetti, Weaving the Web, (ISBN 1-58799-018-0), p. 51.
- « archives sur ksi.cpsc.ucalgary.ca »(Archive.org ⹠Wikiwix ⹠Archive.is ⹠Google ⹠Que faire ?).
- (en) A Little History of the World Wide Web, sur le site W3C.
- Page de présentation du projet.
- (en) « World-Wide Web Servers », sur w3.org (consulté le ).
- « Comment le premier site web français a vu le jour au CNRS », sur CNRS Le journal (consulté le ).
- Présentation sur le site du W3C.
- Présentation sur le site du W3C.
- Annonce sur le site du CERN.
- (en) « Internet Statistics: Web Growth, Internet Growth », sur mit.edu (consulté le ).
- (en) « Web Server Survey », sur news.netcraft.com (consulté le ).
- (en) « Total number of Websites », sur internetlivestats.com (consulté le ).
- (en) « February 2007 Web Server Survey », sur news.netcraft.com (consulté le ).
- (en) « August 2007 Web Server Survey », sur news.netcraft.com (consulté le ).
- (en) « February 2008 Web Server Survey », sur news.netcraft.com (consulté le ).
- (en) « August 2008 Web Server Survey », sur news.netcraft.com (consulté le ).
- février 2009, sur le site netcraft.com.
- février 2011, sur le site netcraft.com.
- « About this project | Restoring the first website », sur first-website.web.cern.ch (consulté le ).
- (en) « Total number of Websites », sur internetlivestats.com (consulté le ).
- (en) Tim Berners-Lee, Mark Fischetti, Weaving the Web: the past, present and future of the World Wide Web by its inventor, Londres, Texere, , 272 p. [dĂ©tail de lâĂ©dition] (ISBN 1-58799-018-0), p. 62.
- comme http://perdu.com
- (en) The Deep Web: Surfacing Hidden Value, Michael K. Bergman, The Journal of Electronic Publishing, August, 2001, Volume 7, Issue 1.
- (en-US) Benjamin Smedberg, « Reducing Adobe Flash Usage in Firefox », sur Future Releases (consulté le )
- « Serveurs web : les géants aiment de plus en plus NGINX », sur ZDNet France (consulté le ).
- (en) https://www.acunetix.com/blog/web-security-zone/articles/statistics-from-the-top-1000000-websites/https://www.acunetix.com/blog/web-security-zone/articles/statistics-from-the-top-1000000-websites/ Statistics from the top 1,000,000 websites]
Voir aussi
Concepts généraux
Concepts du web
Technologies
- ActionScript, DOM, dynamic HTML, CSS, HTML, HTTP, JavaScript, SGML, standards du web, URI, URL, XHTML, XML
Logiciels serveurs
Logiciels clients
Acteurs
Applications
Liens externes
- Notices dans des dictionnaires ou encyclopédies généralistes :
- (en) A Little History of the World Wide Web
- (en) (fr) info.cern.ch, rétrospective historique du CERN.
- (en) Architecture of the World Wide Web, Volume One, recommandation du W3C, .