Wikisource
Wikisource est une bibliothèque numérique de textes du domaine public, gérée en wiki grâce au moteur MediaWiki. Comme Wikipédia, elle est hébergée par la fondation Wikimédia et son contenu est librement améliorable.
Adresse | wikisource.org |
---|---|
Description | Bibliothèque numérique |
Commercial | Non |
Publicité | Non |
Type de site | Wiki |
Langue | Multilingue |
Inscription | Gratuite et optionnelle |
Propriétaire | Wikimedia Foundation |
Créé par | Communauté Wikimedia |
Lancement | [1] |
État actuel | En activité |
Contrairement aux autres projets Wikimédia, Wikisource ne produit aucun contenu original. Il a pour objet de rendre accessibles de manière plus facile et pérenne des textes déjà publiés par ailleurs.
Histoire
Le projet a été lancé le [2]. Il a d'abord été nommé « projet Sourceberg », un jeu de mots à partir du nom du projet Gutenberg qui est aussi à l’origine de l'iceberg figurant sur le logo. L'objectif était de constituer une archive de documents importants du domaine public, aussi bien pour servir de source à Wikipédia que pour son intérêt propre[3]. Le projet a été officiellement appelé « Wikisource » le .
Il a été hébergé sur le domaine ps.wikipedia.org jusqu'en , adresse actuellement utilisée par Wikipédia en pachto, puis sur le domaine sources.wikipedia.org[4]. Il a été transféré à son adresse définitive, wikisource.org, le 23 juillet 2004[5].
Si les documents étaient tous hébergés sur un site unique à l’origine, des sous-domaines ont été créés en 2005 pour chaque langue, sur décision de la communauté prise en mai 2005[6]. Après l'arrivée d'une nouvelle version du logiciel MediaWiki permettant un transfert des pages en conservant les historiques, les sous-domaines ont finalement été créés à la mi-août, et les pages ont été importées le .
En mai 2006, alors que des discussions avaient lieu parmi les contributeurs de Wikisource pour le choix d'un nouveau logo, le logo définitif est instauré sur décision de Jimmy Wales, fondateur de Wikipédia[7].
En , un contributeur de Wikisource crée le système Proofread, qui permet d'afficher l'image d'un fac-similé en face de sa transcription afin de faciliter le travail d'édition[8].
Le projet existe aujourd'hui en de nombreuses langues, dont plus de 70 sont dotées de leur propre sous-domaine Internet[9].
Progression du projet
Le projet a connu une augmentation régulière du nombre de pages dans les principaux domaines linguistiques.
Date | Nombre d'articles (nombre officiel) |
Taille de la base de données |
Nombre de contributeurs (plus de 5 contributions) |
---|---|---|---|
Février 2005 | ≈ 11 000 | 358 Mo | 58 |
Mars 2005 | ≈ 15 000 | 446 Mo | 83 |
Avril 2005 | 18 700 | 516 Mo | 94 |
Langue | Pages au | Pages au | Pages au [10] | Pages au [11] |
---|---|---|---|---|
Anglais[12] | 130 561 | 752 565 | 2 670 539 | 3 990 942 |
Portugais[13] | 82 344 | 28 545 | ||
Français[14] | 50 788 | 1 205 346 | 2 887 518 | 3 909 611 |
Chinois[15] | 49 968 | 120 896 | 843 469 | 1 073 004 |
Espagnol[16] | 44 664 | 100 764 | 226 332 | 235 837 |
Allemand[17] | 36 414 | 355 796 | 480 703 | 583 764 |
Arabe[18] | 152 133 | |||
Bengali[19] | 744 461 | 748 943 | ||
Hébreu[20] | 349 313 | 1 677 445 | ||
Russe[21] | 34 687 | 314 055 | 834 109 | 1 083 642 |
Italien[22] | 20 979 | 108 189 | 533 735 | 726 644 |
Polonais[23] | 13 591 | 113 965 | 745 856 | 1 100 780 |
Roumain[24] | 7 852 | 10 327 | ||
Croate[25] | 7 519 | 6 147 | ||
Tamil[26] | 417 352 | 455 077 | ||
Télougou[27] | 6 803 | 10 121 | ||
Ukrainien[28] | 276 373 |
La progression concerne également le nombre de pages corrigées et le nombre de pages validées, selon le processus d'édition décrit plus loin.
- Nombre de pages corrigées
- Nombre de pages validées
Principes généraux
Contenu
Wikisource édite une large variété de textes : littéraires (romans, poésies, contes…), d'histoire (traités, biographies), de philosophie, des revues, et beaucoup d'autres encore, à condition que leur licence soit compatible avec la licence CC BY-SA. Elle utilise les ressources éditoriales du wiki ce qui lui permet — entre autres — de classer les textes (par genre, époques…) ; de fournir des systèmes de navigation entre les chapitres ; de lier entre elles des références dans un texte… Elle permet d'éditer un document avec des images de la source de référence en regard, pour garantir la fiabilité du travail de relecture.
Principes fondateurs
Trois principes sont particulièrement importants pour définir la réalisation de ce projet[note 1].
- 1. Les documents placés sur Wikisource doivent avoir été déjà publiés ailleurs, sur papier. Trois exceptions sont retenues :
- les publications uniquement électroniques, si elles proviennent de sites officiels ou d’éditeurs en ligne reconnus (c'est-à-dire qui ont une obligation de dépôt légal auprès de la bibliothèque nationale de leur pays) ;
- les traductions ;
- les documents d'archive avec une source papier (par exemple des récits de la Première Guerre mondiale).
- 2. Les documents placés sur Wikisource doivent être dans le domaine public ou sous une licence libre.
- 3. Les documents placés sur Wikisource doivent être objectivement identiques à une édition de référence.
Intérêts de Wikisource
Le système d'état d'avancement de la relecture, avec un code couleur pour identifier le fait que deux relectures ont été faites sur une pages, ou sur l'ensemble d'un chapitre d'ouvrage, contribue à la qualité du texte obtenu, en permettant une estimation rapide de cette qualité de relecture[29] - [30]. Le fait que contrairement à d'autres projets de relecture collaborative, comme le projet Gutenberg, il soit possible de visualiser la page numérisée à côté de sa transcription contribue aussi à la qualité des textes sur la plateforme en facilitant la vérification puis la correction[31]. Les liens interlangue vers des traductions d'un texte constituent aussi un des avantages de la plateforme, tout comme la capacité à relire le texte dans un ancien état de langue et de pouvoir ensuite exporter un version normalisée de façon semi-automatique en français actuel[29].
Le fait que la plateforme permette de respecter la graphie d'un texte ancien est un des intérêts pour une utilisation dans des projets pédagogiques visant à développer les compétences étudiantes de lecture et de compréhension de textes anciens. Leurs compétences numériques sont aussi développées à travers la découverte du système de balises et de modèles du wikicode utilisé sur Wikisource, plus simple qu'un encodage en XML-TEI[31].
Pour les équipes de recherche qui utilisent Wikisource pour y relire des textes en rapport avec leurs projets, la plateforme Wikisource peut être considérée comme un entrepôt de données textuelles[32]. Des équipes de recherche en traitement automatique des langues ou en humanités numériques ont aussi recours à Wikisource pour constituer des corpus numériques, en particulier en cas de volonté de large couverture du corpus[33].
Fonctionnement
Les outils d'édition
Wikisource a mis et met progressivement en place des outils spécifiques à la nature de son projet.
L'usage d'un wiki pour l'édition de textes pose la question de la fiabilité du travail accompli par les Wikisourciens. D'une part, ce travail peut être vandalisé, puisque toute personne qui a accès à Wikisource peut en modifier le contenu, d'autre part le travail d'édition lui-même doit pouvoir être vérifié pour assurer la qualité du projet.
Validation des textes
Afin de parvenir à une garantie suffisante pour les lecteurs, Wikisource admet la semi-protection des textes relus par plusieurs contributeurs. Ainsi, seules des personnes inscrites peuvent modifier un texte validé. Les lecteurs sous IP peuvent signaler des erreurs sur une page donnée en lien dans toutes les pages de discussion des textes validés, pages de discussion où sont données également toutes les informations relatives à l'édition.
L'avancement de la validation d'un texte est signalé par les icônes suivants[34], placés dans l'onglet texte : , , , ,
Espace Page
L'outil permettant de s'assurer réellement de la qualité de l'édition est l'affichage des images en regard du texte édité (voir image ci-contre). Cet outil a été réalisé par un contributeur de Wikisource[note 2].
Cet outil s'utilise ainsi : après avoir copié sur le serveur l'image d'un texte[note 3], le contributeur édite un espace nommé Page: suivi du nom de l'image copiée. L'image apparaît alors dans cet espace, et le contributeur la consulte tout en utilisant la boîte d'édition. L'ensemble du document peut ensuite être reconstitué en mode texte sur une seule page grâce à des inclusions.
Cet outil a été mis en place en . Pour consulter les premiers livres disponibles en mode Page, voir Livres disponibles en mode page.
Éditions multilingues
La division par domaines linguistiques ne sépare pas entièrement les sous-projets, puisqu'il existe des liens permettant l'affichage simultané de deux pages de deux domaines distincts. Ainsi, lorsqu'un contributeur de Wikisource en français édite une traduction d'un texte anglais, le lien interwiki qui lie ces deux textes permet de créer automatiquement une édition bilingue.
Étapes de l'édition sur Wikisource
| |||||||
---|---|---|---|---|---|---|---|
Autres formats
| |||||||
OCR | Importer le résultat de l'OCR page par page | ||||||
Reprendre le texte en mode page | |||||||
Utilisation
La première et fondamentale utilité de Wikisource est la lecture. L'édition et l'organisation des textes s'efforce d'être aussi simple que possible pour la consultation. Ainsi, pour la recherche des textes, Wikisource propose un index des auteurs, des classements par périodes, par thèmes...
Mais le confort du lecteur a aussi son importance, et pour faciliter la lecture sur écran, il est possible d'utiliser le monobook de son compte pour adapter le texte (largeur des paragraphes et taille des lettres) à l'effort que doivent fournir les yeux. Enfin, une extension pdf existe, mais n'étant pas encore parfaitement au point, elle ne pourra être disponible que dans un avenir encore indéterminé.
La lecture sur le site n'est cependant pas la seule utilité de Wikisource. La qualité des éditions doit permettre au projet de servir de référence pour des travaux divers, du collège à l'université. Quelques textes édités sur Wikisource sont ainsi donnés en lien par des sites académiques ; on trouve sur Internet des exemples de liens dans des bibliographies pour des cours universitaires[35] et dans la bibliographie d'un mémoire de maîtrise de philosophie[36]. Wikisource peut aussi servir de source de citation aux articles de Wikipédia. La syntaxe à utiliser est alors (au sein de wikipedia) [[s:Titre du texte sur Wikisource]]. Par exemple [[s:Genèse]] crée un lien s:Genèse qui dirige vers le livre de la Genèse sur Wikisource. On peut améliorer l'apparence du lien en écrivant [[s:Genèse|]], ce qui donne Genèse.
Cette syntaxe ne fonctionne que vers Wikisource en français. Pour accéder à des textes Wikisource d'un autre projet linguistique, il faut utiliser [[wikisource:en:Lien]], en remplaçant éventuellement « en » (qui dirige vers Wikisource en anglais) par un autre code de langue.
Un outil d'exportation des ouvrages en ligne, sous forme de fichiers utilisables par une liseuse est en service depuis 2012[37]. Un nombre grandissant de textes est disponible aux formats epub, MOBI (pour Amazon Kindle), PDF pour liseuse (consulter la catégorie Bon pour export). Les ouvrages qui peuvent être ainsi exportés sont signalés par un logo.
Wikisource permet de publier sur Internet des textes libres de droit, saisis à la main ou OCRisés[38].
Partenariats avec des institutions publiques
En France
L'École nationale vétérinaire de Toulouse (ENVT), une des quatre grandes écoles de vétérinaires de France s'est associée à Wikimédia France, en 2008, pour publier des thèses du XIXe siècle. Toutefois, les contributeurs de Wikisource n'ont pas été sollicités par Wikimédia pour ce projet.
La Bibliothèque nationale de France a fourni à Wikisource, en 2010, 1500 ouvrages numérisés, images de pages et texte issu de la reconnaissance optique de caractères (OCR), dans le format DjVu qu'utilise Wikisource. Les bénévoles contributeurs du site assurent la correction des textes et la mise en ligne d'un texte corrigé. Le site Gallica de la BnF associe l'adresse de ce texte à la fiche de l'ouvrage, à l'aide d'une icône représentant la lettre W, de couleur rouge[39].
Un partenariat est lancé en 2013 avec les Archives nationales de France, avec notamment l'organisation d'ateliers de formation à Wikisource pour le personnel de l'établissement[30].
En Allemagne
« Afin de faciliter le travail de la communauté Wikisource germanophone, l'association allemande a fourni un budget de 1 500 € pour la numérisation de livres et manuscrits anciens. Les membres de la communauté décideront eux-mêmes conjointement de la façon de dépenser cette dotation pour de nouveaux projets. »[40]
- En , Wikimedia Deutschland (l'association allemande) a financé la numérisation d'un manuscrit scolaire de mathématiques intitulé Drei Register Arithmetischer ahnfeng zur Practic[41].
- « Début , le troisième volume des « Zimmerische Chronik » a été transcrit. Il s'agit d'une chronique rédigée par le comte Froben Christoph von Zimmern au XVIe siècle et publiée en 1881 par l'historien allemand Karl August Barack. La transcription du quatrième volume est l'un des plus gros projets de Wikisource germanophone. L'édition électronique a été lancée par un historien de l'université de Fribourg-en-Brisgau, qui agit en tant que consultant scientifique pour le projet. »[40]
Notes et références
Notes
- Il faut cependant remarquer que chaque domaine linguistique met en avant tel ou tel principe ; par exemple, le Wikisource allemand est plus exigeant sur la question des sources afin de mieux garantir la qualité des textes édités. Voir : Über Wikisource. Quoi qu'il en soit de ces différences, le fondement de l'ensemble du projet est le respect du texte.
- Il s'agit de ThomasV.
- La source de ces images est variable : il peut s'agir d'images fournies par un contributeur, ou par un site comme Gallica. Les images de Google Livres peuvent être affichées automatiquement par un robot sans avoir à les copier sur le site.
Références
- « How Wikipedia Works »
- Ayers, Matthews et Yates 2008, p. 435.
- Ayers, Matthews et Yates 2008, p. 436.
- « Mail « Project Sourceberg » par Brion Vibber sur la liste Wikipedia-l »,
- What is Wikisource.
- « Wikisource:New vote on language subdomains », sur wikisource.org, .
- « Wikisource Scriptorium - Logo update », sur wikisource.org, .
- (en) ThomasV, « Annonce du projet Proofread », .
- (en) « List of Wikisources », sur Wikimédia meta-wiki (consulté le ). Des pages transcrites dans un grand nombre de langues supplémentaires sont accessibles sur le site http://wikisource.org. La liste est indiquée sur (en) « Wikisource:Languages », sur Wikisource.
- « List of Wikisources », sur Wikistats (consulté le ).
- « List of Wikisources », sur Wikistats (consulté le ).
- Statistiques pour Wikisource en anglais.
- Statistiques pour Wikisource en portugais.
- Statistiques pour Wikisource en français.
- Statistiques pour Wikisource en chinois.
- Statistiques pour Wikisource en espagnol.
- Statistiques pour Wikisource en allemand.
- Statistiques pour Wikisource en arabe.
- Statistiques pour Wikisource en bengali.
- Statistiques pour Wikisource en hébreu.
- Statistiques pour Wikisource en russe.
- Statistiques pour Wikisource en italien.
- Statistiques pour Wikisource en polonais.
- Statistiques pour Wikisource en roumain.
- Statistiques pour Wikisource en croate.
- Statistiques pour Wikisource en tamil.
- Statistiques pour Wikisource en télougou.
- Statistiques pour Wikisource en ukrainien.
- (en) Christian Vandendorpe, « Wikisource and the Scholarly Book », Scholarly and Research Communication, vol. 3, no 4, (ISSN 1923-0702, DOI 10.22230/src.2012v3n4a58, lire en ligne, consulté le )
- William Yoakim, « Wikipédia, Wikimedia Commons et Wikisource, un eldorado de visibilité », Archives, vol. 48, no 2, , p. 41–81 (ISSN 0044-9423 et 2369-9256, DOI 10.7202/1067524ar, lire en ligne, consulté le )
- Philippe Gambette, Nadège Lechevrel et Caroline Trotot, « Valoriser des corpus littéraires numériques avec Wikisource : de la recherche à la pédagogie », dans Wikipédia, objet de médiation et de transmission des savoirs, Presses universitaires de Paris Nanterre, coll. « Intelligences numériques », (ISBN 978-2-84016-468-5, lire en ligne), p. 159–176
- (en) Timothy K. Armstrong, « Rich Texts: Wikisource as an Open Access Repository for Law and the Humanities », Cincinnati Public Law Research Papers, Social Science Research Network, no ID 1566148, (DOI 10.2139/ssrn.1566148, lire en ligne, consulté le )
- Imene Bensalem, Salim Chikhi et Paolo Rosso, « Building Arabic corpora from Wikisource », 2013 ACS International Conference on Computer Systems and Applications (AICCSA), , p. 1–2 (DOI 10.1109/AICCSA.2013.6616474, lire en ligne, consulté le )
- Voir Qualité des textes pour plus de détails.
- Par exemple : TD de philosophie à Paris IV
- Un mémoire sur Nietzsche et Freud (une référence bibliographique a une édition de Nietzsche)
- Outil WSexport; voir aussi la vitrine de présentation des travaux en cours.
- Guillaume de Morant, « WikiSource, nouvel outil collaboratif dans les Alpes-Maritimes », sur rfgenealogie.com, (consulté le ).
- Voir la liste des ouvrages.
- Liste de discussion Wikimédia-fr.
- Pressemitteilungen/Rechenbuchprojekt.
Voir aussi
Ouvrages et articles
- (en) Phoebe Ayers, Charles Matthews et Ben Yates, « Other Sister Projects : Wikisource », dans How Wikipedia Works, (lire en ligne), p. 435-436
- (en) Peter Boot, « Wikisource and Wikibooks », dans Mesotext: Digitised Emblems, Modelled Annotations and Humanities Scholarship, Amsterdam University Press, (lire en ligne), p. 34-35
- William Yoakim, « Wikipédia, Wikimedia Commons et Wikisource, un eldorado de visibilité », Archives, vol. 48, no 2, , p. 41-81 (lire en ligne).
Pages du projet Wikisource
- (en) Communauté Wikisource, « Wikisource:What is Wikisource? », sur wikisource.org, mis à jour en 2022