Liste Swadesh
La liste Swadesh est une liste de mots appartenant à une partie du lexique la plus résistante au changement, établie par le linguiste et anthropologue américain Morris Swadesh, dans les années 1940-1950. Elle est utilisée en linguistique comparée, en linguistique historique et aussi en anthropologie pour notamment identifier le lexique de base de toute langue étudiée pour la premiÚre fois, ainsi qu'établir le degré de proximité de deux ou plusieurs langues.
Ătablissement de la liste
Swadesh Ă©tudia de nombreuses langues, surtout une vingtaine de langues amĂ©rindiennes du Canada, des Ătats-Unis et du Mexique. Devant faire des recherches sur des langues presque Ă©teintes, avec des moyens limitĂ©s, il Ă©prouva le besoin dâune procĂ©dure standardisĂ©e pour rassembler des donnĂ©es essentielles concernant la parentĂ© entre langues. Ă cet effet, il crĂ©a une liste de mots selon le postulat suivant :
Bien que des mots disparaissent de toute langue, Ă©tant remplacĂ©s par dâautres au cours du temps, certaines parties du lexique sont moins exposĂ©es au changement que dâautres. Câest pourquoi on peut dĂ©finir un lexique de base se rapportant Ă des notions vĂ©hiculĂ©es dans toutes les langues. Les pronoms, les numĂ©raux, certains adjectifs (« grand », « petit », « long », « court »), certains termes dĂ©signant des degrĂ©s de parentĂ© (« mĂšre », « pĂšre »), des parties du corps (« Ćil », « oreille », « tĂȘte »), des Ă©vĂ©nements ou des objets naturels (« pluie », « pierre », « Ă©toile »), des Ă©tats et des actions Ă©lĂ©mentaires (« voir », « entendre », « venir », « donner ») sont peu sujets au remplacement par des emprunts.
Par exemple, le lexique gĂ©nĂ©ral de lâanglais est empruntĂ© Ă 50 % environ, mais ce pourcentage diminue Ă 6 % pour ce qui est du lexique de base. Ainsi, dans la liste Swadesh de 100 mots de lâanglais, il nây a quâun seul mot qui ne provienne pas du lexique de base proto-germanique (mountain â « montagne », dâorigine française, introduit par les Normands). Un autre exemple est celui de lâalbanais et du grec moderne. Lâalbanais a perdu 90 % de ses mots propres dâorigine indo-europĂ©enne, beaucoup plus que le grec, mais si lâon considĂšre la liste Swadesh de 100 mots, le pourcentage de pertes est Ă peu prĂšs Ă©gal pour les deux langues (25 Ă 26 %).
Pour crĂ©er sa liste, Swadesh a choisi un lexique de base que lâon retrouve dans le plus de langues possible, le plus indĂ©pendant possible de lâenvironnement naturel et de la culture locale. Il a commencĂ© par une liste de 225 mots[1], quâil a rĂ©duite plus tard Ă 215[2], puis Ă 200[3], arrivant finalement Ă une variante de 100 mots[4]. On utilise frĂ©quemment une liste de 207 mots, formĂ©e de la liste de 200, plus sept de la liste de 100 absents de celle de 200[5].
Utilisation
Mesure du degré de parenté de deux langues
Swadesh a utilisĂ© sa liste pour mesurer la ressemblance, câest-Ă -dire le degrĂ© de parentĂ© de deux langues, par la mĂ©thode quantitative de la lexicostatistique, en Ă©tablissant le pourcentage de mots dâorigine commune. Plus la ressemblance entre les lexiques des deux langues est grande, plus elles sont proches gĂ©nĂ©tiquement, et plus le temps Ă©coulĂ© depuis le moment oĂč elles se sont sĂ©parĂ©es est court. Selon lui, si le lexique de base de deux langues contient des mots apparentĂ©s Ă raison de 70 %, on peut considĂ©rer quâelles ont Ă©voluĂ© Ă partir dâune mĂȘme langue. Si ce pourcentage dĂ©passe 90 %, alors ces langues sont des parentes proches.
Ătablir le degrĂ© de proximitĂ© de deux ou plusieurs langues donnĂ©es permet ensuite d'Ă©tablir, Ă partir dâune matrice de ressemblances quantitativement pertinentes, un dendrogramme Ă portĂ©e phĂ©nĂ©tiques ou cladistiques des langues comparĂ©es. L'Ă©licitation des concepts de la liste dans un ensemble prĂ©cis de langues permet donc de mesurer les distances interlinguistiques Ă des fins phylogĂ©nĂ©tiques.
Datation des langues dâorigine (la glottochronologie)
Dans ce but, Swadesh a pris comme postulat que le taux de perte du lexique de base initial ne change pratiquement pas, les mots Ă©tant remplacĂ©s Ă un rythme Ă peu prĂšs constant, alors que dans le cas du reste du lexique, qui est Ă©troitement liĂ© Ă des facteurs culturels, le taux de perte variant en fonction des contacts que les locuteurs ont eu avec des cultures qui leur sont Ă©trangĂšres. Ă cause de ce postulat, la mĂ©thode de datation des langues proposĂ©e par Swadesh fut comparĂ©e Ă la dĂ©termination de lâĂąge des fossiles Ă partir de la dĂ©sintĂ©gration radioactive du carbone 14, qui est constante.
Ă la suite dâune recherche sur treize langues (indo-europĂ©ennes pour la plupart) qui ont des attestations Ă©crites sur une longue pĂ©riode, Ă partir de la liste Swadesh de 100 mots, on a calculĂ© un taux de conservation de 86 % sur une pĂ©riode de 1 000 ans, quâon a considĂ©rĂ© comme constant et gĂ©nĂ©ralisĂ© Ă toutes les langues.
Ătant donnĂ© le pourcentage de mots dâorigine commune et le taux de conservation du lexique de base sur 1 000 ans, le temps Ă©coulĂ© depuis la sĂ©paration de deux langues qui rĂ©sultent dâune mĂȘme langue dâorigine peut ĂȘtre dĂ©terminĂ©, avec une marge dâerreur calculable, selon la formule :
oĂč c est le pourcentage de mots dâorigine commune et r â le taux de conservation.
Par exemple, si le lexique de base de deux langues est apparentĂ© Ă 70 %, alors on peut considĂ©rer quâelles ont Ă©voluĂ© Ă partir dâune mĂȘme langue qui a existĂ© douze siĂšcles auparavant.
Discussions sur la pertinence de la liste
Lâutilisation de la liste Swadesh fut contestĂ©e dĂšs le dĂ©but. On lui oppose les objections suivantes :
- Le lexique de base nâest pas exempt dâemprunts de maniĂšre Ă©gale dans toutes les cultures. Par exemple, un objet naturel comme le soleil peut tenir du lexique religieux (tel est le cas en Asie du Sud) et, de ce fait, sa dĂ©nomination est empruntĂ©e. Par ailleurs, des mots du lexique de base peuvent devenir tabous et ĂȘtre remplacĂ©s par dâautres, dâune langue voisine, pour compenser lâinterdiction. Le lexique de base nâest pas indĂ©pendant non plus du statut socio-culturel des locuteurs. Dans les langues dravidiennes, par exemple, dans le lexique de base, il y a relativement beaucoup dâemprunts au sanskrit, dâautant plus que le locuteur est plus instruit[6].
- Certains mots ne se retrouvent pas dans toutes les langues, Ă cause de spĂ©cificitĂ©s de lâenvironnement naturel, par exemple du climat[7]. Ainsi, les mots « neige » et « glace » sont-ils absents des langues des tropiques. Dans la liste de 207 mots il y a, de plus, des mots qui ne se retrouvent pas dans toutes les langues pour des raisons culturelles (Swadesh lui-mĂȘme a rĂ©duit sa liste Ă cent mots).
- Un mot peut avoir pour correspondant dans une autre langue non pas un mot, mais plusieurs mots, voire des affixes, parmi lesquels il faut choisir, ce qui rend plus arbitraire la comparaison des langues[8].
- Il est fort peu probable que le taux de conservation soit constant pour toutes les langues et Ă toutes les Ă©poques[7]. Dans des conditions particuliĂšres qui tiennent de lâisolement du groupe de locuteurs, de sa cohĂ©sion sociale, de lâĂ©ventuelle observation dâune norme littĂ©raire ou religieuse, ce taux peut varier considĂ©rablement[9]. Un exemple dâEurope est celui de lâislandais, langue dâune stabilitĂ© exceptionnelle, ce qui invalide partiellement la mĂ©thode, infirmant son universalitĂ©. En effet, le taux de perte de lâislandais nâest que de 4 %, alors que celui du norvĂ©gien littĂ©raire est de 20 %, bien que ces deux langues soient trĂšs proches gĂ©nĂ©tiquement lâune de lâautre[10].
- Lâidentification des mots apparentĂ©s est problĂ©matique. Lorsquâon applique la technique de la lexicostatistique, Ă dĂ©faut dâune autre possibilitĂ©, sur une aire gĂ©ographique trĂšs Ă©tendue et sur des centaines de langues pour lesquelles lâinformation est trĂšs lacunaire, les descriptions Ă©tant partielles et rĂ©centes, il est impossible, faute de matiĂšre premiĂšre, dâĂ©tablir les lois des changements phonĂ©tiques. De ce fait, lâĂ©limination du lexique empruntĂ©, qui devrait se fonder sur la connaissance de ces lois, est trĂšs difficile. Par consĂ©quent, lâidentification du lexique rĂ©ellement apparentĂ© et, donc, hĂ©ritĂ© en parallĂšle, est problĂ©matique.
- Lâidentification des mots apparentĂ©s est en gĂ©nĂ©ral alĂ©atoire[9]. Des mots trĂšs diffĂ©rents peuvent avoir la mĂȘme origine, par exemple le mot français « chef » (au sens premier de « tĂȘte ») et le mot anglais head « tĂȘte ». Les deux proviennent de la racine indo-europĂ©enne *kauput-, *kaput-[11] - [12]. En revanche, des mots qui se ressemblent peuvent ne pas ĂȘtre directement apparentĂ©s, par exemple le mot latin dies et lâanglais day, les deux signifiant « jour ». Le mot latin a pour origine *dyážws « ciel »[13], et lâanglais â *dÊ°egÊ·h- « brĂ»ler, brĂ»lant »[14]. Un autre exemple de ressemblance sans fondement est le latin habere et lâallemand haben « avoir ». Lâorigine du mot latin est *gÊ°hâbÊ°- « prendre »[15] et celui du mot allemand â *kehâp- « saisir, attraper »[16].
MalgrĂ© les objections, on reconnaĂźt que la liste Swadesh et la lexicostatistique peuvent servir pour les investigations linguistiques de base, dans les situations oĂč ni les techniques comparatives classiques ni la reconstitution interne ne sont praticables, ce qui Ă©tait dâailleurs lâidĂ©e de dĂ©part de Swadesh[7], ou comme simple outil de classification gĂ©nĂ©tique prĂ©liminaire en anthropomĂ©trie[17] - [18].
Un exemple dâune telle situation est celui oĂč lâon ne dispose que de listes incomplĂštes de lexique, comme dans le cas de groupes de langues trĂšs grands, rĂ©cemment attestĂ©es, telles les langues austronĂ©siennes (1 000 environ) ou celles des aborigĂšnes d'Australie (autour de 250). Pour de telles langues, la liste Swadesh peut ĂȘtre utilisĂ©e pour faire une premiĂšre Ă©bauche de leur rĂ©partition en groupes et sous-groupes, servant de point de dĂ©part pour une investigation historique Ă part entiĂšre, qui continue les classements et les reconstitutions.
DĂ©veloppements de la liste Swadesh
Ă partir des mĂȘmes principes, dâautres linguistes ont Ă leur tour Ă©laborĂ© des listes de lexique de base, en Ă©liminant des mots de la liste Swadesh et en introduisant dâautres mots et/ou sens. Un exemple est la liste de 114 sens proposĂ©e par une Ă©quipe de lâUniversitĂ© russe dâĂtat de sciences humaines[19], qui se trouve Ă la base du projet Global Lexicostatistical Database (Base de donnĂ©es lexicostatistique globale) (GDL)[20]. Une autre base de donnĂ©es de ce genre est Indo-European Lexical Cognacy Database (Base de donnĂ©es de mots apparentĂ©s indo-europĂ©ens), Ă laquelle travaille une Ă©quipe de lâInstitut de psycho-linguistique Max-Planck de NimĂšgue (Pays-Bas)[21], Ă partir dâune liste de 200 mots proposĂ©e par Isidore Dyen[22].
Liste Swadesh de 207 mots du français
Les mots en gras figurent Ă©galement dans la liste de 100 mots.
- je
- tu, vous (formel)
- il
- nous
- vous (pluriel)
- ils
- ceci, celui-ci
- cela, celui-lĂ
- ici
- lĂ
- qui
- quoi
- oĂč
- quand
- comment
- ne ... pas
- tout
- beaucoup
- quelques
- peu
- autre
- un
- deux
- trois
- quatre
- cinq
- grand
- long
- large
- Ă©pais
- lourd
- petit
- court
- Ă©troit
- mince
- femme
- homme (mĂąle adulte)
- homme (ĂȘtre humain)
- enfant
- femme (Ă©pouse)
- mari
- mĂšre
- pĂšre
- animal
- poisson
- oiseau
- chien
- pou
- serpent
- ver
- arbre
- forĂȘt
- bĂąton
- fruit
- graine
- feuille (d'un végétal)
- racine
- Ă©corce
- fleur
- herbe
- corde
- peau
- viande
- sang
- os
- graisse
- Ćuf
- corne
- queue (d'un animal)
- plume (d'un oiseau)
- cheveux
- tĂȘte
- oreille
- Ćil
- nez
- bouche
- dent
- langue (organe)
- ongle
- pied
- jambe
- genou
- main
- aile
- ventre
- entrailles, intestins
- cou
- dos
- poitrine
- cĆur (organe)
- foie
- boire
- manger
- mordre
- sucer
- cracher
- vomir
- souffler
- respirer
- rire
- voir
- entendre
- savoir
- penser
- sentir (odorat)
- craindre
- dormir
- vivre
- mourir
- tuer
- se battre
- chasser (le gibier)
- frapper
- couper
- fendre
- poignarder
- gratter
- creuser
- nager
- voler (dans l'air)
- marcher
- venir
- s'Ă©tendre, ĂȘtre Ă©tendu
- s'asseoir, ĂȘtre assis
- se lever, se tenir debout
- tourner (intransitif)
- tomber
- donner
- tenir
- serrer, presser
- frotter
- laver
- essuyer
- tirer
- pousser
- jeter, lancer
- lier
- coudre
- compter
- dire
- chanter
- jouer (s'amuser)
- flotter
- couler (liquide)
- geler
- gonfler (intransitif)
- soleil
- lune
- Ă©toile
- eau
- pluie
- riviĂšre
- lac
- mer
- sel
- pierre
- sable
- poussiĂšre
- terre (sol)
- nuage
- brouillard
- ciel
- vent
- neige
- glace
- fumée
- feu
- cendre
- brûler (intransitif)
- route
- montagne
- rouge
- vert
- jaune
- blanc
- noir
- nuit
- jour
- an, année
- chaud (température)
- froid (température)
- plein
- nouveau
- vieux
- bon
- mauvais
- pourri
- sale
- droit (rectiligne)
- rond
- tranchant
- émoussé
- lisse
- mouillé, humide
- sec
- juste, correct
- prĂšs
- loin
- droite
- gauche
- Ă
- dans
- avec (ensemble)
- et
- si (condition)
- parce que
- nom
Notes et références
- Swadesh 1950, p. 161.
- Swadesh 1952, p. 456-457.
- Swadesh 1955.
- Swadesh 1971, p. 283.
- ComparaLex.
- Sjoberg 1956.
- Strazny 2005.
- Hoijer 1956, p. 53.
- KĂĄlmĂĄn 2007, p. 118.
- Bergsland 1962.
- Wiktionary, article chef.
- Wiktionary, article head.
- Wiktionary, article dies
- Wiktionary, article day.
- Wiktionary, article habeo
- Wiktionary, article haben.
- (en) J. Vansina, « New linguistic evidence and the Bantu expansion », Journal of African History, 1995, vol. 36, no 2, p. 173-195
- (en) I. Ribot, « Differentiation of modern sub-Saharan African populations: craniometric interpretations in relation to geography and history », Bulletins et mĂ©moires de la SociĂ©tĂ© dâAnthropologie de Paris, vol. 16, nos 3-4,â (lire en ligne)
- Kassian 2010.
- Global Lexicostatistical Database.
- Evolutionary Processes in Language and Culture (Processus dâĂ©volution en langue et culture).
- Dyen 1992.
Voir aussi
Bibliographie
- (en) Bergsland, K. et Vogt, H., « On the validity of Glottochronology » [« Sur la validité de la glottochronologie »], Current Anthropology, no 3, p. 115-153
- (en) Dyen, Isidore ; Kruskal, Joseph B. ; Black, Paul, « An Indoeuropean Classification: A Lexicostatistical Experiment » [« Classification indo-européenne. Expérience lexicostatistique »], Transactions of the American Philosophical Society, vol. 82, no 5, 1992
- (en) Hoijer, Harry, « Lexicostatistics: A critique » [« Regard critique sur la lexicostatistique »], Language, no 32, 1956, p. 49-60 (consulté le )
- (hu) Kålmån, Låszló et Trón, Viktor, Bevezetés a nyelvtudomånyba [« Introduction à la linguistique »], 2de édition, augmentée, Budapest, Tinta, 2007 (ISBN 978-963-7094-65-1) (consulté le )
- (en) Kassian, Alexei et al., « The Swadesh wordlist. An attempt at semantic specification » [« La liste Swadesh. Essai de spécification sémantique »], Journal of Language Relationship, no 4, 2010, p. 46-89 (consulté le )
- (en) Sjoberg, Andrée et Sjoberg, Gideon, « Problems in glottochronology », American Anthropologist, no 58 (2), p. 296-308 (consulté le )
- (en) Strazny, Philipp, « Morris Swadesh: critical essay » [« Morris Swadesh: essai critique »], Strazny, Philipp (dir.), The Encyclopedia of Linguistics [« Encyclopédie de la linguistique »], New York, Fitzroy Dearborn, 2005 (consulté le )
- (en) Swadesh, Morris, « Lexicostatistic dating of prehistoric ethnic contacts » [« Datation lexicostatistique des contacts ethniques préhistoriques »], Proceedings of the American Philosophical Society, no 96, p. 452-463
- (en) Swadesh, Morris, « Salish internal relationships » [« Relations entre les langues salish »], International Journal of American Linguistics, no 16, p. 157-167
- (en) Swadesh, Morris, « Towards greater accuracy in lexicostatistic dating » [« Vers une plus grande exactitude dans la datation lexicostatistique »], International Journal of American Linguistics, no 21, p. 121-137
- (en) Swadesh, Morris, The Origin and Diversification of Language [« Origine et diversification de la langue »], édition post mortem de Joel Sherzer, Chicago, Aldine, 1971 (ISBN 0-202-01001-5)
- Bibliographie supplémentaire
- (en) Arndt, Walter W., « The performance of glottochronology in Germanic » [« Performance de la glottochronologie dans le domaine des langues germaniques »], Language, no 35, 1959, p. 180-192
- (en) Bynon, Theodora, Historical Linguistics [« Linguistique historique »], Cambridge, Cambridge University Press, 1977, p. 266-272
- (en) Callaghan, Catherine A., « Utian and the Swadesh list » [« Les langues miwok et la liste Swadesh »], Redden, J. E. (dir.), Papers for the American Indian language conference, held at the University of California, Santa Cruz, July and August, 1991, Occasional papers on linguistics, no 16, 1991, Carbondale, Department of Linguistics, Southern Illinois University, p. 218-237
- Chaker, Salem, « Glottochronologie », Chaker, Salem (dir.) Encyclopédie berbÚre (consulté le )
- (en) Crowley, Terry, An Introduction to Historical Linguistics [« Introduction à la linguistique historique »], Oxford University Press, 1992, p. 168-190
- (en) Gudschinsky, Sarah C., « The ABC's of Lexicostatistics (Glottochronology) » [« Les ABC de la lexicostatistique (glottochronologie) »], Hymes, Dell H., Language in Culture and Society. A Reader in Linguistics and Anthropology [« Langue et culture dans la sociĂ©tĂ©. Guide de linguistique et dâanthropologie »], New York, Harper & Row, 1964, p. 612-623 (consultĂ© le )
- (en) Haarmann, Harald, « Basic vocabulary and language contacts; the disillusion of glottochronology » [« Lexique de base et contacts entre les langues ; la désillusion de la glottochronologie »], Indogermanische Forschungen, no 95, 1990, p. 1-37
- (en) Hockett, Charles F., A course in modern linguistics [« Cours de linguistique moderne »], New York, Macmillan, 1958, chap. 6
- (de) Holm, Hans J., « Genealogische Verwandtschaft » [« Parenté généalogique »], Köhler, R. ; G. Altmann ; R. Piotrowski (dir.), Quantitative Linguistik; ein internationales Handbuch [« Linguistique quantitative ; guide international »], Berlin, Walter de Gruyter, 2005, chap. 45
- (en) Holm, Hans J., « The Proportionality Trap. Or: What is wrong with lexicostatistical Subgrouping » [« Le piĂšge de la proportionnalitĂ© ou Quâest-ce qui ne va pas dans la classification lexicostatistique »], Indogermanische Forschungen, no 108, 2003, p. 38-46
- (en) Hymes, Dell H., « Lexicostatistics so far » [« La lexicostatistique jusquâĂ prĂ©sent »], Current Anthropology, no 1, 1960, p. 3-44
- (en) Jeffers, Robert J. et Lehiste, Ilse, Principles and Methods for Historical Linguistics [« Principes et méthodes en linguistique historique »], Cambridge (Massachusetts) / Londres, The MIT Press, 1982, p. 133-137
- (en) Lees, Robert, « The basis of glottochronology » [« Bases de la glottochronologie »], Language, vol. 29, no 2, p. 113-127
- (en) Lehmann, Winfred P., Historical Linguistics: an Introduction [« Introduction à la linguistique historique »], Londres, Routledge, 1992, p. 175-182
- (en) McMahon, April et McMahon, Robert, Language Classification by Numbers [« Classification des langues par les nombres »], Oxford, Oxford University Press, 2005
- (en) McWhorter, John, The Power of Babel [« Le Pouvoir de Babel »], New York, Freeman, 2001
- MĂ©toz, Laurent, « La convergence pluridisciplinaire dans la recherche de lâorigine des langues: lâexemple amĂ©ricain de la «Nouvelle SynthĂšse» â Aspects historiques, thĂ©oriques et Ă©tude critique », Marges linguistiques, no 11, 2006, p. 281-296
- (en) Nettle, Daniel, « Linguistic diversity of the Americas can be reconciled with a recent colonization » [« La diversitĂ© linguistique des AmĂ©rique peut ĂȘtre rĂ©conciliĂ©e avec une colonisation rĂ©cente »], PNAS, vol. 96, no 6 1999, p. 3325-3329 (consultĂ© le )
- Penchoen, Thomas-G., « La Glottochronologie », Martinet, A. (dir.), Le Langage, Paris, Gallimard, 1968, p. 865-884
- (en) Renfrew, Colin ; McMahon, April ; Trask, Larry, Time Depth in Historical Linguistics [« Profondeur temporelle en linguistique historique »], Cambridge (Angleterre), The McDonald Institute for Archaeological Research, 2000
- (en) Sankoff, David, « On the Rate of Replacement of Word-Meaning Relationships » [« Sur le taux de remplacement des relations mot-sens »], Language vol. 46, no 3, 1970, p. 564-569
- (de) Tischler, Johann, Glottochronologie und Lexikostatistik [« Glottochronologie et lexicostatistique »], Innsbruck, Institut fĂŒr Sprachwissenschaft, 1973
- (en) Wittmann, Henri, « A lexico-statistic inquiry into the diachrony of Hittite » [« EnquĂȘte lexicostatistique dans la diachronie du hittite »] Indogermanische Forschungen, vol. 74, 1969, p. 1-10
- (en) Wittmann, Henri, « The lexicostatistical classification of the French-based Creole languages » [« Classification lexicostatistique des créoles à base française »], Dyen, Isidore (dir.), Lexicostatistics in genetic linguistics: Proceedings of the Yale conference, April 3-4, 1971, La Haye, Mouton, 1973, p. 89-99