Transcription (linguistique)
La transcription, au sens linguistique, est la reprĂ©sentation systĂ©matique du langage sous forme Ă©crite. Certains linguistes considĂšrent que la seule base de la transcription doit ĂȘtre lâĂ©noncĂ©, mĂȘme si des textes dĂ©jĂ existants dans un autre systĂšme dâĂ©criture peuvent Ă©galement servir de support.
Il sâagit de dissocier la transcription non seulement de la traduction, qui a pour objectif de rendre le sens dâun texte de la langue source vers la langue cible (par exemple : traduire un texte de lâanglais vers lâespagnol tout en conservant le sens), mais aussi de la translittĂ©ration, qui a pour objectif de reprĂ©senter les graphĂšmes dâun systĂšme dâĂ©criture par les graphĂšmes correspondants dâun autre systĂšme dâĂ©criture (ex : translittĂ©rer un texte de lâalphabet cyrillique vers lâalphabet latin).
Au sein de la linguistique, la transcription est un domaine essentiel des mĂ©thodologies de (entre autres) la phonĂ©tique, de lâanalyse conversationnelle, de la dialectologie et de la sociolinguistique. Elle joue Ă©galement un rĂŽle important pour plusieurs sous-domaines de la technologie vocale. Lâexemple typique de transcription est lâenregistrement Ă©crit par un greffier dâun compte-rendu dâune audience devant un tribunal, par exemple en cas de procĂ©dure pĂ©nale. Cet article se concentre sur la transcription dans le domaine de la linguistique.
La transcription phonétique en opposition à la transcription orthographique
De maniĂšre gĂ©nĂ©rale, il existe deux approches possibles Ă la transcription linguistique. La transcription phonĂ©tique se concentre sur les propriĂ©tĂ©s phonĂ©tiques et phonologiques du langage parlĂ©. Les systĂšmes de transcription phonĂ©tique fournissent ainsi les rĂšgles de reprĂ©sentation des sons individuels ou des phonĂšmes en symboles Ă©crits. Les systĂšmes de transcription orthographique, au contraire, dĂ©finissent les rĂšgles de reprĂ©sentation des mots exprimĂ©s sous leur forme orale sous la forme Ă©crite dâun langage donnĂ©, tout en respectant ses rĂšgles dâorthographe. La transcription phonĂ©tique utilise des ensembles de caractĂšres expressĂ©ment dĂ©finis, dans la plupart des cas lâAlphabet PhonĂ©tique International (API).
Le type de transcription choisi dĂ©pend majoritairement des intĂ©rĂȘts de recherches poursuivis.
Ătant donnĂ© que la transcription phonĂ©tique met en avant la nature phonĂ©tique du langage, elle est plus utile dans le cadre dâanalyses phonologiques ou phonĂ©tiques. En revanche, la transcription orthographique dispose dâun Ă©lĂ©ment lexical et morphologique aux cĂŽtĂ©s de lâĂ©lĂ©ment phonĂ©tique (lâaspect reprĂ©sentĂ©, et Ă quel point celuiâci est reprĂ©sentĂ©, dĂ©pend du langage en question et de son orthographe). Elle est ainsi plus commode Ă utiliser en cas dâanalyses qui Ă©tudient les aspects liĂ©s au sens dâun langage parlĂ©. La transcription phonĂ©tique est sans aucun doute plus systĂ©matique au sens scientifique, mais est Ă©galement plus difficile Ă assimiler, demande plus de temps Ă rĂ©aliser, et est moins aisĂ©e Ă mettre en pratique que la transcription orthographique.
La transcription en tant que théorie
ReprĂ©senter le langage parlĂ© en symboles Ă©crits nâest pas un processus aussi simple quâil nây y paraĂźt. Le langage Ă©crit est une idĂ©alisation, constituĂ© dâun ensemble limitĂ© de symboles discrets et clairement distincts. Le langage parlĂ©, en revanche, est un phĂ©nomĂšne continu (opposĂ© Ă discret, qui ne peut ĂȘtre isolĂ©), constituĂ© dâun nombre potentiellement illimitĂ© dâĂ©lĂ©ments. Il nâexiste pas de systĂšme prĂ©dĂ©terminĂ© pour distinguer et classifier ces Ă©lĂ©ments et, par consĂ©quent, pas de maniĂšre prĂ©dĂ©finie de reprĂ©senter ces Ă©lĂ©ments en symboles Ă©crits.
La littĂ©rature est relativement constante pour souligner lâabsence de neutralitĂ© des pratiques de transcription. Il nâexiste pas, et il ne peut exister, de systĂšme de transcription neutre. La connaissance dâune culture sociale entre directement en compte dans la rĂ©alisation dâune transcription. Celleâci se retrouve dans la structure de la transcription (Baker, 2005).
SystĂšmes de transcription
Les systĂšmes de transcription sont des ensembles de rĂšgles qui dĂ©finissent comment un langage parlĂ© doit ĂȘtre reprĂ©sentĂ© en symboles Ă©crits. La plupart des systĂšmes de transcription phonĂ©tique se fondent sur lâAlphabet PhonĂ©tique International ou, en particulier dans le domaine de la technologie vocale, sur son dĂ©rivĂ©, SAMPA (Speech Assessment Methods Phonetic Alphabet).
Les systĂšmes suivants sont des exemples de systĂšmes de transcription orthographique (tous traiteant du domaine de lâanalyse conversationnelle ou de domaines connexes) :
Analyse conversationnelle (AC)
Probablement le premier systĂšme du genre, il fut dĂ©crit Ă lâorigine en 1978 (Sacks et al.). Il fut plus tard adaptĂ© en 2000 (MacWhinney) pour ĂȘtre utilisĂ© au sein des corpus informatisĂ©s tels que CA-CHAT. Le domaine de lâanalyse conversationnelle comprend un nombre dâapproches distinctes de la transcription et des ensembles des conventions de transcription. Celles-ci incluent, entre autres, le systĂšme de notation de Jefferson Notation. Pour analyser une conversation, les donnĂ©es enregistrĂ©es sont gĂ©nĂ©ralement transcrites sous une forme Ă©crite qui convient aux analystes. Il existe deux approches gĂ©nĂ©rales. La premiĂšre, appelĂ©e transcription Ă©troite ou transcription phonĂ©tique, reproduit les dĂ©tails des interactions conversationnelles, comme lâaccentuation et lâarticulation de certains mots, la prononciation plus bruyante dâautres mots, la superposition des voix, etc. Si de tels dĂ©tails ont moins dâimportance, par exemple si lâanalyste sâintĂ©resse plus Ă la structure globale de la conversation, alors il est possible dâutiliser un second type de transcription, connue sous le nom de transcription large ou transcription phonĂ©mique (Williamson, 2009).
Notation de Jefferson
Le systĂšme de notation de Jefferson est un ensemble de symboles, dĂ©veloppĂ© par Gail Jefferson, utilisĂ© pour transcrire les conversations. Jefferson fut engagĂ©e en 1963 comme agente de saisie de donnĂ©es au sein du dĂ©partement de la santĂ© publique de lâUniversitĂ© de Californie Ă Los Angeles (UCLA), afin de transcrire les sessions de formation de sensibilisation pour les gardiens de prisons. Quelques annĂ©es plus tard, et forte de cette expĂ©rience prĂ©alable, Jefferson commença Ă transcrire certains des enregistrements qui ont menĂ© au dĂ©veloppement des premiers travaux dâHarvey Sacks. En lâespace de quatre dĂ©cennies, durant la majeure partie desquelles elle nâoccupait aucun poste Ă lâuniversitĂ© et ne recevait pas de salaire, les recherches de Jefferson sur le « parler en interaction » Ă©tablirent la norme de ce qui devint connu sous le nom dâanalyse conversationnelle. Son travail a fortement influencĂ© non seulement lâĂ©tude sociologique de lâinteraction, mais Ă©galement dâautres disciplines telles que la linguistique, la communication et lâanthropologie[1]. Ce systĂšme est utilisĂ© par tous ceux qui travaillent du point de vue de lâanalyse conversationnelle, et est considĂ©rĂ© comme regroupant quasiment toutes les conventions de transcription[2].
Transcription de discours (DT)
Ce systĂšme fut dĂ©crit en 1992 (DuBois et al.) et utilisĂ© pour la transcription du Santa Barbara Corpus of Spoken American English (SBCSAE). DT2, lâĂ©volution de ce systĂšme, est le premier systĂšme du genre, dĂ©crit pour la premiĂšre fois en 1978 (Sacks et al.). Il fut ensuite adaptĂ© en 2000 (MacWhinney) pour ĂȘtre utilisĂ© au sein des corpus informatisĂ©s tel que CA-CHAT.
SystĂšme de transcription analytique de conversation (GAT)
Ce systĂšme, dĂ©crit en 1998 (Selting et al.), a donnĂ© naissance au GAT2 (Selting et al., 2009), frĂ©quemment utilisĂ© dans les pays germanophones pour lâanalyse prosodique des conversations et de la linguistique interactionnelle.
Transcription semi-interprétative (HIAT)
Ce systĂšme, dĂ©crit en 1976 (Ehlich et Rehbein), fut adaptĂ© en 2004 (Rehbein) pour ĂȘtre utilisĂ© au sein des corpus informatisĂ©s. Il est trĂšs rĂ©pandu dans le domaine de la pragmatique.
Logiciels de transcription
La transcription Ă©tait Ă lâorigine un processus effectuĂ© manuellement, se basant sur des enregistrements audio stockĂ©s sur un support, tel quâune cassette audio. De nos jours, la plupart des transcriptions sont effectuĂ©es sur ordinateur. Les enregistrements sont en gĂ©nĂ©ral des fichiers audio ou vidĂ©o, et les transcriptions sont des documents numĂ©riques. Les logiciels informatiques spĂ©cialisĂ©s existent pour aider le transcripteur Ă crĂ©er de maniĂšre efficace une transcription numĂ©rique, Ă partir dâun enregistrement numĂ©rique, de maniĂšre efficace. Parmi les outils de transcription les plus utilisĂ©s dans le domaine de la recherche linguistique, on retrouve :
- ANVIL (Annotation of Video and Language Data) : Outil spĂ©cialisĂ© dans la transcription dâinteraction multimodale.Site du logiciel ANVIL (en).
- CLAN (Computerized Language Analysis) : Outil utilisĂ© principalement pour la transcription des donnĂ©es sur lâacquisition du langage chez les enfants, comme dans la base de donnĂ©es CHILDES. « Page du logiciel CLAN sur le site CHILDES (en) » (consultĂ© le ).
- ELAN (EUDICO Linguistique Annotator) : Outil frĂ©quemment utilisĂ© pour la transcription du langage des signes et la documentation des langues en voie de disparition. « Page du logiciel ELAN sur le portail des technologies dâarchivage des langues (en) » (consultĂ© le ).
- EXMARaLDA (Extensible Markup Language for Discourse Annotation) : Outil frĂ©quemment utilisĂ© pour lâanalyse du discours, la dialectologie et la sociolinguistique. « Site du logiciel EXMARaLDA ».
- FOLKER (FOLK Editor) : Outil frĂ©quemment utilisĂ© pour lâanalyse conversationnelle. « Page du logiciel FOLKER sur le site de lâInstitut de langue allemande de Mannheim (de) » (consultĂ© le ).
- Praat : Outil fréquemment utilisé dans le domaine de la phonétique. Site du logiciel PRAAT.
- Transcriber : Outil dĂ©veloppĂ© Ă lâorigine pour la transcription du discours. Page du logiciel Transcriber sur SourceForge (en).
- Voxcribe : Outil pour la transcription audiovisuelle et le sous-titrage avec reconnaissance vocale intĂ©grĂ©e de lâanglais.
Dâautres logiciels de transcription sont dĂ©veloppĂ©s pour la vente.
Références
- (en) « Gail Jefferson (1938-2008) »
- Davidson, C. (2007). Independent writing in current approaches to writing instruction: What have we overlooked? English Teaching: Practice and Critique. Volume 6, Number 1. [lire en ligne]
Voir aussi
Articles connexes
Bibliographie
- DuBois, John / Schuetze-Coburn, Stephan / Cumming, Susanne / Paolino, Danae (1992): Outline of Discourse Transcription. In: Edwards/Lampert (1992), 45-89.
- Ehlich, K. (1992). HIAT - a Transcription System for Discourse Data. In: Edwards, Jane / Lampert, Martin (eds.): Talking Data â Transcription and Coding in Discourse Research. Hillsdale: Erlbaum, 123-148.
- Ehlich, K. & Rehbein, J. (1976) Halbinterpretative Arbeitstranskriptionen (HIAT). In: Linguistische Berichte (45), 21-41.
- Jenks, C.J. (2011) Transcribing Talk and Interaction: Issues in the Representation of Communication Data. Amsterdam: John Benjamins.
- MacWhinney, Brian (2000): The CHILDES project: tools for analyzing talk. Mahwah, NJ: Lawrence Erlbaum.
- Rehbein, J.; Schmidt, T.; Meyer, B.; Watzke, F. & Herkenrath, A. (2004) Handbuch fĂŒr das computergestĂŒtzte Transkribieren nach HIAT. In: Arbeiten zur Mehrsprachigkeit, Folge B (56). Version en ligne (en)
- Ochs, E. (1979) Transcription as theory. In: Ochs, E. & Schieffelin, B. B. (ed.): Developmental pragmatics, 43-72. New York: Academic Press.
- Sacks, H.; Schegloff, E. & Jefferson, G. (1978) A simplest systematics for the organization of turn taking for conversation. In: Schenkein, J. (ed.): Studies in the Organization of Conversational Interaction, 7-56. New York: Academic Press.
- Selting, Margret / Auer, Peter / Barden, Birgit / Bergmann, Jörg / Couper-Kuhlen, Elizabeth / GĂŒnthner, Susanne / Meier, Christoph / Quasthoff, Uta / Schlobinski, Peter / Uhmann, Susanne (1998): GesprĂ€chsanalytisches Transkriptionssystem (GAT). In: Linguistische Berichte 173, 91-122.
- Selting, M., Auer, P., Barth-Weingarten, D., Bergmann, J., Bergmann, P., Birkner, K., Couper-Kuhlen, E., Deppermann, A., Gilles, P., GĂŒnthner, S., Hartung, M., Kern, F., Mertzlufft, C., Meyer, C., Morek, M., Oberzaucher, F., Peters, J., Quasthoff, U., SchĂŒtte, W., Stukenbrock, A., Uhmann, S. (2009): GesprĂ€chsanalytisches Transkriptionssystem 2 (GAT 2). In: GesprĂ€chsforschung (10), 353-402. [lire en ligne]