Accueil🇫🇷Chercher

Traduction automatique

La traduction automatique désigne la traduction brute d'un texte entièrement réalisée par un ou plusieurs programmes informatiques. Dans le cas de la traduction d'une conversation audio, en direct ou en différé, on parle de transcription automatique. Un traducteur humain n’intervient pas pour corriger les erreurs du texte durant la traduction, mais seulement avant et/ou après. On la distingue de la traduction assistée par ordinateur où la traduction est en partie manuelle, éventuellement de façon interactive avec la machine.

Traduction automatique en réalité augmentée: la scène filmée "Bienvenido al futuro" en espagnol est automatiquement traduite et correctement rendue "Welcome to the future" en anglais sur l'écran de cadrage et de visionnage
Textes non compréhensibles produits par une traduction automatisée
Chinois incorrect "沒有進入" issu d'une traduction automatisée à Bali en Indonésie. La phrase incorrecte signifie "il n'existe pas d'entrée" ou "vous n'êtes pas encore entré" alors que la phrase anglaise "no entry" (littéralement, pas d'entrée) veut signifier "n'entrez-pas"

Malgré ses faiblesses, elle peut rendre des services dans des domaines tels que la veille internationale (y compris la veille technologique)[1], où elle permet de prendre connaissance de façon superficielle, mais rapide, de grandes quantités de textes.

Depuis le début du siècle, la traduction automatique connaît un essor considérable sur le Web, avec plusieurs systèmes en ligne pouvant traduire automatiquement et en quelques secondes des pages Web ou des textes de plus en plus longs. C'est une aide très appréciée du grand public, car elle permet de déchiffrer — de façon grossière — le thème d'une page Web dans une langue totalement inconnue et les principaux faits ou éléments d'information qu'elle contient. Pour simplifier la navigation, plusieurs moteurs de recherche comme Google, Altavista ou Yahoo! proposent de l'utiliser systématiquement.

Histoire et Ă©volutions

Fin , la presse annonce de notables améliorations[2]. Le Centre international pour les technologies avancées des communications, dirigé conjointement par l’université Carnegie-Mellon de Pittsburgh et l'université de Karlsruhe en Allemagne, dévoile alors un système informatique de traduction instantanée. Un étudiant chinois, affublé de onze électrodes sur le visage et sur la gorge, prononce dans sa langue un discours qui est simultanément traduit en anglais et en espagnol. Les chercheurs indiquent en conclusion que « Les résultats ne sont pas parfaits » et qu'« il peut y avoir des difficultés quelquefois ». En fait, aucun article n'indique que les journalistes allemands et américains ont pu discuter avec l'étudiant. Les journalistes omettent d’ailleurs généralement de préciser que, quand le docteur Waibel annonce qu’il va prendre des questions de journalistes allemands et américains, l’ordinateur entend quelque chose comme : « Ainsi nous glycogène il alternant des questions entre l’Allemagne et l’Amérique. »[3] Ce type de traduction instantanée manque encore d'améliorations logicielles concernant la reconnaissance vocale, notamment brouillée par le bruit ambiant et la mauvaise prononciation.

En 2018, un outil informatique basé sur l'intelligence artificielle réussit à traduire en douze heures un livre de 800 pages de texte, de graphiques et de formules mathématiques, écrit avec LaTeX[4]. Cet outil développé par Quantmetry, une jeune entreprise de conseil en intelligence artificielle pour les entreprises, associée à quatre chercheurs français spécialistes de l'apprentissage profond et issus de l'ENSAI, de l'INRIA et de l'Université de Caen, est basé sur le service de traduction automatique DeepL.

La méthode du Deep Learning et l'avancée de la traduction automatique inspirée du mode de fonctionnement du cerveau humain repose sur la traduction automatique neuronale, communément appelée NMT en anglais "Neural Machine Translation"[5].

En 2019, l'un des services leader du domaine est DeepL de Linguee, mais ce service pourrait être devancé par des progrès à venir de Google[6].

En 2010, Pangeanic est devenue la première entreprise au monde à appliquer le traducteur statistique Moses dans un environnement commercial en développant une plateforme d'autoapprentissage, de nettoyage de corpus et de recyclage en collaboration avec l'Instituto Técnico de Informática de Valencia (ITI) et le groupe de recherche Reconnaissance des formes et technologie du langage humain de la Politècnica de València. Membre fondateur de TAUS, Pangeanic a remporté le plus grand contrat d'infrastructure de traduction automatique pour la Commission européenne avec son projet IADAATPA en 2017. Depuis 2019, Pangeanic dirige NTEU.eu, un projet CEF de la Commission européenne. NTEU est la plus grande ferme de moteurs de traduction automatique fondée sur les réseaux neuronaux pour les administrations publiques européennes.

Depuis 2020, Google a rendu la traduction automatique de discours ou de conversation orale accessible depuis des téléphones portables[7].

Traduction automatique et transcription automatique

La traduction automatique se distingue de la transcription automatique par le fait que la traduction automatique est une traduction — de l'écrit vers l'écrit — alors que la transcription s'applique sur un discours et peut être proposée de manière écrite[8].

Par exemple, le centre de traduction des organes de l’UE propose à ses utilisateurs les deux types de services pour leur permettre d'obtenir rapidement et à moindres frais un texte utilisable sans être précisément juste[8].

Le premier distributeur de film indien — originellement par VHS —, avec plusieurs centaines de millions d'utilisateurs enregistrĂ©s, connu pour ses films blockbusters[9] a fait sous-titrer — transcrire automatiquement — l'intĂ©gralitĂ© des 12 000 produits de son catalogue par le service de Google pour les rendre disponibles en langue arabe. Cette transcription automatique rĂ©duit les coĂ»ts de 25 % et les dĂ©lais de deux jours. Elle conduit aussi Ă  des erreurs qui nĂ©cessitent des corrections quand elles sont dĂ©tectĂ©es ou identifiĂ©es[10].

Le processus de traduction

Triangle de Vauquois, modèle pour les fondements de la traduction automatique

Le processus de traduction (au sens humain) peut être découpé en trois phases :

  1. Compréhension : assimilation du sens véhiculé par un texte, du vouloir dire d'un auteur… ;
  2. Déverbalisation : oubli des mots et conservation du sens ; « Opération par laquelle un sujet prend conscience du sens d'un message en perdant conscience des mots et des phrases qui lui ont donné corps »[11] ;
  3. RĂ©expression : reformulation du vouloir dire en langue cible.

En termes informatiques, la compréhension devient l'analyse, la déverbalisation devient le transfert et la réexpression devient la génération. Ces étapes du processus sont modélisées dans le triangle de Vauquois[12]. Ce modèle est utile, car pour passer de la source à la cible, il existe plusieurs chemins possibles qui constituent les différentes approches envisagées à ce jour. Plus le degré de conceptualisation est élevé, plus court est le chemin du transfert. Il existe quatre possibilités principales :

  • Le transfert direct : pas de conceptualisation, toute la traduction repose sur le transfert. La traduction par l'exemple et la traduction statistique[13] travaillent Ă  ce niveau. La traduction est vue comme un processus de dĂ©codage.
  • Le transfert syntaxique : le niveau du transfert est syntaxique. GĂ©nĂ©ralement, sa reprĂ©sentation est l'arbre syntaxique. L'analyse produit une reprĂ©sentation syntaxique pour la langue source. Le transfert consiste Ă  produire une reprĂ©sentation syntaxique pour la langue cible Ă  partir de ce dernier. Finalement, la gĂ©nĂ©ration produit la phrase en langue cible. La traduction automatique Ă  base de règles est reprĂ©sentative de cette catĂ©gorie. Les règles permettent les diffĂ©rentes transformations.
  • Le transfert sĂ©mantique : le niveau du transfert est sĂ©mantique. Cette voie est celle qu'empruntent les humains. Les modèles de reprĂ©sentation de la sĂ©mantique du langage sont dĂ©crits par la pragmatique. La sĂ©mantique peut ĂŞtre dĂ©crite par une ontologie. Il n'y a que peu d'approches de la traduction automatique reprĂ©sentatives du transfert sĂ©mantique[14].
  • L'interlangue : Ce niveau supprime la nĂ©cessitĂ© de transfert. L'interlangue devient universelle. Et seuls restent les processus d'analyse et de gĂ©nĂ©ration. L'interlangue est aussi dĂ©signĂ©e sous le terme de langue pivot. DLT (voir l'article Traduction de langues distribuĂ©e) est une tentative inachevĂ©e de cette approche. Le langage UNL est aussi un exemple de langage formel informatique permettant de reprĂ©senter le sens d'un Ă©noncĂ©. L'approche est sĂ©duisante, car l'effort consiste, pour une langue donnĂ©e, Ă  produire un analyseur et un gĂ©nĂ©rateur pour l'interlangue. On bĂ©nĂ©ficie alors de toutes les traductions de ou vers les langues possĂ©dant aussi l'analyseur et le gĂ©nĂ©rateur. Cette approche reste difficile et n'a pas connu de succès Ă  large Ă©chelle.

Actuellement, les moteurs de traduction sont principalement par règles ou statistiques. Une voie dite hybride émerge[15]. Systran, Google Translate, Reverso et Microsoft Traduction utilisent des approches hybrides.

Prérequis

Les prérequis dépendent de l'approche envisagée : traduction à base de règles (mot-à-mot, transfert, pivot), traduction par l'exemple, traduction statistique.

La traduction automatique à base de règles nécessite :

La traduction par l'exemple et la traduction statistique nécessitent :

On peut, en plus, avoir besoin d'outils d'analyse linguistique tels que :

Approches

Plusieurs approches peuvent être considérées pour la traduction automatique[16].

  • Approche directe :
  1. traduction mot-Ă -mot du texte source vers le texte cible
  2. reformulation de l'ordre des mots traduits dans le texte cible
  3. traduction littérale d'un texte à partir d'une photo
  • Approche Interlangue :
  1. construction de la représentation interlangue du texte source
  2. construction du texte cible par la représentation
  • Approche par transfert :
  1. analyse lexicale et syntaxique du texte source
  2. transfert des lemmes traduits et structures en langue cible
  • Proposition : Approche sĂ©quentielle (ou progressive) :
  1. Correction automatique du texte source
  2. Traitement des expressions idiomatiques
    1. DĂ©tection des expressions idiomatiques en langue source dans le texte source
    2. Interprétation en langage cible
    3. Traduction mot-Ă -mot en langage source
    4. Remplacement dans le texte source
  3. Détection pour interprétation (langue source → langue cible et traduction mot-à-mot → langue source) et remplacement des seuls noms propres dans le texte source
  4. RĂ©organisation syntaxique dans le texte source
  5. Traduction mot-Ă -mot du texte source

Notoriété

L'usage de la traduction automatique est devenu courant pour certains Ă©changes et dans certains milieux professionnels[17].

Par exemple, en dépit des risques et en l'absence de professionnels compétents, les hôpitaux et cliniques des États-Unis pourraient recourir à la traduction automatique[18].

Quelque 90 % des textes traduits par la Direction générale de la Traduction (DG TRAD) sont pré-traduits par traduction automatique[19].

Qualité de la traduction

La traduction automatique, brute, n'est pas parfaite, et quelques erreurs peuvent se trouver dans le résultat, comme l'utilisation d'un mot à la place d'un autre. Elle nécessite donc d'être retravaillée pour éliminer les erreurs. La révision humaine de la traduction automatique est appelée la post-édition. Lorsque le quantitatif et le coût priment sur le qualitatif, la traduction automatique est privilégiée et le traducteur professionnel se trouve parfois contraint de justifier sa plus-value[20]. La qualité des traductions est cependant augmentée par la post-édition. Une étude sur un système de traduction automatisée utilisée dans une agence de presse canadienne a révélé que la post-édition par des rédacteurs humains a corrigé de nombreuses erreurs commises par la machine, mais pas toutes[21].

Exemple d'erreur où le mot mandat est traduit littéralement, sans tenir compte du contexte des mesures sanitaires liées à la pandémie de COVID-19:

Texte original en anglais Traduction automatique en français Post-édition par un humain
And now most mandates

are lifting.

Et maintenant, la plupart des

mandats sont levés.

Et maintenant, l'obligation de le porter [le masque]

est levée à plusieurs endroits au pays.

Mesure de la qualité

Des métriques de mesure de la qualité sont utilisées pour pouvoir automatiser la mesure de la qualité de la traduction automatique. Parmi les métriques connues se trouvent BLEU, ROUGE, NIST et METEOR[20].

Évaluation humaine

La traduction automatique peut Ă©galement faire l'objet d'une classification humaine :

  • classement des traductions selon leur fidĂ©litĂ© aux sources
  • quantitĂ© de post-Ă©dition nĂ©cessaire
  • classification des types d’erreurs identifiĂ©es (erreurs lexicales, syntaxiques ; ajouts, omissions ; ordre des mots notamment)[20].

Risques

Ce type de service peut présenter des risques dans le domaine de la vie privée, ainsi que des risques d'induire des préjugés racistes ou sexistes[22].

Un mauvais usage peut conduire à d'autres risques selon l'usage, ainsi selon le Daily Telegraph, un employé polonais a été sérieusement blessé après avoir suivi les consignes de sécurité dont Google avait donné une traduction incorrecte ou erronée à la demande de l'employeur — Parker's Nurseries —[23].

Savoir-faire

Le savoir utiliser avec le recul nécessaire la traduction automatique s'appelle “Machine Translation Literacy”.

Applications

Les appareils de traduction actuels sont utiles pour des situations limitées, par exemple, pour réserver une chambre dans un hôtel. « Si je vais à Pékin, je peux descendre au Hilton sans aucun problème », disait Stephan Vogel, un chercheur de Carnegie Mellon.

Services en ligne

Les services en ligne sont d'apparence simple Ă  utiliser : ils consistent Ă  ouvrir le service, copier automatiquement le texte Ă  traduire, choisir la langue d'origine et la langue de destination puis demander la traduction[22].

Traducteurs en ligne gratuits :

Ils permettent de traduire des mots ou des textes de taille limitée. Il s'agit, par exemple, de :

Logiciels libres :

Environnements de développement :


Prospective

Divers projets cherchent à améliorer les performances et la rapidité des moteurs de traduction (dont celui de Google), espérant un jour pouvoir surmonter la « barrière de la langue » et traduire en temps réel (comme cela a été imaginé par de nombreux auteurs de science-fiction) une langue étrangère, voire pouvoir « communiquer » avec certains animaux via un logiciel de traitement vocal.

  • Un projet en cours au Japon consiste Ă  Ă©quiper un tĂ©lĂ©phone portable d'un traducteur multilingue automatique. Ce projet vise dans un premier temps Ă  afficher sur l'Ă©cran du tĂ©lĂ©phone la traduction de phrases et mots simples prononcĂ©s en japonais ou en d'autres langues, en quelques secondes et de manière autonome, c'est-Ă -dire sans dĂ©pendre d'un serveur[24].

Notes et références

  1. Laurence Danlos. Professeur de Linguistique Informatique à l'Université Paris 7, écrit dans Linguistique informatique, Traduction automatique : « Ils produisent souvent des traductions erronées mais qui peuvent au moins servir à déterminer de quoi parle le texte (ce qui est important en veille technologique, par exemple). »
  2. « De nouveaux systèmes de traduction pour surmonter la barrière de la langue », sur www.rtflash.fr, (consulté le )
  3. Ange-Gabriel C., « Une machine de traduction simultanée », sur generation-nt.com, (consulté le )
  4. Laure Beaudonnet, « «Deep learning»: L'homme prend sa première grosse raclée par la machine en matière de traduction », sur www.20minutes.fr, (consulté le )
  5. « La traduction automatique fait des pas de géant », sur lesechos.fr (consulté le )
  6. https://www.letemps.ch/economie/traduction-deepl-meilleur-google-innovera-bientot
  7. https://www.science-et-vie.com/science-et-culture/traduction-automatique-la-barriere-de-la-langue-est-en-train-de-tomber-58230
  8. https://www.cdt.europa.eu/fr/news/nouveaux-services-partir-de-janvier-2021-transcription-automatique-traduction-automatique-paste
  9. Cheeni Kum, Happy Bhag Jayegi, Manmarziyaan, Bajirao Mastani, Tanu Weds Manu Returns, Goliyon ki raasleela Ram-Leela, Rockstar, Shubh Mangal Savdhan, Vicky Donor, Mukkabaaz, Munna Michael, Ki & Ka, English Vinglish, Sellvandhan, Zindagi Virat Hain, Maine Pyaar Kiya and Padosan
  10. https://www.moneycontrol.com/news/trends/entertainment/changing-script-ai-not-humans-to-write-subtitles-for-movies-soaps-6632641.html
  11. La traduction: mode d'emploi, Glossaire analytique, J. DEMANUELLI & C. DEMANUELLI, page 51
  12. À la suite des travaux de Vauquois et Boitet (Bernard Vauquois, Christian Boitet: Automated Translation at Grenoble University. Computational Linguistics 11(1): 28-36 (1985))
  13. Philipp Koehn: Statistical Machine Translation. Cambridge University Press, 2010.
  14. (en) Eugene Seo, Il-Sun Song, Su-Kyung Kim, et Ho-Jin Choi. 2009. Syntactic and semantic English-Korean machine translation using ontology. In Proceedings of the 11th international conference on Advanced Communication Technology - Volume 3 (ICACT'09), Vol. 3. IEEE Press, Piscataway, NJ, USA, 2129-2132.
  15. Roland Raoul KOUASSI, Université de Cocody, La problématique de la traduction automatique, , 30 p. (lire en ligne)
  16. M. Constant, Cours de Traduction automatique, Université Paris-Est Marne-la-Vallée, , 32 p.
  17. La traduction juridique face Ă  la traduction automatique
  18. https://www.presse-citron.net/google-traduction-est-toujours-un-risque-pour-la-medecine/
  19. Rapport annuel d'activités, 2015, DG Traduction, D(2016)3325
  20. Rudy Loock, « Traduction automatique et usage linguistique : une analyse de traductions anglais-français réunies en corpus », Méta, vol. 63, no 3,‎ , p.786–806 (lire en ligne).
  21. Éric Poirier et Jean-Hugues Roy, « Ultrad: outil de traduction de La Presse Canadienne. La traduction automatique dans un contexte journalistique », Journée d'étude Traduction et journalisme (Journée d'étude Traduction et journalisme, Montréal, 7 octobre 2022), sous la dir. de Boulanger, Pier-Pascale et Gagnon, Chantal,‎ (lire en ligne [PDF])
  22. Lynne Bowker, « Traduction automatique : une nouvelle forme de littératie à l’ère du numérique », sur noslangues-ourlanguages.gc.ca.
  23. Daily Telegraph, février 2013
  24. description d'un essai au C&C iEXPO 09, article de akihabaranews.

Voir aussi

Articles connexes

Bibliographie

  • Doug Arnold, Balkan, L., Meijer, S., Humphreys, R.L. Sadler, L. 1993. Machine Translation: An Introductory Guide.
  • Paul Bennett. 1994. Translation Units in Human and Machine. Babel 40:12-20.
  • Bert Esselink. 1998. A practical guide to software localization. John Benjamins.
  • Ethnologue. 2001. Languages of the World.
  • W. John Hutchins & Harold L. Somers. 1992.An Introduction to Machine Translation. Academic Press.
  • W.John Hutchins. 2001. Machine translation over fifty years. Histoire, Epistemologie, Langage XXII-1:7-31.
  • Martin Kay. 1997. The Proper Place of Men and Machines in Language Translation. Machine Translation 13:3-23.
  • Alan K. Melby. 1995. The Possibility of Language. A discussion of the nature of language with implications for human and machine translation. John Benjamins.
  • Sergei Nirenburg. 1987. Machine Translation: Theoretical and Methodological Issues. Cambridge University Press.
  • Jörg Porsiel (Ă©d.): Machine Translation. What Language Professionals Need to Know. Bundesverband der Dolmetscher und Ăśbersetzer Weiterbildungs- und Fachverlagsgesellschaft mbH, Berlin 2017, (ISBN 978-3-93843-094-1).
  • Johnatan Slocum. 1988. Machine Translation Systems. Cambridge University Press.

Liens externes

Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.