Google Traduction
Google Traduction (anglais : Google Translate) est un service de traduction automatique gratuit fourni par Google.
Description
Contrairement à d'autres services de traduction comme Babel Fish (supprimé en 2012), AOL et Yahoo! qui utilisent SYSTRAN, Google utilise son propre logiciel de traduction.
Le service permet également la traduction de pages Web, même longues. Depuis , une limitation de 5 000 caractères traduits est posée, mais elle n'affecte pas la traduction d'une page web via son URL[1]. Les hyperliens des pages Web traduites restent fonctionnels et la navigation entre pages Web traduites est assurée, parfois partiellement.
Google Traduction, comme les autres outils de traduction automatique, a ses limites. Les textes traduits contiennent encore des approximations et des faux sens. Par exemple, l'outil confond les contextes d'énonciation et en déduit des sens non pertinents ; parfois, la grammaire n'est pas fiable. C'est l'une des raisons pour lesquelles Google Traduction n'est pas systématiquement utilisé par les plateformes commerciales qui exigent la précision professionnelle de traducteurs humains.
Ce service propose la prononciation par un automate des mots, groupes de mots et phrases. Depuis 2015, le service traduit les mots en temps réel grâce à l'appareil photo intégré du smartphone[2] et depuis 2017, grâce à une fonction de reconnaissance de l'écriture manuscrite. Par ailleurs, des claviers virtuels avec les alphabets étrangers sont disponibles[3]. A partir de 2018, les mots s'affichent en réalité augmentée grâce à Google Lens.
Approche
Google Traduction est basé sur une méthode appelée traduction automatique statistique[4], et plus spécifiquement, sur les recherches de Franz-Josef Och qui a remporté le concours DARPA pour la vitesse de traduction automatique en 2003. Och est maintenant chargé du département de traduction automatique de Google.
Selon Och[5], une base solide pour l'élaboration d'une statistique utilisable consiste à se baser sur un corpus de textes (ou texte parallèle) bilingue de plus d'un million de mots et deux corpus unilingues de plus d'un milliard de mots chacun, les modèles statistiques à partir de ces données servant ensuite à traduire les différentes langues.
Pour acquérir cette quantité considérable de données linguistiques, Google exploite les documents publics de l'Organisation des Nations unies[4]. Le même document est normalement disponible dans les six langues officielles de l'ONU, ce qui permet maintenant à Google hectalingual (cent langues) de disposer d'un corpus de 20 milliards de mots.
La disponibilité de l'arabe et du chinois comme langues officielles de l'ONU est probablement une des raisons pour lesquelles Google Traduction a d'abord concentré ses efforts sur le développement de la traduction entre l'anglais et les autres langues de ce corpus, et pas, par exemple, sur le japonais ou l'allemand, qui ne sont pas des langues officielles de l'ONU.
Les représentants de Google se sont montrés très actifs à des conférences nationales au Japon et ont convaincu certains chercheurs de leur fournir des corpus bilingues. Google s'est avéré être un commanditaire officiel de la Computational Linguistics annuelle à la conférence Gengoshorigakkai au Japon en 2007. Google a également envoyé un délégué à la réunion des membres de la Société de linguistique informatique du Japon en .
Depuis 2016, Google Traduction utilise un réseau de neurones récurrents comme langue intermédiaire pour éviter de passer par l'anglais[6].
Interface
Le , l'interface de Google Traduction a été revue[7], ainsi que fin 2018.
Logos
- Logo français jusqu'à mai 2009.
- Logo en français depuis .
- Ancien logo en français.
- Ancien logo en anglais.
- Ancienne icône.
- Nouvelle icône depuis 2016.
Langues prises en charge
Au , 133 langues sont prises en charge[8] - [9] - [10].
- Afrikaans
- Akan (langue)
- Albanais
- Allemand
- Amharique
- Anglais
- Arabe
- Arménien
- Assamais
- Aymara
- Azéri
- Bambara
- Basque
- Bengali
- Biélorusse
- Birman
- Bosnien (Bosniaque)
- Bulgare
- Catalan
- Cebuano
- Chichewa
- Chinois simplifié et traditionnel
- Cingalais
- Coréen
- Corse
- Créole haïtien
- Croate
- Danois
- Divehi
- Dogri
- Espagnol
- Espéranto
- Estonien
- Ewe
- Finnois
- Français
- Frison occidental
- Gaélique écossais
- Galicien
- Gallois
- Géorgien
- Grec
- Guarani
- Gujarati
- Haoussa
- Hawaïen
- Hébreu
- Hindi
- Hmong
- Hongrois
- Igbo
- Ilocano
- Indonésien
- Irlandais
- Islandais
- Italien
- Japonais
- Javanais
- Kannada
- Kazakh
- Khmer
- Kinyarwanda
- Kirghiz
- Konkani
- Krio
- Kurde (Kurmandji)
- Kurde (Sorani)
- Lao (Laotien)
- Latin
- Letton
- Lingala
- Lituanien
- Lunganda
- Luxembourgeois
- Macédonien
- Malais (Malaisien)
- Malayalam
- Malgache
- Maltais
- Maori
- Marathi
- Manipuri
- Mizo
- Mongol
- Néerlandais
- Népalais
- Norvégien
- Oriya
- Oromo
- Ouïgour
- Ouzbek
- Pachto
- Penjabi
- Persan
- Philippin
- Polonais
- Portugais
- Quechua
- Roumain
- Russe
- Samoan
- Sanscrit
- Sepedi
- Serbe
- Sesotho
- Shona
- Sindhî
- Slovaque
- Slovène
- Somali
- Soundanais
- Suédois
- Swahili
- Tadjik
- Tamoul
- Tatar
- Tchèque
- Telugu
- Thaï
- Turc
- Turkmène
- Ukrainien
- Urdu
- Vietnamien
- Xhosa
- Yiddish
- Yorouba
- Zoulou
En outre, huit autres langues encore non prises en charge sont en cours de validation, soit à terme 119 langues[8].
Google Translator Toolkit
En français « boîte à outils du traducteur Google », ce toolkit permet de traduire au choix :
- une page web
- un article Wikipédia
- une vidéo YouTube
- un fichier de moins d'1 Mo, d'un des types suivants :
- Archive AdWords Editor (. aea)
- Ressource Android (.xml)
- Application iOS Apple (.strings)
- Application Resource Bundle (.arb)
- Extension Google Chrome (.json)
- Fonction gettext de GNU (.po)
- HTML (.html)
- Application Java (.properties)
- Microsoft Word (.doc)
- OpenDocument Text (.odt)
- Texte brut (.txt)
- Rich Text (.rtf)
- SubRip (.srt)
- SubViewer (.sub)
Notes et références
- « Google limite son outil de traduction gratuit au profit de Cloud Translation, payant », ActuaLitté, (lire en ligne, consulté le ).
- 20 Minutes avec agence, « VIDEO. Avec Google translate, le smartphone devient un traducteur instantané », 20 minutes, (lire en ligne, consulté le ).
- « Traduire avec l'écriture manuscrite ou le clavier virtuel », sur aide google traduction (consulté le ).
- (en) Elad Segev, Google and the digital divide : the bias of online knowledge, Chandos Pub, , 256 p. (ISBN 978-1-78063-178-3, 1-78063-178-2 et 1-306-20600-6, OCLC 880637868, lire en ligne)
« Google also uses statistical machine translation, which generates translation by using statistical methods based on bilingual text corpora, such as United Nations documents, or the English-French record of the Canadian Parliament. First the system finds patterns within the human-translated bilingual text, and then it builds rules to translate any given text. »
. - Discours-programme au Sommet de la traduction automatique 2005
- (en) « Google Translate AI invents its own language to translate with », sur New Scientist (consulté le ).
- « Brève : Google Traduction fait peau neuve », sur Comment ça marche, (consulté le ).
- « Connexion : comptes Google », sur google.com (consulté le ).
- « Langues – Google Traduction », sur google.com (consulté le ).
- Jacques Chanteau et Pascal Bodéré, « Langues régionales. Pourquoi Google ne traduit pas le breton ? », Le Télégramme, (lire en ligne , consulté le )
Voir aussi
Articles connexes
Liens externes
- Sites officiels : translate.google.com, (en-US) translate.google.us, translate.google.co.uk, (en-CA) translate.google.ca, (ja) translate.google.co.jp et (ko) translate.google.co.kr
- Site officiel
- FAQ de Google Traduction
- (en) Statistiques