Les étapes d'une traduction


La rédaction , Micro Hebdo, le 26/10/2005 à 07h00

Etape 1 : l'analyse du texte source

Le logiciel examine le texte à traduire, dit texte source, comme le ferait un traducteur humain. Il décortique la structure de chaque phrase et étudie les fonctions des groupes de mots, disséquant sujet, verbe et compléments. Tous ces éléments sont envoyés les uns à la suite des autres dans le « moteur de traduction ».

Etape 2 : l'application des règles

Le logiciel applique alors à tous les éléments analysés, les « règles » syntaxiques, sémantiques et morphologiques, propres à la langue source, qu'il possède dans sa base de données. Une succession d'algorithmes résout les problèmes les uns après les autres.

Pour cela, le logiciel utilise tous les indices présents dans la phrase, y compris la ponctuation et les majuscules. Ainsi, s'il rencontre le mot Paris avec une majuscule au milieu d'une phrase, il sait qu'il s'agit de la ville et non du nom commun. Si le mot est en début de phrase, il analyse alors les mots qui suivent. Dans « Paris est une belle ville » , comme Paris est suivi d'un verbe au singulier et n'est pas précédé d'un article, il en déduit (peut-être un peu vite) qu'il se trouve devant un nom propre.

Autre exemple : dans « il la porte » , le logiciel doit analyser que porte , bien que précédé d'un article, n'est pas un substantif, mais un verbe. De même, il interprète différemment le verbe porter, dans « porter une voile » et « porter un voile » . Résultat, il traduit en anglais la première expression par « to carry a sail » et la seconde par « to wear a veil » .

Quand aucune indication n'est donnée sur le genre, comme dans la phrase « les voiles déferlent en vitesse » , mieux vaut que les règles linguistiques soient complétées par des données statistiques.

Etape 3 : l'intervention du dictionnaire

Pendant qu'il mouline pour appliquer les règles au texte, le logiciel pioche dans son dictionnaire afin de passer en revue tous les cas possibles pour un mot.

La richesse et la structure du dictionnaire se révèlent très importantes. L'utilisation de dictionnaires thématiques ou spécialisés enrichit une traduction de façon très nette en jouant le rôle de filtre supplémentaire. De quoi éviter certains contre-sens. Ainsi, le mot anglais board désigne à la fois une planche, un tableau, le fait d'être à bord d'un véhicule ou un conseil d'administration. Si le logiciel comporte un dictionnaire spécialisé en finance et que l'utilisateur choisit de s'en servir, le logiciel interprète le mot, sans hésitation, dans le sens conseil d'administration.

Si le logiciel ne comporte pas de dictionnaire spécialisé, il a des chances de se tromper. D'ailleurs, c'est cette présence de dictionnaires spécialisés pour affiner la traduction qui fait toute la différence entre un logiciel et un service de traduction en ligne. Parfois, le logiciel propose à l'utilisateur de choisir lui-même entre différents homophones. De plus, certains logiciels évolués sont capables d'apprendre. On dit qu'ils possèdent une « mémoire de traduction » , qui leur permet d'enregistrer des textes qu'ils ont déjà traduits et de les identifier lors d'une autre traduction. Il est aussi parfois proposé à l'utilisateur d'enrichir lui-même le dictionnaire.

Etape 4 : le transfert vers le texte cible

Une fois que le logiciel a décortiqué et analysé chaque portion de phrase ou chaque mot, qu'il les a traduits dans ce qu'il estime être le bon sens, il lui reste à effectuer ce qu'on appelle le « transfert » pour reconstituer le texte cible, traduction complète du texte source.

De nouvelles difficultés apparaissent dans la construction de cette synthèse. Car le logiciel doit maîtriser aussi bien les subtilités de la langue source que celles de la langue cible. Afin de traduire, par exemple, l'expression française « il pleut des cordes » par son équivalent anglais « it's raining cats and dogs » (les Anglais font, eux, pleuvoir des chats et des chiens) et non pas « it's raining ropes » .

C'est généralement là que pèchent le plus les logiciels de traduction automatique. La qualité de la traduction dépend donc de la simplicité syntaxique du texte source et de l'absence de fautes d'orthographe. Le logiciel ne comprend pas le sens du texte, il applique les règles phrase par phrase, sans vision globale. En revanche, il ne traduit pas mot à mot, mais fait l'analyse de la phrase en entier.

Pourquoi ça ne marche pas ?

Pourquoi un logiciel peut-il passer à côté des expressions les plus simples et traduire à la perfection des locutions plus compliquées ou idiomatiques ? Comment sait-il que les Français ont un chat dans la gorge, alors que les Anglais ont, eux, une grenouille ? Tout dépend du nombre et de la qualité des règles qu'il intègre.

Ces dernières sont établies par des linguistes, puis « traduites » sous forme d'algorithmes. Le but est de faire disparaître au maximum l'ambiguïté des mots, en multipliant les entrées du dictionnaire, afin qu'il reste un minimum de possibilités quand un choix se présente.

Le travail de création de ces règles est compliqué. Il faut tenir compte de toutes les subtilités lexicales existantes : les différents sens d'un mot, distinguer un verbe d'un nom, ou certaines ambiguïtés sémantiques, comme pour milieu , qui changent de sens selon le contexte.

Si le logiciel ne possède pas la bonne règle ou le mot dans son dictionnaire, cela peut donner des traductions du style « le 41 année vieux acteur » au lieu de « l'acteur de 41 ans ».

Difficile d'imaginer que même les expressions les plus évidentes dépendent d'une règle. Par exemple, pour traduire correctement pomme de terre par potato , il faut une règle qui lui dise de ne pas considérer les mots séparément, sous peine de renvoyer une expression du genre apple of earth .


La méthode statistique

Il existe une méthode concurrente à l'approche linguistique : la méthode statistique.

Développée depuis à peine dix ans, elle consiste à confronter un même texte, de plusieurs dizaines de milliers de pages, dans deux langues différentes, sans utiliser ni règles grammaticales, ni dictionnaire.

Le logiciel découpe le texte en blocs, étudie les fréquences et établit des correspondances entre les langues. Confronté à un nouveau texte, le logiciel essaie alors de retrouver dans sa mémoire ce qui concorde le mieux, et s'en sert pour fournir une traduction. C'est une technique moins chère à développer, car elle nécessite moins de travail de la part des programmeurs, mais encore assez jeune et limitée car elle requiert une mémoire importante et donne des résultats hasardeux.

Les statistiques interviennent aussi dans les logiciels qui proposent une approche linguistique. Mêler les deux méthodes donne de meilleurs résultats. Les linguistes se servent des statistiques pour enrichir les règles, en ajouter de nouvelles, les affiner.

Cela devrait permettre aux logiciels, dans les deux ans, de mieux analyser les contextes : y repérer de nombreux termes juridiques, par exemple et prendre l'initiative d'appliquer un dictionnaire juridique à l'ensemble.


 

 

 

 01banner_vertical_blanc_ass14.jpg

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 accueil/association/services/promotion/contact/webmaster