Quelques mois avant de déployer ses troupes en Irak, le gouvernement américain a fait appel à une armée de traducteurs pour savoir si le rapport de 12 000 pages fourni par Saddam Hussein était conforme aux exigences des experts en désarmement de l'ONU. Sans l'aide des logiciels de traduction assistée, ce travail occuperait encore plusieurs professionnels. «La conjoncture mondiale actuelle et l'essor du Web font en sorte qu'il y a présentement un engouement sans précédent pour la traduction automatique», explique Simona Gandrabur, chercheuse au Laboratoire de recherche appliquée en linguistique informatique (RALI).
Les aides à la traduction dont on peut aujourd'hui bénéficier font penser aux logiciels orthographiques ou grammaticaux intégrés dans les ordinateurs personnels. De la même manière qu'ils nous indiquent par un soulignement une erreur de frappe ou une faute d'orthographe, ou proposent une graphie plus juste, ces aides automatisées font apparaître en temps réel, à l'écran de l'utilisateur, des suites de un, deux, quatre ou cinq mots susceptibles de constituer la meilleure traduction. L'utilisateur est libre d'accepter ces propositions telles quelles, de les modifier ou simplement de les ignorer.
Ces suites de mots qui semblent les plus appropriées viennent des textes que les logiciels ont en mémoire. Toutefois, le pourcentage de bonnes suggestions obtenues par le truchement des programmes est encore faible. Les travaux du RALI visent à relever la qualité de ces suggestions.
L'informaticienne en collaboration avec son collègue George Foster sont récemment parvenus à améliorer les performances des logiciels. Les failles de la traduction automatique sont cependant loin d'avoir été gommées. «Nous faisons des progrès. Mais nous sommes encore très loin du moment où des livres entiers pourront être traduits automatiquement en autant de langues qu'on veut; ça, c'est presque une utopie», dit en riant Simona Gandrabur.
Sélectionnés à la suite d'un vaste concours international, Simona Gandrabur et George Foster seront, du 30 juin au 22 août prochains, au Center for Language and Speech Processing, de l'Université Johns-Hopkins, à Baltimore, afin d'animer un groupe de travail lié aux «aides-traducteurs», ces logiciels interactifs conçus pour seconder les professionnels de la traduction.
«Ce forum est probablement une des manifestations les plus reconnues du monde dans le domaine du traitement informatique de la langue naturelle, indique Mme Gandrabur. Il est organisé depuis 1995 par le "père", si l'on peut dire, des techniques modernes de reconnaissance de la parole et de traduction automatique statistique, le professeur Frederick Jelinek.»
L'équipe de travail qu'ils animeront - et qui comprendra des scientifiques de Xérox et d'IBM, des chercheurs universitaires de haut vol ainsi que des étudiants des premier, deuxième et troisième cycles triés sur le volet à l'échelle internationale - se penchera sur un sujet extrêmement novateur: comment rendre plus fiables les actuels outils de traduction assistée par ordinateur (ou, dans le jargon, comment améliorer l'«estimé de confiance» de ces programmes).
Anticiper la suite
Un exemple de logiciel d'aide à la traduction (le logiciel TransType) figure sur le site Web du Laboratoire (www-rali.iro.umontreal.ca). L'aide-traducteur suggère différentes suites de mots en se fondant sur un «apprentissage» préalable. Il a en mémoire des tonnes de textes, ce qui lui permet de proposer, sur une base statistique, les suites possibles les plus appropriées aux mots qui viennent d'être tapés.
Un tel outil facilite évidemment le travail du traducteur en accélérant sa frappe. On a effectivement mesuré qu'il pouvait faire épargner à l'utilisateur près de 60 % des frappes. Toutefois, le programme ne permet pas d'obtenir un pourcentage satisfaisant de bonnes suggestions. Les travaux que Simona Gandrabur et George Foster dirigeront à Baltimore cet été chercheront justement à hausser la qualité de ces suggestions.
L'originalité de leur démarche a d'ailleurs beaucoup plu aux gens de l'Université Johns-Hopkins. «Nous avons décidé de nous inspirer des approches utilisées en reconnaissance automatique de la parole, qui consistent à entraîner l'outil à détecter automatiquement, sans intervention humaine, des erreurs de reconnaissance, explique Mme Gandrabur. Quand vous communiquez par exemple avec le service d'assistance-annuaire de Bell et que vous répondez "Montréal" à la question "Pour quelle ville?", ce type de programme est déjà en mesure d'évaluer lui-même la qualité de votre réponse. S'il n'est pas certain de ce qu'il a entendu, il posera une autre fois la question. George Foster et moi avons décidé d'appliquer cette technique à la traduction.»
A priori, il n'y a pas de limites aux domaines d'application possibles de ces aides à la traduction: textes littéraires, juridiques (lois) et gouvernementaux, textes de sites Web, textes à vocation commerciale (modes d'emploi), etc.
Luc Dupont
Collaboration spéciale