ARCHIVÉ - Le CNRC révolutionne la traduction automatique avec PORTAGE

Contenu archivé

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Le 01 août 2009— Ottawa (Ontario)

Dorénavant, le Canada rivalisera avec les chefs de file mondiaux de l’industrie langagière. En effet, le CNRC vient de lancer PORTAGE — un système logiciel s’appuyant sur l’analyse statistique et dont les résultats surpassent largement ceux des essais antérieurs visant à automatiser l’art très nuancé de la traduction.

Le système PORTAGE a été élaboré par l’Institut de technologie de l’information du CNRC (ITI-CNRC). « PORTAGE est l’aboutissement de nos recherches en vue de créer un système robuste et adaptable, articulé sur les techniques d’apprentissage machine, explique Michel Mellinger, agent de développement commercial à l’ITI-CNRC. Bien que d’autres pays aient conçu leurs propres systèmes de traduction automatique reposant sur l’analyse statistique, PORTAGE est le seul du genre au Canada. Et, dans les concours internationaux, PORTAGE s’est classé pratiquement au sommet. »

La recherche sur la traduction automatique remonte aux années 1950. Néanmoins, jusqu’à tout récemment, les systèmes dépendaient tous des règles linguistiques élaborées par des spécialistes pour chaque paire de langues jumelées. Ces règles étaient ensuite programmées dans le système, qui avait la fâcheuse réputation de commettre de véritables bévues – semblables à celles qu’on lit parfois sur les panneaux en français à l’étranger. Bâtir et maintenir de tels systèmes coûtait aussi fort cher. Enfin, plus les spécialistes établissaient de règles, plus les interactions inattendues étaient nombreuses, avec le travail incessant que cela supposait pour les informaticiens.

PORTAGE est plus qu’adéquat pour ce qui est d’éviter ces écueils. Les chercheurs et les informaticiens du CNRC ont « formé » leur système avec une multitude de traductions (français-anglais, chinois-anglais, finlandais-anglais et bien d’autres combinaisons). La qualité de cette « formation » explique pourquoi PORTAGE s’est si bien classé dans les concours.

Bien qu’on ait consacré près de quarante ans à la recherche-développement (R-D) sur les systèmes de traduction automatique, ce n’est que dans les années 1990 que les scientifiques se sont tournés vers la création de programmes qui pourraient « apprendre » à traduire en analysant statistiquement un vaste répertoire de traductions. Cette approche permet de sauter l’étape onéreuse qui consiste à intégrer puis à programmer les règles de grammaire et la terminologie de chaque langue. Au lieu de cela, le système recourt à une série de modèles statistiques qui lui montrent comment passer d’une langue à l’autre, qui lui apprennent les particularités de la langue d’arrivée et qui lui indiquent la nature du texte à traduire. Un des principaux avantages de cette approche novatrice est qu’elle débouche sur plusieurs traductions possibles pour la même phrase, l’analyse statistique indiquant celle qui a la plus grande probabilité d’être la meilleure, selon plusieurs critères.

De tels progrès signifient-ils que le traducteur est une espèce en voie de disparition? « PORTAGE ne remplacera jamais les personnes, car la qualité des traductions réalisées à la main surpassera toujours celle des traductions automatiques, avoue M. Mellinger. Ce système leur permettra simplement de travailler plus vite et de rehausser l’exactitude des traductions, face à une demande grandissante. Bientôt, la majeure partie du travail d’un traducteur consistera à réviser un texte de qualité produit mécaniquement. »

Aux universités canadiennes qui aimeraient poursuivre de la R-D sur la traduction automatique axée sur la statistique, le CNRC propose PORTAGEshared, une version entièrement opérationnelle pour distribution de son système. En mettant PORTAGE à la disposition des chercheurs universitaires, le CNRC contribue au développement d’une communauté canadienne d’experts qui pourrait hisser la traduction automatique s’appuyant sur la statistique vers de nouveaux sommets. Le CNRC offre aussi des licences d’évaluation aux entreprises langagières, pour leur permettre de tester le système PORTAGE et d’établir si elles pourraient mettre au point des applications commerciales spécialisées.

À la fin d’août, PORTAGE sera la vedette du salon technologique organisé à l’occasion du Machine Translation Summit XII, qui se tiendra à Ottawa. L’équipe du CNRC expliquera comment elle prépare un système PORTAGE « formé » pour n’importe quel environnement informatique par la technique des « machines virtuelles ». Le résultat, PORTAGELive, permettra aux clients du CNRC (les sociétés de traduction) d’utiliser le système dans leur entreprise.

« PORTAGE augmentera considérablement le rendement des traducteurs, ce qui leur permettra de mieux répondre à la demande grandissante pour leurs services. » – Michel Mellinger, ITI-CNRC

« PORTAGE augmentera considérablement le rendement des traducteurs, ce qui leur permettra de mieux répondre à la demande grandissante pour leurs services. » – Michel Mellinger, ITI-CNRC

Renseignements : Relations avec les médias
Conseil national de recherches Canada
613-991-1431
media@nrc-cnrc.gc.ca

Restez branché

Abonnez-vous

Date de modification :