Gouvernement du Canada
Symbole du gouvernement du Canada

Liens de la barre de menu commune

Information pertinente

Instituts et programmes

Secteurs industriels clés

Domaines scientifiques

Communautés

Personnes-ressources

George Foster
Téléphone : 819-934-9373
Télécopieur : 819-934-2607
Courriel : George.Foster@cnrc-nrc.gc.ca

Roland Kuhn
Téléphone : 819-934-9603
Télécopieur : 819-934-2607
Courriel : Roland.Kuhn@cnrc-nrc.gc.ca

Personne-ressource pour les affaires

Michel Mellinger
Téléphone : 819-934-9176
Télécopieur : 819-934-2607
Courriel : Michel.Mellinger@cnrc-nrc.gc.ca

ITI-CNRC - Les experts et le personnel

Nos Recherches - Projets

PORTAGE: Apprentissage machine aux fins de traduction

Résumé du projet

Le projet PORTAGE a pour objet de mettre au point une technologie qui permettra à un ordinateur de traduire d’une langue à une autre et d’appliquer cette technologie dans le but d’accroître la productivité des traducteurs humains. Le projet a débuté en septembre 2004. En 2006, la technologie avait atteint le niveau de maturité nécessaire pour nous permettre de commencer à la soumettre à des essais par des utilisateurs d’organisations intéressées (tant gouvernementales que commerciales). Bien que les résultats obtenus demeurent largement confidentiels à la demande des organisations participantes, ceux-ci sont très encourageants. Nous mettons en oeuvre actuellement plusieurs scénarios de commercialisation, tant du système PORTAGE en lui-même que des diverses applications dérivant de cette technologie.

Tel qu’expliqué en détail dans l'aperçu technique, il existe quelques approches principales à la traduction automatique (TA) : une approche plus ancienne dans laquelle des experts définissent un ensemble de règles à programmer selon leur connaissance de la pratique de la traduction d’une langue à une autre, et une approche plus récente qui consiste à permettre à l’ordinateur d’apprendre de lui-même de telles règles à partir d’un grand ensemble de textes (corpus) bilingue. La technologie PORTAGE est basée sur cette seconde approche plus nouvelle, aussi appelée « traduction automatique statistique » ou TAS. Pour autant que l’on ait à sa disposition un corpus bilingue comprenant les deux langues d’intérêt, l’approche de la TAS permet de bâtir un traducteur entre ces deux langues bien plus rapidement et de manière moins coûteuse qu’avec l’ancienne approche. Bien que nos recherches se soient concentrées jusqu’à présent sur le français, l’anglais, l’arabe et le chinois, la technologie PORTAGE s’applique à tous les couples de langues pour lesquels un corpus bilingue est disponible - à partir duquel la technologie « apprend » à traduire. En fait, le système PORTAGE a également été testé sur plusieurs autres langues européennes lors de notre participation à des compétitions internationales, soit l’espagnol, l’allemand et le finlandais.

Pour nous assurer que PORTAGE est concurrentiel par rapport aux meilleurs systèmes de traduction au monde, nous participons à des évaluations internationales de la performance des systèmes de TA; notre participation dans de telles compétitions inclut :

  • les évaluations du National Institute of Standards and Technology (NIST) des É.-U. réalisées en 2005, 2006, 2008 et 2009;
  • l’atelier NAACL « Building and Using Parallel Text » (WPT) en 2005, l’atelier NAACL sur la TA (WMT) en 2006, ainsi que l’atelier ACL sur la TAS (WSMT) en 2007 et 2010;
  • l’atelier TC-STAR en 2006 (commandité par la Communauté européenne);

Au fur et à mesure de l’évolution du système PORTAGE, nous avons constamment amélioré notre classement dans ces évaluations, ce qui fait que PORTAGE est maintenant classé parmi les systèmes les plus performants. Par exemple, notre système pour le couple chinois-anglais était l’un des trois meilleurs systèmes selon l’évaluation NIST de 2009. La visibilité internationale de la technologie PORTAGE a aussi bénéficié de notre participation (d’octobre 2005 à juin 2009) au projet GALE, un projet de plusieurs millions de dollars subventionné par DARPA, l’agence de recherche de pointe du ministère de la Défense des É.-U. Le but du projet GALE (Global Autonomous Language Exploitation) est de rendre accessible à des intervenants unilingues anglophones des enregistrements et des textes initialement en langues étrangères (arabe et chinois), en particulier dans un contexte militaire. En tant que membre du consortium Nightingale dirigé par SRI International (Californie), l’un des trois consortiums ayant participé au projet GALE, notre rôle était de fournir une technologie de TA pour la traduction de l’arabe et du chinois vers l’anglais. Pour de plus amples renseignements, voir l'annonce du consortium Nightingale [disponible en anglais seulement].

De plus, le système PORTAGE a servi de système de référence dans le cadre du projet européen SMART (Statistical Multilingual Analysis for Retrieval and Translation), auquel notre groupe a participé.

Le système PORTAGE a atteint un niveau de maturité qui lui permet de contribuer à des tâches quotidiennes dans divers environnements, par exemple :

  • des outils destinés à accroître la productivité des traducteurs;
  • des outils de formation multilingue; ;
  • des logiciels Web de furetage multilingue;
  • des logiciels servant à vérifier la mise à jour de pages parallèles dans un site Web multilingue;
  • la composition interactive de courriels multilingues;;
  • l'extraction de terminologie multilingue;
  • la post-édition statistique d’ébauches de traductions.

Nous prévoyons que PORTAGE aura des répercussions dans plusieurs secteurs, par exemple : la traduction, l’apprentissage d’une langue seconde et le commerce électronique.

En ce qui concerne le transfert technologique, nous sommes disposés à traiter avec d’éventuels partenaires industriels intéressés à des applications de PORTAGE dans divers domaines, incluant ceux notés ci-dessus. Voir la section ci-dessous pour plus de détails.

Pour obtenir de plus amples renseignements concernant le système PORTAGE, veuillez consulter l'aperçu technique de ce projet.

Octroi de licences pour le logiciel PORTAGE

Afin de nous assurer que le système de pointe de TAS PORTAGE aura un impact pratique, nous suivons actuellement plusieurs scénarios de commercialisation.

Afin de soutenir la R-D en TAS au Canada, et en particulier la formation de personnel hautement qualifié en TAS, nous octroyons des licences de R-D et d’éducation aux universités canadiennes depuis 2006. Ceci permet aux équipes de recherche intéressées de progresser rapidement grâce à un système de pointe entièrement opérationnel qui sert de base solide à leurs travaux. Nous avons élargi cette approche à des laboratoires européens spécialisés en apprentissage machine lors de notre participation au projet européen SMART mentionné ci-dessus.

En ce qui concerne le secteur privé, nous offrons une licence d’évaluation d’une durée d’un an aux entreprises canadiennes de manière à leur permettre de s’engager dans des activités de TAS et d’identifier les applications et les marchés qu’elles désirent cibler à l’aide de PORTAGE. Cette licence d’un an peut être renouvelée le cas échéant et vise à amorcer une négociation de licence commerciale une fois que l’entreprise aura monté un plan d’affaires pour la commercialisation de PORTAGE dans le cadre de leur offre de services ou de produits.

Au cas où une entreprise ou un organisme, qu’il s’agisse d’un usager potentiel de PORTAGE ou d’un fournisseur de technologie intéressé par PORTAGE, désirerait en premier lieu explorer des applications de PORTAGE, nous sommes ouverts à la mise en place de collaborations R-D qui permettraient de démontrer l’utilité de PORTAGE. De telles collaborations sont adaptées aux besoins particuliers identifiés.

Information pertinente

Traitement des langues naturelles

Instituts: