ARCHIVÉ - Un outil de recherche plus futé sur le marché

Contenu archivé

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Le 07 décembre 2007— Ottawa (Ontario)

La recherche d'information

La recherche d'information est devenue un peu plus astucieuse grâce à une nouvelle technologie du CNRC qui filtre la mer d'information numérique pour trouver exactement ce que désire l'internaute. L'outil de recherche « Factor » détecte la nature des mots et les liens qui les unissent pour produire une liste stratégiquement abrégée des résultats les plus significatifs.

« Factor déniche les faits que vous cherchez au lieu de dresser une liste de documents », explique Joel Martin, chef du groupe qui a mis au point cette technologie à l'Institut de technologie de l'information du CNRC (ITI-CNRC), à Ottawa.

À l'inverse des moteurs de recherche actuels, Factor discerne les liens entre les faits (par ex., fusions, embauche, états financiers) et les entités (par ex., gens, lieux, devises). Tapez « fusion » dans un moteur de recherche ordinaire et vous obtiendrez des milliers d'entrées nées de l'appariement des mots clés. En faire le tri vous demandera une éternité. Factor peaufine cette recherche en allant droit aux connaissances que désire vraiment l'utilisateur.

« Au lieu de présenter une liste de documents, Factor indiquera le nom des entreprises qui ont fusionné », reprend M. Martin. La technologie vise rapidement les questions du genre « Quels investissements les entreprises américaines ont-elles réalisés dans les entreprises européennes ces trois dernières années? » ou « Quelles sociétés financières engagent du personnel? »

Factor pourrait servir dans n'importe quelle situation où l'on doit extraire de l'information d'une grande masse de données ou de documents. « Les entreprises d'éditique, par exemple, gèrent une énorme somme de contenu. Elles ont besoin d'outils de recherche automatiques pour trouver l'information que souhaitent leurs clients », déclare Randall Milburn, agent de développement commercial à l'ITI-CNRC.

D'ailleurs, la technologie a déjà trouvé preneur dans le secteur privé, chez Nstein Technologies inc., en l'occurrence. Cette entreprise montréalaise exploite Factor sous licence afin de perfectionner sa propre technologie d'exploration et d'analyse de texte (lire l'encadré) en éditique et dans d'autres secteurs. Le CNRC et Nstein ont conclu un contrat de concession de licence d'une durée de 10 ans et une entente de trois ans pour mener en tandem des recherches qui serviront à adapter Factor aux marchés de Nstein.

Explorer pour apprendre

Tirer des connaissances d'une masse de données s'effectue en deux temps.

  • Exploration de texte : cette opération suppose l'extraction de miettes d'information brute à partir des données non structurées, un peu comme on extrait le minerai d'une mine. On recourt à l'exploration de texte pour réunir le nom des personnes mentionnées dans une série de documents, par exemple.
  • Analyse de texte : cette opération transforme les miettes d'information en connaissances comme des tendances, des liens ou des événements. L'analyse de texte vous apprendrait que « Stephen Harper » est le nom du premier ministre du Canada et qu'il est le chef du parti conservateur.

En misant sur le marché pour le transfert de ses technologies, le CNRC s'est efforcé de trouver la compagnie d'analyse de texte qui tirerait le maximum de Factor.

Il est entré en communication avec Nstein à cause de sa solide situation dans le secteur et parce que l'entreprise possède les compétences et les ressources pour commercialiser le produit. Factor procurera à Nstein un avantage concurrentiel dans le secteur de l'analyse de texte pour la gestion du contenu et l'extraction d'information. « Leur capacité de trouver et de traiter l'information pertinente rapidement s'est considérablement accrue », estime M. Milburn.

Le partenariat de recherche entre le CNRC et Nstein fera en sorte que le produit continue de répondre aux besoins commerciaux de l'entreprise. « En oeuvrant avec Nstein, nous nous assurerons que la technologie poursuit son développement en fonction de problèmes et de besoins concrets, reprend M. Milburn. Pour le CNRC, il n'y a pas de meilleure façon de garantir que ce qu'il crée aura son utilité. La technologie s'inspirera vraiment des besoins existants. »

En plus de travailler avec Nstein, le CNRC adaptera la technologie en vue d'autres applications, notamment pour la recherche sur les médicaments et la santé. « Le volume d'information connaît une croissance exponentielle dans les sciences de la santé », précise M. Martin. Rien qu'en biologie, environ 40 000 à 50 000 nouveaux articles sont publiés tous les mois. Les scientifiques ont l'habitude de se tenir au courant de ce qui s'écrit dans leur spécialité, « mais qu'arriverait-il si un élément essentiel à vos recherches figurait dans un des 40 000 autres articles édités ce mois-là? demande-t-il. Comment le dénicheriez-vous? »

Factor dépouille une multitude d'articles pour en retirer les faits pertinents – quels médicaments parmi ceux qu'on prescrit pour soigner le diabète accroissent la pression artérielle, par exemple. « Les chercheurs économiseraient beaucoup de temps, croit M. Martin. Sans compter qu'ils apprendront des choses qui seraient passées inaperçues autrement, ce qui a autant d'importance. Passer au crible une telle masse d'informations est tout simplement irréalisable pour l'être humain. »


Liens connexes :


Renseignements : Relations avec les médias
Conseil national de recherches Canada
613-991-1431
media@nrc-cnrc.gc.ca

Restez branché

Abonnez-vous

Date de modification :