An artificial neural network

SYSTRAN : 50 ans d’innovation et de savoir-faire au service de la traduction automatique

Dossier : Dossier FFEMagazine N°733 Mars 2018
Par Jean SENELLART (X92)

SYSTRAN, dont le cœur de métier est la traduction automatique, va fêter son cinquantième anniversaire en 2018.
Quelles sont les principales évolutions connues par la société ?

SYSTRAN a ini­tia­le­ment vu le jour dans un contexte de Guerre Froide pour four­nir de la tra­duc­tion du russe vers l’anglais. Notre métier a ensuite évo­lué et a été por­té par le déve­lop­pe­ment d’Internet et des outils de communication. 

De nou­veaux besoins de tra­duc­tion pro­fes­sion­nelle sont appa­rus. Nous sommes res­tés très pré­sents dans le monde de la défense et de la sécu­ri­té où la tra­duc­tion joue un rôle pri­mor­dial dans le trai­te­ment mas­sif et l’analyse de don­nées pro­ve­nant de mul­tiples sources. 

Nous opé­rons aus­si lar­ge­ment dans le sec­teur pri­vé. Nous avons notam­ment lan­cé le pre­mier moteur de tra­duc­tion en ligne Babel Fish et nous avons équi­pé, entre autres, les por­tails de tra­duc­tion auto­ma­tique de Google et Yahoo. 

Jusqu’en 2007, la tra­duc­tion en ligne, c’était essen­tiel­le­ment SYSTRAN ! 

Dès 2005, nous avons com­men­cé à être uti­li­sés comme un outil de pro­duc­ti­vi­té par les ser­vices de tra­duc­tion. Grâce à notre tech­no­lo­gie qui avait atteint une cer­taine matu­ri­té, les tra­duc­teurs pou­vaient accé­lé­rer la vitesse de tra­duc­tion, par la post-édi­tion de tra­duc­tion auto­ma­tique et l’utilisation de mémoires de traduction. 

En paral­lèle, au sein des entre­prises, la com­mu­ni­ca­tion est deve­nue de plus en plus mul­ti­lingue avec un besoin de solu­tions de tra­duc­tion en temps réel et inté­grées aux sys­tèmes bureau­tiques et de mes­sa­ge­rie avec une prise en compte de la ter­mi­no­lo­gie propre à la société. 

La par­ti­cu­la­ri­té de SYSTRAN est en effet de pro­po­ser une tra­duc­tion spé­cia­li­sée. Nous pro­po­sons à nos clients du sur-mesure, une solu­tion adap­tée à leurs métiers en repre­nant leur ter­mi­no­lo­gie interne, leur style et en nous ali­gnant sur leurs cri­tères de qualité. 

Pour cette rai­son, les der­nières tech­no­lo­gies per­met­tant de spé­cia­li­ser auto­ma­ti­que­ment la tra­duc­tion sur la base de textes déjà tra­duits ont per­mis de faire un bond énorme en termes de qua­li­té et de réduire les temps néces­saires à la pro­duc­tion de moteurs spécialisés. 

Comment s’inscrivent les évolutions technologiques dans l’histoire de SYSTRAN ?

Aujourd’hui, le Big Data, la per­for­mance des algo­rithmes et la puis­sance des machines, offrent de nou­veaux leviers de déve­lop­pe­ment et de per­for­mance pour la tra­duc­tion automatique. 

Cepen­dant, c’est sur la tech­no­lo­gie elle-même que les chan­ge­ments majeurs sont appa­rus. Au fil des années, nous nous sommes déve­lop­pés en conser­vant tou­jours un temps d’avance tech­no­lo­gique. Les années 70 ont été mar­quées par la mul­ti­pli­ca­tion des socié­tés de tra­duc­tion auto­ma­tique. Par­mi toutes ces socié­tés, nous sommes les seuls à avoir tra­ver­sé les décennies. 

Dans cette pre­mière phase, la tech­no­lo­gie uti­li­sée pour la tra­duc­tion auto­ma­tique était celle des sys­tèmes experts, qui s’appuyaient sur des règles décri­vant les langues. Ces règles étaient ensuite implé­men­tées dans un pro­gramme. Il s’agissait d’une tech­no­lo­gie coû­teuse qui néces­si­tait des finan­ce­ments sur plu­sieurs années et beau­coup de res­sources humaines. 

Pen­dant plus de 20 ans, c’est ce sys­tème que nous avons déve­lop­pé et qui a notam­ment été uti­li­sé par la Com­mis­sion Européenne. 

Trente ans plus tard, en 1998, IBM lance une nou­velle tech­no­lo­gie de tra­duc­tion pure­ment sta­tis­tique se basant sur des textes déjà tra­duits pour recons­truire des tra­duc­tions par fragments. 

En 2007, Google pour­suit sur cette même voie, en réa­li­sant un exploit tech­no­lo­gique à l’échelle du Web avec une seconde géné­ra­tion de Google Trans­late qui fait entrer les acteurs du mar­ché dans la conquête des don­nées (the big­ger, the better). 

De son côté, SYSTRAN se posi­tionne en conce­vant une tra­duc­tion hybride qui com­bine les deux tech­no­lo­gies misant sur la qua­li­té adap­tée à chaque domaine. 

Il y a environ deux ans, votre positionnement a complètement évolué avec la découverte de la traduction neuronale…

En effet, les résul­tats de recherche menée par l’Université de Mont­réal en tra­duc­tion neu­ro­nale ont ouvert de nou­velles pers­pec­tives que nous n’avons pas hési­té à sai­sir : la tra­duc­tion neu­ro­nale qui s’appuie sur l’apprentissage pro­fond, une des tech­niques de l’intelligence artificielle. 

En sep­tembre 2016, nous étions, avec Google les pre­miers à lan­cer des sys­tèmes opé­ra­tion­nels basés sur ces moteurs neu­ro­naux. Alors que la recherche sur ce domaine conti­nuait de pro­gres­ser à une vitesse consi­dé­rable, nous avons déci­dé de contri­buer à cet essor et de lan­cer en paral­lèle un fra­me­work open source « OpenNMT ». 

Après avoir accu­mu­lé plus de 48 ans de tech­no­lo­gie, nous avons donc ren­du notre tech­no­lo­gie publique… OpenNMT a été déve­lop­pé en col­la­bo­ra­tion avec Har­vard NLP et met à dis­po­si­tion des déve­lop­peurs et cher­cheurs des algo­rithmes neu­ro­naux à l’état de l’art du trai­te­ment du lan­gage naturel. 

Ce fra­me­work a déjà reçu des prix aca­dé­miques et fédère plu­sieurs cen­taines de membres actifs : pas­sion­nés, cher­cheurs, déve­lop­peurs et industriels. 

Même si nos clients peuvent avoir accès libre­ment à cette tech­no­lo­gie, ils font appel à nous car ils recherchent une solu­tion clé en main. Nous sommes avant tout un édi­teur de solu­tions logi­cielles et déten­teurs d’un véri­table savoir-faire. 

Quels sont vos principaux défis ?

Aujourd’hui, nous sommes sur un posi­tion­ne­ment inédit : en misant sur l’Open Source, nous avons en quelque sorte ouvert le mar­ché à de nou­veaux acteurs. Nous allons accom­pa­gner les pro­chaines évo­lu­tions. En ambi­tion­nant d’être un lea­der sur ce mar­ché, nous ne pou­vons pas nous refer­mer sur nous-mêmes. 

Concrè­te­ment, pour main­te­nir notre posi­tion­ne­ment sur ce domaine à la pointe de la recherche, nous nous appuyons sur une équipe dédiée d’une dizaine d’ingénieurs doc­teurs. Aujourd’hui, nous enten­dons beau­coup par­ler de l’intelligence arti­fi­cielle pour le trai­te­ment de la voix, des images et des textes. Très vite, les nou­velles décou­vertes tech­no­lo­giques vont sûre­ment nous per­mettre de pou­voir trai­ter ces 3 dimen­sions ensemble. 

CHIFFRES CLÉS

  • 50 ans d’existence
  • 3 bureaux à Paris, San Diego et Séoul
  • 200 collaborateurs
  • 50+ langues couvertes

Dans cette optique, il est aus­si impor­tant de com­prendre que l’intelligence arti­fi­cielle n’est pas seule­ment une ques­tion de bon para­mé­trage des réseaux de neu­rones. Ce sont des modèles qui doivent être entraî­nés sur le long terme. 

Le pro­chain défi est donc de déve­lop­per et d’accompagner sur plu­sieurs années cet appren­tis­sage infi­ni de nos modèles neu­ro­naux et « d’élever » des IA multilingues. 

Poster un commentaire