Pour le plaisir de traduire Posted on Monday, September 24 @ 06:56:51 EDT
Topic: French Articles
|
ntégration des nouveaux outils: implications et perspectives pour le traducteur
l est permis de rêver: disposant du document original sous forme électronique, le traducteur l’envoie à EURAMIS1, qui procède: - à une consultation terminologique d’EURODICAUTOM2 grâce à l’analyse effectuée par SYSTRAN3, - à une recherche phraséologique d’équivalences, de quasiéquivalences ou d’éléments de phrases similaires dans une base de ressources linguistiques (avec option de filtrage des resultants obtenus), - à une récupération dans CELEX4 de tous les actes législatifs, dans les langues source et cible, auxquels il est fait reference - et à une traduction automatique de l’ensemble du texte. Ensuite, EURAMIS renvoie au traducteur les données terminologiques dans un fichier de format MULTITERM5 et les données phraséologiques dans un fichier de format TWB6.
EURAMIS (European Advanced Multilingual Information System) désigne un ensemble d’applications mises en oeuvre au Service de traduction de la Commission européenne offrant divers services dans le domaine du traitement du langage naturel. EURODICAUTOM est la principale base terminologique des institutions communautaires.Elle propose des entrées dans les onze langues de l’Union et en latin. SYSTRAN est le système de traduction automatique de la Commission européenne. CELEX est une base de données contenant, pour l’essentiel, les arrêts de la Cour de justice et les actes législatifs de la Commission européenne, du Conseil de l’Union européenne et du Parlement européen. MULTITERM est le logiciel de gestion terminologique retenu par le Service de traduction de la Commission européenne. Il a été développé par la société Trados. TWB (Translator’s Workbench) désigne un logiciel permettant la gestion locale et le traitement interactif de données obtenues par l’alignement (ou la mise en parallèle) de deux versions linguistiques d’un même document, par la consultation d’une mémoire de traduction centrale ou par la traduction d’un document en cours. Il a été retenu par le Service de traduction de la Commission européenne et a été développé par la société Trados. Enfin, le traducteur utilise TWB, logiciel convivial pleinement integer à WORD et lié à MULTITERM, qui lui permet de traiter efficacement au niveau local les données ainsi obtenues, lui indique leur origine, l’aide, par son interactivité, à mieux gérer la répétitivité interne du document et lui donne finalement la possibilité d’accélérer et d’améliorer, par la réutilisation de ressources existantes, son travail de traduction. Ce faisant, le traducteur peut se concentrer sur l’essentiel, redécouvrir le vrai plaisir de traduire, en évitant de retraduire ce qui l’a déjà été, et faire bénéficier ses collègues du fruit de son propre labeur. S’agit-il vraiment d’un rêve? Plus pour longtemps. La plupart des fonctions décrites existent déjà ou existeront bientôt. Si les outils restent instables et perfectibles, ils devraient, dans un avenir proche, atteindre un niveau de fiabilité suffisant pour révolutionner le quotidien du traducteur. L’intégration est déterminante à cet égard (voir également “EURAMIS: Added Value by Integration” d’ACHIM BLATT, p 59), car elle seule permettra de généraliser l’utilisation de ces outils, sans devoir la restreindre à certains types de textes. Il convient également de souligner que le traducteur restera seul maître du jeu, car il n’est ici nullement question d’une automatisation du processus de traduction, mais simplement d’une récupération automatique de données utiles ou nécessaires. Finalement, seuls ceux qui nourriront des attentes démesurées à l’égard des nouveaux outils d’aide à la traduction risqueront d’être déçus: non, aucun logiciel ne fera le travail du traducteur, mais tous ensemble contribueront à le simplifier. Encore heureux, d’ailleurs, car quelle serait sinon sa raison d’être?
1 Fonctions déjà disponibles
Actuellement, EURAMIS permet déjà: A La consultation automatique ’EURODICAUTOM au départ d’un texte: comme elle utilise, pour établir la liste des termes à vérifier, le moteur d’analyse de SYSTRAN, elle n’est disponible que pour les langues à partir desquelles ce système de traduction automatique fonctionne (allemand, anglais, espagnol et français). En revanche, elle opère vers toutes les langues pour lesquelles EURODICAUTOM contient des entrées. Pour éviter beaucoup de bruit pour rien, l’utilisation des codes mat ières est vivement recommandée. Il convient de réserver cette fonction aux textes spécialisés. Le résultat de cette consultation automatique peut être obtenu en format MULTITERM, fusionné avec une base terminologique existante pour créer une base ad hoc et utilisé interactivement lors de la traduction avec WORD et TWB. B La recherche phraséologique d’équivalences ou de quasiéquivalences: elle permet, en consultant automatiquement la base de ressources linguistiques (ou mémoire de traduction centrale) développée dans le cadre d’EURAMIS, de retrouver sur un serveur des phrases équivalentes ou quasi-équivalentes à celles contenues dans le document à traduire (le niveau de correspondance minimale étant fixé par l’utilisateur). Toutes les unités de traduction contenues dans cette base centrale (sous forme de couples de phrases dans les langues source et cible) sont identifiées par une série de champs ou d’étiquettes (numéro du document, nom du traducteur, type du document, domaine, etc) qui peuvent être utilisés pour filtrer les résultats obtenus. C La traduction automatique du texte en format TWB avec recherche phraséologique: les résultats de la recherche phraséologique dans la mémoire de traduction centrale et de la traduction automatique effectuée par SYSTRAN sont fusionnés dans un même fichier directement utilisable dans TWB. Comme TWB permet l’application de pénalités aux phrases obtenues par traduction automatique (faute de quoi elles seraient considérées comme des équivalences techniquement parfaites, indépendamment de leur qualité linguistique intrinsèque), l’utilisateur reste libre de fixer le taux de correspondance en deçà duquel les propositions de SYSTRAN lui seront présentées par priorité. Qui plus est, comme TWB affiche les propositions de SYSTRAN dans une couleur distincte (vert pour les équivalences, jaune pour les quasi-équivalences et gris pour les phrases obtenues par traduction automatique), l’utilisateur connaît la nature des propositions qui lui sont offertes et a toujours la possibilité de choisir en connaissance de cause. Il va de soi qu’une proposition de traduction automatique modifiée puis validée ne sera plus considérée comme telle au cours du processus interactif de traduction, mais comme une équivalence ou une quasi-équivalence, selon le cas, avec mention, dans l’étiquettecorrespondante, du nom du traducteur. Lors de l’exportation d’une mémoire locale vers la mémoire centrale d’EURAMIS, toutes les unités de traduction contenant une etiquette “MT!” (machine translation), non modifiées par le traducteur, sont automatiquement supprimées. Il convient enfin de noter que cette fonction est bien plus qu’une simple intégration: en contribuant à améliorer deux services existants (l’utilisation de TWB, qu’elle rend appropriée pour des textes moins répétitifs, puisqu’il y a toujours une proposition, et la traduction automatique, qu’elle valorise par les atouts propres à une mémoire de traduction), elle offre à l’utilisateur une valeur ajoutée indéniable.
2 Fonctions bientôt disponibles
Dans un avenir proche, EURAMIS devrait permettre: A La recherche d’éléments de phrases similaires en format TWB avec équivalences ou quasi-équivalences phraséologiques et/ou traduction automatique. EURAMIS permet déjà la recherche d’éléments de phrases et leur remplacement dans le texte original grâce à un logiciel comme TMan7. L’intégration avec la recherche phraséologique classique dans la mémoire de traduction centrale et la traduction automatique (dans l’optique suivie ci-dessus) n’a pas encore été réalisée. Sur le plan technique, cette intégration ne pose guère de problèmes: il suffit de rechercher, dans une base de données du type TMan, des éléments de phrases similaires à ceux du texte à traduire, de les aligner pour les langues source et cible et d’ajouter le résultat de cet alignement au fichier de format TWB contenant déjà le résultat de la recherche phraséologique et/ou de la traduction automatique. Evidemment, lors du travail interactif de traduction, la plupart des éléments ainsi récupérés ne seraient pas automatiquement proposes par TWB, la mémoire de traduction locale, car leur niveau de TMan est un logiciel développé pour le Service de traduction de la Commission européenne permettant de remplacer les éléments constitutifs d’une phrase, à l’inverse du TWB, qui procède au remplacement de la phrase dans son ensemble par une phrase équivalente ou quasi-équivalente. correspondance serait plus que probablement insuffisant (ils pourraient ne représenter que 10% ou 20% de la phrase originale à traduire). L’intérêt serait pourtant évident: l’intégration d’éléments de phrases similaires à ceux du texte à traduire dans le fichier de format Twb améliorerait considérablement l’efficacité de la fonction de concordance8. Pour alimenter TMan et donc améliorer la récupération d’éléments de phrases similaires, l’utilisateur pourrait recourir à une nouvelle fonction du type Save to TMan, qui lui permettrait d’ajouter dans la base de ressources linguistiques des éléments de phrases dont il sait qu’ils sont susceptibles de réapparaître dans une catégorie donnée de documents. En revanche, la récupération d’éléments de phrases non sauvegardés en tant que tels dans la base de ressources linguistiques (et y figurant donc uniquement sous forme de phrases dans les langues source et cible) est actuellement impossible, car elle nécessiterait une analyse de ces deux langues pour déterminer la partie du texte source correspondant à la partie du texte cible. B La récupération dans CELEX de tous les actes législatifs, dans les langues source et cible, auxquels il est fait référence dans le document à traduire, leur alignement automatique et leur ajout au fichier de format TWB contenant déjà le résultat de la recherche d’équivalences, de quasi-équivalences ou d’éléments de phrases similaires ainsi que, le cas échéant, de la traduction automatique. La récupération dans CELEX de tous les actes législatifs, dans les langues source et cible, auxquels il est fait référence dans le document à traduire est déjà possible. En revanche, leur alignement automatique suppose un résultat parfait qui, pour l’instant, n’est pas encore totalement garanti. Il convient néanmoins de souligner, d’une part, que la structure des textes CELEX est très parallèle et, d’autre part, qu’il existe déjà une macro permettant de résoudre bon nombre des difficultés rencontrées. Dès que tous les problèmes résiduels auront été résolus, l’intégration de ces données dans un fichier de format TWB deviendra possible. Concordance: fonction de TWB permettant une recherche ciblée dans la mémoire locale sur tout élément de phrase (terme, expression, morceau de phrase ou phrase entière) lors du processus interactif de traduction.
3 Formats
Il convient de noter qu’EURAMIS offre, à côté du format TWB, la possibilité d’obtenir directement un fichier de format WORD (voir également “EURAMIS: Added Value by Integration” d’ACHIM BLATT). Ce format présente certains avantages (simplicité d’utilisation, nul besoin d’un équipement particulier, possibilité de prétraitement de textes confiés à des traducteurs freelance, etc) et certains inconvénients (aucune gestion de la répétitivité interne du document, aucune possibilité de choix entre plusieurs propositions, etc). L’élément déterminant à cet égard semble toutefois être la restriction des possibilités d’intégration qui en résulte. En effet, ce format ne permet plus aucune interaction directe avec les données de formats MULTITERM et TWB.
Conclusion
Pour un texte donné, EURAMIS devrait bientôt permettre d’obtenir, grâce à une seule et même interface, deux fichiers distincts: - l’un en format MULTITERM (logiciel pleinement intégré à TWB) contenant la terminologie spécifique; - l’autre en format TWB contenant les équivalences, quasiéquivalences et éléments de phrases similaires trouvés dans la base de ressources linguistiques, les alignements des documents de référence récupérés dans CÉLEX et, le cas échéant, les résultats d’une demande de traduction automatique. Il est vraiment permis de rêver, mais parfois les rêves se réalisent, et bien plus vite qu’on ne l’avait espéré.
ERIC LAVIGNE Service de traduction Commission européenne
|
|
| |
|