Elektronische Werkzeuge für den Übersetzer – Ein Überblick – Uta Seewald-Heeg — Hochschule Anhalt ATICOM Dortmund, 18. März 2000 1 Typen elektronischer Übersetzungswerkzeuge 2 Vollautomatische Übersetzungssysteme 3 Evaluation von Übersetzungssystemen mit der Sprachrichtung Englisch–Deutsch und Deutsch– Französisch 4 Elektronische Glossar- und Terminologieverwaltung 5 Translation-Memory-Systeme 6 Integrierte Systeme 7 Evaluation von Translation-Memory-Systemen Typen elektronischer Übersetzungswerkzeuge Elektronische Werkzeuge für den Übersetzer — Systemtypen — • Textbausteine • Vollautomatische Übersetzungssysteme • Terminologieverwaltungssysteme • Translation Memories / Übersetzungsspeicher • Integrierte Übersetzungssysteme Textbausteine Textbausteine für französische Geschäftskorrespondenz – Computergestützte Briefstellhilfen – – una EUROBRIEF 3.0 – Langenscheidts Geschäftskorrespondenz 2.0 Basieren auf einem Inventar an Textbausteinen. Der Brief wird zunächst in deutscher Sprache erstellt und dann in die Fremdsprache übertragen. una EUROBRIEF Adreßverwaltung una EUROBRIEF Briefstruktur una EUROBRIEF Textbausteinhierarchie una EUROBRIEF Variablenbearbeitung in Textbausteinen una EUROBRIEF Deutscher Brieftext una EUROBRIEF Transformierung ins Französische Langenscheidts Geschäftskorrespondenz Auf der Basis von Textbausteinen erstellter Angebotsbrief Dokumentenexport nach Microsoft Word Bewertung • Präsentationskonventionen der französischen Geschäftskorrespondenz werden nur unzureichend berücksichtigt. • Differenzierter Gebrauch von Anrede- und Grußformeln im Französischen wird nicht reflektiert. • Fehler bei den Entsprechungen zwischen deutschen und französischen Textbausteinen. Vollautomatische Übersetzungssysteme Vollautomatische Übersetzungssysteme Architekturen von MÜ-Systemen Das Vauquoi‘sche Dreieck der Transferebenen Interlingua Semantischer Transfer Synthese/ Generierung Analyse Syntaktischer Transfer Zielsprache 3 Zielsprache 2 Direkter Transfer Quellsprache 1 Zielsprache 1 Vollautomatische Übersetzungssysteme • Sprachpaar Englisch–Deutsch: – Logos 7.8.3 (Logos) – – – – – – Personal Translator plus ‘98/Office 2000 (Linguatec, IBM) Power Translator Pro 6.5 (Globalink) Systran PROfessional für Windows 2.0 (Systran) T1 Professional (Langenscheidt, L&H) Transcend 1.2 (HEISOFT, Intergraph) ... • Sprachpaar Französisch–Deutsch: – Logos 7.8.3 (Logos) – – – – PowerTranslator Pro 6.5 (Globalink/L&H) Reverso 98 (HEISOFT, PROjectMT/Softissimo) PC-Dolmetscher (Software Brokers) Ikarus Translator Pro (CDV Software) FAMT Evaluation maschineller Übersetzungssysteme Evaluation der linguistischen Performanz maschineller Übersetzungssysteme Qualitätsbewertung Korrektheit von Grammatik, Orthographie, Wortwahl, Phraseologie Auf der Grundlage der von der ARPA entwickelten Fluency Evaluation Methodology, d.h. der intuitiven Bewertung von Sprechern der Zielsprache mit muttersprachlicher Kompetenz. Mediale Stellung zwischen der adequacy evaluation und der diagnostic evaluation. Black-Box-Evaluierung. Evaluation der linguistischen Performanz • Ausklammern der Benutzerschnittstellen aus der Evaluation. • Keine Berücksichtigung der Einbindung von Werkzeugen wie Übersetzungsspeicher sowie deren Auswirkung auf die Übersetzungsqualität. Evaluation von Übersetzungssystemen mit der Sprachrichtung Englisch– Deutsch Linguistische Phänomene Englisch–Deutsch • • • • Anweisungsstrukturen (Instruktionstexte) Syntaktische Koordinationen Komposita Nebensätze Instruktionstexte als Textbasis zur Evaluation maschineller Übersetzungssysteme • Bedienungsanleitungen von technischen Geräten müssen innerhalb der EU jeweils in der Sprache des betreffenden Absatzlandes abgefaßt sein (Produkthaftungsgesetz) • Lokalisierung von Softwareprodukten — kurze Versionszyklen Einsatz maschineller Übersetzungswerkzeuge gehört in diesen Bereichen bereits zur Realität Evaluation anhand syntaktischer Koordinationen • Koordinationen treten unabhängig von der Textsorte auf. • Aufgrund ihres komplexen Analyseaufwands stellen sie eine Herausforderung für MÜ-Systeme dar. • Typisch für Koordinationen ist das Auftreten von grammatischen Ellipsen, die bei der maschinellen Übersetzung die größten Probleme bereiten. Evaluation anhand von Komposita • Produktives Wortbildungsmittel: Testsätze aus Web-Seiten von Tourismus-Anbietern (kreativer Gebrauch von Komposita) • Zwei Testläufe: a) mit authentischen Sätzen b) mit isolierten Komposita („X is a compound“) Evaluation anhand von Nebensätzen Relevant bei der Übersetzung von Nebensätzen: – Abgrenzung von Konstituenten – Funktionsbestimmung (z.B. that-Sätze als Komplementoder als Relativsätze) – Unterschiedliche Wortstellung in AS und ZS, Tempusverschiebung usw. Test Suite Korpusgröße • 100 konstruierte Testsätze, die das linguistische Phänomen in unterschiedlichen Kontexten bzw. Varianten enthalten. • 300 authentische Testsätze aus Instruktionstexten und Web-Seiten, die das jeweils anzuwendende linguistische Phänomen enthalten. Fehlerklassifikation 1 „Satz bzw. Syntagma vollständig korrekt“ 2 „Satz bzw. Syntagma in bezug auf das zu überprüfende linguistische Phänomen grammatisch korrekt“ 3 „Satz bzw. Syntagma hinsichtlich des zu überprüfenden linguistischen Phänomens falsch“ 4 „Satz bzw. Syntagma falsch; Fehlerursache nicht eindeutig entscheidbar“ Präselektion von Systemen – Logos 7.8.3 (Logos) – Personal Translator plus ‘98 (Linguatec, IBM) – Power Translator Pro 6.5 (Globalink) – Systran PROfessional für Windows 2.0 (Systran) – T1 Professional (Langenscheidt, L&H) – Transcend 1.2 (HEI-Soft, Intergraph) Übersetzungsrichtung EnglischDeutsch Ergebnisse der textsortenbezogenen Evaluation anhand von Instruktionstexten • Übersetzungsoptionen – Logos, PT plus 98, T1 bieten die Option, zwischen imperativischer und infinitivischer Übersetzung des englischen Imperativs zu wählen. – Power Translator und Transcend können den englischen Imperativ nur imperativisch wiedergeben, Systran nur infinitivisch. • Wörterbuchfilter – Transcend verfügt als einziges System nicht über selektierbare Sachgebiete. – Systran bietet zusätzlich eine Auswahlliste von Dokumententypen. Statistische Auswertung Gesamtes Korpus (412 Sätze) PT Plus 412 (alle) Sätze Mittelwert Mittlere Abweichung Rangfolge 1 2 3 4 Summe Rangfolge nach 1 Bewertung 1 Bewertung 2 Bewertung 3 Bewertung 4 Transcent T1 LOGOS Power Translator Systran Mittelwert 1,86407767 2,33009709 2,05825243 1,7961165 2,24757282 1,94660194 2,04045307 0,47904637 0,54833345 0,63178885 0,51408915 0,50273943 0,5255145 2 6 4 1 5 3 124 220 68 0 412 2 PT Plus 30,10% 53,40% 16,50% 0,00% 1+2 83,50% 32 223 146 11 412 6 Transcent T1 7,77% 54,13% 35,44% 2,67% 61,89% 113 176 109 14 412 3 135 228 47 2 412 1 27,43% 42,72% 26,46% 3,40% 70,15% LOGOS 32,77% 55,34% 11,41% 0,49% 88,11% 34 110 248 216 124 84 6 2 412 412 5 4 Power Translator Systran 8,25% 26,70% 60,19% 52,43% 30,10% 20,39% 1,46% 0,49% 68,45% 79,13% 91,3333333 218,5 96,3333333 5,83333333 412 Mittelwert 22,17% 53,03% 23,38% 1,42% 75,20% Abweichung 0,4337918 Übersetzungsergebnisse Imperativ im einfachen Satz Open the engine compartment. – PT plus 98: Den Motorraum öffnen. – T1: Den Motorraum aufmachen. – Transcend: Öffnen Sie die Maschine Abteilung. – Logos: Das Motorfach öffnen. – Systran: Den Motorraum öffnen. – PowerTransl.: Öffnen Sie das Motor-Fach. Übersetzungsergebnisse Imperativ in parataktischer Struktur Position and align the machine. – PT plus 98: Die Maschine plazieren und ausrichten. – T1: Positionieren und die Maschine ausrichten. – Transcend: Stellen Sie ein und richten Sie die Maschine aus. – Logos: Die Maschine setzen und ausrichten. – Systran: Die Maschine in Position bringen und ausrichten. – PowerTransl.: Position und gleicht die Maschine an. Formale Schwächen der Systeme bei der Übersetzung von Instruktionstexten Kapitelüberschriften: Logos, T1 Numerierungen: PT Plus, T1 Die von einem Punkt gefolgten Zahlen werden als Bestandteil des folgenden Satzes interpretiert: z.B.: engl. 3. Position the window grid where you want the new window to appear. dt. 3 positionieren das Fenstergitter., wo das neue Fenster erscheinen soll. [T1] Übersetzungsprozeß: PT Plus Bei sehr komplexen Satzstrukturen terminiert der Übersetzungsprozeß nicht immer. Nach eingestelltem Zeitablauf wird die Übersetzung abgebrochen. Sprachliche Schwächen der Systeme Homonymie von Imperativ und Nomen: PowerTranslator z.B.: engl. Check the details. dt. Überprüfung die Details. Kongruenz, Kompositagenerierung: PowerTranslator Transcend z.B.: engl. brightness of the displayed image dt. Helligkeit des gezeigt Bildes support staff Stütze Personal Ergebnisse der Evaluation anhand syntaktischer Koordinationen Statistische Auswertung Gesamtes Korpus (300 Sätze) Systran Bewertung 1 23,10% Bewertung 2 43,00% 1+2 66,10% Logos Pt plus 98 24,60% 21,80% 39,60% 42,40% 64,20% 64,20% T1 Power Tra. Transcend 20,50% 17,70% 13,30% 39,30% 35,40% 27,80% 59,80% 53,10% 41,10% 1+2 Systran Logos PT plus 98 T1 Power Tra. Transcend Ling. TS 54,20% 50,40% 59,80% 54,20% 46,70% 40,10% Online Shop. 69,90% 75,70% 76,60% 58,20% 65,00% 53,30% Automobil-R. 74,50% 66,90% 56,60% 66,90% 48,10% 31,10% Übersetzungsergebnisse Koordinationen mit Ellipse des NP-Kopfes It offers the narrow width in men’s and women’s shoes. – PT plus 98: Es bietet die enge Breite in Mann- und Frauenschuhen an. – T1: Es bietet die schmale Breite in Männern und den Schuhen von Frauen an. – Transcend: Es bietet die enge Breite in Männer und die Schuhe von Frauen an. – Logos: Es bietet die enge Breite in den Schuhen Männer und Frauen an. – Systran: Sie bietet die schmale Breite in den Männern und in den Schuhen der Frauen an. – PowerTransl.: Es bietet die schmale Weite in den Schuhen Männer und Frauen an. Übersetzungsergebnisse Koordinationen mit Ellipse der Präposition (1) Click on the shopping cart link found in our navigation bar at the top and bottom of every page. – PT plus 98: Klicken Sie auf die in unserem Navigationsstrich am oberen Ende und Ende jeder Seite gefundene Einkaufswagenverbindung. – T1: Klicken Sie die Einkaufs-Karren-Beziehung, die oben in unserem Seefahrtenbar gefunden wird und den Boden jeder Seite an. – Transcend: Klicken Sie auf dem einkaufenden Wagen verknüpft gefunden in unserem Navigation Stab oben und Boden jeder Seite. Übersetzungsergebnisse Koordinationen mit Ellipse der Präposition (2) Click on the shopping cart link found in our navigation bar at the top and bottom of every page. – Logos: Klicken Sie auf der EinkaufswagenVerbindung, die sich am oberen und unteren Ende jeder Seite in unserer Navigationsstange befindet. – Systran: Die Einkaufskarrenverbindung an klicken, die in unserem Navigationsstab an der Oberseite gefunden wird und von jeder Seite grundieren. – PowerTransl.: Klicken Sie das einkaufend HandwagenGlied an, das in unserer Navigation-Stange bei der Spitze gefunden wird, und unterst von jeder Seite. Ergebnisse der Evaluation anhand von Komposita Statistische Auswertung Erkennung der Komposita in authentischen Sätzen Bewertung 1 Bewertung 2 Bewertung 3 Bewertung 4 1+2 Transcend PT plus 98 0,54% 13,59% 3,26% 25,00% 45,65% 32,61% 50,54% 28,80% 3,80% 38,59% Logos Power Tra. Systran 11,96% 4,89% 5,98% 15,22% 13,59% 18,48% 36,41% 34,24% 27,17% 36,41% 47,28% 48,37% 27,18% 18,48% 24,46% T1 8,70% 21,20% 40,76% 29,35% 29,90% Erkennung bei isolierten Komposita Erkennung Transcend PT plus 98 25,17% 65,23% Logos Power Tra. Systran 60,74% 43,22% 60,47% T1 65,57% Übersetzungsergebnisse Komposita diving adventures – PT plus 98: Tauchen Abenteuer – T1: tauchende Abenteuer – Transcend: Tauchende Abenteuer – Logos: tauchende Abenteuer – Systran: Tauchensabenteuer – PowerTransl.: Abenteuer springend Übersetzungsergebnisse Komposita – PT plus 98: lounge chairs Gesellschaftsraumstühle – T1: steam room Dampfraum – Transcend: charter flights Grundungsurkunde Flüge – Logos: charter flights Satzungsflüge – Systran: shuttle bus Doppelventilkegelbus – PowerTransl.: charter flights Charta-Flüge Ergebnisse der Evaluation anhand von Nebensätzen 1. 2. - 3. 4. PT plus 98 T1 Power Transl. Systran Übersetzungsergebnisse Partizipiale Nebensätze His wife being so fond of jewelry, he brought her a necklace from India. – PT plus 98: Seine Frau, so mögend, von Schmuck, er brachte ihr eine Halskette aus Indien. – T1: Sein von Schmuck so übertriebenes Ehefrauenwesen, er sie eine Halskette aus Indien bringen. – Systran: Seine Frau, die in Schmucksachen so vernarrt ist, holte er ihr einen Necklace von Indien. – PowerTransl.: Seine Frau, die von Juwel so zärtlich ist, er brachte ihr eine Halskette von Indien. Übersetzungsergebnisse Gerundiale Nebensätze mit Genitivobjekt The family were overjoyed at Ted's having been awarded a medal for life-saving. – PT plus 98: Die Familie war darüber überglücklich, daß Ted eine Medaille für Lebensrettung zuerkannt worden war. – T1: Die Familie war äußerst erfreut an Ted ist zuerkennen eine Medaille für die Bergung. – Systran: Die Familie waren @@overjoyed bei @@Ted, die eine Medaille für Lebensrettung zugesprochen wurde. – PowerTransl.: Die Familie wäre bei Ted überglücklich, haben sein verleihen eine Medaille für Rettung. Bewertung der linguistischen Performanz der Systeme mit der Sprachrichtung Englisch–Deutsch (Hinsichtlich der Textsortenklasse Instruktionstexte) • Alle Systeme sind grundsätzlich in der Lage, englische Imperative ins Deutsche zu übersetzen (Einschränkungen bei mangelnder Auswahlmöglichkeit). • Mit einem geringen Vorsprung vor PT plus ist Logos insgesamt relativ zur Textsortenklasse der Instruktionstexte das leistungsfähigste System, gehört allerdings der oberen Preiskategorie an. • Im mittleren Preissegment kann PT plus 98 bei Instruktionstexten als besonders geeignet betrachtet werden. • PowerTranslator und Transcend kommen aufgrund ihrer Mängel nicht als MÜ-Systeme zur Übersetzung von Instruktionstexten in Betracht. Gesamtbewertung der linguistischen Performanz der getesteten Systeme mit der Sprachrichtung Englisch– Deutsch Leistungsstärkste Gruppe Mittelfeld Leistungsschwächste Gruppe Logos Systran Power Translator PT plus 98 T1 Transcend Evaluation von Übersetzungssystemen mit der Sprachrichtung Deutsch– Französisch Linguistische Phänomene Deutsch–Französisch • Morphosyntax und Semantik des Adjektivs • • Genus- und Numeruskongruenz Flexionsmorphologie des Adjektivs zielsprachenrelevant • • • • • • • Homonymie der Adjektive und Adverbien Qualitäts- und Relationsadjektive Adjektivklassen: Bsp. Adjectif possessif Prä- und postnominale Stellung Positionsbedingter Bedeutungswechsel Adjektive mit präpositionaler Ergänzung Graduierung übersetzungsrelevant Übersetzungsergebnisse Genus- und Numeruskongruenz • Das Hotel befindet sich auf der Hauptstraße. – Reverso: L’hôtel se trouve dans la rue principale. – PowerTransl.: L’hôtel se trouve sur la rue principal. – Logos: L’hotel se trouve sur la grand-rue. Flexionsmorphologie • Ich studiere die griechische Grammatik. – Reverso: J’étudie la grammaire greque. – PowerTransl.: J’étudie la grammaire greque. – Logos: J’étudie la grammaire grecque. Übersetzungsergebnisse Homographie der Adjektive und Adverbien im Deutschen • Er schreibt lesbar. – Reverso: Il écrit lisible. – PowerTransl.: Il écrit lisiblement. – Logos: Il écrit lu. Relationsadjektive • Sie forschen auf dem Gebiet der Sonnenenergie. Reverso: Ils font des recherches dans le domaine{ région } de l’énergie solaire. PowerTransl.: Vous énergique dans la région de l’énergie de s’exposé à la soleil. Logos: Ils recherchent dans le domaine Ø l’énergie solaire. Übersetzungsergebnisse Adjectif possessif • Die Methode hat ihre Vor- und Nachteile. – Reverso: La méthode a le leur devant les inconvénients et. – PowerTransl.: La méthode a ses/leurs devant - et désavantages. – Logos: La méthode a leur/ses avantages et les désavantages. Prä- und postnominale Stellung • Er hat ein teures Auto. Reverso: Il a une chère voiture. PowerTransl.: Il a une voiture chère. Logos: Il a une voiture chère. Auswertung Gesamtes Korpus (400 Sätze) Bewertung Reverso Power Translator Logos Note 1 40,35 47,75 43,25 Note 2 21,80 20,75 26,25 Note 3 37,34 29,50 29,00 Note 4 0,50 2,00 1,50 3 1 2 62,16 68,50 69,50 3 2 1 Rang nach 1 1+2 Rang nach 1+2 Schwächen der Systeme • Morphosyntaktische Schwächen Sie hat einen gewissen Charme. Reverso: Elle a une conscience le charme. • Syntaktische und lexikalisch-semantische Schwächen – Stellung des Adjektivs Gewisse Lehrer irren sich nie. PowerTransl.: Des professeurs certains ne se trompent jamais. – Fehlübersetzungen von lexikalisierten Wendungen Er ist mit seinen Kräften am Ende. (être à bout de force) Logos: Il est à la fin avec ses forces. – In Bezug auf Kontext/Semantik falsche Lexemwahl Die Hitze ist drückend. PowerTransl.: La chaleur est pesante. – Lücken im Systemwörterbuch Er mag strohgelbe Pullis. Logos: Il veut ?Pullis ?strohgelbe. Schwächen der Systeme • Wiedergabe von Adverbien, die mit Adjektiven in prädikativer Stellung homograph sind Reverso: Wortklasse wird nicht erkannt • Wiedergabe des Präteritums im Französischen Reverso: immer Imparfait PowerTranslator: immer Passé Composé Logos: immer Passé Composé • Adjektive mit präpositionaler Ergänzung Alle Systeme selektieren in der Mehrzahl der Fälle nicht die korrekte Präposition. • Adjektivreihungen mit elidiertem Bezugsnomen Ellipsen stellen für alle Systeme eine Problem dar. Bewertung der linguistischen Performanz der Systeme mit der Sprachrichtung Deutsch–Französisch PowerTranslator und Reverso verfügen nicht über Lexikonfilter, die Homographien auflösen könnten. Bsp: (dt.) Das erste Schulfach ist Lesen. PowerTransl.: ... des récoltes. Logos: ... des vendanges. PowerTranslator bietet keine Möglichkeit, Mehrwortausdrücke in das Systemlexikon einzutragen, Reverso nur in eingeschränktem Maße. Bewertung der linguistischen Performanz der Systeme mit der Sprachrichtung Deutsch–Französisch Für qualitativ hochwertige Übersetzungen ist der Posteditionsaufwand als zu hoch einzuschätzen. Die getesteten Systeme kommen aufgrund ihrer Mängel nicht als MÜ-Systeme zur Übersetzung publikationsreifer Dokumente in Betracht. Die Systeme sind (mit Einschränkungen) zum Information Scanning geeignet. Die Systeme müssen sprachpaarspezifisch und bezogen auf die Übersetzungsrichtung beurteilt werden (keine Analogieschlüsse von Ergebnissen derselben Systeme mit anderen Sprachkombinationen möglich). Elektronische Glossar- und Terminologieverwaltung Terminologiesysteme • Erstellung und Pflege komplexer strukturierter Datenbestände (nicht nur Eingabe eines Wortpaares: ausgangssprachliches Wort – zielsprachliches Wort) • Zwei Arten von Systemen: – Terminologieformat fest definiert: der Benutzer kann das vom Hersteller festgelegte Format nicht mehr ändern und an seine Bedürfnisse anpassen – Terminologieformat frei definierbar • Integration in Textverarbeitung sollte möglich sein • Anzahl der möglichen Einträge sollte nach oben offen sein • Wichtig/nützlich: Schnittstelle zum Importieren und Exportieren der erstellten Terminologien, ggf. in einen Terminologiestandard wie MARTIF • Möglichkeiten zur Erstellung gedruckter Glossare sollten bestehen MSG-Browser (Microsoft Glossaries Browser) Deutsch http://www.icactive.com/msgb/ (Testversion für 30 Tage ) MSG-Browser MSG-Browser Französisch Trados MultiTerm ’95 http://www.trados.com / (Testversion für 30 Tage) • Zu einem Terminus bzw. einem Konzept können bis zu 20 zielsprachige Äquivalente eingetragen werden • Einträge können kreuzreferenziert werden • Suche in beliebigen Sprachrichtungen möglich • Suche mit Wildcards und Fuzzy Match MultiTerm ’95 Querverweise MultiTerm ’95 Einbinden graphischer Elemente MultiTerm ’95 Fuzzy Searching MultiTerm ’95 Fuzzy Searching MultiTerm ’95 Fuzzy Searching MultiTerm ’95 Suche mit Filtern MultiTerm ’95 (Vordefinierte Eintragsstruktur) MultiTerm ’95 (Einbindung in Word) MultiTerm Lite • Begrenzung auf 8192 Einträge • nicht netzwerkfähig • Graphiken (in Einträgen) können nicht angezeigt werden • kein Fuzzy Match möglich MultiTerm Dictionary • Zur Weitergabe firmenspezifischen Vokabulars an Übersetzer, Kunden etc. • Benutzer haben nur Leserecht • Kann mit MultiTerm erzeugt werden TermStar von Star • Zu einem Terminus bzw. einem Konzept können bis zu 20 zielsprachige Äquivalente eingetragen werden • Einträge können kreuzreferenziert werden • Suche in beliebigen Sprachrichtungen möglich • Unterschiedliche Eintragsmodi verfügbar TermStar von Star Wörterbuchsuche Wahl verschiedener Layouts für die Bildschirmansicht möglich TermStar TermStar Kreuzreferenzen TermStar Integration grafischer Elemente Kreuzreferenzen TermStar Konzept-Layout definieren Felder TermStar Konzept-Layout definieren Arbeiten mit TermStar unter MS Word TermStar-Icons: •Suchen •Schnelle Eingabe •Wechseln zu TermStar Arbeiten mit TermStar unter MS Word Selektiertes Äquivalent im Text einsetzen Arbeiten mit TermStar unter MS Word TermStar „Schnelleingabe“ WebTerm (Star) Verfügbarkeit der Terminologie im Intranet oder im Internet Translation-Memory-Systeme Übersetzungsspeicher (Translation Memory — TM): • multilinguales Text-/Satzarchiv • synchronisierte quellsprachige und übersetzte Textsegmente (Sätze), die als Referenzmaterial dienen • Retrieval erfolgt in der Regel mit fuzzy logic Speichereinheiten des Satzarchives Quelltextsegment Zieltextsegment To create an object, please follow the steps below. Um ein Objekt zu erzeugen, folgen Sie bitte den nachfolgenden Schritten. Change Date: 25.07.1999 Change User: UTA Product: VW-Manual Angaben zur Datenverwaltung Übersetzungsspeicher Le 6 novembre 1998, la SWX a introduit un fixing de clôture pour tous les titres de participation cotés, y compris les fonds de placement. La procédure commence à 16 h 55 pour les titres du SMI, et cinq minutes auparavant pour les autres titres. Dés que la procédure est lancée, des ordres peuvent certes encore être introduits dans le carnet d‘ordres, mais ils n‘entraîneront aucune exécution. Chaque fois que le carnet d ’ordres subit une modification, un nouveau prix de fixing théorique est calculé. Satzarchiv Terminologiedatenbank Le 6 novembre 1998, la SWX a introduit un fixing de clôture pour tous les titres de participation cotés, y compris les fonds de placement. La procédure commence à 16 h 55 pour les titres du SMI, et cinq minutes auparavant pour les autres titres. Sobald die Schlussauktion eröffnet ist, können neue Aufträge ins Orderbuch eingegeben werden, mais ils n‘entraîneront aucune exécution. Chaque fois que le carnet d ’ordres subit une modification, un nouveau prix de fixing théorique est calculé. Vom TM bearbeiteter Text Ausgangstext Terminologieverwaltungssystem Komponenten eines Translation-Memory-Systems 3 Text-/ Dokumentenprogramm 4 Alignmentprogramm 1 DatenbankVerwaltungsprogramm 2 Terminologieprogramm 5 Import-/ ExportFilter 1 DatenbankVerwaltungsprogramm • Suche nach gespeicherten Übersetzungen mit Fuzzy-Match-Verfahren • Perfect Match: Segment im zu übersetzenden Dokument und im TM stimmen zu 100 % überein • Full Match: Das Segment im zu übersetzenden Dokument und im TM stimmen bis auf Ersetzungsklassen wie Zahlen, Monatsnamen überein • Fuzzy Match: Textsegmente, die Abweichung zum zu übersetzenden Segment aufweisen • Eingriff bei Fehlern oder globalen terminologischen Änderungen an Satzpaaren 2 Terminologieprogramm • z.T. ausgereifte Programme • Möglichkeit des Imports elektronisch gespeicherter Glossare • Translation Manager (IBM) wird mit TerminologieWörterbuch ausgeliefert, andere Firmen (Trados, Star) bieten Terminologie-Wörterbücher zusätzlich an • einige Programme sind sehr komplex (FuzzyMatch-Algorithmen ermöglichen Suche nach Wörtern mit derselben Wurzel) • Möglichkeit, nach einzelnen Wörtern im TM zu suchen (in den meisten Programmen) 3 Text-/ Dokumentenprogramm • Programm, in dem die Übersetzung angefertigt wird • häufig: 2 parallel angeordnete Fenster (AT - ZT) • oft: 1 weiteres Fenster, das Einheiten des TM anzeigt • meistens: Fenster des Terminologieprogramms • z.T. recht primitive Textverarbeitungsmöglichkeiten, einige Programme erlauben nur „copy and paste“, andere volle Formatierungsmöglichkeiten 4 Alignmentprogramm • Möglichkeit, bestehende Texte und Übersetzungen in die Datenbank einzulesen • Texte werden in Segmente (meist Sätze) zerlegt • Zuordnung von Textstellen (Sätzen) durch Verwendung von statistischen und/oder inhaltlichen Kriterien • Nachbearbeitung in der Regel erforderlich • große Unterschiede zwischen den angebotenen Programmen • Star Transit: stark automatisiert (zeitsparend) • Trados WinAlign: halbautomatisch; mit graphischer Alignierfunktion; ermöglicht, Alignment-Probleme schnell und einfach zu beheben • in der Regel: zusätzliche Kosten bei der Anschaffung 5 Import-/ ExportFilter • Einige Programme sind mit einer reichen Auswahl an Filtern ausgestattet (Déjà Vu, SDLX, IBM) • Andere Programme bieten Filter zu Aufpreis an (Star Transit, Trados TWB) • Alle Programme sind standardmäßig mit einem Filter für MS Word ausgestattet Eignung von Translation Memories • Texte liegen maschinenlesbar vor • Große Textmengen mit hohem Anteil an Wiederholungen (Sätze, syntaktische Strukturen, Terminologie) innerhalb eines Textes sowie relativ zum vorhandenen Referenzmaterial • Umfangreiche Terminologie • Sicherstellen der terminologischen Konsistenz • Wenige große Kunden (schnellere Amortisierung) Translation Memories Übersetzungsspeicher • Déjà Vu von Atril • Eurolang Optimizer • Joust von Alpnet • SDLX von SDL • Transit von STAR • Translation Manager von IBM • Translator‘s Workbench von Trados • XEROX XTrans • ZERESTRANS von Zeres CAT IBM — TranslationManager • „Vater“ oder „Mutter“ aller TM-Systeme • Von IBM zur Unterstützung der eigenen Lokalisierungsbedürfnisse entwickelt • Hat seine anfängliche Position als Marktführer verloren (langsame Entwicklung, wenig Marketing) • Einziges Programm, das mit Alignment-Tool, erweiterbarem Wörterbuch und Filtern für die gängigsten Textverarbeitungsprogramme ausgeliefert wird • In mancher Hinsicht das einfachste Programm, allerdings ohne besonderes Interface (nicht sehr benutzerfreundlich) IBM — TranslationManager Filter • • • • • • • • • • • MS Word WordPerfect Alle FormatAmi Pro Informationen HTML bleiben während der Übersetzung erhalten, RTF so dass Original und Übersetzung das Ventura Publisher gleiche Layout haben. Interleaf FrameBuilder BookMaster IPF (Information Presentation Facility) ASCII IBM — TranslationManager Import des zu übersetzenden Dokumentes IBM — TranslationManager IBM — TranslationManager IBM Translation Manager Analysefunktion IBM — TranslationManager Formatinformationen Übersetzungsfenster TM-Fenster Wörterbuch-Fenster IBM — TranslationManager Übergabe des übersetzten Segments an das Translation Memory IBM — TranslationManager Übersetzungsvorschlag aus dem TM IBM — TranslationManager copy & paste Aktives Segment IBM — TranslationManager Übernahme eines Eintrags aus dem Wörterbuch mit Ctrl + a IBM Translation Manager Nachschlagen im Wörterbuch IBM Translation Manager Nachschlagen im Wörterbuch IBM Translation Manager Eintrag im Wörterbuch hinzufügen IBM Translation Manager Eintrag im Wörterbuch hinzufügen IBM — TranslationManager Systemmeldung bei Abschluss der Übersetzung Durch Bestätigen gelangt man in den Posteditionsmodus IBM — TranslationManager Verbergen der Format-TAGs IBM Translation Manager Darstellung des übersetzten Textes ohne Format-TAGs IBM Translation Manager Posteditionsmodus Einfügen von Text mit der Einfügetaste aktivieren. IBM Translation Manager Nachschlagen im TM IBM Translation Manager Globlae Änderungen im TM IBM Translation Manager Globlae Änderungen im TM IBM Translation Manager Export eines übersetzten Dokuments SDLX von SDL • SDL – eines der grössten Lokalisierungsunternehmen in Groß Britannien • SDLX – Weiterentwicklung von Amptran • SDLX setzt sich aus einer Reihe von Einzelprogrammen zusammen SDLX Benutzerführung in Version 3.0 SDLX — Version 2.0 SDLX Zur Erstellung des Zieltextes SDLX Editor — Übersetzungsfenster SDLX SDLX Aktualisierung des TM-Inhalts SDL Translate Setzt quellsprachige Entsprechungen oberhalb eines vom Benutzer spezifizierten Match-Wertes in den Zieltext ein. SDLX Abgleich des ASTextes mit dem TM SDLX TM-Matches Unterschiede zwischen A-Text und Z-Text SDLX Übernahme der Übersetzung eines Fuzzy-Matches Übernahme eines 100%-Matches SDLX Übersetzes Segment „View source differences“ Anzeigen der Unterschiede zwischen aktuellem Segment und Referenzmaterial SDLX Glossar-Import Plural Singular SDLX SDLX Glossar-Import SDLX Glossar-Import SDLX Glossar-Schnittstelle in Version 3.0 Import und Export von TMs in SDLX TMX ist ein XML-Format, das erlauben soll, TMs verschiedener Hersteller auszutauschen. TMX wird von der Localisation Industry Standards Association (LISA) unterstützt und von der Interessengruppe OSCAR (Open Standards for Container/Content Allowing Re-use) entwickelt. Import und Export von TMs aus und in zahlreiche Dateiformate. — Das Hauptformat des Export- und Import-Tools ist TMX, das Format, das von SDL Edit verwendet wird. Alignment in SDLX AS-Text ZS-Text Alignment in SDLX Déjà Vu Interactive von Atril • Déjà Vu vor allem bei freiberuflich tätigen Übersetzern verbreitet (Produktumfang, Anschaffungskosten) • Umfasst eigenes Alignment-Werkzeug, Terminologie-Programm, Wörterbücher zur Rechtschreibprüfung und Dokumentenfilter Déjà Vu Interactive Einstellungen Déjà Vu Interactive Sprachspezifische Konfiguration Déjà Vu Interactive Anlegen eines Projektes Filter Déjà Vu Interactive Filter Déjà Vu Interactive Déjà Vu Interactive Fuzzy-Match-Einstellungen Déjà Vu Interactive Quelltext-Import Déjà Vu Interactive Übersetzungsfenster Zeichenformat-Kodierung Vollständige Anzeige des aktivierten Satzes im AS-Fenster Déjà Vu Interactive Übersetzungsfenster Déjà Vu Interactive Übersetzungsfenster Mit Ctrl+D wird der jeweils nächste Zeichenformat-Kode in den Zieltext kopiert Déjà Vu Interactive Übersetzungsfenster Reihenfolge der ZeichenformatKodierung im ZS-Text umgekehrt Zeichenformat-Kodierung einfügen Déjà Vu Interactive Übersetzungsfenster Verbindung zweier Segmente Déjà Vu Interactive Übersetzungsfenster Verbundene Segmente Déjà Vu Interactive Übersetzungsfenster Aufgespaltene Segmente Déjà Vu Interactive Übersetzungsfenster Aufnahme von Satzpaaren in die Datenbank Déjà Vu Interactive Übersetzungsfenster Die Datenbank nach Kandidaten für die Übersetzung durchsuchen Déjà Vu Interactive Übersetzungsfenster Markierte Textauswahl wird in die Terminologiedatenbank übernommen Déjà Vu Interactive Übersetzungsfenster Nachschlagen in der Terminologiedatenbank Déjà Vu Interactive Terminologie-Schnittstelle Eintrag in die Terminologie-Datenbank Nachschlagen in der Terminologie-Datenbank Déjà Vu Interactive Übersetzungsfenster Alle Satzpaare des aktuellen Projekts in die Datenbank aufnehmen Déjà Vu Interactive „Vorübersetzung“ „Vorübersetzung“ Déjà Vu Interactive Übersetzungsfenster „Vorübersetzung“ Déjà Vu Interactive Übersetzungsfenster „Vorübersetzung“ Déjà Vu Interactive Übersetzungsfenster Fuzzy Match Déjà Vu Interactive Nachschlagen im Wörterbuch (TermWatch) Einfügeoptionen Déjà Vu Interactive Suche in der Datenbank Déjà Vu Interactive Export der Übersetzung Déjà Vu Interactive Export der Übersetzung Transit von Star • Translation Memory von Star basiert nicht auf einer Datenbank, sondern auf einem sogenannten Assoziativen Netzwerk • Ermöglicht sehr schnellen Zugriff und Laufzeit auch bei großen Datenmengen Transit von Star Übersetzen im Transit-Editor Transit von Star Anlegen eines Projektes Ab Version 3 erhält der Benutzer Hilfestellung durch sogenannte Wizards (Programm-Assistenten). Transit von Star Anlegen eines Projektes Hier angewählte Wörterbücher stehen anschließend unter TermStar zur Verfügung Transit von Star Anlegen eines Projektes Sprachpaar laden Erläuterungen für den Benutzer Transit von Star Anlegen eines Projektes Speichern/Laden eines Dokumentenfilters bzw. TAGSchutzes Transit von Star „Profil“ TM in Form eines sprachpaarbezogenen Assoziativen Netzwerks Transit von Star Editor Editoremulation Transit von Star Editor Optionen für die Textdarstellung Transit von Star Editor — Ausblenden von Tags und Segmentgrenzen Transit von Star Editor Wörterbuch Transit von Star Editor Wörterbuch Statuszeile Transit von Star Auswahl des Referenzmaterials Transit von Star Suche im Referenzmaterial 100%-Match Transit von Star Suche im Referenzmaterial Transit von Star Suche im Referenzmaterial Transit von Star Vorübersetzung Kombination aller Referenzdateien zu einem Sprachpaar (vereinfacht Weitergabe) Automatische Anpassung und Übernahme von Segmenten mit unterschiedlichen Zahlen oder mit unterschiedlichen TAGs Transit von Star Fuzzy-Index (Voreinstellungen) Transit von Star Import von Dateien mit Vorübersetzung Segmentierungsregeln für den Import Transit von Star „Vorübersetzen“ Transit von Star „Vorübersetzen“ Transit von Star Vorübersetzung — Statistik Version 2.7 Version 3.0 Transit von Star „Fuzzy Match“ Automatisches Anpassen von Zahlen Angabe des Match-Wertes und der Referenzdatei Transit von Star „Fuzzy Match“ Hervorhebung der Unterschiede zwischen aktuellem Dokument und Referenzdokument Transit von Star Transit-Editor (Version 3.0) ZieltextFenster FuzzyIndex Fenster WörterbuchFenster NotizFenster Transit von Star Transit-Editor (Version 3.0) FuzzyIndex Fenster WörterbuchFenster ZieltextFenster NotizFenster Transit von Star Fuzzy-Index Automatische Anpassung des aktuellen Segments Markierung der Unterschiede zwischen altem und aktuellem Segment Transit von Star Nachschlagen in TermStar Transit von Star Übernahme der markierten Wörter aus dem Wörterbuch Transit von Star Eintrag in TermStar Transit von Star Eintrag in TermStar TermStar Transit von Star Terminologieerstellung Transit von Star Terminologieerstellung Verschieben von Wörtern der Liste „Allegmeine Begriffe“ in die Liste „Fachterminologie“ Anlegen eines allgemeinsprachlichen Wörterbuchs Transit von Star Terminologieerstellung Kontrolle über mehrfache Einträge Transit von Star Überprüfung der Formatierung Transit von Star Alignment Transit von Star Alignment Einflussgrößen für das Alignment Transit von Star Alignment Bestätigen der Alignierung Transit von Star Alignment Transit von Star Alignment Verbinden von Segmenten Trados Translator‘s Workbench • Workbench-Editor = Textverarbeitungsprogramm (MS Word oder Word Perfect) • Durch Intergartion in Textverarbeitung hohe Benutzerfreundlichkeit Trados Translator‘s Workbench Translator‘s Workbench mit Word-Editor Trados Translator‘s Workbench Trados Translator‘s Workbench Erzeugen eines Fuzzy-Index in MultiTerm Trados Translator‘s Workbench Erzeugen eines Fuzzy-Index in MultiTerm Trados Translator‘s Workbench Trados Translator‘s Workbench Kein Vorschlag für eine Übersetzung in der TM-Datenbank enthalten Markierung für die Eingabe einer Übersetzung Trados Translator‘s Workbench Trados Translator‘s Workbench Trados Translator‘s Workbench Trados Translator‘s Workbench Konkordanzsuche Trados Translator‘s Workbench Konkordanzsuche mit Fuzzy-Match-Funktion Trados Translator‘s Workbench Trados Translator‘s Workbench Trados Translator‘s Workbench Trados Translator‘s Workbench TRADOS Translator‘s Workbench Trados Translator‘s Workbench Laden von MultiTerm Trados MultiTerm Trados MultiTerm Terminus-Feld Feld für Definitionen, Anmerkungen, Beispiele etc. Feld zur Angabe von Sachgebier, Genus etc. Trados MultiTerm Attribut aus einer vordefinierten Liste Auswahl des Sachgebiets aus einer Attributwert-Liste Trados MultiTerm Selektion der Sprache Textfeld für die Eingabe des Terminuns Trados MultiTerm Querverweis Indexfeld „Sprache“ Trados MultiTerm Indexfeld „Sprache“ Querverweis Trados MultiTerm Arbeiten mit MultiTerm unter Word MultiTerm Suchergebnis Integrierte Systeme Integrierte Systeme Integration verschiedener Systeme / Systemkomponenten auf unterschiedlichen Verarbeitungsstufen. Integration eines vollautomatischen Systems mit einem Satzarchiv bzw. einer Translation-Memory-Komponente Integration verschiedener Übersetzungswerkzeuge EP Electronic Publishing Partners GmbH Integration verschiedener Übersetzungswerkzeuge EP Electronic Publishing Partners GmbH Integration verschiedener Übersetzungswerkzeuge EP Electronic Publishing Partners GmbH Integriertes Übersetzungssystem Abgleich Referenzmaterial Kopie des AT 100 %-Matches Translation Memory Ausgangstext (AT) neues Referenzmaterial (z.B. Transit von STAR) Terminologieverwaltung unübersetzte Segmennte des AT Übersetzungssystem (z.B. Logos) Zieltext Evaluation von Translation-Memory-Systemen Match-Werte R-Satz Chapter 2 Getting Started Ü-Satz T1 PT plus TWB Chapter 2 Getting started Chapter 2 Getting Started. Chapter 1 Getting Started Chapter 2 Getting Started Getting started 75% 75% 75% 50% 50% 25% 100% 100% 95% 0% 77% 0% 92% 97% 100% 0% 0% 0% 87% 87% 87% 87% 75% 87% 87% 75% 62% 77% 62% 91% 86% 100% 82% 87% 87% 82% 71% 75% 89% 80% 89% 89% 99% 89% 87% 84% 89% 78% 67% 81% 67% R-Satz This chapter is an introduction to X11 operations. Ü-Satz This chapter gives an introduction to X11 operations. This manual is an introduction to X11 operations. This chapter is an introduction to X11 operations This chapter is an introduction to X11 functions. This chapter is an introduction to X11. This chapter is an introduction to X11 This chapter is an XXX to X11 operations. This chapter is an overview over X11 operations. This chapter is a list of X11 operations. This chapter is a brief introduction to X11 operations. This chapter is a brief introduction to X11. Match-Werte R-Satz This chapter is an introduction to X11 operations. Ü-Satz The following chapter is an introduction to X11 operations. Chapter 2 is an introduction to X11 operations. Chapter 2 is a brief introduction to X11 operations. Chapter 2 of this manual is an introduction to X11 operations. This chapter is an introduction to X11 operations and X11 functions. This chapter is an introduction to operations of X11. This is an introduction to X11 operations. See the introduction to X11 operations. X11 operations are introduced in this chapter. X11 is introduced in this chapter. chapter This an is to introduction operations X11. is an introduction This chapter to operations. X11 X11 introduction This chapter is an to operations. X11 introduction This an chapter is an to operations. X11 This an chapter is an to operations. T1 PT plus TWB 77% 75% 55% 54% 72% 66% 87% 50% 12% 25% 75% 87% 100% 100% 100% 78% 84% 76% 68% 77% 93% 91% 75% 53% 0% 91% 95% 87% 97% 86% 86% 86% 64% 70% 77% 88% 87% 53% 0% 0% 89% 79% 67% 71% 75% EAGLES-Evaluationsdesign • EAGLES-Arbeitsgruppe "Assessment and evaluation“ • Grundlage: ISO-Norm 9126 • Modell: Adäquatheits-Evaluation • Prüf-/Qualitätskriterien nach ISO 9126: – Funktionalität (functionality) – Zuverlässigkeit (reliability) – Brauchbarkeit (usability) – Leistungsfähigkeit (efficiency) – Wartbarkeit (maintainability) – Portierbarkeit (portability) • Erweiterung von ISO 9126 um Nutzerorientiertheit EAGLES-Evaluationsdesign für TM-Systeme • off-line-Funktionen – – – – Art der Textanalyse Möglichkeiten des Imports und Exports von Text Segmentierung Alignment • on-line-Funktionen – Größe des TM – Retrieval-Geschwindigkeit bei der Suche im Übersetzungsarchiv – Trefferquote beim Abgleich eines zu übersetzenden Satzes mit den Daten des TM – Relevant: Zahl der jeweils benötigen Arbeitsschritte Schlussfolgerungen für eine Evaluation von TMs • Um Aussagen über die Funktionsweise der TM-Systeme machen zu können, ist eine Evaluation von TMs im Wesentlichen auf der Basis der sogenannten on-lineFunktionen durchzuführen. • Die Möglichkeit des Alignment soll als Nebenkriterium Berücksichtigung finden. • Evaluationsparameter: Textformate, Retrieval, Zuverlässigkeit der Klassifizierung von Sätzen als 100%Matches. Textkorpus (a) (b) Konstruiertes Testkorpus Authentisches Textmaterial Bewertungsschema 1. das System beherrscht das Problem (der Modifikation) 2. das System beherrscht das Problem nicht zufriedenstellend 3. das System beherrscht das Problem nicht Anschaffungskosten von Translation-Memory-Systemen Anschaffungskosten von Translation-Memory-Systemen Die Anschaffungskosten sind je nach Produkt und der im Lieferumfang enthaltenen Komponenten verschieden; zum Beispiel: • SDL — SDLX 199 $ (Sonderangebot), 350 $ • Atril — Déjà Vu (mit Alignment-Tool, TermWatch u. zahlreichen Filtern) 990 EUR • Star — Transit SMART 3.0 (Transit und TermStar für Einzelübersetzer) 591 EUR (1155 DM) • Trados — Translator‘s Workbench (Translator's Workbench, MultiTerm, TagEditor, WinAlign) 995 EUR (1946 DM) Resümee • Jedes der vorgestellten Terminologieverwaltungssysteme und Translation-Memory-Systeme erfordert eine Einarbeitung, um sie effizienzsteigernd einzusetzen. • Terminologieverwaltungssysteme bieten nennenswerte Erleichterung bei Erstellung und Pflege von Terminologie. • Sowohl Terminologieverwaltungssysteme als auch Transaltion-Memory-Systeme tragen zur Konsistenz der Übersetzungen bei. • Für effiziente Auftragsbearbeitung gibt es bei großen Textmengen mit hohem Anteil an Wiederholungen zu TMs keine Alternative. Vielen Dank für Ihre Aufmerksamkeit! Uta Seewald-Heeg • [email protected]