Globalisierung und Lokalisierung Fremdsprachen auf Embedded Systemen Embedded Computing Conference 2012 Vera Mirković, CSA Engineering AG CSA Engineering AG Seit 1989 in Solothurn Software Entwicklung Embedded Systeme PC Software mit Microsoft .NET Hardware Entwicklung Consulting & Engineering Wir haben Best ausgebildete Mitarbeiter Höchste Ansprüche an Qualität Innovative Lösungen für komplexe technische Aufgaben 2 Agenda • Sprachrelevante Aspekte • Kulturelle Unterschiede • Analyse der Zielsysteme und mögliche Lösungseinsätze • Tools • Fazit 3 Unicode Internationaler Standard Es gibt 17 Bereiche (planes), in jedem Bereich 65536 Zeichen Für jedes Schriftzeichen gibt es einen digitalen Code Bezeichnung: U+00AD (hexadezimal) In Unicode werden lediglich „abstrakte Zeichen“ (englisch: characters) kodiert, nicht dagegen die grafische Darstellung (Glyphen) dieser Zeichen 4 Basic Multilingual Plane Symbols ASCII Other CJK Greek Jamo Kana Arabic Other 0x0000 Compatibility Hangul 0xFFFF Indic Surrogates Ideographs Private use Latin Hebrew Yi Punctuation Cyrillic Ethiopic = Future use Source: ASMUS, Inc. © Copyright 1995-2012· Used by permission 5 Characters ≠ Glyphs ه 0647 Coded Character f i 0066 0069 Coded Character Sequence Source: ASMUS, Inc. © Copyright 1995-2012· Used by permission ههه ه Positional Shapes fi fi Optional Ligature 6 Characters G Ω 語 4716 3A916 Encoding Forms 8A9E16 G Ω語 UTF-16 UTF-8 UTF-32 Source: ASMUS, Inc. © Copyright 1995-2012· Used by permission 0047 03A9 8A9E G ÎΩ© 語 ž 47 G 00000047 CE A9 E8 AA 9E Ω 000003A9 語 00008A9E 7 Fonts Fonts werden zur Darstellung der Zeichen auf dem Display von Geräten (Computer, Tablets) oder zum Drucken verwendet Es gibt Bitmap Fonts Vektor Fonts (TrueType) Strich (Stroke) Fonts Font Engines 8 Lateinisches Alphabet Meistverbreitetes Alphabet der Welt 26 Buchstaben Grosse und kleine Buchstaben Es wird von links nach rechts geschrieben Es gibt noch andere Buchstaben, abhängig von der Sprache Deutsch: ü, ä, ö, … Französisch: à, è, é, … 9 Kyrillisches Alphabet Es wird in vielen slawischen Sprachen verwendet Russisch, Bulgarisch, Serbisch… Russisch: 33 Buchstaben grosse und kleine Buchstaben von links nach rechts geschrieben 10 WGL4 Zeichensatz Windows Glyph List 4 Besteht aus 652 UNICODE Zeichen WGL4 Zeichen können auf allen aktuellen Betriebssystemen zuverlässig dargestellt werden. Es eignet sich für Schreiben von Sprachen in: Fast allen europäischen Ländern Nord und Süd Amerika Australien Einigen afrikanischen und asiatischen Ländern 11 Chinesische Schrift Traditionelle Schrift – Taiwan, Hongkong Einfache Schrift – China und Singapur Jedes Zeichen ist eine Silbe, ca.400 Silben Standard GB18030 – 27484 Zeichen Leere Zeichen sind unüblich Von links nach recht, von oben nach unten Du gut ! Sehr lange nicht sehen (Aussage) ! Hallo! Lange nicht gesehen! http://www.schriften-lernen.de/index.html 12 Japanische Schrift Das moderne japanische Schreibsystem besteht aus 4 verschiedene Schriften: Kanji (japanischer Name für chinesische Zeichen) Hiragana Katakana Romaji (Latin) Anzahl Zeichen: ca.7500 13 Koreanische Schrift eine Mischung von 2 verschiedenen Schriften: Hangul (Silben), Hanja (koreanischer Name für die chinesischen Zeichen) Anzahl Grundzeichen ist 51 Anzahl Zeichen im Standard ist ca. 20000 14 Indische Schriften Devanagari - ein südasiatisches Schriftsystem, das in vielen (indischen) Sprachen verwendet wird Es wird von links nach rechts geschrieben, ca. 500 Glyphe Es gibt keine Unterscheidung zwischen grossen und kleinen Buchstaben 15 Arabische Schrift Es wird in vielen asiatischen und afrikanischen Ländern benutzt Die Schrift ist kursiv, ohne grosse und kleine Buchstaben Es wird von rechts nach links geschrieben, ca. 830 Glyphe Zeichen können bis zu 4 verschiedenen Formen haben: Anfangsform ﺳ Mittelform ﺴ Final Form ﺲ Isolierte Form ﺱ Arabische Präsentation Form ist in UNICODE definiert (Kompatibilität) 16 Memory 0644 0647 0645 Display Order Glyph Selection & Positioning = + ligature final medial initial final medial initial Font 17 Source: ASMUS, Inc. © Copyright 1995-2012· Used by permission Positional Shapes and Ligatures Agenda • Sprachrelevante Aspekte • Kulturelle Unterschiede • Analyse der Zielsysteme und mögliche Lösungseinsätze • Tools • Fazit 18 Farben Fehler? Warnung? Erfolg? 19 Ziffern Arabisch-Indische Ziffern 12 3 4 5 6 7 8 9 0 ١٢٣ ٤ ٥٦ ٧ ٨ ٩٠ Chinesische Ziffern Hebräisch Wert Aleph א 1 Beth ב 2 Gimel ג 3 Daleth ד 4 He ה 5 Waw ו 6 Zajin ז 7 Chet ח 8 Tet ט 9 Jod י 10 20 Kalender und Datum BE-2012-3-31 LE-31.3.2012 ME-3/31/2012 Gelb:Big-Endian(BE); Blaugrün:Little-Endian(LE), Violett:MiddleEndian(ME) 21 Symbole Stop Zeichen In Israel In Japan Sanduhr Mailbox Menschliche Figuren Home Hilfe oder Abfrage 22 Agenda • Sprachrelevante Aspekte • Kulturelle Unterschiede • Analyse der Zielsysteme und mögliche Lösungseinsätze • Tools • Fazit 23 Analyse der Zielsysteme Betriebssystem Speicher Dateisystem Eingabe der Texte OTS Software oder nicht Lizenzkosten (Fonts, Font Engines …) Aufwand bei der Implementation einer neuen Sprache 24 Zielsysteme Gruppe I Mit Betriebssystem, Layout und Font Engines Gruppe II Mit Betriebssystem aber ohne Layout und Font Engines Ohne Betriebssystem 25 Zielsysteme - Gruppe I (Beispiel Windows CE) Uniscribe Komponente Layout + Font Engines sind Teil des Betriebssystems Tools für die einfache Übersetzung ResourceBlender Zeta Resouce Editor SDL Passolo … Fertige Bibliotheken in der Entwicklungsumgebung CultureInfo, Calender, DateTime … 26 Zielsysteme – Gruppe II OTS für Layout und Font Engines 27 OTS für Layout und Font Engines Vorteile Nachteile Implementierungsaufwand Software Lizenzen ist klein Smart Fonts sind vorhanden Es gibt einige Anbieter von solchen Komponenten (Linotype, Bitstream), aber es gibt auch OpenSource ICU Bibliothek von IBM Speicherbedarf Abhängigkeit von OTS Software Herstellern Eventuelle Software Verifizierung (Normen) 28 Proprietäre Lösung Font 1,2, or 3 29 Proprietäre Lösung Vorteile Keine OTS Software, keine Lizenzkosten (ausser Fonts) Keine Abhängigkeit von Herstellern von Layout/Font Engines Die Darstellung («rendering») ist sehr schnell RAM Bedarf ist im Vergleich mit anderen Methoden relativ klein Firmware soll nicht ändern wenn eine neue Sprache hinzugefügt wird Nachteile Es können nur Sprachen wo eine direkte Beziehung zwischen Kodierung und Glyphe besteht, dargestellt werden. Die Eingabe von Texten für die komplexen Schriften ist sehr wahrscheinlich nicht möglich (oder mit viel Aufwand verbunden) Hohe Entwicklungskosten (im Vergleich mit anderen Methoden) Sprachpakete sind im Vergleich mit OTS Lösung grösser 30 Agenda • Sprachrelevante Aspekte • Kulturelle Unterschiede • Analyse der Zielsysteme und mögliche Lösungseinsätze • Tools • Fazit 31 Tools 32 33 Länderfreigabe Dokument 34 Fazit Sprachen Kulturelle Unterschiede Texteingabe oder nur die Darstellung Systemdesign Tools 35 Referenzen und Danksagung Stefan Brunner, CSA Engineering AG, Geschäftsführer Asmus Freytag, Ph.D. President ASMUS, Inc. http://www.basistech.com/knowledge- center/unicode/understanding-unicode-5.0.ppt. 36