Globalisierung und Lokalisierung Fremdsprachen auf Embedded

Werbung
Globalisierung und Lokalisierung
Fremdsprachen auf Embedded Systemen
Embedded Computing Conference 2012
Vera Mirković, CSA Engineering AG
CSA Engineering AG
 Seit 1989 in Solothurn
 Software Entwicklung
 Embedded Systeme
 PC Software mit Microsoft .NET
 Hardware Entwicklung
 Consulting & Engineering
 Wir haben
 Best ausgebildete Mitarbeiter
 Höchste Ansprüche an Qualität
 Innovative Lösungen für
komplexe technische Aufgaben
2
Agenda
• Sprachrelevante Aspekte
• Kulturelle Unterschiede
• Analyse der Zielsysteme und mögliche Lösungseinsätze
• Tools
• Fazit
3
Unicode
 Internationaler Standard
 Es gibt 17 Bereiche (planes), in jedem Bereich 65536
Zeichen
 Für jedes Schriftzeichen gibt es einen digitalen Code
 Bezeichnung: U+00AD (hexadezimal)
 In Unicode werden lediglich „abstrakte Zeichen“ (englisch:
characters) kodiert, nicht dagegen die grafische Darstellung
(Glyphen) dieser Zeichen
4
Basic Multilingual Plane
Symbols
ASCII
Other CJK
Greek Jamo
Kana
Arabic Other
0x0000
Compatibility
Hangul
0xFFFF
Indic
Surrogates
Ideographs
Private use
Latin Hebrew
Yi
Punctuation
Cyrillic
Ethiopic
= Future use
Source: ASMUS, Inc.
© Copyright 1995-2012· Used by permission
5
Characters ≠ Glyphs
‫ه‬
0647
Coded Character
f i
0066 0069
Coded Character Sequence
Source: ASMUS, Inc.
© Copyright 1995-2012· Used by permission
‫ههه ه‬
Positional
Shapes
fi fi
Optional Ligature
6
Characters
G Ω 語
4716
3A916
Encoding Forms
8A9E16
G Ω語
UTF-16
UTF-8
UTF-32
Source: ASMUS, Inc.
© Copyright 1995-2012· Used by permission
0047 03A9 8A9E
G ÎΩ© 語 ž
47
G
00000047
CE A9
E8 AA 9E
Ω
000003A9
語
00008A9E
7
Fonts
 Fonts werden zur Darstellung der Zeichen auf dem Display
von Geräten (Computer, Tablets) oder zum Drucken
verwendet
 Es gibt
 Bitmap Fonts
 Vektor Fonts (TrueType)
 Strich (Stroke) Fonts
 Font Engines
8
Lateinisches Alphabet
 Meistverbreitetes Alphabet der Welt
 26 Buchstaben
 Grosse und kleine Buchstaben
 Es wird von links nach rechts geschrieben
 Es gibt noch andere Buchstaben, abhängig von der Sprache
 Deutsch: ü, ä, ö, …
 Französisch: à, è, é, …
9
Kyrillisches Alphabet
 Es wird in vielen slawischen




Sprachen verwendet
Russisch, Bulgarisch, Serbisch…
Russisch: 33 Buchstaben
grosse und kleine Buchstaben
von links nach rechts geschrieben
10
WGL4 Zeichensatz
 Windows Glyph List 4
 Besteht aus 652 UNICODE Zeichen
 WGL4 Zeichen können auf allen aktuellen Betriebssystemen
zuverlässig dargestellt werden.
 Es eignet sich für Schreiben von Sprachen in:
 Fast allen europäischen Ländern
 Nord und Süd Amerika
 Australien
 Einigen afrikanischen und asiatischen Ländern
11
Chinesische Schrift






Traditionelle Schrift – Taiwan, Hongkong
Einfache Schrift – China und Singapur
Jedes Zeichen ist eine Silbe, ca.400 Silben
Standard GB18030 – 27484 Zeichen
Leere Zeichen sind unüblich
Von links nach recht, von oben nach unten
Du gut ! Sehr lange nicht sehen (Aussage) !
Hallo! Lange nicht gesehen!
http://www.schriften-lernen.de/index.html
12
Japanische Schrift
 Das moderne japanische Schreibsystem besteht aus 4
verschiedene Schriften:
 Kanji (japanischer Name für chinesische Zeichen)
 Hiragana
 Katakana
 Romaji (Latin)
 Anzahl Zeichen: ca.7500
13
Koreanische Schrift
 eine Mischung von 2 verschiedenen Schriften:
 Hangul (Silben),
 Hanja (koreanischer Name für die chinesischen Zeichen)
 Anzahl Grundzeichen ist 51
 Anzahl Zeichen im Standard ist ca. 20000
14
Indische Schriften
 Devanagari - ein südasiatisches Schriftsystem, das in vielen
(indischen) Sprachen verwendet wird
 Es wird von links nach rechts geschrieben, ca. 500 Glyphe
 Es gibt keine Unterscheidung zwischen grossen und kleinen
Buchstaben
15
Arabische Schrift
 Es wird in vielen asiatischen und afrikanischen Ländern
benutzt
 Die Schrift ist kursiv, ohne grosse und kleine Buchstaben
 Es wird von rechts nach links geschrieben, ca. 830 Glyphe
 Zeichen können bis zu 4 verschiedenen Formen haben:
 Anfangsform ‫ﺳ‬
 Mittelform ‫ﺴ‬
 Final Form ‫ﺲ‬
 Isolierte Form ‫ﺱ‬
 Arabische Präsentation Form ist in UNICODE definiert
(Kompatibilität)
16
Memory
0644 0647 0645
Display
Order
Glyph
Selection
&
Positioning
=
+
ligature
final medial initial
final medial initial
Font
17
Source: ASMUS, Inc.
© Copyright 1995-2012· Used by permission
Positional
Shapes
and Ligatures
Agenda
• Sprachrelevante Aspekte
• Kulturelle Unterschiede
• Analyse der Zielsysteme und mögliche Lösungseinsätze
• Tools
• Fazit
18
Farben
Fehler?
Warnung?
Erfolg?
19
Ziffern
Arabisch-Indische Ziffern
12 3 4 5 6 7 8 9 0
١٢٣ ٤ ٥٦ ٧ ٨ ٩٠
Chinesische Ziffern
Hebräisch
Wert
Aleph
‫א‬
1
Beth
‫ב‬
2
Gimel
‫ג‬
3
Daleth
‫ד‬
4
He
‫ה‬
5
Waw
‫ו‬
6
Zajin
‫ז‬
7
Chet
‫ח‬
8
Tet
‫ט‬
9
Jod
‫י‬
10
20
Kalender und Datum
BE-2012-3-31
LE-31.3.2012
ME-3/31/2012
Gelb:Big-Endian(BE); Blaugrün:Little-Endian(LE),
Violett:MiddleEndian(ME)
21
Symbole
Stop Zeichen
In Israel
In Japan
Sanduhr
Mailbox
Menschliche Figuren
Home
Hilfe oder Abfrage
22
Agenda
• Sprachrelevante Aspekte
• Kulturelle Unterschiede
• Analyse der Zielsysteme und mögliche Lösungseinsätze
• Tools
• Fazit
23
Analyse der Zielsysteme
 Betriebssystem
 Speicher
 Dateisystem
 Eingabe der Texte
 OTS Software oder nicht
 Lizenzkosten (Fonts, Font Engines …)
 Aufwand bei der Implementation einer neuen Sprache
24
Zielsysteme
 Gruppe I
 Mit Betriebssystem, Layout und Font Engines
 Gruppe II
 Mit Betriebssystem aber ohne Layout und Font Engines
 Ohne Betriebssystem
25
Zielsysteme - Gruppe I
(Beispiel Windows CE)
 Uniscribe Komponente
 Layout + Font Engines sind Teil des Betriebssystems
 Tools für die einfache Übersetzung
 ResourceBlender
 Zeta Resouce Editor
 SDL Passolo …
 Fertige Bibliotheken in der Entwicklungsumgebung
 CultureInfo, Calender, DateTime …
26
Zielsysteme – Gruppe II
OTS für Layout und Font Engines
27
OTS für Layout und Font Engines
Vorteile
Nachteile
 Implementierungsaufwand
 Software Lizenzen
ist klein
 Smart Fonts sind vorhanden
 Es gibt einige Anbieter von
solchen Komponenten
(Linotype, Bitstream), aber
es gibt auch OpenSource
ICU Bibliothek von IBM
 Speicherbedarf
 Abhängigkeit von OTS
Software Herstellern
 Eventuelle Software
Verifizierung (Normen)
28
Proprietäre Lösung
Font 1,2, or 3
29
Proprietäre Lösung
Vorteile
 Keine OTS Software, keine Lizenzkosten




(ausser Fonts)
Keine Abhängigkeit von Herstellern von
Layout/Font Engines
Die Darstellung («rendering») ist sehr
schnell
RAM Bedarf ist im Vergleich mit anderen
Methoden relativ klein
Firmware soll nicht ändern wenn eine
neue Sprache hinzugefügt wird
Nachteile
 Es können nur Sprachen wo eine
direkte Beziehung zwischen
Kodierung und Glyphe besteht,
dargestellt werden.
 Die Eingabe von Texten für die
komplexen Schriften ist sehr
wahrscheinlich nicht möglich
(oder mit viel Aufwand verbunden)
 Hohe Entwicklungskosten (im
Vergleich mit anderen Methoden)
 Sprachpakete sind im Vergleich mit
OTS Lösung grösser
30
Agenda
• Sprachrelevante Aspekte
• Kulturelle Unterschiede
• Analyse der Zielsysteme und mögliche Lösungseinsätze
• Tools
• Fazit
31
Tools
32
33
Länderfreigabe Dokument
34
Fazit
 Sprachen
 Kulturelle Unterschiede
 Texteingabe oder nur die Darstellung
 Systemdesign
 Tools
35
Referenzen und Danksagung
 Stefan Brunner, CSA Engineering AG, Geschäftsführer
 Asmus Freytag, Ph.D.
President ASMUS, Inc.
 http://www.basistech.com/knowledge-
center/unicode/understanding-unicode-5.0.ppt.
36
Herunterladen