! multimediatechnik ss’03 prof. dr. peter kneisel inhalt Grundlagen Was ist Multimedia Datenkompression Speichermedien Transfersysteme Anwendungen -> Dr. Haas Praktische Anwendungen Audio/Video Graphik/Bild Text/Internet überblick kapitel 1 kurze erläuterung involvierte branchen der medienbegriff klassifikation eigenschaften daten was ist multimedia überblick kapitel 2 datenkompression bedarfsanalyse quellen-, entropie- kodierung grundlegende verfahren Lauflängenkodierung Nullunterdrückung Vektorquantisierung Pattern Substitution Huffmann .... angewandte verfahren Überblick Audiokompression näheres in Kapitel Audiotechnik Überblick Videokompression näheres in Kapitel Videotechnik übersicht überblick kapitel 3 speichermedien Optische Speichermedien Elektronische Speichermedien überblick kapitel 4 … transfersysteme kapitel 1 was ist multimedia was, warum, wer der medienbegriff definition multimedia anforderungen multimedia charakteristik kontinuierliche Medien zusammenfassung kapitel 1 übung 1.1 was, warum und wer was • kurze erläuterung warum • pädagogisches wer • involvierte branchen zusammenfassung w3 1.1.1 was • kurze erläuterung MultiMedia bedeutet aus Benutzersicht: Zur Darstellung von Information wird nicht nur Text oder Graphik oder Ton sondern Text und Graphik und Ton eingesetzt Genauere Definition ... ... später 1.1.2 warum • pädagogisches Durch multimediale Darstellung lassen sich Informationen natürlicher und einprägsamer darstellen Der Mensch behält von dem, was er liest was er hört was er sieht was er liest, hört und sieht was er sagt was er sagt und tut 10% 20% 30% 70% 80% 90% 1.1.3 wer • involvierte branchen Telekommunikation Breitbandkommunikation IP-Telephonie Unterhaltungsbranche "braune Ware": Videorekorder, CD-Player, DVD Computer/Consolen-Spiele Studiotechnik Fernseh- und Rundfunkanstalten professionelle Audio- und Videotechnik Verlage Elektronischen Publizieren enge Beziehungen zu Filmgesellschaften 1.1.4 zusammenfassung w3 Zur Darstellung von Information wird Text, Bild und Ton verwendet Dies erhöht en Aufmerksamkeits- und Merkbarkeitsgrad entscheident Involviert in die Entwicklungen sind vor allem Telekommunikations- und Unterhaltungsbranche, die Studiotechnik und Verlage. ! 1.2 der medienbegriff perzeptionsmedium repräsentationsmedium präsentationsmedium speichermedium übertragungsmedium informationsaustauschmedium zusammenfassung schlussfolgerung kleine übung 1.2.1 perzeptionsmedium Abgeleitet von den menschlichen Sinnen: Wie nimmt der Mensch Informationen auf ? Hören - auditive Medien: Musik Geräusch (Sound) Sprache Sehen - visuelle Medien Einzelbild Bild (Photo) Graphik Bewegtbild Video Animation Text Fühlen (Braille Schrift), Schmecken, Riechen ! 1.2.2 repräsentationsmedium Abgeleitet von der rechnerinternen Darstellung: Wie wird die Information im Rechner kodiert ? Beispiele: Text Audio Graphik: Einzelbild Video ASCII, EBCDIC, UNICODE PCM-linear 16bit, .wav, .voc, .raw, ... Videotext (CEPT), GKS, PICT, Postscript, ... Fax Gruppe 3, JPEG, GIF, TIFF, ... PAL, SECAM, NTSC, CCIR-601, MPEG, .. 1.2.3 präsentationsmedium Abgeleitet vom Hilfsmittel/Gerät zur Ein- und Ausgabe der Information: Worauf/Womit wird die Information ein- bzw. ausgegeben ? Eingabe: Tastatur Kamera Miktofon DataGlove Ausgabe Papier Bildschirm Lautsprecher Dual Shock Paddle 1.2.4 speichermedium Abgeleitet vom verwendeten Datenträger Worauf/Womit werden Informationen gespeichert ? Nichtelektronische Speichermedien Papier Mikrofilm ... Elektronische Speichermedien Magnetband Diskette Festplatte CD-ROM ... 1.2.5 übertragungsmedium Abgeleitet vom Träger der Information kontinuierlich übertragen kann. Worüber wird Information übertragen ? Kabelgebundene Übertragung Koaxialkabel Hohlwellenleiter Twisted Pair Glasfaser ... Funkübertragung Luft Gas Luftleerer Raum 1.2.6 informationsaustauschmedium Abgeleitet von den Datenträgern, die zur Übertragung von information verwendet werden. Welcher Informationsträger wird zum Austausch von Information zwischen Orten verwendet ? Indirekte Übertragung mit Hilfe von (Zwischen)Speichermedien : Papier, Mikrofilm, Diskette, ... Direkte Übertragung über eine Übertragungsmedium Koaxialkabel, Glasfaser, Luft, ... 1.2.7 zusammenfassung medienbegriff Perzeptionsmedium Wie nimmt der Mensch Informationen auf ? Repräsentationsmedium Wie wird die Information im Rechner kodiert ? Präsentationsmedium Worauf/Womit wird die Information ein-/ ausgegeben ? Speichermedium Worauf/Womit werden Informationen gespeichert ? Übertragungsmedium Worüber wird Information übertragen ? Informationsaustauschmedium Welcher Informationsträger wird zum Austausch von Information zwischen Orten verwendet ? ! 1.2.8 schlussfolgerung Perzeptionsmedium Das (wie nimmt der Mensch die Information auf) kommt dem Begriff Medium im Kontext der Informationsverarbeitung am nächsten. ! 1.2.9 kleine übung Wo und wie ist das Fernsehen einzuordnen ? Perzeptionmedium auditiv, visuell: Musik, Sprache, Geräusch, Bild, Graphik, Animation, Video Repräsentationsmedium Video/Audio (PAL) Präsentationsmedium Eingabe (Kamera, Mikrofon), Ausgabe (Bildschirm, Lautsprecher) Speichermedium Magnetband Übertragungsmedium Koaxialkabel, Glasfaser, Luft, luftleerer Raum Informationsaustauschmedium Speichermedium, Übertragungsmedien 1.3 definition multimediasystem definition: kombination von medien definition: unabhängigkeit definition: kommunikationsfähigkeit definition: rechnergestütze integration zusammenfassung definition 1.3.3 definition: kombination von medien Qualitative Definition Ein System, das mehrere bzgl. der Zeitkontinuität unterschiedliche Medien unterstützt Beispiel Lern-CDs Web-Auftritt Kombination aus Text, Video und Audio Kombination aus Text, Video Quantitativ Definition Ein System, welches mehr als ein Medium unterstützt Beispiel DTP Fernsehen Kombination von Text und Graphik Kombination aus Video und Audio Der Begriff Multimedia ist eher qualitativ als quantitativ zu definieren 1.3.5 definition: unabhängigkeit Die Medien müssen unabhängig voneinander zu verarbeiten sein Gegenbeispiel: Film (Video) mit Untertitel (Text) T T T T T T T TTTTTTTTTTTTTTTTTTTT 1.3.6 definition: kommunikationsfähigkeit Austausch von Informationen über Rechnergrenzen hinweg Gegenbeispiel: Offline Lern-CDs Kommunizierende Multimediasysteme In einem (kommunizierenden) MultimediaSystem werden Informationen als Daten mit einem kontinuierlichen und diskreten Medium, digitisiert und in einzelnen Einheiten (Pakete) übertragen 1.3.4 definition: rechnergestütze integration Das Multimediasystem muss in der Lage sein, Medien rechnergesteuert zu verarbeiten Gegenbeispiel: Videorekorder - Bloße Aufnahme/Wiedergabe von unterschiedlichen Medien ohne Möglichkeit der Verarbeitung Medien integriert zu verarbeiten Gegenbeispiel: Tabellenkalkulation setzt unterschiedliche Medien Text, Graphik, Tabellen oft nicht in Bezug Medien gleichartig zu verarbeiten Gegenbeispiel: e-Mail Programm: Video, Audio läßt sich oft nicht wie Text bearbeiten und/oder übertragen 1.3.5 zusammenfassung definition Ein Multimediasystem ist durch die rechnergestützte, integrierte Erzeugung, Manipulation, Darstellung, Speicherung und Kommunikation von unabhängigen Informationen gekennzeichnet, die in mindestens einem kontinuierlichen und einem diskreten Medium kodiert sind. ! 1.4 anforderungen multimediasystem synchronisation datendurchsatz echtzeit zusammenfassung anforderungen 1.4.1 synchronisation Keine zeitliche Restriktion Anwendung: diskrete Medien (z.B. e-mail) Synchrone Übertragung Maximale Ende-zu-Ende Verzögerung Anwendung: Audioübertragung Isochrone Übertragung Maximale und Minimale Ende-zu-Ende Verzögerung Anwendung: Videoübertragung Plesichrone Übertragung Exakte Ende-zu-Ende Verzögerung Anwendung: Breitbandkommunikation Zwischenspeicherbedarf Asynchrone Übertragung 1.4.2 datendurchsatz kleine Datendurchsätze (Transferraten) typisch: 2400bit/sec- 56kbit/sec Technik: Modem, Telephonnetz Anwendung: Text mittlere Datendurchsätze typisch: 64kbit/sec - 128kbit/sec Technik: ISDN, europäisches Telephonnetz, GPRS Anwendung: Text, komprimiertes Audio/Video Hohe Datendurchsätze typisch: 10Mbit/sec - 100Mbit/sec Technik: LAN, B-ISDN (ATM) Anwendung: Audio, Video Sehr hohe Datendurchsätze typisch: > 100Mbit/sec Technik: LAN, B-ISDN (ATM) Anwendung: HDTV, HD-Videokonferenzen, VOD 1.4.3 echtzeit weiche Echtzeit zur Übertragung/Verarbeitung von Informationen, auf die nicht "so schnell" reagiert werden muss harte Echtzeit zur Übertragung/Verarbeitung von Informationen, auf die innerhalb einer "sehr beschränkten Zeit" reagiert werden muss 1.4.4 zusammenfassung anforderungen Ein Multimediasystem stellt hohe Anforderungen an Synchronisation zur korrekten Wiedergabe von Informationen ohne übermäßigen Speicheraufwand der End- und Zwischensysteme Datendurchsatz zur korrekten Wiedergabe von Informationen über die Zeit ohne Datenverluste Echtzeit zur zeitnahen Wiedergabe von informationen ! 1.5 charakteristik kontinuierliche medien zeitintervall variation zusammenhang zusammenfassung charakteristik kleine übung ! 1.5.1 zeitintervall Charakterisierung nach Zeitintervalle zwischen der vollständig abgeschlossenen Übertragung aufeinander-folgender Informationseinheiten (Paketen) Konstant / streng periodisch PCM-kodierte Sprache Gruppenweise konstant / schwach periodisch strukturierte Informationseinheiten Aperiodisch kooperative/dialogorientierte Anwendungen t ! 1.5.2 variation Charakterisierung nach Variation der Datenmenge aufeinanderfolgender Informationseinheiten Gleichbleibend / streng gleichmäßig unkomprimiertes Audio/Video Periodisch variierend / schwach gleichmäßig komprimiertes Video (z.B) MPEG Erstes Bild vollständig Nächsten Bilder Differenzen Danach wieder vollständig Variierend / Ungleichmäßig komprimiertes Video Erstes Bild vollständig danach nur Differenzen t ! 1.5.3 zusammenhang Charakterisierung nach Zusammenhang aufeinanderfolgender Pakete Zusammenhängende Informationen bezieht sich auf Nutz- und Zusatzinformationen optimale Auslastung des Betriebsmittels z.B. 64kbit/s Audio bei ISDN-Gespräch Unzusammenhängende Informationen oft Bandbreite Übertragungsmedium höher als Bandbreitenbedarf der information z.B. Audio über Ethernet t 1.5.4 zusammenfassung charakteristik Charakterisierung nach Zeitintervalle zwischen der vollständig abge-schlossenen Übertragung aufeinander-folgender Informationseinheiten (Paketen) Charakterisierung nach Variation der Datenmenge aufeinanderfolgender Informationseinheiten Charakterisierung nach Zusammenhang aufeinanderfolgender Pakete ! 1.5.5 kleine übung Digitales Fernsehen Videosignal, PAL-Verfahren aufgenommen, im Rechner ohne Kompression digitisiert und über die Luft digital übertragen. Streng periodisch streng gleichmäßig zusammenhängend Web-Fernsehen MPEG kodiertes Videosignal, über 16Mbit/sec Token-Ring übertragen: schwach periodisch schwach gleichmäßig unzusammenhängend ! 1.6 zusammenfassung kapitel 1 was, warum und wer medienbegriff schlussfolgerung medienbegriff definition anforderungen charakteristik 1.6.1 was, warum und wer Zur Darstellung von Information wird Text, Bild und Ton verwendet Dies erhöht en Aufmerksamkeits- und Merkbarkeitsgrad entscheident Involviert in die Entwicklungen sind vor allem Telekommunikations- und Unterhaltungsbranche, die Studiotechnik und Verlage. ! 1.6.2 medienbegriff Perzeptionsmedium Wie nimmt der Mensch Informationen auf ? Repräsentationsmedium Wie wird die Information im Rechner kodiert ? Präsentationsmedium Worauf/Womit wird die Information ein-/ ausgegeben ? Speichermedium Worauf/Womit werden Informationen gespeichert ? Übertragungsmedium Worüber wird Information übertragen ? Informationsaustauschmedium Welcher Informationsträger wird zum Austausch von Information zwischen Orten verwendet ? ! 1.6.3 schlussfolgerung medienbegriff Perzeptionsmedium Das (wie nimmt der Mensch die Information auf) kommt dem Begriff Medium im Kontext der Informationsverarbeitung am nächsten. ! 1.6.4 definition Ein Multimediasystem ist durch die rechnergestützte, integrierte Erzeugung, Manipulation, Darstellung, Speicherung und Kommunikation von unabhängigen Informationen gekennzeichnet, die in mindestens einem kontinuierlichen und einem diskreten Medium kodiert sind. ! 1.6.5 anforderungen Ein Multimediasystem stellt hohe Anforderungen an Synchronisation zur korrekten Wiedergabe von Informationen ohne übermäßigen Speicheraufwand der End- und Zwischensysteme Datendurchsatz zur korrekten Wiedergabe von Informationen über die Zeit ohne Datenverluste Echtzeit zur zeitnahen Wiedergabe von informationen ! 1.6.6 charakteristik Charakterisierung nach Zeitintervalle zwischen der vollständig abge-schlossenen Übertragung aufeinander-folgender Informationseinheiten (Paketen) Charakterisierung nach Variation der Datenmenge aufeinanderfolgender Informationseinheiten Charakterisierung nach Zusammenhang aufeinanderfolgender Pakete ! 1.7 übung Überlegen Sie sich eine "typische" multimediale Anwendung Versuchen Sie, die Komponenten entsprechend der möglichen Medienklassifikationen einzuordnen. Begründen Sie, weshalb Ihre Anwendung der Definition eines Multimediasystems entspricht. Greifen Sie ein kontinuierliches Perzeptionsmedium heraus und charakterisieren Sie es. ! kapitel 2 datenkompression einleitung kodierverfahren grundlegende verfahren angewandte verfahren zusammenfassung 2.1 einleitung motivation speicherbedarf einteilung zusammenfassung einleitung 2.1.1 motivation Unkomprimierte Graphiken, Audio- und Videodaten fordern eine beträchtliche Speicherplatzkapazität unkomprimierte Videodaten passen nicht auf CD oder DVD Der Datentransfer dieser Medien fordert beträchtliche Bandbreiten unkomprimierter Transfer von Videodaten ist über Primärmultiplex ISDN nicht möglich Bestimmte Medien müssen für Speicherung und Transfer komprimiert werden ! ! 2.1.2 speicherbedarf Text Bild Vektorbild Pixelbild (640 x 480) / (8 x 8) = 4,8 Kbyte/Bildschirmseite 500 Geraden x 10 Byte/Gerade = 5,0 Kbyte/Bild 1024 x 768 x 24Bit = 2,3 Mbyte/Bildschirmseite Audio Sprache Telefon: 8 KHz Abtastung x 8 bit/Abtastung CD-Musik: 44,1 KHz Abt. x 16 bit/Abt. x 2 (Stereo) = 8 Kbyte/sec = 172 Kbyte /sec Video PAL 25 Bilder/sec x 625 x 833 Punkte x 3 Byte/Punkt Digitales Video (CCIR 601) 13,5MHz Lumin. + 2 x 6,75MHz Chromin. x 1 B/Pkt HDTV CCIR 601 x 5,33 = 37 Mbyte/sec = 25 Mbyte/sec = 133 Mbyte/sec 2.1.3 einteilung Anwendungen im Dialog-Modus Typisch für Bildübertragung und Videokonferenzen Anforderungen Ende-zu-Ende Verzögerung < 500 ms Kompression, Dekompression < 150 ms (opt. 50 ms) Anwendungen im Abfragemodus Typisch für audiovisuelle Auskunftsysteme Anforderungen Schneller Vor- und Rücklauf mit Anzeige Wahlfreier Zugriff auf Einzelbild < 500 ms (ohne Kontextinformation) Anwendungen in Dialog und Abfragemodus Anforderungen Format unabhängig vom Darstellungsgerät Adaptierbare Datenraten Hoher Grad an Synchronisation 2.1.4 zusammenfassung einleitung Übertragung und Speicherung unkomprimierter Medien, insbesondere von Video, ist zu aufwendig Die Datenmenge unkomprimierter Medien beläuft sich auf bis zu 133 Mbyte/sec (HDTV) Anforderungen im Abfrage und Dialogmodus erfordern maximale Gesamtlaufzeiten (< 500 ms) und maximale KoDek-Zeiten ( < 150 ms) ! 2.2 kodierungverfahren überblick grundsätzliche kodierungsarten schritte bei der bildkompression dekodierung zusammenfassung ! 2.2.1 überblick Kodierungsart Ausprägung Verfahren Statistische Kodierung Lauflängenkod. Huffmann-Kod. Arithmetische Kod. Entropiekodierung Quellenkodierung Prädiktion Transformation Layered koding Hybride Kodierung DPCM DM FFT DCT Bitposition Unterabtastung Subband-Kodierung Vektorquantisierung JPEG MPEG H.263 ... 2.2.2 grundsätzliche kodierungsarten Die Entropiekodierung kodiert ungeachtet der zugrundliegenden Information. betrachtet die zu komprimierten Daten als Bitsequenz. es werden nur Redundanzen eliminiert, es geht keine Information verloren. unterschiedliche Kompressionsquoten bei unterschiedlichen zu komprimierenden Daten. Die Quellenkodierung verwendet die Semantik der zu kodierenden Information. ist oft verlustbehaftet. ist abhängig vom zu kodierenden Medium. Spezifika der Medien können gut genutzt werden. wesentlich bessere Kompressionsraten bei "akzeptabler" Qualität. ! 2.2.3 schritte bei der bildkompression Datenkompression durchläuft typischerweise vier Schritte: 1. Datenaufbereitung erzeugt eine geeignete digitale Darstellung der Information Bsp.: Zerlegung eines Bildes in Pixelblöcke 2. Datenverarbeitung erster Schritt der Kompression, z.B. Transformation aus dem Zeitbereich in den Frequenzbereich 3. Quantisierung Gewichtung der Amplituden und Zuordnung zu Quantisierungsstufen (nicht notwendigerweise linear) 4. Entropiekodierung verlustfreie Kompression 2.2.4 dekodierung Die Dekodierung erfolgt invers zur Kodierung zwei Vorgehensweisen Symetrische Kodierung Der Aufwand zur Komprimierung und Dekomprimierung ist vergleichbar Eingesetzt bei häufig wechselnden Datenquellen Beispiel.: Life-CAMs Asymmetrische Kodierung Der Aufwand zur Komprimierung und Dekomprimierung ist ungleich Meist ist der Aufwand bei der Dekomprimierung wesentlich einfacher Oft Dekompression in Echtzeit Eingesetzt bei konstanten Datenquellen Bsp.: Audio-Visuelle Lern-CDs 2.2.5 zusammenfassung kodierungsverfahren Im wesentlichen unterscheidet man zwischen Entropiekodierung Quellenkodierung hybride Kodierung Die Kodierung besteht typischerweise aus vier Phasen: Datenaufbereitung Datenverarbeitung Qualtisierung Entropiekodierung Die Dekodierung erfolgt invers zur Kodierung und kann symetrischn oder asymetrische Aufwände haben ! 2.3 grundlegende verfahren lauflängenkodierung huffmann-kodierung prädiktion / relative kodierung transformations-kodierung unterabtastung vektorquantisierung spezialformen 2.3.1 lauflängenkodierung ! Beispiel: ABCCCCCCCCDEFGGG ABC!8DEFGGG Voraussetzung Datenfolge besteht aus vielen Unterfolgenden identischen Inhalts Kodierung Die Folgen gleichen Inhalts werden mit einem Markierungszeichen (oft M-Byte) markiert und mit dem Inhalt und der Länge der Folge kodiert M-Byte als Markierung läßt sich durch Byte- /Bit-Stuffing eindeutig kennzeichnen, z.B.: jedes Vorkommen des M-Bytes als Datum wird verdoppelt oft Kompression ab 4 identischen Zeichen Dekodierung beim Dekompromieren wird jedes doppelt vorkommende M-Byte halbiert Einfache M-Bytes, werden als M-Byte interpretiert und veranlassen eine Interpretation der folgenden Bytes 2.3.2 huffmann-kodierung Voraussetzung: Es gibt unterschiedliche Häufigkeiten von Bit-Mustern (Bytes) Kodierung Die Häufigkeit des Auftretens der Bitmuster (Bytes) wird bestimmt Die am häufigsten auftretenden Bytes werden mit kurzen Bitfolgen (Huffmann-kode) kodiert Der Huffmann-code wird zur kodierung der Bitfolge verwendet Dekodierung Dekodierer besitzt identischen Huffmann-kode Dekodierer setzt den Huffmann-code in Bytefolge um ! ! 2.3.2 huffmann-kodierung • beispiel sei P(A) = 0,16 P(B) = 0,51 P(C) = 0,09 P(D) = 0,13 P(E) = 0,11 P(C)=0,09 P(E)=0,11 1 0 P(D)=0,13 1 P(CE)=0,2 1 0 P(AD)=0,29 1 P(B)=0,51 P(A)=0,16 0 P(CEAD)=0,49 0 Kodierung A = 000 B=1 C = 011 D = 001 E = 010 P(BCEAD)=1,0 Der Baum wird von oben nach unten mit den zwei Buchstaben (oder Buchstabengruppen) mit den jeweils kleinsten Wahrscheinlichkeiten schrittweise aufgebaut 2.3.3 prädiktion / relative kodierung Voraussetzung Aufeinanderfolgende Zeichen unterscheiden sich nicht stark Kompression Speicherung nur der Differenzen Dekompression Rekonstruktion der Zeichen durch Ableitung ab dem ersten Zeichen Anwendungen: Bild-kodierung: Kanten bei Bildern liefern große Unterschiede, Flächen kleine (0). Aufeinanderfolgende Videobilder unterscheiden sich oft nur in Details Differencial Pulse kodeModulation (DPCM) nur die Amplitudendifferenzen werden, mit weniger Zeichen, kodiert ! 2.3.4 transformations-kodierung Kodierung Transformation in einen anderen mathematischen Raum Dekodierung Rücktransformation Beispiele: Schnelle Fouriertransformation (FTT) Diskrete Kosinus-Transformation (DCT) Subband-Kodierung Transformation nur einzelner Anteile des Spektrums sehr gut geeignet für Sprachkodierung ! 2.3.5 unterabtastung Die Datenquelle wird nicht mit der zur vollständigen Rekonstruktion notwendigen Frequenz abgetastet Notwendige Frequenz 2 x Grenzfrequenz (Shannonsches Abtasttheorem) Dabei werden Eigenschaften der menschlichen Physiologie ausgenutzt Reduktion des Qualitätsverlustes Beispiel Videokompression: Hohe Abtastfrequenz der Luminanz, niedrige Abtastung der Chrominanz (YUV statt RGB), da der Mensch Helligkeitsunterschiede wesentlich deutlicher wahrnimmt als Farbunterschiede ! 2.3.6 vektorquantisierung Voraussetzung: Datenfolge besteht aus vielen Unterfolgen ähnlicher (Bit-) Muster Kodierung Datenstrom wird in Blöcke zu n Bytes unterteilt Eine Tabelle enthält ein Menge von (Byte-)Mustern Ein Muster in einem Datenstrom-Block wird den Index eines ähnlichen Musters in der Tabelle indiziert. Die Tabelle kann mehrdimensional sein, damit ist der Index ein Index-Vektor. Dekodierung Dekodierer besitzt identische Muster-Tabelle Dekodierer übersetzt Index (-Vektor) in Byte-Muster und fügt dies zu einer Datenfolge zusammen ! 2.3.7 spezialformen I Nullunterdrückung Spezialform der Lauflängenkodierung. Zusammenfassung nur der 0-Bytes Pattern Substitution Spezialform der Vektorquantisierung Ermittlung des exakten Musters aus Tabelle Markierung eines Treffers über Markierungs-Byte (M-Byte) Verwendung auch bei Bild/Video mit Farbtabellen Diatonic Enkoding Spezialform des Pattern Substitution Muster sind Buchstaben-Paare und ergeben sich aus semantischen Eigenschaften der zu kodierenden Sprache 2.3.7 spezialformen II Delta-Modulation Spezial form der Differential Pulse code Modulation (DPCM) Kodierung der Differenzwerte 1 bit (steigend/fallend) Adaptiver DPCM Spezial form der Differential Pulse code Modulation (DPCM) Kennzeichnung leiser und hochfrequenter Stellen und entsprechende Quantisierung mit den Differenzwerten Adaptive Huffmann Kodierung Spezialfall der Huffmann kodierung kode-Tabelle wird dynamisch erstellt und geändert 2.3.7 zusammenfassung grundlegende verfahren Entropiekodierung Lauflängenkodierung huffmann-kodierung Quellenkodierung prädiktion / relative kodierung transformations-kodierungen unterabtastung vektorquantisierung Es gibt zu vielen "reinen" Kodierungsverfahren Spezialformen ! 2.4 angewandte verfahren JPEG H.261 / H.263 MPEG fraktale kompression 2.4.1 JPEG • übersicht Von der Joint Photographics Expert Group (Joint CCITT and ISO) ab 1982 entwickelt Anforderungen Unabhängigkeit von der Bild- und Pixelgröße, von der Farbvielfalt und der statistischen Farbverteilung. Durchführbarkeit der Kodierung/Dekodierung von in akzeptabler Geschwindigkeit per Software mit Standardprozessor. Sequenzielle (Zeile um Zeile) und progressive (immer weiter verfeinernd) Dekodierung. Verlustfreie und hierarchische (unterschiedliche Auflösungen) Kodierung. 1992 als ISO-Norm verabschiedet ! 2.4.1 JPEG • modi und durchführung Verlustbehaftetet DCT-basierter Modus einziger Modus, der von jedem JPEG-Dekoder unterstützt werden muß Erweiterter verlustbehafteter DCT-basierter Modus erweitert den Basis Modus Verlustfreier Modus wesentlich geringerer Kompressionsfaktor Hierarchischer Modus beinhaltet Bilder verschiedener Auflösung, die jeweils entsprechend einem der vorgenannten Modi kodiert wurde. Bildaufbereitung Bildverarbeitung FDCT Quantisierung Entropiekodierung 2.4.1 JPEG • vier schritte (modus 1) 1. Bildung von Ebenen (eventuell unterschiedlicher Auflösung) Beispiel: RGB - 3 Ebenen, YUV - 3 Ebenen, BMP - 1 Ebene 2. Transformation / Inverse Transformation der Bildpunkte mittels Diskreter Kosinus-Transformation (DCT) (2 x 1)u (2 y 1)v s cucv syx cos cos 16 16 x 0 y 0 7 7 (2 x 1)u (2 y 1)v 1 sxy 4 cucvsvu cos cos 16 16 x 0 y 0 7 7 1 vu 4 1 für u, v 0 2 bzw. sonst cu , cv 1 cu, cv 3. Quantifizierung der einzelnen Pixel pro Ebene per Tabelle 8/12 bit (verlustbehaftet) 2-12 bit pro Ebene (verlustfrei) 4. Entropiekodierung Lauflängen Huffman Arithmetisch 2.4.2 H.261 / H.263 1990: CCITT Empfehlung H.261: Video kodec for Audiovisual Services at p x 64 Kbit/s Speziell konzipiert für ISDN (auch Primärmultiplex) Auch als p x 64 bezeichnet max Verzögerung für (De)Kodierung < 150 ms 1996: CCITT Empfehlung H.263: Verfeinerung der Kompressionsalgorithmen von H.261 Konzipiert auch für kleinere Übertragungsraten (z.B. V.34) Unterschiede von H.263 bzgl H.261 Kleinere Genauigkeit bei Bewegungen Aushandelbare optionale Teile bei H.263 erlauben CoDecOptimierung oft Faktor 2 schneller bei gleicher Qualität neben QCIF und CIF 3 zusätzliche Auflösungen: SQCIF, 4CIF, 16CIF (Common Interface Format) 2.4.2 H.261 / H.263 • formate 29,97 Pic/sec komprimiert auf min 15 Pic/sec Pixelkodierung nach CCIR 601 (Luminanz) Y : Cb : Cr (Chrominanz) = 2:1:1 Seitenverhältnis 4:3 Common Interface Format CIF 352 x 288 (Luminanz) 176 x 144 (Chrominanz) 36,45 Mbit/sec (Quarter)QCIF 176 x 144 bzw. 88 * 72 9,115 Mbit/sec Kompressionsrate für ISDN-B-Kanal bei 10 Bilder/sec 1:47,5 (was heute gut machbar ist) 2.4.2 H.261 / H.263 • kodierung Intraframe (jedes Bild wird für sich kodiert) Kodierung nach DCT (wie JPEG) Interframe (es werden Deltas verwendet) Prädiktionsverfahren, als Mustertabelle wird vorangegangenes Bild verwendet Muster sind als DPCM-kodierte und anschließend DCT komprimierte Makroblöcke abgelegt Bewegungsvektor des Musters wird entropiekodiert (z.B. Lauflängenkodierung) ? Wer ist gestorben Bild n mit Dynamic PCM erfasst und mit DCT kodiert, dient als Muster für Bild n+1 ! Bild n+1 unterscheidet sich von Bild n durch die um die Vektoren verschobenen Teile 2.4.3 MPEG siehe Kapitel: Videotechnik 2.4.4 fraktale kompression Verfahren:Keine Übertragung von Pixelinformation Übertragung von Transformationsfunktion, die auf ähnliches Bild iterativ angewandt werden muss Ausnutzung der Selbstähnlichkeit von Bildern Transformationsfunktion besteht aus Skalierung, Verschiebung, Rotation, Kontrast/Helligkeitsänderung Eigenschaften Unabhängig von Bildgröße frei skalierbare Qualität (je nach Anzahl Iterationsschritte) Kompressionsfaktor 1:1000 erreichbar Nachteile sehr Rechenzeitintensiv schlechte Effizienz bei Graphiken ! 2.4.5 zusammenfassung angewandte verfahren JPEG ist der Standard für die Einzelbildkodierung bis zu 255 Bildebenen bis zu 65535 x 65535 große Bilder unterschiedliche Qualitätsstufen 0,25 bit/Pixel - 0,5 bit/Pixel: mäßige Qualität 0,5 bit/Pixel - 0,75 bit/Pixel: gute Qualität 0,75 bit/Pixel - 1,5 bit/Pixel: sehr gute Qualität 1,5 bit/Pixel - 2 bit/Pixel: Vom Original nicht zu unterscheiden H.261 / H.263 Standard Verfahren für Videotelephonie vorangetrieben durch Netzbetreiber zugeschnitten auf ISDN zufriedenstellend ab CIF 2.5 zusammenfassung einleitung kodierungsverfahren grundlegende verfahren angewandte verfahren 2.5.1 einleitung Übertragung und Speicherung unkomprimierter Medien, insbesonder von Video, ist zu aufwendig Die Datenmenge unkomprimierter Medien beläuft sich auf bis zu 133 Mbyte/sec (HDTV) Anforderungen im Abfrage und Dialogmodus erfordern maximale Gesamtlaufzeiten (< 500 ms) und maximale KoDek-Zeiten ( < 150 ms) ! 2.5.2 kodierungsverfahren Im wesentlichen unterscheidet man zwischen Entropiekodierung Quellenkodierung hybride Kodierung Die Kodierung besteht typischerweise aus vier Phasen: Datenaufbereitung Datenverarbeitung Qualtisierung Entropiekodierung Die Dekodierung erfolgt invers zur Kodierung und kann symetrischn oder asymetrische Aufwände haben 2.5.3 grundlegende verfahren Entropiekodierung Lauflängenkodierung huffmann-kodierung Quellenkodierung prädiktion / relative kodierung transformations-kodierungen unterabtastung vektorquantisierung Es gibt zu vielen "reinen" Kodierungsverfahren Spezialformen 2.5.4 angewandte verfahren JPEG ist der Standard für die Einzelbildkodierung bis zu 255 Bildebenen bis zu 65535 x 65535 große Bilder unterschiedliche Qualitätsstufen 0,25 bit/Pixel - 0,5 bit/Pixel: mäßige Qualität 0,5 bit/Pixel - 0,75 bit/Pixel: gute Qualität 0,75 bit/Pixel - 1,5 bit/Pixel: sehr gute Qualität 1,5 bit/Pixel - 2 bit/Pixel: Vom Original nicht zu unterscheiden H.261 / H.263 Standard Verfahren für Videotelephonie vorangetrieben durch Netzbetreiber zugeschnitten auf ISDN zufriedenstellend ab CIF kapitel 3 speichermedien überblick basistechnologien (read only) CD-DA CD-ROM CD-ROM/XA CD-I weitere Formate (read only) CD-R/WO CD-MO/RW DVD logische Formate 3.1 überblick anforderungen historie • bis zur CD-ROM historie • erweiterungen historie • beschreibbare CD zusammenfassung überblick ! 3.1.1 anforderungen Speichermedien Magnetische Diskette Festplatte Magnetbänder (TK50, DAT, ...) Optische Compact Disc (CD, DVD) 3.1.2 historie • bis zur CD-ROM 1973 Video Long Play (VLP) Bildplatte analoge (wertdiskret, zeitkontinuierlich) Technik wenig Erfolg 1982 Compact Disc Digital Audio (CD-DA) digitale Technik. Spezifiziert von Philips/Sony (Red Book) 30 Mio CD-DA-Player, 450 Mio CDs in ersten 5 Jahren 1985 CD read only Memory (CD-ROM) spezifiziert von Philips/Sony (Yellow Book) 1988 Spezifikation der physikalischen Struktur (ECMA-119) Konsortium High-Sierra Proposal: Spezifikation der logischen Struktur (ISO 9660,) 3.1.3 historie • erweiterungen 1986 CD interactive (CD-I) spezifiziert von Philips/Sony (Green Book) 1987 Digital Video Interactive (DVI) spezifiziert von Philips/Sony (De-)Kompression von Video-/Audiodaten auf CD-ROM 1989 CD-ROM extended Architecture (CDROM/XA) spezifiziert von Philips/Sony Spezifikation für mehrere Medien auf optischen Datenträgern 3.1.4 historie • beschreibbare CD 1991 CD write once (CD-WO / CD-R) Spezifiziert im Orange Book einmal beschreibbar 1991 CD magneto optical (CD-MO) Spezifiziert im Orange Book mehrmals beschreibbar 1995 CD read write (CD-RW) Spezifiziert (1991) im Orange Book löschbare und mehrmals beschreibbare CD 1997 Digital Video Disc (DVD) Spezifikation vom DVD-Konsortium 3.1.5 zusammenfassung überblick Die Anforderungen von Multimediasystemen an eine Speichermedium sind z.Z. nur mit optischen Speichermedien realisierbar Die Entwicklung vollzog sich bislang in drei Etappen Bis zur CD-ROM Erweiterung, insbesondere der logischen Struktur auf CDROM Erweiterung der physikalischen Fähigkeit um die Beschreibbarkeit Die "Krone" der aktuellen Entwicklung stellt die DVD dar Die Entwicklung wird weiter rasant verlaufen ! 3.2 basistechnologie (read only) aufbau ausprägungen digitale informationsdarstellung problem: zugriffsgeschwindigkeit zusammenfassung basistechnologie ! 3.2.1 aufbau Schutzschicht pit Reflexionsschicht 1,2 m land 0,6 m Substratschicht (Polykarbonat) 1,6 m Abtastung durch Laserstrahl ca. 780 nm, 1 m Fokus in 1 mm Abstand Eine Spur (nicht wie bei HD), von innen nach außen 1,66 bit / m, 1 Mio bit/mm2 Keine Verschleiß, keine magnetischen Effekte 3.2.2 ausprägungen analoge aufzeichnung wertdiskret (0, 1) zeitkontinuierlich Übergang zwischen 0 / 1 / 0 kann zu jedem Zeitpunkt erfolgen Bsp.Video Long Play (VLP) Digitale Aufzeichnung wert- und zeitdiskret 3.2.3 digitale informationsdarstellung Kodierung pits und lands kodieren logische Nullen Flanken zwischen pit/land bzw. land/pit kodiereb logische Einsen Zwei aufeinander folgende Einsen sind nicht darstellbar Einfügen von Füllbits zwischen die bits eines Bytes und zwischen Bytes (sog. Verbindungsbits) Synchronisation Synchronisation der CD in der Zeit über SynchronisationsBitmuster Fehlererkennung Redundante Bits zur Fehlererkennung und -korrektur ! 3.2.4 problem: zugriffsgeschwindigkeit Zugriffszeiten von ca. 400 bis ca. 100 msec akzeptabel für Audio, für Daten im Vergleich zur HD (6 ms) schlecht. Gründe: Synchronisationszeiten Einstellung der internen Taktfrequenz auf CD-Signal mehrere ms Rotationsverzögerung bei 1 x Geschwindigkeit ca. 300ms bei 40 x Geschwindigkeit ca. 6,3 ms Seek-Zeit Einstellung des exakten Radiuses ca. 100ms Mögliche Zeiten: unter 100ms 3.2.5 zusammenfassung basistechnologie Eine Compact Disk besteht aus einem Substrat auf das eine reflektierende Schicht aufgebracht ist. Die Reflexionsschicht wird durch eine transparente Schutzschicht vor Beschädigung geschützt Nach den wenig erfolgreichen analogen Aufzeichnungsverfahren wird heute nur noch digital aufgezeichnet. Die physikalische Informationsdarstellung ist extrem redundant Die Zugriffsgeschwindigkeit mit nicht viel weniger als 100ms gilt als grundsätzliches Problem ! 3.3 CD-DA technische daten physikalische grenzen fehlerkorrektur frames aufbau einer CD zusammenfassung CD-DA 3.3.1 technische daten Durchmesser: 12 cm konstante Bahngeschwindigkeit Constant linear Velocity, CLV Umdrehungszahl abhängig vom Radius der Bahn Spiralförmige Spur mit ca. 20000 Windungen (LP: 850 Windungen) Länge der Pits: n x 0,3 m 44,1 KHz Abtastrate (PulseCodeModulation) à 16 bit Stereo (172,3 Kbyte/sec) Dynamik 96dB (LP: 50-60dB) Laufzeit: mindestens 74 min Nutzdaten (ohne Fehlerkorrektur) 747 Mbyte 3.3.2 physikalische grenzen Probleme Jeder Wechsel Pit/Land bzw. Land/pit entspricht einer Eins. Eins-Folgen lassen sich aufgrund der Laserauflösung nicht korrekt lesen. Der minimale Abstand ist 2 bit (also 1001) Lange Null-Folgen (Pit-Plateaus oder Land-Täler) erschweren die Synchronisation Nicht nur innerhalb eines Bytes, sondern auch zwischen benachbarten Bytes können Eins-Folgen entstehen Eight-to-Fourteen Modulation (EFM) fügt Bits ein Ein Byte wird mit 14 bit kodiert z.B. 00000000 01001000100000 3 Füllbits verhindern Eins-Folgen zwischen Bytes ! 3.3.3 fehlerkorrektur Fehler resultieren meist aus Kratzer und Verschmutzung und sind burst-artig Fehlerbehandlung in zwei Ebenen (Cross Interleaved Reed Solomon) 1. Ebene Verfahren nach Reed-Solomon Aus 24 Audiobytes werden 2 Gruppen von je 4 Korrekturbytes gebildet Erste Gruppe korrigiert Einzelbytefehler Zweite korrigiert Doppelbytefehler und erkennt weitere Fehler 2. Ebene: Framekonzept hintereinanderliegende Datenbytes auf mehrere Frames (588 Kanalbitblöcke / 24 Audiobytes) verteilt so betrifft ein burst-artiger Fehler nur wenige Bytes Fehlerrate 10 -8 : Kratzer von 7.7 mm, Löcher von 2mm können erkannt werden ! 3.3.4 frames Audiodaten EFM Je zwei Gruppen à 12 Audiobytes, Jede Gruppe enthält Low- bzw. High-Byte des linken und rechten Kanals. Fehlerkorrektur: wie oben beschrieben Control- und Display Byte 8-bit (sog. P,Q,R,S,T,U,V,W-Subchannels) Die Subchannels von 98 Frames werden zu Blöcken (Subchannel-frames) zusammengefasst davon sind 72 bit Nutzinformation Füllbits 2 x 12 x 14 + 3 2 x 4 x 14 + 3 14 + 3 P-Subchannel: Unterscheidung CD-DA / CD mit Daten Q-Subchannel: Inhaltsverzeichnisses, Zeiten Synchronisationsmuster Kennzeichnung des Framestarts mit 12 Einsen, 12 Nullen und 3 Füllbits 24 + 3 588 bits 3.3.5 aufbau einer CD 3 Bereiche Lead-in: Inhaltsverzeichnis mit Beginn aller Tracks Tracks zur Speicherung der Daten Lead-out: Zur Begrenzung der Tracks Tracks max. 99 Tracks pro CD-DA Jeder Track kann mehrere positionierbare Index-Points besitzen Meist nur zwei Index-Points: IP0: Anfang des Tracks IP1: Anfang der Audiodaten IP1 - IP0 wird als Track-Pregap bezeichnet (2 - 3 Sec) Blöcke 98 Frames werden logisch zu Blöcken zusammengefasst In Blöcken sind nur Subchannels von Bedeutung 3.3.6 zusammenfassung CD-DA CD-DAs speichern Musik in einer, vergleichbar zur LP, herausragenden Qualität. Aufgrund physikalischer Grenzen müssen EinsEins-Sequenzen durch die Eight-FourteenModulation (EFM) und Füllbits vermieden werden. Die CD-DA besitzt ausgereifte Mechanismen zur Korrektur von burst-artigen Fehlern. Audiodaten werden in Frames mit Fehlerredundanz-, Informations- und Synchronisationsdaten logisch zusammengefasst. Eine CD-DA besteht, neben einem ein- und ausführenden Teil, aus bis zu 99 Tracks. ! 3.4 CD-ROM anforderungen ansatz modi überblick datenhierarchie zusammenfassung 3.4.1 anforderungen CD-ROM sollen neben Audiodaten auch Rechnerdaten und weitere Medien speichern können. Die CD-ROM soll den wahlfreien Zugriff auf die Daten ermöglichen die CD-DA besitzt als Positionspunkte nur die Tracks mit ihren (meist 2) Index-Points die Auflösung der Positionierung bei CD-ROM soll höher sein Die CD-ROM soll eine gegenüber der CD-DA verbesserte Fehlerkorrektur besitzen 3.4.2 ansatz die CD-ROM kennt zwei Typen von Tracks Audio-Tracks entsprechen der CD-DA Daten-Tracks Innerhalb der Tracks darf nur ein Medium gespeichert sein Eine CD-ROM kann aber unterschiedliche Medien beinhalten gemischte CD-ROMS werden als Mixed Mode Disc bezeichnet im Mixed Mode werden zunächst die Datentracks und anschließend die Audio-tracks angeordnet 3.4.3 modi Mode 0 dient zur Abgrenzung von Speicherblöcken alle Nutzdaten sind auf Null gesetzt Mode 1 zur Fehleredundanten Speicherung von Daten Aufteilung des Blocks: Verwaltungsinformation (16 Bytes: Sync, Header) Daten (2048 Bytes) Fehlerredundanz (280 Bytes, damit Fehlerrate < 10-12) 650 Mbyte pro CD-ROM Mode 2 für weitere Medien Aufteilung der Blöcke Verwaltungsinformation (16 Bytes: Sync, Header) Daten (2336 Bytes) 741,85 Mbyte pro CD ! 3.4.4 überblick datenhierarchie CD Block 330000 Blöcke 2352 Nutzbytes / 7203 Kanalbytes, Vier Arten von Blöcken Audio 73,5 (frame) 73,5 (frame) Mode 0 12 4 2336 Nullen Mode 1 12 4 2048 Daten Mode 2 12 4 2336 Daten ... 98 x ... 73,5 (frame) 4 CRC 8 276 CRC 3.4.5 zusammenfassung CD-ROM Die CD-ROM soll wahlfrei und fehlerunanfällig multimediale Daten zugänglich machen Neben Audio-Blöcken gibt es Modi für Rechnerdaten und sonstige Medien Die Datenhierarchie unterteilt eine CDROM in Blöcke (entweder Audio, Daten oder sonstiges Medium) die wiederum entsprechend ihres Verwendungszweckes unterstrukturiert sind ! 3.5 CD-ROM/XA ansatz forms daten innerhalb der forms zusammenfassung CD-ROM/XA 3.5.1 ansatz Gleichzeitige Wiedergabe von Medien soll ermöglicht werden die ist bei CD-ROM nicht vorgesehen "historische" Vorgänger: CD-I, DVI Ansatz Erweiterung der CD-ROM Spezifikation Verwendung von Mode-2 Blöcken die Verzahnung unterschiedlicher Medien innerhalb eines Tracks ist möglich Definition von zwei Untermodi, sog. Forms 3.5.2 forms Form 1 verbesserte Fehlererkennung und -korrektur Definition eines Sub-Headers Sync 12 Head SubHead 4 8 Data 2048 EDC 4 ECC 276 Form 2 auf Kosten der Fehlerbehandlung eine um 13% höhere Datenausnutzung Sync 12 Head SubHead 4 8 Data 2324 EDC 4 3.5.3 daten innerhalb der forms Audiodaten mit ADPCM (adaptive Difference Pulse Modulation) komprimiert Differenz wird jeweil mit 4 bit kodiert 19 Stunden Musik theoretisch möglich dadurch Kombination mit anderen Medien möglich 4 Audio-Qualitätssstufen Level B Stereo Abtastfrequenz 37,8 KHz (CD-DA 41,1 KHz) Kompressionsrate zu CD-DA 4:1 (4 Stunden, 48 min Musik) Level B Mono Kompressionsrate 8:1 (8 Stunden, 36 min Musik) Level C Stereo Abtastfrequenz 18,9 KHz Kompressionsrate 8:1 Level C Mono 19 Stunden, 12 min Musik 3.5.4 zusammenfassung CD-ROM/XA Gleichzeitige Wiedergabe verschiedener Medien möglich Nutzt Mode-2 der CD-ROM Spezifikation für Erweiterungen form 1: sehr fehlerredundante Daten form 2: 13% mehr Daten Für das Audio-Format sind 4 Qualitätsstufen bis zum Kompressionsfaktor 1:16 (bzgl. CD-DA) spezifiziert. MPEG verwendet kein adPCM und ist zu CDROM/XA nicht komatibel ! 3.6 CD-I ansatz medien zusammenfassung CD-I 3.6.1 ansatz CD-I soll(te) multimediale Anwendungen in der Unterhaltungselektronik verfügbar machen CD-I ist nicht nur ein Speichermedium sondern ein System, bestehend aus optisches Speichermedium Abspielgerät basierend auf MC-68K Prozessor-Familie Betriebssystem RTOS basierend auf OS/9 In-/Output Geräte Joystick, Maus RGB-Monitor, Fernseher Kompatibel zu CD-DA 3.6.2 medien Audio Level A: 37,8 KHz Abtastung, 8 bit ADPCM, 2,4 Stunden Stereo Level B: 37,8 KHz Abtastung, 4 bit ADPCM, 4,8 Stunden Stereo Level C: 18,9 KHz Abtastung, 4 bit ADPCM, 9,6 Stunden Stereo Bild YUV-Modus 360 x 240 Pixel bei 18 bit = 194 Kbyte Color Look Up Table (CLUT - ähnlich GIF) 720 x 240 Pixel bei 4 bit/Pixel (3,7 oder 8) = 86 KByte RGB-Modus 360 x 240 Pixel bei 15+1 bit/Pixel = 172 Kbyte Video Lauflängenkodierung (20000 Byte/Bild) 3.6.3 zusammenfassung CD-I CD-I ist eine Systembeschreibung, konzipiert für multimediale Anwendungen in der Unterhaltungselektronik Speziell: Verknüpfung Audio-Daten mit weiteren Medien CD-i verknüpft Audio mit Standbildern und Bewegtbildern z.B. Bilder der Interpreten Cover Video-Clips CD-I ist seit 1997 vom Markt verschwunden ! 3.7 weitere formate (read only) CD-I ready format CD bridge disc photo CD digital video interactive (DVI) zusammenfassung weitere formate 3.7.1 CD-I ready format CD-I Speichermedien, d.h. die Audioteile, sollen auch auf CD-DA Abspielgeräten abspielbar sein. Ablage der zusätzlichen (nicht Video-) Information in Track-Pregap zwischen IP0 und IP1 Erweiterung des Pregaps von 2-3 Sekunden auf 182 Sekunden Abspielen einer CD-I Ready Format Mit CD-DA: Ignorieren des Pregaps Abspielen mit CD-I: Auslesen und Interpretieren des Pregaps Mixed Mode Abspielen auf CD-I: Gleichzeitiges Interpretieren des Pregaps und Abspielen der zugehörigen Audiodaten. 3.7.2 CD bridge disc Ansatz wie CD-I Ready Format: Schaffung der Abwärtskompatibilität Allerdings hier: Schaffung der Kompatibilität zu CD-ROM/XA und CD-I statt CD-DA Beziehungen: CD-DA CD-I CD-I Ready Disc CD-XA CD Bridge Disc 3.7.3 photo CD Entwickelt von Eastman Kodak und Philips Basiert auf CD-WO-Technik ein Teil ist schon beschrieben ein zweiter Teil einmal beschreibbar Anwendung einer CD Bridge Disc alos kompatibel zu CD-I und CD-ROM/XA Zur Speicherung von Bildern Speicherung erfolgt durch entwickelndes Photolabor Qualitäten Luminanz und 2 x Chrominanz mit je 8 bit 6 Auflösungen 128x192, 256x384, 512x768, 1024x1536, 2048x3072,4096x6144 Kompression mit JPEG 3.7.4 digital video interactive (DVI) Beschreibt, wie DV-I, ein System Kompressions- und Dekompressionsalgorithmen für Bewegtbilder in Echtzeit Benutzerschnittstelle (Audiovisual Kernel, AVK) Datenformate DVI ist weniger Speiche-r, als vielmehr Kompressionstechnologie verwendet CD-ROM Mode 1 zur Speicherung ähnliche Entwicklungen auch bei Commodore: Commodore Dynamic Total Vision - CDTV) 3.7.5 zusammenfassung weitere formate CD-I ready format versucht, wahrscheinlich aus Marketing-Gründen, die Abwärtskompatibilität zu CD-DA herzustellen CD bridge disc versucht dassselbe mit CD-I und CD-XA Kodaks Photo-CD ist eine Anwendung der CD Bridge Disc Technologie und hat im Nischensektor einigen Erfolg DVI ist eine (De-)Kompressionstechnologie und wird wahrscheinlich von den MPEGEntwicklungen überrollt. ! 3.8 CD recordable (CD-R / CD-WO) physikalischer aufbau CD-R logischer aufbau CD-R zusammenfassung CD-R ! 3.8.1 physikalischer aufbau CD-R Schutzschicht Reflexionsschicht Absorptionschicht Substratschicht (Polykarbonat) Zusätzliche Absorptionschicht zwischen Reflexionsschicht und Substratschicht Vorab eingravierte Spur Irreversible Änderung der Reflexionseigenschaften Durch Erhitzung auf 2500C durch Laser CD-Rs sind in "normalem" Gerät lesbar CD-R werden manchmal auch als CD-WO (Write Once) bezeichnet 3.8.2 logischer aufbau CD-R Regular CD-R Lead In Data Lead Out Hybrid CD-R Lead In Data Lead Lead Out In Data Lead Out ... Lead In Data Lead Out Abspeichern des Inhaltsverzeichnisses im Lead-IN Vor 1992 konnten Geräte nur einen Lead-In (eine Session) erkennen regular CD-R Nach 1992 waren multi-session-fähige Geräte auf dem Markt hybrid CD-R 3.8.3 zusammenfassung CD-R Die CD-R ist ein WORM (Write Once, Read Multiple) Die Information wird durch Erhitzen mit einem Laser in speziellen CD-Schreibgeräten gebrannt der Brennvorgang ist kontinuierlich, bedarf also einer konstanten Zuführung von Daten durch den Rechner Neuere CD-R Geräte sind multi-session-fähig Die CD-R könnte die CD-DA ablösen ist in der Produktion allerdings teurer ! 3.9 CD magneto-optical (CD-MO/CD-RW) ansatz struktur CD read-write (CD-RW) zusammenfassung 3.9.1 ansatz Spezifiziert im Orange book (erster Teil) 1991 Ermöglicht mehrmaliges Schreiben der CD Physikalischer Ansatz Bei hohen Temperaturen lassen sich in bestimmten Materialien Dipole durch ein Magnetfeld ausrichten Bei der CD-MO erhitzt ein Laser die Oberfläche auf 1500C. In einem Magnetfeld von 10facher Erdmagnetfeldstärke werden Dipole nach unten oder oben ausgerichtet. Diese Ausrichtung ändert die Lichtreflexion. Beim Löschen wird ein konstanten Magnetfeld angelegt Das Verfahren ist also ein magnetisches Aufzeichnungsverfahren kombiniert mit einem optischen Abtastverfahren 3.9.2 struktur Die CD-MO ist (optional) zweigeteilt Premastered Area (optional) Nur lesbarer Bereich, der initial auf die CD-MO aufgebracht wurde. Rocordable Area CD-MO Recordable Premastered Area Area CD-DA Die Technik ist inkompatibel: CD-MO (oder CD-RW) ist nicht mit CD-DA, CD-ROM, CDROM/XA oder CD-WO Gerät lesbar. 3.9.3 CD read-write (CD-RW) Die CD-RW ist eine Weiterentwicklung der CDMO Physikalisches Prinzip wie bei der CD-MO Erhitzung durch impulsartige Energiezufuhr durch den Laser CD-RW können auf alten CD-ROM Lesegeräten oft nicht gelesen werden. Der Reflexionsgrad liegt bei 15-20% Zum Vergleich Reflexionsgrad CD-DA: 70% Reflexionsgrad CD-R/WO: 65 % Neuere Geräte besitzen eine Signalverstärkungsanpassung und können CD-RW lesen 3.9.4 zusammenfassung CD-MO/RW Die CD-MO/RW ermöglicht das mehrmalige Beschreiben von CDs Die CD-MO/RW ist strukturell optional zweigeteilt Die CD-RW ist eine technische Fortentwicklung der CD-MO Die CD-MO kann auf keinem CD-ROM Lesegerät gelesen werden. Die CD-RW kann nur auf neueren Geräten gelesen werden ! 3.10 Digital Versatile Disc (DVD) standards versionen technik aufbau dekoder vergleich CD DVD zusammenfassung DVD 3.10.1 standards Die DVD-Standards wurden 1996 vom DVDKonsortium im "Buch A" bis "Buch E" spezifiziert Folgende Standards sind in diesen Büchern beschrieben: DVD-ROM (Buch A: DVD Read Only Specification) Speichermedium hoher Kapazität. Nachfolger der CD-ROM DVD-Video (Buch B: DVD Video Specification) Speichermdeium für lineare Videodatenströme DVD-Audio (Buch C: DVD Audio Specifivcation) Speichermedium für lineare Audiodatenströme, Nachfolger der CD-DA DVD-R (Buch D: DVD Recordable Specification) Einmalig beschreibbare DVD, Nachfolger der CD-R DVD-RW/RAM (Buch E: DVD Rewritable Specification) Wiederbeschreibbare DVD, Nachfolger der CD-RW 3.10.2 Bezeichnung DVD-5 DVD-9 DVD-10 DVD-18 DVD-R DVD-R DVD-R DVD-R DVD-RAM DVD-RAM versionen Ø Seiten Schichten 12 SS SL 12 SS DL 12 DS SL 12 DS DL 8 SS SL 8 SS DL 8 DS SL 8 DS DL 12 SS SL 12 DS SL 8 SS SL 8 DS SL 12 SS SL 12 DS SL Kapazität 4,38 GB 7,95 GB 8,75 GB 15,9 GB 1,36 GB 2,48 GB 2,72 GB 4,95 GB 3,68 GB 7,38 GB 1,15 GB 2,3 GB 2,4 GB 4,8 GB Anmerkung > 2 Std. Video ca. 4 Std. Video ca. 4,5 Std Video > 8 Std Video ca. 0,5 Std Video ca. 1,3 Std Video ca. 1,4 Std Video ca. 2,5 Std Video SS DS SL DL Single Side Double Side Single Layer Double Layer 3.10.3 technik Die technischen Grundlagen der DVD entsprechen denen der CD Die Vergrößerung der Speicherkapazität wurde bei der DVD durch folgende Maßnahmen erreicht: Verkleinerung der Pits (von 0,6 m auf 0,24 m) und damit auch der Abstände zwischen aufeinanderfolgenden und nebeneinanderliegender Pits (von 1,6 m auf 0,74 m). Vergrößerter Datenbereich Effizientere Bikodierung: (EFM+ - Eight to fourteen+) 8/16 Modulation, dadurch Einsparung der Füllbits. Effizientere Fehlerkorrektur Geringerer Sektor-Overhead Benutzung beider Seiten Verwendung von zwei Fokusierungsebenen ! 3.10.4 aufbau Blöcke 37856 Bytes ... 37856 Bytes ... 16 x ... 2064 Bytes 4832 Bytes 37856 Bytes 37856 Bytes Sektoren (16 pro Block + Fehlererkennung) 2064 Bytes 2064 Bytes Zeilen (12 pro Sektor) 12 Byte Sektor Header 160 Byte Nutzdaten 172 Byte Nutzdaten ... 10 x ... 172 Byte Nutzdaten 168 Byte Nutzdaten 4 Byte Fehlererkennung 33024 Bytes von 37856 Bytes Nutzinformation ( 87%) 3.10.5 dekoder Die Dekodierung erfolgt beim Durchlauf von 6 Ebenen Ebene 1: Synchronisation, 8/16 Demodulation, Sektorerkennung Eingehende Kanalbitrate 26,16 Mbit/s, danach 13 Mbit/s. Ebene 2: Fehlererkennung (EDC) und -beseitigung (ECC) Nutzdatenrate sinkt auf 11,08 Mbit/s. Ebene 3: Discrambling und Descryption Entfernung von Permutationen und Verschlüsselungen (als Kopierschutz) Ebene 4: EDC-Prüfung Erneute Fehlererkennung Ebene 5: Track Zwischenspeicher Eventuell Umwandlung der festen Datenrate in variable Datenrate. Nutzdaten hier noch 10,08 Mbit/s Ebene 6: Datentransfer zum MPEG-Dekoder Verteilung der Daten (Demultiplexing) auf Anwendungen (z.B. MPEG-Dekoder) 3.10.6 vergleich CD DVD Durchmesser Stärke Laser-Wellenlänge Track-Abstand Min. Pit-Länge Daten-Layer Seiten Kapazität Video-Standard Videokapazität Sound-Tracks Untertitel CD ca. 120 mm ca. 1,2 mm 780 nm (Infrarot) 1,6 m 0,83 m 1 1 ca. 650 MB MPEG-1 ca. 1 Std 2-Kanal MPEG DVD 80mm / 120mm 1,2 mm 650/635 nm (rot) 0,74 m 0,4 m 1/2 1/2 bis 15,9 GB MPEG-3 bis 8 Std 2-Kanal PCM (optional 8 Ströme) bis zu 32 Sprachen 3.10.7 zusammenfassung DVD DVD deckt die Funktionalitäten aller CDStandards ab Unterschiedlicher Versionen unterscheiden sich im Durchmesser sowie der Anzahl der Seiten und Schichten Die Speicherkapazität beträgt zwischen 1,3 GB und 15,9 GB haben Die DVD-Technik optimiert der CD-Technik Die DVD ist in Blöcke, Sektoren und Zeilen strukturiert Der DVD Dekoder durchläuft 6 Ebenen Die DVD stellt in (fast) allen Bereichen einen Fortschritt gegenüber der CD dar ! 3.11 logische formate der ISO 9660 standard die ISO 9660 struktur erweiterungen der ISO 9660 verwendung zusammenfassung logische formate 3.11.1 der ISO 9660 standard 1990 wurde im Del Webb's High Siera Hotel & Casino der High Sierra Proposal erarbeitet. Dieser Proposal war Vorlage für den ISO 9660Standard Die ISO 9660 definiert ein File-System, bestehend aus: Definition eines Directory Baumes Zusätzlich Liste aller Direktories (Path Table) Path Table kann bei erstem Zugriff auf CD lokal gespeichert werden Probleme Dateiattribute Lange Filenamen Bootfähigkeit ! 3.11.2 die ISO 9660 struktur Das File-System wird im ersten Track abgelegt: 16 Blöcke (à 2352 Byte, 2048 Byte Nutzinformation) System Area herstellerspezifischer Bereich Primary Volume Descriptor Länge des Dateisystems Länge und Adresse der Path Table Supplementory Volume Descriptors eventuell weitere Dateisysteme Volume Descriptor Terminator kennzeichnet das Ende der Dateisysteme ... 3.11.3 erweiterungen der ISO 9660 Rockbridge Erweiterung Anpassung an UNIX-Filesystem lange Dateinamen Links Zugriffsrechte Joliet Filesystem Anpassungen an Windows 95 / NT insb. lange Dateinamen El Torito Erweiterung um boot-Fähigkeit ISO 13490 Bessere Unterstützung der Multisession-Fähigkeiten ! 3.11.4 verwendung keine Dateisystem CD/DA CD-ROM/XA ISO 9660 DVI CD-ROM CD-R/WO CD-RW/MO Rockbridge, Joliet, El Torito CD-ROM CD-R/WO CD-RW/MO ISO13490 DVD 3.11.5 zusammenfassung Dateisysteme können nach der ISO9660 Spezifikation auf einer CD angelegt werden Nach ISO 9660 sind Informationen über das Dateisystem ab dem 16. Sektor im 1. Track untergebracht Erweiterungen der ISO 9660 erlauben u.A. längere Dateinamen, Dateiattribute und Links Die bedeutenden Erweiterungen sind die Rockbridge Erweiterung, das Joliet Filesystem, die El Torino Erweiterung und die ISO 13490 Die meisten CD-Formate unterstützen alle Dateisysteme bis auf die ISO13490. Letztere wird bei der DVD eingesetzt. ! kapitel 4 transfersysteme Entwicklung der Telekommunikation Dienste Netze Vermittlungsknoten Kommunikationsmodelle Signalisierung Breitbandkommunikation zusammenfassung 4.1 entwicklung der telekommunikation Zeitliches Technisches Zusammenfassung 4.1.1 zeitliches Die ersten 100 Jahre Der Übergang zur Digitaltechnik Die neuesten Generationen 4.1.1.1 die ersten 100 jahre 1833 1861 1876 1877 1881 1889 1892 1901 1908 1927 1933 Telegraf (Digital: Gauß, Weber) Telefon (Phillip Reis) Brauchbares Telefon (Gray, Bell) Handvermittlungssystem (USA) Handvermittlungssystem (Berlin) Hebdrehwähler (Undertaker) Automatische Vermittlung (USA) Drahtlose Telegraphie (Eng) Automatische Vermittlung (D) Transatalatische KW-Übertragung Fernschreibnetz, Telex (D) 4.1.1.2 der übergang zur digitaltechnik 1938 1948 1955 1956 1960 1962 1965 1965 1965 1968 1969 PCM (A. Reeves) Transistor Edelmetalmotordrehwähler (EMD) Transatlantisches Kabel Vollelektonische VSt (USA) Fernsehsatellit "Telstar 1" Rechnergesteuerte Ovst (ESS) Geostationärer Satellit "Intelsat 1" Elektronische VSt im Zeitmultiplex ARPANET-Vertrag Bildübertragung Mondlandung 4.1.1.3 die neuesten generationen 1970 1970 1975 1976 1979 1980 1984 1989 1992 1997 1998 Vollautomatisierung Elektronisches Wähl System Start des IDN EWS1 im Wirkbetrieb LWL-Betrieb Frankfurt - Oberursel Bildübertragung Jupiter und Saturn ATM-Strecke Prototypen Start ISDN WWW Volldigitales Netz Fall des Telekom-Monopols 4.1.2 technisches Analog zu digital Analoge Technik Digitale Technik 4.1.2.1 überblick • analog zu digital Direkte analoge Leitung zwischen Teilnehmern Analoge Vermittlung, analoge Übertragung Analoge zur VST, Digitale Vermittlung, digit zwischen VSt ISDN: Digital zur VST, Digitale Vermittlung, digit zwischen VSt ! 4.1.2.2 analoge technik Analoge Verbindung Verbindung zwischen Teilnehmern Analoge Vermittlung Kontakt zwischen Ein- und Ausgängen der Vermittlungsstellen Prinzip der Vermittlung 4.1.2.2.1 analoge verbindung Niederfrequenzleitungen (NF) auf dem Basisband (begrenzung aug ca. 4KHz) zu den Teilnehmern Niederfrequenzleitungen auf dem Basisband zwischen Orts/End-Vermittlungsstellen (O/EVSt) und Knotenvermittlungsstellen (KVSt) Trägerfrequenzübertragung zwischen VStn höherer Ordnung (Frequenzmultiplex - Rasterabstand 4 KHz) 4.1.2.2.2 analoge vermittlung Prinzip eines Koppelpunktes Eingang Steuerung Ausgang Koppeleinrichtung Drehen Heben Heb-/Drehwähler EMD 4.1.2.2.3 prinzip der vermittlung Anrufsuch-Wähler (AS) Konzentriert Anzahl von Endstellen auf geringere Anzahl von gleichzeitigen Verbindungsmöglichkeiten (100:8-50) Gruppenwähler (GW) Zur Bestimmung der Ausgangsrichtung Leitungswähler (LW) Selektion des Endteilnehmers 4.1.2.3 digitale technik Erste Stufe Zweite Stufe Dritte Stufe Vierte Stufe Digitale Übertragung zwischen VStn Digitalisierung der VStn Digitalisierung des Teilnehmerzugangs Gesamtdigitalisierung 4.1.2.3.1 digitale übertragung zwischen VStn Zeitmultiplextechnik PCM30 (2,048 Mbps) zwischen O/EVSt und KVSt PCM480 bzw. PCM 7680 (565 Mbps) zwischen KVSTn A/D-D/A-Wandlung zwischen den VStn notwendig Analog/Diagital-Wandler sehr schnell und teuer 4.1.2.3.2 digitalisierung der VStn 1984: Digitale Fermvermittlungsstellen (DIVF) 1985: Digitale Ortsvermittlungsstellen (DIVO) Ersatz der EMD durch rechnergesteuerte Raum- und Zeitmultiplexkoppelfelöder Lieferanten in Deutschland: SEL (System 12), Siemens (EWSD) Erste LWL Multi-/Monomodefasern (statt Koax): Übertragungsraten bis 2,488 Gbps (PCM 30720 ) 4.1.2.3.3 digitalisierung des teilnehmerzugangs Seit 1989 ISDN (Integrated Services Digital Network) 2 x 64 Kbps Sprachkanal, 1 x 16 Kbps Steuerkanal Anschlussmöglichkeit auch für analoge Teilnehmer über AD/DA-Wandler Anschlussmöglichkeit für digitale nicht-ISDN-Gerate ("Schmallband"-ISDN, S-ISDN) Seit 1995 S-ISDN auch in den neuen Bundesländern 4.1.2.3.4 gesamtdigitalisierung B-ISDN (Breitband-ISDN) auf ATM-Technik (Asynchronous Transfer Mode) Dynamsische Zuweisung von Bandbreiten Integration aller digitalen Endgeräte 4.1.3 zusammenfassung Die Telefonie entwickelte sich seit 1833 in drei Stufen 1. Entwicklung und Automatisierung des Fernsprechnetzes 2. Digitalisierung des Fernsprechnetzes 3. Integration der Sprach- und Datendiensten Die analoge Telefonie gipfelte ca. 1975 in vollautomatischen Vermittlungssystemen mit 4KHz-Teilnehmerbandbreiten EMD-Wählern. Die digitale Telefonie ist seit 1997 vollständig im Netz eingeführt. Die vierte digitale Generation steht an ATM-Technik !