Moderne Medientechnik Prof. Dr. Wolf-Peter Buchwald Inhalt Einleitung .................................................................................................................................. 1 1. Audio .................................................................................................................................. 2 1.1 Grundlagen .............................................................................................................. 2 1.2 Digitale Audiotechnik ............................................................................................. 8 1.2.1 Digitalisierung ............................................................................................. 8 1.2.2 Datenreduktion .......................................................................................... 11 1.2.3 MIDI .......................................................................................................... 15 1.2.4 Digitale Audioübertragung ........................................................................ 18 1.3 Audioaufnahme und -wiedergabe ......................................................................... 20 1.3.1 Aufnahme .................................................................................................. 20 1.3.2 Wiedergabe ................................................................................................ 23 2. Video ................................................................................................................................. 25 2.1 Grundlagen ............................................................................................................ 25 2.2 Farbbild-Darstellung ............................................................................................. 32 2.3 Digitale Videotechnik............................................................................................ 38 2.3.1 Digitale Videonorm ................................................................................... 38 2.3.2 Datenreduktion .......................................................................................... 42 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Einleitung Medien sind Bestandteil des alltäglichen Lebens von frühesten Zeiten an beginnend mit geschriebenen oder gezeichneten bzw. gemalten Darstellungen über Druckerzeugnisse und schließlich der Möglichkeit elektronischer Präsentation von akustischen Informationen sowie statischen und bewegten Bildern. Die moderne Medientechnik nutzt hierbei die Möglichkeiten der Digitalisierung. Hier stehen Fragen der Aufnahme, Speicherung, Übertragung und Wiedergabe im Vordergrund. Ausgehend von den Gegebenheiten der analogen Grundlagen sollen vordergründig die Audiound Videotechnik sowie die digitale Fotografie behandelt werden. Audiotechnik Schallwahrnehmung des Menschen Sprache und Musik Telefon Rundfunk Speicher Schnittstellen, Aufnahme, Wiedergabe Videotechnik Auflösungsvermögen des Auges Bildfeldzerlegung Farbe Übertragung Speicher Schnittstellen, Kamera, Monitor Fotografie Bildsensoren Bildverarbeitung elektronische Bildwiedergabe, Ausdruck 1 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik 1. Audio 1.1 Grundlagen Eigenschaften des menschlichen Gehörs: • Frequenzbereich bzw. Frequenzgang • Dynamik bzw. Amplitudenbereich Hörphysiologie: • Empfindung der Lautstärke bei unterschiedlichen Frequenzen als Funktion des Schalldruckes • untere und obere Begrenzung (Hörschwelle und Schmerzgrenze) Schalldruck: p Schalldruckpegel: L p = 20 ⋅ log Hörschwelle: p0 = 20µPa = 2 ⋅ 10−5 Pa (bei 1 kHz) Schalldruckpegel bei 1 kHz: L = L p (1kHz) in Phon Schmerzgrenze: 120 Phon p p0 bzw. in dB 106 ⋅ p0 = 20Pa Hörfläche: Quelle: https://de.wikipedia.org/wiki/Phon_(Einheit) 2 Prof. Dr.-Ing. W.-P. Buchwald Lautheit Moderne Medientechnik Die Lautheit wird in Sone angegeben. Sie berücksichtigt einen nichtlinieren Zusammenhang zwischen der subjektiven Lautstärkeempfindung und dem Phonwert bei kleineren Schalldruckpegeln Quelle: https://de.wikipedia.org/wiki/Phon_(Einheit) Akustische Bewertungskurven Die Bewertungskurven beschreiben den Hörfrequenzgang und dienen für die messtechnische Beschreibung von Audiosignalen unter Einbeziehung subjektiver Empfindungen. A: B: C: D: Bereich 20 bis 40 Phon Bereich 50 bis 70 Phon Bereich 80 bis 90 Phon Bereich oberhalb 90 Phon Typische Anwendung ist die A-Bewertung. Ein aufgenommenes Audiosignal wird beispielsweise mit einem Filter gemäß AÜbertragungsfunktion gefiltert bzw. bewertet und der resultierende Pegel in dB(A) angegeben. Quelle: https://de.wikipedia.org/wiki/Frequenzbewertung 3 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Menschliche Stimme: • nichtperiodisch (Konsonanten) • periodisch (Vokale) Stimmbildung: • Grundwellenerzeugung (Impulsfolge) • Spektrale Formung durch Mund-Nasenraum Stimmerzeugung durch Impulsfolge: zugehöriges Spektrum: geformtes Spektrum: Vokale: werden charakterisiert durch unterschiedliche Lage und Form der Formanten Grundwellenfrequenz f0 ist für die Spracherkennung nicht wichtig, unterschiedlich vor allem zwischen Mann (typisch 130 Hz) und Frau (typisch 240 Hz) Sprachverständlichkeit: wichtig für die Telekommunikation Optimierung: gute Verständlichkeit bei möglichst kleiner Bandbreite absolute Silbenverständlichkeit: „sinnlose“ Silben werden korrekt verstanden relative Silbenverständlichkeit: normale sinnhafte Silbenabfolge eine ca. 70%ige absolute Silbenverständlichkeit entspricht einer 100%ige relativen Silbenverständlichkeit (nicht verstandene Silben können durch den Zusammenhang interpoliert werden) 4 Prof. Dr.-Ing. W.-P. Buchwald Telefonbandbreite: AM-Rundfunk: Moderne Medientechnik klassisch minimal zu übertragende Frequenzanteile (analoge Telefonie): untere Grenzfrequenz: f gu = 300Hz obere Grenzfrequenz: f go = 3400Hz obere Grenzfrequenz: f go = 4500Hz hier wurde die obere Grenzfrequenz etwas erhöht, da hier nicht nur Sprache bzw. Sprachverständlichkeit im Vordergrund stand, sondern auch Musikübertragung FM-Rundfunk: obere Grenzfrequenz: f go = 15000Hz Ziel ist eine naturgetreue Wiedergabe aller Audioquellen (High Fidelity, HiFi) Stereo-Übertragung im FM-Band: die Rechts- und Links-Information wird mittels Frequenzmultiplex zu einem Signal zusammengefasst und dann frequenzmoduliert übertragen 1. Schritt: Matrizierung 2. Schritt: Modulation (Frequenzmultiplex) 5 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Analoge Speicherung: • Schallplatte (i.a. nur Wiedergabe) • Magnettonband (Aufnahme und Wiedergabe) Tonband: Grenzfrequenz abhängig von der Bandgeschwindigkeit Verringerung von Bandrauschen: • optimale Aussteuerung (hoher Signalpegel) • Einsatz von Pre- und Deemphase • Kompandierungsverfahren (analoges Dolby) Rauschüberlagerung vom Band: Rauschverminderung durch Pre-/Deemphase: 6 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Dolby Rauschreduktionssystem (analog): Rauschreduktion basiert auf einer Kompandierung, i.a. in einem höheren Frequenzbereich Kompandierung = Kompression und Expansion Vor der Aufnahme werden z.B. bei Dolby B alle Frequenzen oberhalb von 1 kHz in Abhängigkeit von der Amplitude so verstärkt, dass kleine Pegel mehr angehoben werden als größere Pegel. Dadurch wird die Dynamik komprimiert. Im Ergebnis wird praktisch das Band bei der Aufnahme stärker ausgesteuert. Bei der Wiedergabe muss die pegelabhängige Verstärkung wieder exakt gegenläufig zum Kompressor arbeiten (Expandierung), um den ursprünglichen Amplitudenwert der aktuellen Einhüllenden zu erhalten. Beispiel: ursprüngliches Testsignal nach der Kompression Zu beachten ist, dass die einzelnen Sinusschwingungen nach wie vor Sinusform aufweisen und nicht verzerrt werden, da die Kompression nicht auf die Momentanwerte wirkt, sondern mit einer gewissen Zeitkonstante nur auf die Hüllkurve. wesentliche Dolby Versionen: Dolby B bis ~10 dB Rauschunterdrückung Dolby C bis ~20 dB Rauschunterdrückung Dolby SR bis ~24 dB Rauschunterdrückung 7 Auch Dolby NR genannt, große Verbreitung (u.a. Compact Cassette), wirkt nur ab ca. 1 kHz Zwei Kompressoren hintereinander Professionelles System für Studioanwendungen, mehrere Frequenzbänder mit variablen Übergangsfrequenzen Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik 1.2 Digitale Audiotechnik 1.2.1 Digitalisierung Abtasttheorem: Anforderung Telefon: fa ≥ 2 f g Die Grenzfrequenz beim analogen Telefonsignal beträgt 3,4 kHz. Sie wird aufgerundet auf 4 kHz und wird mit diesem Wert als Nyquistfrequenz bei der Abtastung festgelegt. Nyquistfrequenz entspricht halber Abtastfrequenz fNyq = ½ fa Abtastrate: f a = 2 ⋅ 4kHz = 8kHz Abtastspektrum: Quantisierung: m = 8bit entspricht n = 2m = 28 = 256 Amplitudenstufen Durch die Quantisierung wird ein Rundungsfehler eingeführt, der irreversibel ist. Da dieser Fehler wie überlagertes Rauschen klingt, spricht man auch von Quantisierungsrauschen. Mit 8 Bit ist diese Störung etwa angepasst an das typische Signal/Rauschverhältnis von analogen Telefonsignalen. Dynamik: D = m ⋅ 6dB Die Dynamik beschreibt logarithmisch das Verhältnis zwischen maximalem Spitzenwert und dem Spitzenwert des Quantisierungsfehlers in dB. 8 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Datenrate: b = m ⋅ f a = 8bit ⋅ 8kHz = 64kbit/s (klassischer ISDN-Kanal) Anforderung digitales Audio: Für qualitativ hochwertige Audioaufnahme und Wiedergabe (vgl. frühere HiFi-Norm) muss sowohl eine höhere Bandbreite als auch ein besserer Störabstand mit Blick auf das Quantisierungsrauschen bzw. der Anzahl der Bits pro Abtastwert zu Grunde gelegt werden. Bandbreite: 16Hz - 20.000Hz (vgl. UKW und analoges TV: 50Hz - 15.000Hz) Quantisierung: m = 16bit Compact Disk: optische digitale Speicherung (für Speicherung und Wiedergabe ausreichend, für Aufnahme und Verarbeitung häufig deutlich mehr, bis 24 bit) fa=44,1kHz DAT-Recorder: digitale Speicherung auf Magnetband fa=48kHz Überabtastung: Um analoge Vorfilter hoher Ordnung zu vermeiden, die zur Vermeidung von Unterabtasteffekten erforderlich sind (Alias), kann mit deutlich höherer Abtastrate gearbeitet werden. Das Vorfilter kann dann als digitales Filter ausgeführt werden, danach kann intern auf die ursprünglich erforderliche Abtastrate gewandelt werden. typische Überabtastung: 88,2kHz = 2 ⋅ 44,1kHz 96kHz = 2 ⋅ 48kHz 192kHz = 4 ⋅ 48kHz Oversampling: Begriff entspricht zwar im Englischen dem Wort „Überabtastung“, meint jedoch speziell bei CDPlayern oder allgemein bei D/A-Wandlern das nachträgliche Interpolieren der vorhandenen Datenrate auf ein Vielfaches von 44,1kHz. Damit wird die Anforderung an das analoge Nachfilter zur Oberwellenunterdrückung geringer. 9 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Beispiel: 2-fach Oversampling Nach Auslesen der Daten von der CD mit der Abtastrate fa=44,1kHz wird das abgetastete Signal auf 2fa=88,2kHz interpoliert, z.B. durch Einfügen von 0 zwischen den Abtastwerten oder durch wiederholen des vorhergehenden Abtastwertes. Ein folgendes digitales Tiefpassfilter arbeitet jetzt aber mit 2fa Arbeitstakt und kann eine Übertragungsfunktion realisieren, die erst mit 2fa periodisch ist. Damit kann das erste Oberwellenband um fa unterdrückt werden. Hinter dem D/AWandler braucht das Nachfilter damit erst das Oberwellenband um 2fa zu unterdrücken, seine Filterflanke kann entsprechend breiter und das Filter somit einfacher aufgebaut sein. Datenraten: CD Stereo b = 2 ⋅ 16bit ⋅ 44,1kHz = 1411,2kbit/s (entspricht 176,4 kByte/s) DAT Stereo b = 2 ⋅ 16bit ⋅ 48kHz = 1536kbit/s (entspricht 192 kByte/s) Diese Datenraten entsprechen dem Audiosignal ohne jegliche Kompression. Zwischen A/DWandler und D/A-Wandler ergibt sich als einzige Beeinflussung nur ein additives Quantisierungsrauschen von mit einer Dynamik von D=96dB. Dies ist i.a. geringer als das bereits analog vorhandene Rauschen. 10 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik 1.2.2 Datenreduktion Verfahren zur Datenreduktion werden allgemein unter dem Begriff Quellencodierung zusammengefasst. Hier unterscheidet man zwischen verlustlosen und verlustbehafteten Prinzipien. Verlustlose Datenreduktion: z.B. zip-Archiv Komprimierte Dateien bzw. Signale können fehlerfrei wieder rekonstruiert werden, die Kompressionsrate ist je nach Datei oder Signal relativ begrenzt (Beispiel für eine Audiodatei: Reduktion nur von wenigen % möglich) . Hier wird weiterhin unterschieden: • Irrelevante Information Zeichen, die beim Empfänger unbekannt sind, (entspricht bei analoger Signaldarstellung einer größeren Signalbandbreite als für den Empfänger sinnvoll, z.B. Audiosignalbandbreite über 20kHz). • Redundante Information Zeichen, die vorhersagbar sind. Information, die mehrfach in einer Nachricht enthalten ist und somit bereits grundsätzlich bekannt ist. Redundante Nachrichten haben den Vorteil, störunempfindlich zu sein, da verfälschte Informationen rekonstruiert oder zumindest erkannt werden können. (Beispiel: die Sprache enthält nicht alle mathematisch möglichen Buchstabenkombination für Silben und Wörter, sondern nur eine kleine Auswahl, so dass ein Fehler i.a. erkannt und korrigiert werden kann: „FACHHOCHSCHXLE“ ist eindeutig fehlerfrei rekonstruierbar) Verlustbehaftete Datenreduktion: mp3, jpg, MPEG Das Originalsignal bzw. die Datei wird irreversibel verändert, es geht somit Information verloren. Die dadurch eingefügten Fehler führen aber zu Störungen, die subjektiv möglichst wenig bis gar keine Beeinträchtigung der Signalqualität darstellen (Überdeckungseffekt). 11 Prof. Dr.-Ing. W.-P. Buchwald Überdeckungseffekt bei Audio Moderne Medientechnik Ein lauter Ton der Frequenz f0 überdeckt einen Ton mit einer ähnlichen Frequenz f1=f0+∆f, so dass dieser nicht mehr wahrgenommen werden kann. Je kleiner der Frequenzunterschied ∆f ist, desto größer kann die Amplitude der Schwingung mit f1 sein, ohne dass man sie hören kann. Man spricht bei diesem Effekt auch von Maskierung. Die Hörschwelle wird damit im Bereich eines Audiospektrums mit großer Leistung angehoben. Quelle: https://de.wikipedia.org/wiki/Maskierungseffekt Dieser Maskierungs- bzw. Überdeckungseffekt ist der wesentliche Kern aller verlustbehafteten Datenreduktionsverfahren für Audiosignale, indem spektrale Bereiche in der Nachbarschaft von leistungsstarken Frequenzbereichen gröber quantisiert werden können (weniger Bits!), wobei der resultierende größere Quantisierungsfehler überdeckt bzw. maskiert wird und somit nicht hörbar ist. 12 Prof. Dr.-Ing. W.-P. Buchwald MP3 Verfahren Moderne Medientechnik Entstammt dem digitalen Videokompressionsstandard MPEG 1 (Moving Pictures Expert Group) und ist als Audiokompression dort in verschiedenen sogenannten Layern definiert MPEG-1 Audio Layer I MPEG-1 Audio Layer II MPEG-1 Audio Layer III (das eigentliche MP3) während für MPEG-2 ein Kompressionsverfahren für Audio mit dem Namen AAC standardisiert ist (Advanced Audio Coding). MPEG-1 Audio Layer I Beispiel Abtastrate 48 kHz entsprechend Nyquistfrequenz 24 kHz Aufteilung des Audiosignals in 32 Frequenzbänder (Filterbank) Bandbreite je Band: 24 kHz/32=750Hz Unterabtastung je Band mit 1,5 kHz (ergibt jeweils ein Basisband 0…750 Hz) 12 Abtastwerte pro Band ergeben parallel mit allen 32 Bändern insgesamt 384 Abtastwerte, die ein Frame bilden Parallel zur Filterbank wird das Audiosignal mit einer 512-FFT analysiert. Die vorliegenden Amplituden dieser Frequenzanteile steuern zusammen mit den Ausgangssignalen der einzelnen Bänder über ein psychoakustisches Modell die Quantisierung der Ausgangssignale der einzelnen Bandpässe. Signale aus einem benachbarten Band, in dem eine große Amplitude vorliegt, werden wegen des Überdeckungseffekts gröber quantisiert oder ggf. gar nicht mehr übertragen. Dies ist die eigentliche Datenreduktion. 13 Prof. Dr.-Ing. W.-P. Buchwald MPEG-1 Audio Layer II Moderne Medientechnik auch MUSICAM genannt (Masking-pattern adapted Universal Subband Integrated Coding and Multiplexing) FFT mit 1024 Abtastwerten Verwendung von 3 Frames: 3x12x32=1252 Abtastwerte MPEG-1 Audio Layer III als MP3 bekannt die 32 Frequenzbänder sind mit zunehmender Frequenz breiter (angepasst an die subjektiven Höreigenschaften) FFT mit 1024 Abtastwerten Abtastwerte aus der Filterbank werden einer Modifizierten Diskreten Cosinus Transformation (MDCT) unterzogen. Im Unterschied zur normalen DCT überlappen sich die benachbarten Blöcke um 50% ihrer Breite Stereokomprimierung: Joint-Stereo Verfahren (typisch) Matrizierung der Rechts/Links Signale zu Rechts+Links (mono) und Rechts-Links (Diff.) Monosignal: Differenzsignal: 14 wesentliche Datenrate kleine Datenrate Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Übersicht und Vergleich (Basis: resultierende Qualität mit CD vergleichbar): MPEG-1 Layer I 384 kbit/s MPEG-1 Layer II (MUSICAM) MPEG-1 Layer III (MP3) AAC (Advanced Audio Coding) Dolby Digital (AC-3) ATRAC 192 - 256 kbit/s KompressionsAnwendung faktor 4 DCC Dig. Compact Disc 6-8 DAB, DVB, DVD 112 - 128 kbit/s 10 - 12 96 kbit/s 16 DAB+, DRM 192 kbit/s 8 DVD 292 kbit/s 5 MiniDisc Verfahren Datenrate Stereo 1.2.3 MIDI MIDI bedeutet Musical Instrument Digital Interface und beschreibt in gänzlich anderer Weise als in der bisher beschriebenen digitalen Audiotechnik die Darstellung von Musik. MIDI kann man sich vorstellen als die Fernsteuerung einer Klaviertastatur, bei der nur Daten übertragen werden, die den Zeitpunkt und die Dauer des Anschlages einer definierten Taste beschreiben. Zusätzlich werden dabei u.a. auch noch Informationen wie Anschlagstärke, nachträglicher Druck auf die bereits angeschlagene Taste oder Geschwindigkeit des Loslassens übertragen. Die Besonderheit liegt weiterhin darin, dass parallel 16 Datenkanäle gleichzeitig genutzt werden können und jedem Kanal ein Klang zugeordnet ist, so dass natürlich nicht nur ein Klavier erklingt, sondern je nach Wahl alles, was im Empfänger (typischerweise einem MusikKeyboard, aber auch ein PC) als Instrumentenklang verfügbar ist. Somit ist ein direktes Abspielen eines komplexeren Musikarrangements bestehend aus verschiedensten Instrumenten inklusive perkussiver Instrumente (Schlagzeug) möglich. Die Übertragungsrate der notwendigen Daten ist dabei extrem klein, da keine Abtastwerte von Tönen übertragen werden müssen, sondern nur die Steuerinformationen für die Wiedergabe im Empfänger vorhandener und dort gespeicherter Klänge. Sehr frühe Vertreter dieser Musikwiedergabetechnik sind z.B. das elektrische Klavier oder ein Leierkasten. Auf breiten Papierbändern (oder auch auf großen runden Stahlscheiben) werden beim Vorschub bzw. der Drehung eingebrachte Löcher abgetastet und steuern einen Tastendruck oder das Anblasen einer Orgelpfeife. Diese mechanischen Datenträger enthalten in grundlegender Form das Prinzip von digitalen MIDI-Daten. Sie können auf verschiedenen geeigneten Instrumenten abgespielt werden, die je nach Aufwand unterschiedliche Wiedergabequalität ermöglichen. 15 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Steuerung eines Keyboards (oder allgemein eines sogenannten Slaves) durch MIDI-Daten: MIDI Daten: Für die Steuerung der Töne werden 3 Bytes verwendet, hier der Note On Befehl: 1. Byte: 2. Byte: 3. Byte: 1001 XXXX 0kkk kkkk 0vvv vvvv mit 1001 XXXX kkk kkkk vvv vvvv steht für Taste drücken (Note On) = 0…16 MIDI-Kanal = 24…108 Taste (Key) = 10…127 Anschlagstärke (Velocity) Ton wird so lange gehalten, bis ein Note Off Befehl gesendet wird (mit der Kennung 1000 im ersten Nibble des 1. Bytes) 16 Prof. Dr.-Ing. W.-P. Buchwald Übertragungsgeschwindigkeit: Moderne Medientechnik 31250 bit/s Die drei Bytes werden jeweils durch ein Startbit und ein Stoppbit auf 10 Bit ergänzt, die Übertragungsdauer dieser Sequenz dauert insgesamt 960 µs (ca. 1 ms). MIDI-Controller: Über weitere Befehle können unterschiedliche Controller angesprochen werden, z.B. • • • • Gesamtlautstärke Lautstärke je Kanal Sustainpedal Effektparameter (Hall, Echo usw.) Track-Dateigröße MIDI-File Track-Dateigröße MP3 Track-Dateigröße unkomprimiert ca. 30…60 kByte ca. 3…6 MByte ca. 30…60 Mbyte Schnittstelle: MIDI-In MIDI-Out MIDI-Thru Eingabe von Daten Ausgabe vom Keyboard Durchleifen von In nach Thru Verwendung der alten 5-poligen Phonobuchse als physikalische Schnittstelle Quelle: https://de.wikipedia.org/wiki/Musical_Instrument_Digital_Interface 17 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik 1.2.4 Digitale Audioübertragung Digitaler terrestrischer Rundfunk: DAB (Digital Audio Broadcast) ab 2011: DAB+ Entwickelt in der Zeit zwischen 1987-2000 sollte DAB den analogen terrestrischen Rundfunk (UKW) ablösen. Ursprünglich sollte 2012 der analoge UKW-Rundfunk abgeschaltet werden. Dies konnte mangels Akzeptanz nicht realisiert werden. Auch ein zweiter Abschalttermin 2015 musste aufgegeben werden. Probleme: • keine flächendeckende Sendeversorgung • unzureichendes Programmangebot Details DAB: • • • • • Frequenzbereiche: • VHF III (174 - 230 MHz) • 1,5 GHz Band / L-Band Modifikation bei DAB+: • AAC • Datenrate: 80 kbit/s • kompatibler Empfang von DAB Alternatives System: DMB (Digital Multimedia Broadcast) MPEG-1 Audio Layer 2 (MUSICAM) Datenrate: 32 - 256 kbit/s typisch 160 kbit/s (~ CD Qualität) Multiplex zu höheren Datenraten COFDM Modulation des Multiplex Entspricht DAB mit eingebetteten Videoinhalten bei maximalen Datenraten von 1,5 Mbit/s (typisch 1 Mbit/s) Ziel: mobiler Empfang von Audio und Video auf einem Handy DMB wurde mangels Akzeptanz in Deutschland nicht eingeführt (nur Erprobungen in der Vergangenheit) 18 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Quelle: http://www.digitalradio.de/index.php/de/empfangneu 19 Prof. Dr.-Ing. W.-P. Buchwald Digitalradio über Satellit Digitalradio über Kabel Moderne Medientechnik DVB-S/S2 DVB-C/C2 MPEG-1 Audio Layer 2 AAC Dolby Digital (AC-3) Internetradio/Webradio (Internet-Telefonie) MP3 (MPEG-1 Audio Layer 3) AAC 1.3 Audioaufnahme und -wiedergabe 1.3.1 Aufnahme Mikrofone Wandlung von Schalldruck in elektrische Spannung. Typische Systeme sind • dynamische Mikrofone • Kondensatormikrofone Qualitätsmerkmale: • • • • Dynamisches Mikrofon Frequenzgang Empfindlichkeit Linearität (Klirrfaktor) Richtcharakteristik Aufbau Quelle: https://de.wikipedia.org/wiki/Dynamisches_Mikrofon 20 Prof. Dr.-Ing. W.-P. Buchwald Beispiel Shure SM58 Moderne Medientechnik Frequenzgang: Quelle: http://www.shure.de/produkte/mikrofone/sm58 Empfindlichkeit: -54,5dBV/Pa bzw. 1,88 mV/Pa 1 Pa bei 94 dB Schalldruckpegel (105 Pa entsprechen 1 bar Luftdruck, 1 Pa entsprechen 94 dB Schalldruckpegel) Richtcharakteristik: Quelle: datasheet_sm_microphones_EN_2360kB.pdf 21 Prof. Dr.-Ing. W.-P. Buchwald Kondensatormikrofon Moderne Medientechnik Aufbau https://de.wikipedia.org/wiki/Kondensatormikrofon Proportional zum Schalldruck ändert sich der Abstand der Membran zur Gegenelektrode, so dass sich damit auch die Kapazität der Anordnung verändert. C =ε ⋅ A d und U= Q C Die Vorspannung wird üblicherweise vom Mischpult als sogenannte Phantomspeisung an das Mikrofon geleitet (über die Signaladern, typisch 48V). Gleichzeit wird damit ein Vorverstärker im Mikrofon versorgt (Impedanzwandler). Beispiel Sennheiser E 914 Frequenzgang: Quelle: http://de-de.sennheiser.com/global-downloads/file/2858/e_914_12_2012.pdf Empfindlichkeit: 7 mV/Pa 22 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Richtcharakteristik: Quelle: http://de-de.sennheiser.com/global-downloads/file/2858/e_914_12_2012.pdf 1.3.2 Wiedergabe Lautsprecher Tauchspulensystem Quelle: https://de.wikipedia.org/wiki/Lautsprecher Je nach Größe der Membran strahlen Lautsprecher in unterschiedlichen Frequenzbereichen ab (vom Subwoofer bis Hochtöner), eine Sonderform meist nur für Hochtöner stellen Hornsysteme dar (hoher Wirkungsgrad). 23 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Wirkungsgrad: Eigentlich der Anteil der abgegebenen SchallLeistung relativ zur zugeführten elektrischen Leistung. Im allgemeinen Sprachgebrauch wird allerdings meist der Schalldruck in Relation auf eine Lautsprecheransteuerung mit 1 W elektrischer Leistung bei 1 kHz im Abstand von 1 Meter darunter verstanden (Kennschalldruckpegel). Aufhängung: • weich langes Schwingspule, schlechter Wirkungsgrad, dafür linearer Frequenzgang (Anwendung in HiFi-Boxen) • hart kurze Schwingspule, guter Wirkungsgrad, Frequenzgang nicht ausgeprägt linear (Anwendung Bühnen-Boxen bzw. PA-Systeme - PA=Public Address) Beispiel: 12'' Tieftöner, weich aufgehängt DYN-1220, 4Ω, 200W 12'' Tieftöner, hart aufgehängt Celestion GH12H, 8Ω, 30W 89dB/W/m 100dB/W/m Verstärker mit 200W entspricht 23dB d.h. 89+23=112dB Schalldruck max. für 112 dB Schalldruck ist hier nur ein Verstärker mit 12dB erforderlich, das entspricht linear 16W maximaler Schalldruck: Verstärker mit 30W entspricht 15dB d.h. 112+15=127dB Schalldruck max. Bei gleicher Ansteuerleistung liefert der hart aufgehängte Tieftöner 11dB mehr Schalldruck, das ist 12,5 mal so laut. 24 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik 2. Video 2.1 Grundlagen Eine Szene wird in der Videotechnik durch eine Videokamera zeilenweise abgetastet und nach Übertragung auf einem Monitor entsprechend wiedergegeben. Kriterium für die notwendige Anzahl der Zeilen ist das Modell einer Bildbetrachtung, bei der in einem Abstand a zwischen Monitor und Auge zwei benachbarte Zeilen gerade nicht mehr vom Betrachter einzeln wahrgenommen werden und zu einer kontinuierlichen Fläche verschwimmen. Ähnlich wie in der akustischen Wahrnehmung mit einer typischen maximalen Frequenz von ca. 20 kHz existiert beim Sehen eine Grenze der Auflösung, die über einen minimalen Raumwinkel von δ = 1,5’ (Winkelminuten) beschrieben wird, bei dem zwei benachbarte Lichtpunkte beim Betrachter gerade zu einem Punkt zu verschmelzen scheinen. Benachbarte Zeilen sollten daher mindestens unter diesem Raumwinkel gesehen werden, da ansonsten die Zeilenstruktur eines Videobildes erkennbar ist und störend wirkt. Denkt man sich in Zeilenrichtung weiterhin das Bild in einzelne Punkte zerlegt, ergibt sich eine zweidimensional gerasterte Wiedergabe. Diese Bildpunkte werden englisch Picture Elements oder abgekürzt Pixel genannt. Grundsätzlich können die Pixelabmessungen mit ∆x und ∆y durchaus unterschiedlich groß sein. Im Folgenden ist aber zunächst von quadratischen Bildpunkten auszugehen, so dass sich der Zeilenabstand ∆y identisch mit dem horizontalen Bildpunktabstand ∆x ergibt. Grenzauflösung des Auges: mit pw - sichtbare Bildbreite (picture width) ph - sichtbare Bildhöhe (picture height) Grenzauflösungswinkel: δ = 1,5’ Typischer Betrachtungsabstand: a = (4...5) ⋅ ph (4...5 mal Bildhöhe) 25 Prof. Dr.-Ing. W.-P. Buchwald Zeilenzahl: Moderne Medientechnik z= ph ph a tan(α ) α = ≈ = ⋅ ∆y a ∆y tan(δ ) δ Die Zeilenstruktur wird vom Auge gerade nicht mehr wahrgenommen (Grenzauflösung). Mit dem typischen Betrachtungsabstand von ca. 4...5 x Bildhöhe ph ergibt sich ein Betrachtungswinkel von ca. α ≈ 15° und damit die endgültig notwendige Zeilenzahl z≈ α 15° 15 = = ⋅ 60 = 600 δ 1,5' 1,5 Die elektronische analoge Darstellung eines Bildes erfolgt durch das zeilensequentielle Abtasten von links nach rechts und von oben nach unten, indem die Helligkeit je nach Grauwert als Spannung zwischen 0 und 0,7V = 700mV beschrieben wird. Bildabtastung: Zeilensignal: Das resultierende Videosignal entspricht also in zeitlicher Richtung der horizontalen Helligkeitsverteilung in einer Zeile. Vertikal benachbarte Zeilen werden dabei zeitlich nacheinander übertragen. 26 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Zur Festlegung der notwendigen Übertragungsbandbreite eines analogen Videosignals ist die Berechnung der oberen Grenzfrequenz erforderlich. Hierzu muss zunächst das Bildseitenverhältnis bekannt sein, mit der dann auch die Gesamtzahl der Pixel eines Bildes festliegt. Bildseitenverhältnis: pw : ph = 4 : 3 (klassisch, aktuell typisch 16 : 9) Pixel pro Zeile: ρx = z ⋅ Pixel pro Bild: ρ = ρx ⋅ z = z2 ⋅ Videobandbreite: Die höchste Signalfrequenz ergibt sich, wenn abwechselnd die horizontal benachbarten Bildpunkte schwarz und weiß auftreten. Zwei Punkte beschreiben dann eine Grundwelle, die die maximale Signalfrequenz bzw. Bandbreite oder Grenzfrequenz darstellt. Zeitliche Periode: Tg = 2 ⋅ Grenzfrequenz: fg = pw ph TH ρx = 2⋅ pw ph TH z ⋅ pw ph 1 1 pw = ⋅z⋅ ⋅ fH Tg 2 ph 27 also ca. ρ = 600 2 ⋅ mit mit 4 = 480000 3 TH - Zeilendauer fH = 1 (Zeilenfrequenz) TH Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Die Videogrenzfrequenz hängt damit neben der Zeilenzahl und dem Bildseitenverhältnis vor allem von der Zeilenfrequenz ab. Vordergründig ist allerdings nicht die Zeilenfrequenz von Bedeutung, sondern die Bildfrequenz, d.h. die Anzahl der Einzelbilder pro Sekunde (vergleichbar mit dem Film). Der Zusammenhang zwischen Zeilen- und Bildfrequenz lässt sich einfach über die entsprechenden reziproken Größen Zeilendauer und Bilddauer angeben, denn die Bilddauer entspricht anschaulich der Zeilendauer multipliziert mit der Anzahl der Zeilen. Bildfrequenz: fB = 1 TB mit TB - Bilddauer Zeilenfrequenz: fH = 1 TH mit TH - Zeilendauer Zusammenhang: TB = z ⋅ TH bzw. fH = z ⋅ fB Mit dieser Beziehung lässt sich schließlich die Videogrenzfrequenz vor allem in Abhängigkeit von der Bildfrequenz und der Gesamtpixelzahl ρ angeben. Grenzfrequenz: fg = 1 2 pw 1 ⋅z ⋅ ⋅ fB = ⋅ ρ ⋅ fB ph 2 2 Mit der oben stehenden Grundformel lässt sich der Bandbreitebedarf eines Videosystems bei analoger Signalübertragung angeben. Dies ist darüber hinaus nicht auf Fernsehen beschränkt, sondern gilt auch für PC-Monitore bei analoger Ansteuerung über VGA (Video Graphics Array - analoge PC-Monitorschnittstelle), die mit sehr unterschiedlichen Grafikstandards betrieben werden. Beispiele: Video: (SD Auflösung) Zeilenzahl z=625 Bildfrequenz fB=25Hz fg = 1 4 ⋅ 6252 ⋅ ⋅ 25Hz = 6,51MHz 2 3 PC Standard VGA: (640 x 480) Zeilenzahl z=480 Bildfrequenz fB=60Hz fg = 1 4 ⋅ 4802 ⋅ ⋅ 60Hz = 9,22MHz 2 3 PC Standard XGA: (1024 x 768) Zeilenzahl z=768 Bildfrequenz fB=85Hz fg = 1 4 ⋅ 7682 ⋅ ⋅ 85Hz = 33,42MHz 2 3 PC Standard HD1080 (1920 x 1080) Zeilenzahl z=1080 Bildfrequenz fB=60Hz fg = 1 16 ⋅ 10802 ⋅ ⋅ 60Hz = 62,21MHz 2 9 28 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Zeilensprung (englisch: interlace): Vollbild 1. Teilbild 2. Teilbild Kantenflackern (25Hz Störung - nur bei Bildröhren) Vorteile Zeilensprung: - Verdopplung des Großflächenflimmern von 25Hz auf 50Hz bei gleichbleibender Videobandbreite und Zeilenfrequenz, war allerdings nur relevant bei Wiedergabe mit Bildröhren - verdoppelte Bewegungsauflösung mit 50Hz Nachteile Zeilensprung: - an horizontal verlaufenden Kanten (in vertikaler Richtung verlaufende Helligkeitssprünge) verbleibende 25Hz Flimmerstörung (Kantenflackern), nur relevant bei Bildröhren - Abgespeicherte Vollbilder enthalten bei Objekten ausgerissene Kanten (siehe Kapitelende) Randbemerkungen zur subjektiven Flimmerwahrnehmung des Auges Flimmern wird mit zunehmender Frequenz der Helligkeitsänderung immer weniger störend wahrgenommen. Es ergibt sich hier eine Art Tiefpasseigenschaft des Auges vergleichbar der Auflösung von feinen Details oder dem Hören hoher Tonfrequenzen. Zusätzlich ist die Flimmerempfindung nichtlinear von der zugehörigen Helligkeit abhängig. Je dunkler eine flimmernde Lichtquelle ist, desto weniger wird das Flimmern stören. Diese Effekte waren von großer Bedeutung beim Einsatz von Bildröhren in TV-Empfängern und PC-Monitoren. 29 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Dennoch fällt auf, dass im Bereich der PC-Monitore früher eine Bildwiederholrate von sogar 60Hz als absolut unzureichend empfunden wurde, während das europäische 50Hz Fernsehsystem jahrzehntelang akzeptiert wurde. Der Grund liegt in der wiederum nichtlinearen Abhängigkeit der Flimmerempfindlichkeit des Auges vom Raumwinkel. Im zentralen Sehen (kleiner Betrachtungswinkel, fernsehtypisch) weist das Auge eine gute Auflösung bei geringerer Flimmerempfindlichkeit auf. Im sogenannten peripheren Sehen (großer Raumwinkel, z.B. geringer Abstand zum PC-Monitor) ist die Auflösung am Rand schlecht, jedoch eine hohe Flimmerempfindlichkeit gegeben. Dies basiert auf typischen Schutzmechanismen, indem auf eine Gefahr von der Seite (Helligkeitsänderung durch Objekt) schnellstmöglich reagiert werden muss, wohingegen feine Details im Augenwinkel diesbezüglich ohne Bedeutung sind und auch nicht erkennbar sind. Einfluss unterschiedlicher Betrachtungsabstände auf die resultierende Flimmerwahrnehmung (nur relevant bei Bildröhren) Bewegungsartefakte beim Zeilensprung Der Vorteil der hohen Bewegungsauflösung beim Fernsehen durch die 50Hz Teilbildabtastung liefert bei Standbildwiedergabe von Vollbildern das Problem ausgerissener Kanten. Dort werden die verkämmten Teilbilder wieder sichtbar, die an bewegten Konturen natürlich kein fehlerfreies Vollbild ergeben, sondern eine Doppelkontur mit deutlicher vergröberter Zeilenstruktur. 30 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Im realen Videobild äußert sich dieser Effekt an allen bewegten Details. Es zeigen sich aufgerissene Kanten in der Breite der Bewegungsdistanz, die zwischen zwei Teilbildern (20ms) auftritt. Bei normaler Betrachtung im bewegten Videobild sind diese Störungen nicht kritisch, da das Auge der Bewegung nachfolgt. Beim Herausgreifen eines Vollbildes jedoch ist der beschriebene Effekt deutlich störend und muss durch Nachverarbeitung (Interpolation) unterdrückt werden. 31 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik 2.2 Farbbild-Darstellung Eine farbige Vorlage wird durch drei Farbauszüge ROT, GRÜN und BLAU (abgekürzt RGB) beschrieben, die bei der Wiedergabe additiv überlagert werden. Kameraseitig wird dazu das Bild durch optische Farbfilter bzw. dichroitische Spiegel (Strahlenteiler) in die genannten Farbauszüge zerlegt und parallel abgetastet. Am Kameraausgang sind drei für RGB vorhanden. Diese elektronische Farbbilddarstellung nennt man Komponentenformat im Gegensatz zum Composite-Format, wie es zur analogen Übertragung mit PAL, NTSC oder SECAM verwendet wird, wenn RGB in einem einzigen Signal verschachtelt wird (analoge Farbcodierung). Die RGB-Signale der Kamera weisen klassisch bei Standardauflösung (SD-Format) jeweils identisch 5 MHz Grenzfrequenz auf. Für eine Übertragung wäre also grundsätzlich die dreifache Bandbreite im Vergleich zu einem Schwarzweiß-Signal erforderlich. 32 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Ein wichtiges Testsignal in der Farbfernsehtechnik stellt das Farbbalkentestsignal dar, das alle Kombinationen von Rot, Grün und Blau jeweils mit den Pegeln 0 und 100% (analog: 0V und 0,7V) zeigt. Farbbalkentestsignal: Hieraus sind auch einige Grundeigenschaften bei der hier vorliegenden additiven Farbmischung zu erkennen: Weiß ergibt sich aus der Summe von maximal Rot, Grün und Blau. Komplementärfarben zu diesen Grundfarben definieren sich aus der Summe der jeweils anderen beiden Grundfarben, so dass Grundfarbe plus zugehöriger Komplementärfarbe ebenfalls Weiß ergibt. 33 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Additive Farbmischung: Weiß = R + G + B Grau = R + G + B mit R=G=B=1 (normiert) mit R=G=B= 0....1 Komplementärfarben: Rot - Cyan Cy = G + B R + Cy = Weiß Grün - Purpur Pp = R + B G + Pp = Weiß Blau - Gelb Ge = R +G B + Ge = Weiß Neben der Möglichkeit, ein Farbbild mit den Grundfarben Rot, Grün und Blau zu beschreiben, ist die Darstellung mit einem Schwarzweißanteil (Leuchtdichte oder Luminanz Y) und zwei Farbartkomponenten (Chrominanz) besonders günstig, da hier eine sehr gute Anpassung an das menschliche Sehvermögen gegeben ist. Auch das Auge unterscheidet mit seinen Sehnerven nach Schwarzweiß- und Farbartempfindung entsprechend Stäbchen und Zapfen auf der Netzhaut des Auges. Die Helligkeitsempfindung des Auges folgt einer glockenförmigen Kurve über der Lichtwellenlänge im sichtbaren Farbspektrum zwischen ca. 400 und 700nm Wellenlänge. Basierend hierauf ergibt sich eine relative Helligkeitsempfindung für Rot von 30%, für Grün von 59% und für Blau von 11%. Damit lässt sich schließlich der Schwarzweißanteil oder die Luminanz aus einem RGB-Bild berechnen. Die beiden anderen Anteile, die die Chrominanz beschreiben, werden als sogenannte Farbdifferenzsignale ebenfalls aus RGB abgeleitet. Spektrale Empfindlichkeit des Auges: Zapfen (rote, grüne und blaue Kurve) Stäbchen (gestrichelte Kurve) Quelle: https://de.wikipedia.org/wiki/Stäbchen_(Auge) 34 Prof. Dr.-Ing. W.-P. Buchwald Farbmatrix: Moderne Medientechnik Eine Umformung mit einem linearen Gleichungssystem führt auf die genannten drei alternativen Größen, die zudem in Anpassung an die Augencharakteristik weniger Gesamtbandbreite beanspruchen, ohne den subjektiven Bildeindruck zu beeinträchtigen, da die Chrominanz mit geringerer Auflösung dargestellt und übertragen werden kann, weil die Auflösung des Auges für die Chrominanz deutlich geringer ist als für die Luminanz. Y = 0,3⋅R + 0,59⋅G R-Y = 0,7⋅R - − 0,59⋅G B-Y = − 0,3⋅R − 0,59⋅G + 0,11⋅B − 0,11⋅B + 0,89⋅B Luminanz Y: Die Luminanz Y entspricht dem Schwarz/Weiß-Auszug eines Bildes. Die Bandbreite beträgt für Standard TV (SD) 5MHz. Der subjektive Schärfeeindruck eines Farbbildes liegt in der Hauptsache in der Luminanzauflösung begründet. Chrominanz C: Die beiden Chrominanzkomponenten beschreiben zusammen die Farbe des Bildinhaltes. Durch die verminderte Farbauflösung des menschlichen Auges lässt sich eine reduzierte Chrominanzbandbreite rechtfertigen, so dass eine Luminanz/Chrominanz-Bildbeschreibung mit geringerer Gesamtbandbreite bzw. Datenrate auskommt. 35 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik RGB- und Y/C-Signale beim Farbbalken: 36 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Trägt man die beiden Farbdifferenzsignale in einem orthogonalen Koordinatensystem als Achsen ein, so ergibt sich eine Ebene, die alle unterschiedlichen Farben enthält. Hierbei lässt sich die Farbsättigung als proportional zum Abstand vom Ursprung angeben, während der Farbton durch den Winkel gegen die Abszisse gegeben ist. Eingesetzt sind exemplarisch die Farborte des vorher diskutierten Farbbalkentestbildes. Dabei ergibt sich für Rot (R=1; G=0; B=0) mit der zugehörigen Luminanz Y=0,3 ein Wertepaar von R - Y = 1 - 0,3 = 0,7 B - Y = 0 - 0,3 = -0,3 37 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik 2.3 Digitale Videotechnik 2.3.1 Digitale Videonorm Taktfrequenzen: Luminanz Y Chrominanz R-Y Chrominanz B-Y faY = 13,5 MHz faR-Y = 6,75 MHz faB-Y = 6,75 MHz Die Chrominanz wird so vorgefiltert (Tiefpass), dass mit halber Abtastrate gegenüber Luminanz gearbeitet werden kann. Aussteuerung: Die Aussteuerungswerte hinter der Farbmatrix ergeben sich zunächst zu Luminanz Y 0,7 V 0V für weiß für schwarz Chrominanz R-Y (auch V genannt) 0V ± 0,49 V für unbunt für max. Sättigung Chrominanz B-Y (auch U genannt) 0V ± 0,62 V für unbunt für max. Sättigung Für die A/D-Wandlung werden alle drei Komponenten auf den gleichen Spannungshub skaliert. Die Chrominanz wird dabei durch einen Gleichspannungsoffset in positive Spannungswerte verschoben, so dass der Unbunt-Wert bei halber Aussteuerungsamplitude liegt. Luminanz Y Chrominanz R-Y Chrominanz B-Y Digitalisierung: uss = 0,7 V uss = 0,7 V uss = 0,7 V } an 75 Ω Die Digitalisierung erfolgt einheitlich jeweils mit 8 Bit Quantisierung (linear). Komponente Luminanz Y Bandbreite 5 MHz Chrominanz R-Y 2,5 MHz Chrominanz B-Y 2,5 MHz Abtasttakt Aussteuerung 13,5 MHz 0,7 V 0V 6,75 MHz 0,7 V 0,35 V 0V 6,75 MHz 0,7 V 0,35 V 0V 38 digitaler Wert 255 0 255 128 0 255 128 0 Signalinhalt weiß schwarz max. Sättigung unbunt max. Sättigung max. Sättigung unbunt max. Sättigung Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Während die Abtastung des Videosignals durch die ausreichend hohe Abtastfrequenz bei angepassten analogen Vor- und Nachfiltern keinerlei Beeinträchtigung für das resultierende Bild darstellt, führt die notwendige Quantisierung grundsätzlich zu einem Fehler, der sich als Quantisierungsrauschen dem Nutzsignal überlagert. Durch geeignet hohe Bitbreite der A/DWandler kann allerdings die Sichtbarkeit des Quantisierungsfehlers unter die subjektive Erkennbarkeitsgrenze gedrückt werden. Dies ist für m=8bit entsprechend n=28=256 Graustufen sichergestellt. A/D-Wandler-Kennlinie: ws uq ∆q sw u Datenrate: Luminanz Chrominanz gesamt bY = m ⋅ f aY = 8bit ⋅ 13,5MHz = 108Mbit/s bC = 2 ⋅ m ⋅ f aC = 2 ⋅ 8bit ⋅ 6,75MHz = 108Mbit/s b = 2 ⋅ 108Mbit/s = 216Mbit/s Kritisch sind Bildinhalte mit flachen Grauverläufen, die bei zu geringer Quantisierung zum sogenannten Contouring führen. Die Abstufungen zwischen den Grauwertniveaus erscheinen als deutlich sichtbare Kantenverläufe. In realen Vorlagen ist allerdings bedingt durch geringfügige Rauschüberlagerung die Sichtbarkeit des Contourings häufig nicht so kritisch wie im Testbild (Dithereffekt, Verwischen der Quantisierungskonturen). Quantisierungsfehler beim Graukeiltestbild 8bit (256 Graustufen) 4bit (16 Graustufen) 39 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Quantisierungsfehler beim realen Bild 8bit (256 Graustufen) 4bit (16 Graustufen) Contouring 3bit (8 Graustufen) 2bit (4 Graustufen) Bei zu geringer Quantisierung kann die Dithertechnik durch vorheriges künstliches Verrauschen des Analogbildes genutzt werden, um über die geometrische Mittelung benachbarter Pixel Zwischenwerte für die begrenzten Grauwerte zu simulieren. 2bit (4 Graustufen mit Dither) 1bit (2 Graustufen mit Dither) Offsetdarstellung (1bit, faksimile) 40 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik Quantisierungsfehler beim realen farbigen Bild 3x8=24bit (3x256 Graustufen) 3x4=12bit (3x16 Graustufen) 3x2=6bit (3x4 Graustufen) 3x1=3bit (3x2 Graustufen) Mit Dithertechnik 3bit (8 Farben gleichabständig) 3bit (8 Farben angepasst an Häufigkeit) Anstelle einer linearen Quantisierung kann insbesondere bei Einzelbildern (Scans, digitale Fotos) eine angepasste Quantisierung verwendet werden. Dabei werden die häufigsten Farbwerte eines Bildes als Repräsentativwerte bei der Quantisierung verwendet, so dass der resultierende Fehler durch die Quantisierung minimiert wird. 41 Prof. Dr.-Ing. W.-P. Buchwald Moderne Medientechnik 2.3.2 Datenreduktion 42