Skript - public.fh-wolfenbuettel.de

Werbung
Moderne Medientechnik
Prof. Dr. Wolf-Peter Buchwald
Inhalt
Einleitung .................................................................................................................................. 1
1.
Audio .................................................................................................................................. 2
1.1
Grundlagen .............................................................................................................. 2
1.2
Digitale Audiotechnik ............................................................................................. 8
1.2.1 Digitalisierung ............................................................................................. 8
1.2.2 Datenreduktion .......................................................................................... 11
1.2.3 MIDI .......................................................................................................... 15
1.2.4 Digitale Audioübertragung ........................................................................ 18
1.3
Audioaufnahme und -wiedergabe ......................................................................... 20
1.3.1 Aufnahme .................................................................................................. 20
1.3.2 Wiedergabe ................................................................................................ 23
2.
Video ................................................................................................................................. 25
2.1
Grundlagen ............................................................................................................ 25
2.2
Farbbild-Darstellung ............................................................................................. 32
2.3
Digitale Videotechnik............................................................................................ 38
2.3.1 Digitale Videonorm ................................................................................... 38
2.3.2 Datenreduktion .......................................................................................... 42
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Einleitung
Medien sind Bestandteil des alltäglichen Lebens von frühesten Zeiten an beginnend mit geschriebenen oder gezeichneten bzw. gemalten Darstellungen über Druckerzeugnisse und
schließlich der Möglichkeit elektronischer Präsentation von akustischen Informationen sowie
statischen und bewegten Bildern. Die moderne Medientechnik nutzt hierbei die Möglichkeiten
der Digitalisierung. Hier stehen Fragen der Aufnahme, Speicherung, Übertragung und Wiedergabe im Vordergrund.
Ausgehend von den Gegebenheiten der analogen Grundlagen sollen vordergründig die Audiound Videotechnik sowie die digitale Fotografie behandelt werden.
Audiotechnik
Schallwahrnehmung des Menschen
Sprache und Musik
Telefon
Rundfunk
Speicher
Schnittstellen, Aufnahme, Wiedergabe
Videotechnik
Auflösungsvermögen des Auges
Bildfeldzerlegung
Farbe
Übertragung
Speicher
Schnittstellen, Kamera, Monitor
Fotografie
Bildsensoren
Bildverarbeitung
elektronische Bildwiedergabe, Ausdruck
1
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
1. Audio
1.1 Grundlagen
Eigenschaften des menschlichen Gehörs:
• Frequenzbereich bzw. Frequenzgang
• Dynamik bzw. Amplitudenbereich
Hörphysiologie:
• Empfindung der Lautstärke bei unterschiedlichen Frequenzen als Funktion des Schalldruckes
• untere und obere Begrenzung (Hörschwelle
und Schmerzgrenze)
Schalldruck:
p
Schalldruckpegel:
L p = 20 ⋅ log
Hörschwelle:
p0 = 20µPa = 2 ⋅ 10−5 Pa
(bei 1 kHz)
Schalldruckpegel bei 1 kHz:
L = L p (1kHz)
in Phon
Schmerzgrenze:
120 Phon
p
p0
bzw.
in dB
106 ⋅ p0 = 20Pa
Hörfläche:
Quelle: https://de.wikipedia.org/wiki/Phon_(Einheit)
2
Prof. Dr.-Ing. W.-P. Buchwald
Lautheit
Moderne Medientechnik
Die Lautheit wird in Sone angegeben. Sie berücksichtigt
einen nichtlinieren Zusammenhang zwischen der subjektiven Lautstärkeempfindung und dem Phonwert bei kleineren Schalldruckpegeln
Quelle: https://de.wikipedia.org/wiki/Phon_(Einheit)
Akustische Bewertungskurven
Die Bewertungskurven beschreiben den Hörfrequenzgang
und dienen für die messtechnische Beschreibung von Audiosignalen unter Einbeziehung subjektiver Empfindungen.
A:
B:
C:
D:
Bereich 20 bis 40 Phon
Bereich 50 bis 70 Phon
Bereich 80 bis 90 Phon
Bereich oberhalb 90 Phon
Typische Anwendung ist die
A-Bewertung. Ein aufgenommenes
Audiosignal wird beispielsweise
mit einem Filter gemäß AÜbertragungsfunktion gefiltert
bzw. bewertet und der resultierende Pegel in dB(A) angegeben.
Quelle: https://de.wikipedia.org/wiki/Frequenzbewertung
3
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Menschliche Stimme:
• nichtperiodisch (Konsonanten)
• periodisch (Vokale)
Stimmbildung:
• Grundwellenerzeugung (Impulsfolge)
• Spektrale Formung durch Mund-Nasenraum
Stimmerzeugung durch Impulsfolge:
zugehöriges Spektrum:
geformtes Spektrum:
Vokale:
werden charakterisiert durch unterschiedliche
Lage und Form der Formanten
Grundwellenfrequenz f0 ist für die Spracherkennung nicht wichtig, unterschiedlich vor allem
zwischen Mann (typisch 130 Hz) und Frau (typisch 240 Hz)
Sprachverständlichkeit:
wichtig für die Telekommunikation
Optimierung: gute Verständlichkeit bei möglichst
kleiner Bandbreite
absolute Silbenverständlichkeit:
„sinnlose“ Silben werden korrekt verstanden
relative Silbenverständlichkeit:
normale sinnhafte Silbenabfolge
eine ca. 70%ige absolute Silbenverständlichkeit
entspricht einer 100%ige relativen Silbenverständlichkeit (nicht verstandene Silben können
durch den Zusammenhang interpoliert werden)
4
Prof. Dr.-Ing. W.-P. Buchwald
Telefonbandbreite:
AM-Rundfunk:
Moderne Medientechnik
klassisch minimal zu übertragende Frequenzanteile (analoge Telefonie):
untere Grenzfrequenz:
f gu = 300Hz
obere Grenzfrequenz:
f go = 3400Hz
obere Grenzfrequenz:
f go = 4500Hz
hier wurde die obere Grenzfrequenz etwas erhöht,
da hier nicht nur Sprache bzw. Sprachverständlichkeit im Vordergrund stand, sondern auch Musikübertragung
FM-Rundfunk:
obere Grenzfrequenz:
f go = 15000Hz
Ziel ist eine naturgetreue Wiedergabe aller
Audioquellen (High Fidelity, HiFi)
Stereo-Übertragung im FM-Band:
die Rechts- und Links-Information wird mittels
Frequenzmultiplex zu einem Signal zusammengefasst und dann frequenzmoduliert übertragen
1. Schritt: Matrizierung
2. Schritt: Modulation (Frequenzmultiplex)
5
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Analoge Speicherung:
• Schallplatte (i.a. nur Wiedergabe)
• Magnettonband (Aufnahme und Wiedergabe)
Tonband:
Grenzfrequenz abhängig von der Bandgeschwindigkeit
Verringerung von Bandrauschen:
• optimale Aussteuerung (hoher Signalpegel)
• Einsatz von Pre- und Deemphase
• Kompandierungsverfahren (analoges Dolby)
Rauschüberlagerung vom Band:
Rauschverminderung durch Pre-/Deemphase:
6
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Dolby Rauschreduktionssystem (analog):
Rauschreduktion basiert auf einer Kompandierung, i.a. in einem höheren Frequenzbereich
Kompandierung = Kompression und Expansion
Vor der Aufnahme werden z.B. bei Dolby B alle
Frequenzen oberhalb von 1 kHz in Abhängigkeit
von der Amplitude so verstärkt, dass kleine Pegel
mehr angehoben werden als größere Pegel.
Dadurch wird die Dynamik komprimiert. Im Ergebnis wird praktisch das Band bei der Aufnahme
stärker ausgesteuert.
Bei der Wiedergabe muss die pegelabhängige
Verstärkung wieder exakt gegenläufig zum Kompressor arbeiten (Expandierung), um den ursprünglichen Amplitudenwert der aktuellen Einhüllenden zu erhalten.
Beispiel:
ursprüngliches Testsignal
nach der Kompression
Zu beachten ist, dass die einzelnen Sinusschwingungen nach wie vor Sinusform aufweisen
und nicht verzerrt werden, da die Kompression nicht auf die Momentanwerte wirkt, sondern
mit einer gewissen Zeitkonstante nur auf die Hüllkurve.
wesentliche Dolby Versionen:
Dolby B
bis ~10 dB
Rauschunterdrückung
Dolby C
bis ~20 dB
Rauschunterdrückung
Dolby SR
bis ~24 dB
Rauschunterdrückung
7
Auch Dolby NR genannt,
große Verbreitung (u.a.
Compact Cassette), wirkt nur
ab ca. 1 kHz
Zwei Kompressoren hintereinander
Professionelles System für
Studioanwendungen, mehrere Frequenzbänder mit variablen Übergangsfrequenzen
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
1.2 Digitale Audiotechnik
1.2.1 Digitalisierung
Abtasttheorem:
Anforderung Telefon:
fa ≥ 2 f g
Die Grenzfrequenz beim analogen Telefonsignal
beträgt 3,4 kHz. Sie wird aufgerundet auf 4 kHz
und wird mit diesem Wert als Nyquistfrequenz
bei der Abtastung festgelegt.
Nyquistfrequenz entspricht halber Abtastfrequenz
fNyq = ½ fa
Abtastrate:
f a = 2 ⋅ 4kHz = 8kHz
Abtastspektrum:
Quantisierung:
m = 8bit
entspricht n = 2m = 28 = 256 Amplitudenstufen
Durch die Quantisierung wird ein Rundungsfehler eingeführt, der irreversibel ist. Da dieser Fehler wie überlagertes Rauschen klingt, spricht man
auch von Quantisierungsrauschen. Mit 8 Bit ist
diese Störung etwa angepasst an das typische
Signal/Rauschverhältnis von analogen Telefonsignalen.
Dynamik:
D = m ⋅ 6dB
Die Dynamik beschreibt logarithmisch das Verhältnis zwischen maximalem Spitzenwert und
dem Spitzenwert des Quantisierungsfehlers in dB.
8
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Datenrate:
b = m ⋅ f a = 8bit ⋅ 8kHz = 64kbit/s
(klassischer ISDN-Kanal)
Anforderung digitales Audio:
Für qualitativ hochwertige Audioaufnahme und
Wiedergabe (vgl. frühere HiFi-Norm) muss sowohl eine höhere Bandbreite als auch ein besserer
Störabstand mit Blick auf das Quantisierungsrauschen bzw. der Anzahl der Bits pro Abtastwert zu
Grunde gelegt werden.
Bandbreite:
16Hz - 20.000Hz
(vgl. UKW und analoges TV: 50Hz - 15.000Hz)
Quantisierung:
m = 16bit
Compact Disk:
optische digitale Speicherung
(für Speicherung und Wiedergabe
ausreichend, für Aufnahme und
Verarbeitung häufig deutlich mehr,
bis 24 bit)
fa=44,1kHz
DAT-Recorder:
digitale Speicherung auf Magnetband
fa=48kHz
Überabtastung:
Um analoge Vorfilter hoher Ordnung zu vermeiden, die zur Vermeidung von Unterabtasteffekten
erforderlich sind (Alias), kann mit deutlich höherer Abtastrate gearbeitet werden. Das Vorfilter
kann dann als digitales Filter ausgeführt werden,
danach kann intern auf die ursprünglich erforderliche Abtastrate gewandelt werden.
typische Überabtastung:
88,2kHz = 2 ⋅ 44,1kHz
96kHz = 2 ⋅ 48kHz
192kHz = 4 ⋅ 48kHz
Oversampling:
Begriff entspricht zwar im Englischen dem Wort
„Überabtastung“, meint jedoch speziell bei CDPlayern oder allgemein bei D/A-Wandlern das
nachträgliche Interpolieren der vorhandenen Datenrate auf ein Vielfaches von 44,1kHz. Damit
wird die Anforderung an das analoge Nachfilter
zur Oberwellenunterdrückung geringer.
9
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Beispiel: 2-fach Oversampling
Nach Auslesen der Daten von der CD mit der
Abtastrate fa=44,1kHz wird das abgetastete Signal auf 2fa=88,2kHz interpoliert, z.B. durch Einfügen von 0 zwischen den Abtastwerten oder
durch wiederholen des vorhergehenden Abtastwertes. Ein folgendes digitales Tiefpassfilter arbeitet jetzt aber mit 2fa Arbeitstakt und kann eine
Übertragungsfunktion realisieren, die erst mit 2fa
periodisch ist. Damit kann das erste Oberwellenband um fa unterdrückt werden. Hinter dem D/AWandler braucht das Nachfilter damit erst das
Oberwellenband um 2fa zu unterdrücken, seine
Filterflanke kann entsprechend breiter und das
Filter somit einfacher aufgebaut sein.
Datenraten:
CD Stereo
b = 2 ⋅ 16bit ⋅ 44,1kHz = 1411,2kbit/s
(entspricht 176,4 kByte/s)
DAT Stereo
b = 2 ⋅ 16bit ⋅ 48kHz = 1536kbit/s
(entspricht 192 kByte/s)
Diese Datenraten entsprechen dem Audiosignal
ohne jegliche Kompression. Zwischen A/DWandler und D/A-Wandler ergibt sich als einzige
Beeinflussung nur ein additives Quantisierungsrauschen von mit einer Dynamik von D=96dB.
Dies ist i.a. geringer als das bereits analog vorhandene Rauschen.
10
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
1.2.2 Datenreduktion
Verfahren zur Datenreduktion werden allgemein unter dem Begriff Quellencodierung zusammengefasst. Hier unterscheidet man zwischen verlustlosen und verlustbehafteten Prinzipien.
Verlustlose Datenreduktion:
z.B. zip-Archiv
Komprimierte Dateien bzw. Signale können fehlerfrei wieder rekonstruiert werden, die Kompressionsrate ist je nach Datei oder Signal relativ begrenzt (Beispiel für eine Audiodatei: Reduktion
nur von wenigen % möglich) . Hier wird weiterhin unterschieden:
• Irrelevante Information
Zeichen, die beim Empfänger unbekannt sind,
(entspricht bei analoger Signaldarstellung einer
größeren Signalbandbreite als für den Empfänger
sinnvoll, z.B. Audiosignalbandbreite über
20kHz).
• Redundante Information
Zeichen, die vorhersagbar sind. Information, die
mehrfach in einer Nachricht enthalten ist und somit bereits grundsätzlich bekannt ist. Redundante
Nachrichten haben den Vorteil, störunempfindlich zu sein, da verfälschte Informationen rekonstruiert oder zumindest erkannt werden können.
(Beispiel: die Sprache enthält nicht alle mathematisch möglichen Buchstabenkombination für Silben und Wörter, sondern nur eine kleine Auswahl, so dass ein Fehler i.a. erkannt und korrigiert werden kann: „FACHHOCHSCHXLE“ ist
eindeutig fehlerfrei rekonstruierbar)
Verlustbehaftete Datenreduktion:
mp3, jpg, MPEG
Das Originalsignal bzw. die Datei wird irreversibel verändert, es geht somit Information verloren.
Die dadurch eingefügten Fehler führen aber zu
Störungen, die subjektiv möglichst wenig bis gar
keine Beeinträchtigung der Signalqualität darstellen (Überdeckungseffekt).
11
Prof. Dr.-Ing. W.-P. Buchwald
Überdeckungseffekt bei Audio
Moderne Medientechnik
Ein lauter Ton der Frequenz f0 überdeckt einen
Ton mit einer ähnlichen Frequenz f1=f0+∆f, so
dass dieser nicht mehr wahrgenommen werden
kann. Je kleiner der Frequenzunterschied ∆f ist,
desto größer kann die Amplitude der Schwingung
mit f1 sein, ohne dass man sie hören kann. Man
spricht bei diesem Effekt auch von Maskierung.
Die Hörschwelle wird damit im Bereich eines
Audiospektrums mit großer Leistung angehoben.
Quelle: https://de.wikipedia.org/wiki/Maskierungseffekt
Dieser Maskierungs- bzw. Überdeckungseffekt
ist der wesentliche Kern aller verlustbehafteten
Datenreduktionsverfahren für Audiosignale, indem spektrale Bereiche in der Nachbarschaft von
leistungsstarken Frequenzbereichen gröber quantisiert werden können (weniger Bits!), wobei der
resultierende größere Quantisierungsfehler überdeckt bzw. maskiert wird und somit nicht hörbar
ist.
12
Prof. Dr.-Ing. W.-P. Buchwald
MP3 Verfahren
Moderne Medientechnik
Entstammt dem digitalen Videokompressionsstandard MPEG 1 (Moving Pictures Expert
Group) und ist als Audiokompression dort in verschiedenen sogenannten Layern definiert
MPEG-1 Audio Layer I
MPEG-1 Audio Layer II
MPEG-1 Audio Layer III (das eigentliche MP3)
während für MPEG-2 ein Kompressionsverfahren
für Audio mit dem Namen AAC standardisiert ist
(Advanced Audio Coding).
MPEG-1 Audio Layer I
Beispiel Abtastrate 48 kHz entsprechend
Nyquistfrequenz 24 kHz
Aufteilung des Audiosignals in 32 Frequenzbänder (Filterbank)
Bandbreite je Band: 24 kHz/32=750Hz
Unterabtastung je Band mit 1,5 kHz
(ergibt jeweils ein Basisband 0…750 Hz)
12 Abtastwerte pro Band ergeben parallel mit
allen 32 Bändern insgesamt 384 Abtastwerte, die
ein Frame bilden
Parallel zur Filterbank wird das Audiosignal mit
einer 512-FFT analysiert. Die vorliegenden
Amplituden dieser Frequenzanteile steuern zusammen mit den Ausgangssignalen der einzelnen
Bänder über ein psychoakustisches Modell die
Quantisierung der Ausgangssignale der einzelnen
Bandpässe. Signale aus einem benachbarten
Band, in dem eine große Amplitude vorliegt,
werden wegen des Überdeckungseffekts gröber
quantisiert oder ggf. gar nicht mehr übertragen.
Dies ist die eigentliche Datenreduktion.
13
Prof. Dr.-Ing. W.-P. Buchwald
MPEG-1 Audio Layer II
Moderne Medientechnik
auch MUSICAM genannt
(Masking-pattern adapted Universal Subband
Integrated Coding and Multiplexing)
FFT mit 1024 Abtastwerten
Verwendung von 3 Frames:
3x12x32=1252 Abtastwerte
MPEG-1 Audio Layer III
als MP3 bekannt
die 32 Frequenzbänder sind mit zunehmender
Frequenz breiter (angepasst an die subjektiven
Höreigenschaften)
FFT mit 1024 Abtastwerten
Abtastwerte aus der Filterbank werden einer Modifizierten Diskreten Cosinus Transformation
(MDCT) unterzogen. Im Unterschied zur normalen DCT überlappen sich die benachbarten Blöcke um 50% ihrer Breite
Stereokomprimierung:
Joint-Stereo Verfahren (typisch)
Matrizierung der Rechts/Links Signale zu
Rechts+Links (mono) und Rechts-Links (Diff.)
Monosignal:
Differenzsignal:
14
wesentliche Datenrate
kleine Datenrate
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Übersicht und Vergleich (Basis: resultierende Qualität mit CD vergleichbar):
MPEG-1 Layer I
384 kbit/s
MPEG-1 Layer II
(MUSICAM)
MPEG-1 Layer III
(MP3)
AAC
(Advanced Audio Coding)
Dolby Digital
(AC-3)
ATRAC
192 - 256 kbit/s
KompressionsAnwendung
faktor
4
DCC
Dig. Compact Disc
6-8
DAB, DVB, DVD
112 - 128 kbit/s
10 - 12
96 kbit/s
16
DAB+, DRM
192 kbit/s
8
DVD
292 kbit/s
5
MiniDisc
Verfahren
Datenrate Stereo
1.2.3 MIDI
MIDI bedeutet Musical Instrument Digital Interface und beschreibt in gänzlich anderer Weise
als in der bisher beschriebenen digitalen Audiotechnik die Darstellung von Musik. MIDI kann
man sich vorstellen als die Fernsteuerung einer Klaviertastatur, bei der nur Daten übertragen
werden, die den Zeitpunkt und die Dauer des Anschlages einer definierten Taste beschreiben.
Zusätzlich werden dabei u.a. auch noch Informationen wie Anschlagstärke, nachträglicher
Druck auf die bereits angeschlagene Taste oder Geschwindigkeit des Loslassens übertragen.
Die Besonderheit liegt weiterhin darin, dass parallel 16 Datenkanäle gleichzeitig genutzt werden können und jedem Kanal ein Klang zugeordnet ist, so dass natürlich nicht nur ein Klavier
erklingt, sondern je nach Wahl alles, was im Empfänger (typischerweise einem MusikKeyboard, aber auch ein PC) als Instrumentenklang verfügbar ist. Somit ist ein direktes Abspielen eines komplexeren Musikarrangements bestehend aus verschiedensten Instrumenten
inklusive perkussiver Instrumente (Schlagzeug) möglich. Die Übertragungsrate der notwendigen Daten ist dabei extrem klein, da keine Abtastwerte von Tönen übertragen werden müssen,
sondern nur die Steuerinformationen für die Wiedergabe im Empfänger vorhandener und dort
gespeicherter Klänge.
Sehr frühe Vertreter dieser Musikwiedergabetechnik sind z.B. das elektrische Klavier oder ein
Leierkasten. Auf breiten Papierbändern (oder auch auf großen runden Stahlscheiben) werden
beim Vorschub bzw. der Drehung eingebrachte Löcher abgetastet und steuern einen Tastendruck oder das Anblasen einer Orgelpfeife. Diese mechanischen Datenträger enthalten in
grundlegender Form das Prinzip von digitalen MIDI-Daten. Sie können auf verschiedenen
geeigneten Instrumenten abgespielt werden, die je nach Aufwand unterschiedliche Wiedergabequalität ermöglichen.
15
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Steuerung eines Keyboards (oder allgemein eines sogenannten Slaves) durch MIDI-Daten:
MIDI Daten:
Für die Steuerung der Töne werden 3 Bytes
verwendet, hier der Note On Befehl:
1. Byte:
2. Byte:
3. Byte:
1001 XXXX
0kkk kkkk
0vvv vvvv
mit
1001
XXXX
kkk kkkk
vvv vvvv
steht für Taste drücken (Note On)
= 0…16
MIDI-Kanal
= 24…108
Taste (Key)
= 10…127
Anschlagstärke
(Velocity)
Ton wird so lange gehalten, bis ein Note Off
Befehl gesendet wird (mit der Kennung 1000
im ersten Nibble des 1. Bytes)
16
Prof. Dr.-Ing. W.-P. Buchwald
Übertragungsgeschwindigkeit:
Moderne Medientechnik
31250 bit/s
Die drei Bytes werden jeweils durch ein Startbit und ein Stoppbit auf 10 Bit ergänzt, die
Übertragungsdauer dieser Sequenz dauert insgesamt 960 µs (ca. 1 ms).
MIDI-Controller:
Über weitere Befehle können unterschiedliche
Controller angesprochen werden, z.B.
•
•
•
•
Gesamtlautstärke
Lautstärke je Kanal
Sustainpedal
Effektparameter (Hall, Echo usw.)
Track-Dateigröße MIDI-File
Track-Dateigröße MP3
Track-Dateigröße unkomprimiert
ca. 30…60 kByte
ca. 3…6 MByte
ca. 30…60 Mbyte
Schnittstelle:
MIDI-In
MIDI-Out
MIDI-Thru
Eingabe von Daten
Ausgabe vom Keyboard
Durchleifen von In nach Thru
Verwendung der alten 5-poligen Phonobuchse
als physikalische Schnittstelle
Quelle: https://de.wikipedia.org/wiki/Musical_Instrument_Digital_Interface
17
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
1.2.4 Digitale Audioübertragung
Digitaler terrestrischer Rundfunk:
DAB (Digital Audio Broadcast)
ab 2011: DAB+
Entwickelt in der Zeit zwischen 1987-2000
sollte DAB den analogen terrestrischen Rundfunk (UKW) ablösen. Ursprünglich sollte 2012
der analoge UKW-Rundfunk abgeschaltet
werden. Dies konnte mangels Akzeptanz nicht
realisiert werden. Auch ein zweiter Abschalttermin 2015 musste aufgegeben werden.
Probleme:
• keine flächendeckende Sendeversorgung
• unzureichendes Programmangebot
Details DAB:
•
•
•
•
•
Frequenzbereiche:
• VHF III (174 - 230 MHz)
• 1,5 GHz Band / L-Band
Modifikation bei DAB+:
• AAC
• Datenrate: 80 kbit/s
• kompatibler Empfang von DAB
Alternatives System:
DMB (Digital Multimedia Broadcast)
MPEG-1 Audio Layer 2 (MUSICAM)
Datenrate: 32 - 256 kbit/s
typisch 160 kbit/s (~ CD Qualität)
Multiplex zu höheren Datenraten
COFDM Modulation des Multiplex
Entspricht DAB mit eingebetteten Videoinhalten bei maximalen Datenraten von 1,5 Mbit/s
(typisch 1 Mbit/s)
Ziel:
mobiler Empfang von Audio und Video auf
einem Handy
DMB wurde mangels Akzeptanz in Deutschland nicht eingeführt (nur Erprobungen in der
Vergangenheit)
18
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Quelle: http://www.digitalradio.de/index.php/de/empfangneu
19
Prof. Dr.-Ing. W.-P. Buchwald
Digitalradio über Satellit
Digitalradio über Kabel
Moderne Medientechnik
DVB-S/S2
DVB-C/C2
MPEG-1 Audio Layer 2
AAC
Dolby Digital (AC-3)
Internetradio/Webradio
(Internet-Telefonie)
MP3 (MPEG-1 Audio Layer 3)
AAC
1.3 Audioaufnahme und -wiedergabe
1.3.1 Aufnahme
Mikrofone
Wandlung von Schalldruck in elektrische
Spannung. Typische Systeme sind
• dynamische Mikrofone
• Kondensatormikrofone
Qualitätsmerkmale:
•
•
•
•
Dynamisches Mikrofon
Frequenzgang
Empfindlichkeit
Linearität (Klirrfaktor)
Richtcharakteristik
Aufbau
Quelle: https://de.wikipedia.org/wiki/Dynamisches_Mikrofon
20
Prof. Dr.-Ing. W.-P. Buchwald
Beispiel Shure SM58
Moderne Medientechnik
Frequenzgang:
Quelle: http://www.shure.de/produkte/mikrofone/sm58
Empfindlichkeit:
-54,5dBV/Pa bzw. 1,88 mV/Pa
1 Pa bei 94 dB Schalldruckpegel
(105 Pa entsprechen 1 bar Luftdruck, 1 Pa entsprechen 94 dB Schalldruckpegel)
Richtcharakteristik:
Quelle: datasheet_sm_microphones_EN_2360kB.pdf
21
Prof. Dr.-Ing. W.-P. Buchwald
Kondensatormikrofon
Moderne Medientechnik
Aufbau
https://de.wikipedia.org/wiki/Kondensatormikrofon
Proportional zum Schalldruck ändert sich der
Abstand der Membran zur Gegenelektrode, so
dass sich damit auch die Kapazität der Anordnung verändert.
C =ε ⋅
A
d
und
U=
Q
C
Die Vorspannung wird üblicherweise vom
Mischpult als sogenannte Phantomspeisung an
das Mikrofon geleitet (über die Signaladern,
typisch 48V). Gleichzeit wird damit ein Vorverstärker im Mikrofon versorgt (Impedanzwandler).
Beispiel Sennheiser E 914
Frequenzgang:
Quelle: http://de-de.sennheiser.com/global-downloads/file/2858/e_914_12_2012.pdf
Empfindlichkeit:
7 mV/Pa
22
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Richtcharakteristik:
Quelle: http://de-de.sennheiser.com/global-downloads/file/2858/e_914_12_2012.pdf
1.3.2 Wiedergabe
Lautsprecher
Tauchspulensystem
Quelle: https://de.wikipedia.org/wiki/Lautsprecher
Je nach Größe der Membran strahlen Lautsprecher in unterschiedlichen Frequenzbereichen ab (vom Subwoofer bis Hochtöner), eine
Sonderform meist nur für Hochtöner stellen
Hornsysteme dar (hoher Wirkungsgrad).
23
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Wirkungsgrad:
Eigentlich der Anteil der abgegebenen SchallLeistung relativ zur zugeführten elektrischen
Leistung. Im allgemeinen Sprachgebrauch
wird allerdings meist der Schalldruck in Relation auf eine Lautsprecheransteuerung mit 1 W
elektrischer Leistung bei 1 kHz im Abstand
von 1 Meter darunter verstanden (Kennschalldruckpegel).
Aufhängung:
• weich
langes Schwingspule, schlechter Wirkungsgrad, dafür linearer Frequenzgang (Anwendung in HiFi-Boxen)
• hart
kurze Schwingspule, guter Wirkungsgrad,
Frequenzgang nicht ausgeprägt linear (Anwendung Bühnen-Boxen bzw. PA-Systeme
- PA=Public Address)
Beispiel:
12'' Tieftöner, weich aufgehängt
DYN-1220, 4Ω, 200W
12'' Tieftöner, hart aufgehängt
Celestion GH12H, 8Ω, 30W
89dB/W/m
100dB/W/m
Verstärker mit 200W
entspricht 23dB
d.h. 89+23=112dB Schalldruck max.
für 112 dB Schalldruck ist hier nur ein
Verstärker mit 12dB erforderlich, das
entspricht linear 16W
maximaler Schalldruck:
Verstärker mit 30W
entspricht 15dB
d.h. 112+15=127dB Schalldruck max.
Bei gleicher Ansteuerleistung liefert der hart aufgehängte Tieftöner 11dB mehr Schalldruck, das ist 12,5 mal so laut.
24
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
2. Video
2.1 Grundlagen
Eine Szene wird in der Videotechnik durch eine Videokamera zeilenweise abgetastet und
nach Übertragung auf einem Monitor entsprechend wiedergegeben. Kriterium für die notwendige Anzahl der Zeilen ist das Modell einer Bildbetrachtung, bei der in einem Abstand a zwischen Monitor und Auge zwei benachbarte Zeilen gerade nicht mehr vom Betrachter einzeln
wahrgenommen werden und zu einer kontinuierlichen Fläche verschwimmen.
Ähnlich wie in der akustischen Wahrnehmung mit einer typischen maximalen Frequenz von
ca. 20 kHz existiert beim Sehen eine Grenze der Auflösung, die über einen minimalen
Raumwinkel von δ = 1,5’ (Winkelminuten) beschrieben wird, bei dem zwei benachbarte
Lichtpunkte beim Betrachter gerade zu einem Punkt zu verschmelzen scheinen.
Benachbarte Zeilen sollten daher mindestens unter diesem Raumwinkel gesehen werden, da
ansonsten die Zeilenstruktur eines Videobildes erkennbar ist und störend wirkt. Denkt man
sich in Zeilenrichtung weiterhin das Bild in einzelne Punkte zerlegt, ergibt sich eine zweidimensional gerasterte Wiedergabe.
Diese Bildpunkte werden englisch Picture Elements oder abgekürzt Pixel genannt. Grundsätzlich können die Pixelabmessungen mit ∆x und ∆y durchaus unterschiedlich groß sein. Im Folgenden ist aber zunächst von quadratischen Bildpunkten auszugehen, so dass sich der Zeilenabstand ∆y identisch mit dem horizontalen Bildpunktabstand ∆x ergibt.
Grenzauflösung des
Auges:
mit
pw - sichtbare Bildbreite (picture width)
ph - sichtbare Bildhöhe (picture height)
Grenzauflösungswinkel:
δ = 1,5’
Typischer
Betrachtungsabstand:
a = (4...5) ⋅ ph
(4...5 mal Bildhöhe)
25
Prof. Dr.-Ing. W.-P. Buchwald
Zeilenzahl:
Moderne Medientechnik
z=
ph ph a tan(α ) α
=
≈
=
⋅
∆y
a ∆y tan(δ ) δ
Die Zeilenstruktur wird vom Auge gerade nicht mehr wahrgenommen (Grenzauflösung).
Mit dem typischen Betrachtungsabstand von ca. 4...5 x Bildhöhe ph ergibt sich ein Betrachtungswinkel von ca. α ≈ 15° und
damit die endgültig notwendige Zeilenzahl
z≈
α 15° 15
=
=
⋅ 60 = 600
δ 1,5' 1,5
Die elektronische analoge Darstellung eines Bildes erfolgt durch das zeilensequentielle Abtasten von links nach rechts und von oben nach unten, indem die Helligkeit je nach Grauwert als
Spannung zwischen 0 und 0,7V = 700mV beschrieben wird.
Bildabtastung:
Zeilensignal:
Das resultierende Videosignal entspricht also in zeitlicher Richtung der horizontalen Helligkeitsverteilung in einer Zeile. Vertikal benachbarte Zeilen werden dabei zeitlich nacheinander
übertragen.
26
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Zur Festlegung der notwendigen Übertragungsbandbreite eines analogen Videosignals ist die
Berechnung der oberen Grenzfrequenz erforderlich. Hierzu muss zunächst das Bildseitenverhältnis bekannt sein, mit der dann auch die Gesamtzahl der Pixel eines Bildes festliegt.
Bildseitenverhältnis:
pw : ph = 4 : 3
(klassisch, aktuell typisch 16 : 9)
Pixel pro Zeile:
ρx = z ⋅
Pixel pro Bild:
ρ = ρx ⋅ z = z2 ⋅
Videobandbreite:
Die höchste Signalfrequenz ergibt sich, wenn abwechselnd die
horizontal benachbarten Bildpunkte schwarz und weiß auftreten.
Zwei Punkte beschreiben dann eine Grundwelle, die die maximale Signalfrequenz bzw. Bandbreite oder Grenzfrequenz darstellt.
Zeitliche Periode:
Tg = 2 ⋅
Grenzfrequenz:
fg =
pw
ph
TH
ρx
= 2⋅
pw
ph
TH
z ⋅ pw
ph
1 1
pw
= ⋅z⋅
⋅ fH
Tg 2
ph
27
also ca. ρ = 600 2 ⋅
mit
mit
4
= 480000
3
TH - Zeilendauer
fH =
1
(Zeilenfrequenz)
TH
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Die Videogrenzfrequenz hängt damit neben der Zeilenzahl und dem Bildseitenverhältnis vor
allem von der Zeilenfrequenz ab. Vordergründig ist allerdings nicht die Zeilenfrequenz von
Bedeutung, sondern die Bildfrequenz, d.h. die Anzahl der Einzelbilder pro Sekunde (vergleichbar mit dem Film). Der Zusammenhang zwischen Zeilen- und Bildfrequenz lässt sich
einfach über die entsprechenden reziproken Größen Zeilendauer und Bilddauer angeben, denn
die Bilddauer entspricht anschaulich der Zeilendauer multipliziert mit der Anzahl der Zeilen.
Bildfrequenz:
fB =
1
TB
mit TB - Bilddauer
Zeilenfrequenz:
fH =
1
TH
mit TH - Zeilendauer
Zusammenhang:
TB = z ⋅ TH
bzw.
fH = z ⋅ fB
Mit dieser Beziehung lässt sich schließlich die Videogrenzfrequenz vor allem in Abhängigkeit
von der Bildfrequenz und der Gesamtpixelzahl ρ angeben.
Grenzfrequenz:
fg =
1 2 pw
1
⋅z ⋅
⋅ fB = ⋅ ρ ⋅ fB
ph
2
2
Mit der oben stehenden Grundformel lässt sich der Bandbreitebedarf eines Videosystems bei
analoger Signalübertragung angeben. Dies ist darüber hinaus nicht auf Fernsehen beschränkt,
sondern gilt auch für PC-Monitore bei analoger Ansteuerung über VGA (Video Graphics Array - analoge PC-Monitorschnittstelle), die mit sehr unterschiedlichen Grafikstandards betrieben werden.
Beispiele:
Video:
(SD Auflösung)
Zeilenzahl z=625
Bildfrequenz fB=25Hz
fg =
1
4
⋅ 6252 ⋅ ⋅ 25Hz = 6,51MHz
2
3
PC Standard VGA:
(640 x 480)
Zeilenzahl z=480
Bildfrequenz fB=60Hz
fg =
1
4
⋅ 4802 ⋅ ⋅ 60Hz = 9,22MHz
2
3
PC Standard XGA:
(1024 x 768)
Zeilenzahl z=768
Bildfrequenz fB=85Hz
fg =
1
4
⋅ 7682 ⋅ ⋅ 85Hz = 33,42MHz
2
3
PC Standard HD1080
(1920 x 1080)
Zeilenzahl z=1080
Bildfrequenz fB=60Hz
fg =
1
16
⋅ 10802 ⋅ ⋅ 60Hz = 62,21MHz
2
9
28
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Zeilensprung (englisch: interlace):
Vollbild
1. Teilbild
2. Teilbild
Kantenflackern
(25Hz Störung - nur bei Bildröhren)
Vorteile Zeilensprung:
- Verdopplung des Großflächenflimmern von 25Hz auf 50Hz
bei gleichbleibender Videobandbreite und Zeilenfrequenz,
war allerdings nur relevant bei Wiedergabe mit Bildröhren
- verdoppelte Bewegungsauflösung mit 50Hz
Nachteile Zeilensprung:
- an horizontal verlaufenden Kanten (in vertikaler Richtung
verlaufende Helligkeitssprünge) verbleibende 25Hz Flimmerstörung (Kantenflackern), nur relevant bei Bildröhren
- Abgespeicherte Vollbilder enthalten bei Objekten ausgerissene Kanten (siehe Kapitelende)
Randbemerkungen zur subjektiven Flimmerwahrnehmung des Auges
Flimmern wird mit zunehmender Frequenz der Helligkeitsänderung immer weniger störend
wahrgenommen. Es ergibt sich hier eine Art Tiefpasseigenschaft des Auges vergleichbar der
Auflösung von feinen Details oder dem Hören hoher Tonfrequenzen. Zusätzlich ist die Flimmerempfindung nichtlinear von der zugehörigen Helligkeit abhängig. Je dunkler eine flimmernde Lichtquelle ist, desto weniger wird das Flimmern stören. Diese Effekte waren von
großer Bedeutung beim Einsatz von Bildröhren in TV-Empfängern und PC-Monitoren.
29
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Dennoch fällt auf, dass im Bereich der PC-Monitore früher eine Bildwiederholrate von sogar
60Hz als absolut unzureichend empfunden wurde, während das europäische 50Hz Fernsehsystem jahrzehntelang akzeptiert wurde. Der Grund liegt in der wiederum nichtlinearen Abhängigkeit der Flimmerempfindlichkeit des Auges vom Raumwinkel.
Im zentralen Sehen (kleiner Betrachtungswinkel, fernsehtypisch) weist das Auge eine gute
Auflösung bei geringerer Flimmerempfindlichkeit auf. Im sogenannten peripheren Sehen
(großer Raumwinkel, z.B. geringer Abstand zum PC-Monitor) ist die Auflösung am Rand
schlecht, jedoch eine hohe Flimmerempfindlichkeit gegeben. Dies basiert auf typischen
Schutzmechanismen, indem auf eine Gefahr von der Seite (Helligkeitsänderung durch Objekt)
schnellstmöglich reagiert werden muss, wohingegen feine Details im Augenwinkel diesbezüglich ohne Bedeutung sind und auch nicht erkennbar sind.
Einfluss unterschiedlicher Betrachtungsabstände
auf die resultierende Flimmerwahrnehmung
(nur relevant bei Bildröhren)
Bewegungsartefakte beim Zeilensprung
Der Vorteil der hohen Bewegungsauflösung beim Fernsehen durch die 50Hz Teilbildabtastung liefert bei Standbildwiedergabe von Vollbildern das Problem ausgerissener Kanten. Dort
werden die verkämmten Teilbilder wieder sichtbar, die an bewegten Konturen natürlich kein
fehlerfreies Vollbild ergeben, sondern eine Doppelkontur mit deutlicher vergröberter Zeilenstruktur.
30
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Im realen Videobild äußert sich dieser Effekt an allen bewegten Details. Es zeigen sich aufgerissene Kanten in der Breite der Bewegungsdistanz, die zwischen zwei Teilbildern (20ms)
auftritt. Bei normaler Betrachtung im bewegten Videobild sind diese Störungen nicht kritisch,
da das Auge der Bewegung nachfolgt. Beim Herausgreifen eines Vollbildes jedoch ist der
beschriebene Effekt deutlich störend und muss durch Nachverarbeitung (Interpolation) unterdrückt werden.
31
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
2.2 Farbbild-Darstellung
Eine farbige Vorlage wird durch drei Farbauszüge ROT, GRÜN und BLAU (abgekürzt RGB)
beschrieben, die bei der Wiedergabe additiv überlagert werden. Kameraseitig wird dazu das
Bild durch optische Farbfilter bzw. dichroitische Spiegel (Strahlenteiler) in die genannten
Farbauszüge zerlegt und parallel abgetastet. Am Kameraausgang sind drei für RGB vorhanden.
Diese elektronische Farbbilddarstellung nennt man Komponentenformat im Gegensatz zum
Composite-Format, wie es zur analogen Übertragung mit PAL, NTSC oder SECAM verwendet wird, wenn RGB in einem einzigen Signal verschachtelt wird (analoge Farbcodierung).
Die RGB-Signale der Kamera weisen klassisch bei Standardauflösung (SD-Format) jeweils
identisch 5 MHz Grenzfrequenz auf. Für eine Übertragung wäre also grundsätzlich die dreifache Bandbreite im Vergleich zu einem Schwarzweiß-Signal erforderlich.
32
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Ein wichtiges Testsignal in der Farbfernsehtechnik stellt das Farbbalkentestsignal dar, das alle
Kombinationen von Rot, Grün und Blau jeweils mit den Pegeln 0 und 100% (analog: 0V und
0,7V) zeigt.
Farbbalkentestsignal:
Hieraus sind auch einige Grundeigenschaften bei der hier vorliegenden additiven Farbmischung zu erkennen: Weiß ergibt sich aus der Summe von maximal Rot, Grün und Blau.
Komplementärfarben zu diesen Grundfarben definieren sich aus der Summe der jeweils anderen beiden Grundfarben, so dass Grundfarbe plus zugehöriger Komplementärfarbe ebenfalls
Weiß ergibt.
33
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Additive Farbmischung:
Weiß = R + G + B
Grau = R + G + B
mit R=G=B=1
(normiert)
mit R=G=B= 0....1
Komplementärfarben:
Rot - Cyan
Cy = G + B
R + Cy = Weiß
Grün - Purpur
Pp = R + B
G + Pp = Weiß
Blau - Gelb
Ge = R +G
B + Ge = Weiß
Neben der Möglichkeit, ein Farbbild mit den Grundfarben Rot, Grün und Blau zu beschreiben, ist die Darstellung mit einem Schwarzweißanteil (Leuchtdichte oder Luminanz Y) und
zwei Farbartkomponenten (Chrominanz) besonders günstig, da hier eine sehr gute Anpassung
an das menschliche Sehvermögen gegeben ist. Auch das Auge unterscheidet mit seinen Sehnerven nach Schwarzweiß- und Farbartempfindung entsprechend Stäbchen und Zapfen auf
der Netzhaut des Auges.
Die Helligkeitsempfindung des Auges folgt einer glockenförmigen Kurve über der Lichtwellenlänge im sichtbaren Farbspektrum zwischen ca. 400 und 700nm Wellenlänge. Basierend
hierauf ergibt sich eine relative Helligkeitsempfindung für Rot von 30%, für Grün von 59%
und für Blau von 11%. Damit lässt sich schließlich der Schwarzweißanteil oder die Luminanz
aus einem RGB-Bild berechnen. Die beiden anderen Anteile, die die Chrominanz beschreiben, werden als sogenannte Farbdifferenzsignale ebenfalls aus RGB abgeleitet.
Spektrale Empfindlichkeit des Auges:
Zapfen (rote, grüne und blaue Kurve)
Stäbchen (gestrichelte Kurve)
Quelle: https://de.wikipedia.org/wiki/Stäbchen_(Auge)
34
Prof. Dr.-Ing. W.-P. Buchwald
Farbmatrix:
Moderne Medientechnik
Eine Umformung mit einem linearen Gleichungssystem führt
auf die genannten drei alternativen Größen, die zudem in Anpassung an die Augencharakteristik weniger Gesamtbandbreite
beanspruchen, ohne den subjektiven Bildeindruck zu beeinträchtigen, da die Chrominanz mit geringerer Auflösung dargestellt
und übertragen werden kann, weil die Auflösung des Auges für
die Chrominanz deutlich geringer ist als für die Luminanz.
Y
= 0,3⋅R + 0,59⋅G
R-Y = 0,7⋅R - − 0,59⋅G
B-Y = − 0,3⋅R − 0,59⋅G
+ 0,11⋅B
− 0,11⋅B
+ 0,89⋅B
Luminanz Y:
Die Luminanz Y entspricht dem Schwarz/Weiß-Auszug eines
Bildes. Die Bandbreite beträgt für Standard TV (SD) 5MHz. Der
subjektive Schärfeeindruck eines Farbbildes liegt in der Hauptsache in der Luminanzauflösung begründet.
Chrominanz C:
Die beiden Chrominanzkomponenten beschreiben zusammen
die Farbe des Bildinhaltes. Durch die verminderte Farbauflösung des menschlichen Auges lässt sich eine reduzierte Chrominanzbandbreite
rechtfertigen,
so
dass
eine
Luminanz/Chrominanz-Bildbeschreibung mit geringerer Gesamtbandbreite bzw. Datenrate auskommt.
35
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
RGB- und Y/C-Signale beim Farbbalken:
36
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Trägt man die beiden Farbdifferenzsignale in einem orthogonalen Koordinatensystem als
Achsen ein, so ergibt sich eine Ebene, die alle unterschiedlichen Farben enthält. Hierbei lässt
sich die Farbsättigung als proportional zum Abstand vom Ursprung angeben, während der
Farbton durch den Winkel gegen die Abszisse gegeben ist.
Eingesetzt sind exemplarisch die Farborte des vorher diskutierten Farbbalkentestbildes. Dabei
ergibt sich für Rot (R=1; G=0; B=0) mit der zugehörigen Luminanz Y=0,3 ein Wertepaar von
R - Y = 1 - 0,3 = 0,7
B - Y = 0 - 0,3 = -0,3
37
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
2.3 Digitale Videotechnik
2.3.1 Digitale Videonorm
Taktfrequenzen:
Luminanz Y
Chrominanz R-Y
Chrominanz B-Y
faY = 13,5 MHz
faR-Y = 6,75 MHz
faB-Y = 6,75 MHz
Die Chrominanz wird so vorgefiltert (Tiefpass), dass mit halber
Abtastrate gegenüber Luminanz gearbeitet werden kann.
Aussteuerung:
Die Aussteuerungswerte hinter der Farbmatrix ergeben sich zunächst zu
Luminanz Y
0,7 V
0V
für weiß
für schwarz
Chrominanz R-Y
(auch V genannt)
0V
± 0,49 V
für unbunt
für max. Sättigung
Chrominanz B-Y
(auch U genannt)
0V
± 0,62 V
für unbunt
für max. Sättigung
Für die A/D-Wandlung werden alle drei Komponenten auf den
gleichen Spannungshub skaliert. Die Chrominanz wird dabei
durch einen Gleichspannungsoffset in positive Spannungswerte
verschoben, so dass der Unbunt-Wert bei halber Aussteuerungsamplitude liegt.
Luminanz Y
Chrominanz R-Y
Chrominanz B-Y
Digitalisierung:
uss = 0,7 V
uss = 0,7 V
uss = 0,7 V
}
an 75 Ω
Die Digitalisierung erfolgt einheitlich jeweils mit 8 Bit Quantisierung (linear).
Komponente
Luminanz Y
Bandbreite
5 MHz
Chrominanz R-Y
2,5 MHz
Chrominanz B-Y
2,5 MHz
Abtasttakt Aussteuerung
13,5 MHz
0,7 V
0V
6,75 MHz
0,7 V
0,35 V
0V
6,75 MHz
0,7 V
0,35 V
0V
38
digitaler Wert
255
0
255
128
0
255
128
0
Signalinhalt
weiß
schwarz
max. Sättigung
unbunt
max. Sättigung
max. Sättigung
unbunt
max. Sättigung
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Während die Abtastung des Videosignals durch die ausreichend hohe Abtastfrequenz bei angepassten analogen Vor- und Nachfiltern keinerlei Beeinträchtigung für das resultierende Bild
darstellt, führt die notwendige Quantisierung grundsätzlich zu einem Fehler, der sich als
Quantisierungsrauschen dem Nutzsignal überlagert. Durch geeignet hohe Bitbreite der A/DWandler kann allerdings die Sichtbarkeit des Quantisierungsfehlers unter die subjektive Erkennbarkeitsgrenze gedrückt werden. Dies ist für m=8bit entsprechend n=28=256 Graustufen
sichergestellt.
A/D-Wandler-Kennlinie:
ws
uq
∆q
sw
u
Datenrate:
Luminanz
Chrominanz
gesamt
bY = m ⋅ f aY = 8bit ⋅ 13,5MHz = 108Mbit/s
bC = 2 ⋅ m ⋅ f aC = 2 ⋅ 8bit ⋅ 6,75MHz = 108Mbit/s
b = 2 ⋅ 108Mbit/s = 216Mbit/s
Kritisch sind Bildinhalte mit flachen Grauverläufen, die bei zu geringer Quantisierung zum
sogenannten Contouring führen. Die Abstufungen zwischen den Grauwertniveaus erscheinen
als deutlich sichtbare Kantenverläufe. In realen Vorlagen ist allerdings bedingt durch geringfügige Rauschüberlagerung die Sichtbarkeit des Contourings häufig nicht so kritisch wie im
Testbild (Dithereffekt, Verwischen der Quantisierungskonturen).
Quantisierungsfehler beim Graukeiltestbild
8bit (256 Graustufen)
4bit (16 Graustufen)
39
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Quantisierungsfehler beim realen Bild
8bit (256 Graustufen)
4bit (16 Graustufen)
Contouring
3bit (8 Graustufen)
2bit (4 Graustufen)
Bei zu geringer Quantisierung kann die Dithertechnik durch vorheriges künstliches Verrauschen des Analogbildes genutzt werden, um über die geometrische Mittelung benachbarter
Pixel Zwischenwerte für die begrenzten Grauwerte zu simulieren.
2bit (4 Graustufen mit Dither)
1bit (2 Graustufen mit Dither)
Offsetdarstellung (1bit, faksimile)
40
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
Quantisierungsfehler beim realen farbigen Bild
3x8=24bit (3x256 Graustufen)
3x4=12bit (3x16 Graustufen)
3x2=6bit (3x4 Graustufen)
3x1=3bit (3x2 Graustufen)
Mit Dithertechnik
3bit (8 Farben gleichabständig)
3bit (8 Farben angepasst an Häufigkeit)
Anstelle einer linearen Quantisierung kann insbesondere bei Einzelbildern (Scans, digitale
Fotos) eine angepasste Quantisierung verwendet werden. Dabei werden die häufigsten Farbwerte eines Bildes als Repräsentativwerte bei der Quantisierung verwendet, so dass der resultierende Fehler durch die Quantisierung minimiert wird.
41
Prof. Dr.-Ing. W.-P. Buchwald
Moderne Medientechnik
2.3.2 Datenreduktion
42
Herunterladen