Einf¨uhrung in die Telekommunikation - Informatik

Einführung in die Telekommunikation
logonoff
25. Juni 2006
1
Periodische und transiente Signale
Deterministische Signale können periodisch oder transient sein. Periodische Signale bleiben gleich,
wenn man sie um ein ganzzahliges Vielfaches ihrer Periode verschiebt und haben ein diskretes Linienspektrum. Transiente Signale sind aperiodisch und haben ein kontinuierliches Spektrum.
1.1
Periodische Signale
1.1.1
Fourierreihe
Alle periodischen Signale können als gewichtete Summe harmonischer Sinusschwingungen dargestellt werden. Dies erfolgt als z.B. trigonometrische Fourierreihe:
∞
X
v(t) = C0 +
Cn cos(nω1 t + φn )
n=1
Das ist die Cosinus-Form der trigonometrischen Fourierreihe, sie kann auch ohne Phasenverschiebung
als Cosinus-Sinus-Form angeschrieben werden:
v(t) = C0 +
∞
X
(An cos ωn t − Bn sin ωn t)
n=1
Wobei die An die Inphase- und die Bn die Quadratur1 Amplituden sind. Diese lassen sich mittels der
Filter-Integrale“ ermitteln:
Z
”
2 T +t
v(t) cos ωn tdt
An =
T t
Und entsprechend auch für die Quadratur-Amplitude mit Sinus. Dank Trigonometrie lassen sich daraus auch die Cn und mittels arctan die φn berechnen.
Über die Euler’sche Relation kommt man zur Exponentialform der Fourierreihe. Dabei wird immer ein Paar aus gegenläufigen, konjugierten Zeigern benutzt um eine reelle Sinusschwingung darzustellen:
v(t) =
∞
X
Cn0 e−jωn t dt
n=−∞
Dabei gilt: Cn0
= An −jBn für die exponentiellen Fourierkoeffizienten. Trägt man den Betrag der Amplituden auf, so erhält man für reelle v(t) ein zweiseitiges Amplitudenspektrum mit gerader und ein
Phasenspektrum mit ungerader Symmetrie. Das einseitige Spektrum für die reellen Sinusschwingungen ergibt sich durch Faltung und Addition der Amplituden der positiven und negativen Frequenzen.
Daher sind die komplexen Fourierkoeffizienten auch nur halb so groß wie die trigonometrischen.
1.1.2
Leistung
√
Wenn man die trigonometrischen Koeffizienten durch 2 dividiert und auf die Frequenzen aufträgt,
erhält man ein einseitiges RMS2 -Amplitudenspektrum. Das normalisierte Leistungsspektrum erhält
man durch Quadrieren des RMS-Amplitudenspektrums. Die Gesamtleistung eines Linienspektrums
1
2
Um π/2 versetzt
RMS = root mean square
1
ist die Summe der Leistungen jeder einzelnen Frequenz. Dies gilt für jedes periodische Signal unter anderem aufgrund der Orthogonalität der einzelnen Sinusschwingungen und heißt Parseval’sches
Theorem:
Z
∞ X
1 t+T
C 0 2
|v(t)|2 dt =
P =
n
T t
n=−∞
1.1.3
Bandbreite & Sampling
Die Bandbreite bezieht sich auf den Teil des Frequenzbereich, in dem ein Signal nennenswerte Leistung enthält. Bandbreite bezeichnet genauer die Differenz zwischen zwei Frequenzen fmin und fmax
unter- respektive oberhalb derer die Spektralkomponenten auf √12 der Spitzenkomponente abfallen.
Signale mit steilen Flanken haben eine hohe Bandbreite.
Hat ein Signal keine Spektralkomponenten oberhalb einer Frequenz fH , so kann es nach eine
Abtastung nur dann genau rekonstruiert werden, wenn die Abtastfrequenz fS mindestens doppelt
so hoch wie fH ist (oversampling). Diese Tatsache ist auch als Nyquist-Theorem bekannt. Ist die
Abtastfrequenz zu niedrig, so kommt es zu Aliasing-Fehlern.
1.2
Transiente Signale
1.2.1
Fouriertransformation
Bekannt ist die Fourierreihe für die diskreten Linienspektren. Bei transienten Signalen hat man aber
ein kontinuierliches Spektrum. Den Übergang kann man sich wie folgt vorstellen: die Periode T strebt
gegen unendlich und der Abstand der Spektrallinien T1 gegenRNull. Die diskreten fn des Spektrums
P
∞
0
werden zu f und aus der Summe ∞
n=−∞ wird das Integral −∞ . Die Fourierkoeffizienten Cn (fn )
werden zu V (f )df (Einheit Volt). Es kommt die kontinuierliche Fourierreihe (inverse Fouriertransformation) heraus:
Z
∞
V (f )ej2πf t df
v(t) =
−∞
und den Filterintegralen entspechend die Fouriertransformation:
Z
∞
v(t)e−j2πf t dt
V (f ) =
−∞
Auch die (inverse) Fouriertransformation kann in Sinus und Cosinus aufgesplittet werden.
Jedem Signal im Zeitbereich entspricht genau ein, durch die Fouriertransformation gegebenes Amplitudenund Phasenspektrum im Frequenzbereich.
1.2.2
Korrespondenz der Fouriertransformation eines Rechteckpulses
Ein Rechteckpuls ist gegeben durch:
Y
(t) =


 1.0, |t| <
0.5, |t| =
|t| >

 0,
1
2
1
2
1
2
Das Spannungsspektrum ergibt sich durch die Fouriertransformation:
Z
∞
V (f ) =
−∞
(t)e−j2πf t dt =
Y
Z
1
2
− 12
"
e−j2πf t
e−j2πf t dt =
−j2πf
2
#1
2
=
− 12
1
[ejπf − e−jπf ] =
j2πf
=
1.2.3
sin(πf )
j2 sin(πf )
=
= sinc(x)
j2πf
πf
Theoreme der Fouriertransformation
• Linearität: av(t) + bw(t)
aV (f ) + bW (f )
V (f )e−jωt
• Zeitverschiebung: v(t − T )
• Zeitumkehr: v(−t)
V (−f )
• Multiplikation: v(t)w(t)
• Faltung: v(t) ∗ w(t)
V (f ) ∗ W (f )
V (f )W (f )
∞
Superpositionsintegral: z(t) = −∞
f (τ )g(τ − t)dτ . Das Faltungstheorem ist äußerst praktisch, da
eine Faltung im Zeitbereich durch eine Multiplikation im Frequenzbereich gelöst wird.
Will man z.B. ein periodisches Rechtecksignal erzeugen, so kann man dazu einen transienten
Rechteck-Impuls mit einem periodischen Dirac-Impulssignal falten.
R
1.3
Kurvenformen als Vektor
Laut dem Nyquist-Theorem lässt sich ein periodisches Signal mit einer höchsten Frequenzkomponente von fH durch N Abtastungen mit einer Frequenz von 2fH exakt rekonstruieren. Betrachtet man
nun jeden Abtast-Wert als Länge eines Vektors einer Orthogonalbasis, so kann man ein durch N Abtastungen spezifiziertes Signal als N = 2fH T -dimensionalen Vektor darstellen. Nun kann man mit
den Signalen das gleiche anstellen wie mit Vektoren: addieren, skalieren - das Skalarprodukt zweier
Funktionen/Signale ist wie folgt definiert:
1
[f (t), g(t)] = 0
T
Z
T0
f ∗ (t)g(t)dt
0
mit der Einheit V 2 und bedeutet soviel wie Kreuz-Leistung.
1.4
Korrelationsfunktion
Das Skalarprodukt zweier Signale gibt deren Ähnlichkeit an. Die (normalisierte) Kreuzkorrelationsfunktion gibt die Korrelation zweier Funktionen für alle möglichen Zeitverschiebungen an. Für transiente Signale lautet sie:
R∞
ρvw (τ ) = qR
∞
−∞ v(t)w(t
2
−∞ |v(t)| dt
− τ )dt
qR
∞
2
−∞ |w(t)| dt
Für periodische Signale:
limT 0 →∞
ρpq (τ ) = q R
1 t+T
T
t
R T 0 /2
−T 0 /2 p(t)q(t
|p(t)|2 dt
q
1
T
R t+T
Eigenschaften der normalisierten Kreuzkorrelationsfunktion:
3
− τ )dt
t
|q(t)|2 dt
• −1 ≤ ρ(τ ) ≤ 1
• ρ(τ ) = −1 iff v(t) = −kw(t − τ )
• ρ(τ ) = 1 iff v(t) = kw(t − τ )
• Wenn ρ(τ ) = 0, so sind die Signale orthogonal und haben keine Ähnlichkeit
2
Zufallssignale und Rauschen
Nur Signale, deren Zukunft nicht genau bestimmt ist, können Information tragen. Ebenso sind Störsignale zufälliger Natur. Um Nutzsignale von Störsignalen bzw. Rauschen unterscheiden zu können,
müssen sie wahrscheinlichkeitstheoretisch beschrieben werden.
2.1
2.1.1
Wahrscheinlichkeitstheorie
Wahrscheinlichkeit und Bayes
Wird ein Zufallsexperiment N -mal wiederholt, so ist die Wahrscheinlichkeit eines Ereignisses A, das
L-mal auftritt:
L
P (A) = lim
N →∞ N
Der Ausgang eines Zufallsexperiments, z.B. Münzwurf (diskret) oder Wettlauf (kontinuierlich) ist eine Zufallsvariable. Der Wert einer Zufallsvariablen (stochastische Größe) an einem bestimmten Zeitpunkt in der Zukunft kann nicht genau vorhergesagt werden, jedoch ist nach einem Wahrscheinlichkeitsmodell bekannt, welche Werte die Variable annehmen könnte.
Die Wahrscheinlichkeit eines Ereignisses A bedingt durch das Auftreten eines Ereignisses B wird
mit P (A|B) bezeichnet. Für das gemeinsame Ereignis P (A, B) gilt:
P (A, B) = P (A)P (B|A) = P (B)P (A|B)
und nach Umformen die Bayes’sche Regel:
P (A|B) =
P (A)P (B|A)
P (B)
Die Ereignisse A und B sind statistisch unabhängig, wenn das Auftreten des einen nicht die Wahrscheinlichkeit des anderen beeinflusst, also gilt:
P (A|B) = P (A)
2.1.2
P (B|A) = P (B)
Fehlerwahrscheinlichkeit in einem Datenblock
Gefragt ist die Wahrscheinlichkeit, dass mehr als eine bestimmte Anzal an Fehlern in einem Codewort auftreten - ein diskretes Wahrscheinlichkeitsproblem. Die gegebene Wahrscheinlichkeit eines
Bitfehlers ist Pe , R0 ist die Anzahl der Fehler und n ist die Länge des Codeworts. Da die Summe der
Wahrscheinlichkeiten eins ergeben muss, gilt:
P (Fehleranzahl > R0 ) = 1 − P (Fehleranzahl ≤ R0 )
4
Die Wahrscheinlichkeit von genau j Fehlern ist gegeben durch:
P (j Fehler) = (Pe )j (1 − Pe )n−j n Cj
wobei n Cj der Binomialkoeffizient ist. Die Wahrscheinlichkeit von mehr als R0 Fehlern ergibt sich
dann als:
0
P (Fehleranzahl > R0 ) = 1 −
R
X
P (j)
j=0
2.1.3
Wahrscheinlichkeitsverteilung und -dichte
Eine Verteilungsfunktion gibt die Wahrscheinlichkeit Px (x) an, dass der Wert der Zufallsvariablen X
kleiner gleich einem bestimmten Wert x ist: Px (x) = P (X ≤ x). Der Wertebereich der Verteilungsfunktion liegt zwischen 0 und 1, der negative Grenzwert ist 0 und der positive 1. Verteilungsfunktionen
sind monoton steigend und es gilt: Px (x2 ) − Px (x1 ) = P (x1 < X ≤ x2 )
Eine Dichtefunktion gibt die Wahrscheinlichkeit an, dass der Wert einer Zufallsvariablen zwix (x)
schen x und x + dx liegt: px (x) = dPdx
. Die Fläche unter der Dichtefunktion ist 1 und es gilt:
R x2
p
(x)dx
=
P
(x
<
X
≤
x
).
x
1
2
x1
Ein Moment ist eine Statistik einer Zufallsvariable und gibt Information über die Form von Dichtefunktionen. Die wichtigsten sind das erste Moment - der Erwartungswert - und das erste Zentralmoment - die Varianz, deren Wurzel die Standardabweichung ist:
Z
∞
E[X] = X =
xp(x)dx
(X − X)2 =
−∞
Z
∞
(x − X)2 p(x)dx = σ 2
−∞
Das dritte und vierte zentrale Moment zeigen Asymmetrie und Spitzen die Wahrscheinlichkeitsdichte
auf und sind z.B. für die Analyse von Sprache interessant.
Sowohl Verteilungs- als auch Dichtefunktion können diskrete, kontinuierliche und gemischte Zufallsvariablen darstellen.
2.1.4
Gemeinsame und Randverteilung
Sind X und Y zwei Zufallsvariablen, so ist eine gemeinsame Dichtefunktion px,y (x, y) so gegeben,
dass px,y (x, y) dx dy die Wahrscheinlichkeit ist, dass X im Bereich x und x + dx sowie Y im Bereich
y und y + dy liegt. Die Fläche unter der gemeinsamen Dichte ist wiederum 1.
Ist die gemeinsame Dichte bekannt, so wird die Wahrscheinlichkeit, dass X, unabhängig von Y
zwischen x1 und x2 liegt, Randwahrscheinlichkeit von X genannt und man erhält sie indem man über
ganz Y integriert:
Z
∞
p(x) =
−∞
2.1.5
px,y (x, y)dy
Gemeinsame Momente, Korrelation und Kovarianz
Die Definition der gemeinsamen (zentralen) Momente erfolgt analog zur Definition der einzelnen“
”
Momente. Das erste gemeinsame Moment ist die Korrelation. Ein hoher positiver Korrelationswert
spricht für hohe Ähnlichkeit (wenn x high ist, so ist wahrscheinlich auch y high), ein Wert nahe Null
bedeutet, dass sich aufgrund des Zustands für x keine nennenswerten Aussagen über den Zustand von
y treffen lassen. Sind X und Y statistisch Unabhängig, so ist die Korrelation Null, der Umkehrschluss
gilt allerdings nicht.
5
Das erste zentrale gemeinsame Moment ist die Kovarianz. Bei der Bildung der Kovarianz wurde
der Erwartungswert bereits abgezogen; die Kovarianz bezieht sich daher auf die Korrelation der sich
unterscheidenden Teile von X und Y . Bei Erwartungswert Null sind Kovarianz und Korrelation ident.
2.1.6
Der zentrale Grenzwertsatz
Addiert man zwei Zufallsvariablen zu einer neuen (d.h. X + Y = Z), so stellt sich die Frage wie die
aus dieser Addition hervorgehende Dichte pz (z) aussieht. Lässt man Z zwei bestimmte Werte z und
z + dz annehmen, so ergibt sich durch einfache Umformung:
Y =z−X
Y = z + dz − X
Diese beiden Gleichungen geben zwei parallele Linien im X, Y Koordinatensystem an. Die Wahrscheinlichkeit, dass Z im Bereich z und z + dz liegt, ist durch die Fläche unter px,y (x, y) in dem
durch die Linien gebildeten Streifen gegeben:
P (z < Z ≤ z + dz) =
Z
Z
px,y (x, y)ds
bzw.
pz (z)dz =
Streif en
px,y (x, y)dxdz
Streif en
Daraus ergibt sich:
Z
pz (z) =
∞
−∞
px,y (x, z − x)dx
und bei stochastischer Unabhängigkeit das bekannte Superpositions- bzw. Faltungsintegral:
Z
pz (z) =
∞
−∞
px (x)py (z − x)dx
Addiert man N stochastisch unabhängige Zufallsvariablen, so hat die Summe eine Dichtefunktion,
die sich mit N → ∞ der Gauss’schen Glockenkurve annähert.
2.2
Zufallsprozesse
Ein Zufallsprozess ist eine Zufallsvariable, die sich in Abhängigkeit von Zeit (oder Raum) verändert.
Zufallsprozesse werden durch eine Anzahl (i) von Zeitfunktionen xi (t) beschrieben. X( tj ) bezeichnet
ein Ensemble von Werten zur Zeit tj und bildet eine Zufallsvariable. Zufallsprozesse können kontinuierlich und diskret bezüglich Zeit oder Position, analog oder digital (wiederum kontinuierlich oder
diskret) bezüglich ihrer Dichte, (nicht) deterministisch, (nicht) ergodisch und (nicht) stationär sein.
Stationär bezieht sich auf die Zeitabhängigkeit des Zufallsprozess. Ein Zufallsprozess ist
• streng stationär, wenn alle seine Dichten für jeden Zeitpunkt gleich sind, sich also nicht im
Zeitverlauf ändern.
• locker bzw. leicht stationär, wenn sein Erwartungswert zeitunabhängig ist und seine Korellation
nur vom Zeitunterschied abhängt.
Ein Zufallsprozess ist ergodisch wenn jede Zeitfunktion (sample function) des Ensembles das gleiche statistische Verhalten hat wie irgendeine Menge von Werten X(tj ) des Ensembles. Ergodizität
impliziert stationär, aber nicht umgekehrt.
6
2.2.1
Gauss-Prozess
Eine sample function gehört auf streng-Gauss’sche Art zu einem Zufallsprozess, wenn die Zufallsvariablen X1 . . . XN eine N -dimensionale gemeinsame Gauss’sche Glocken-Dichte beschreiben. Eine
sample function gehört auf lose Gauss’sche Art zu einem Zufallsprozess, wenn einzelne Werte aus
xi (t) aus einer Gauss’schen Glocken-Dichte stammen.
Ein streng-Gauss’scher Prozess ist der strukturloseste, zufälligste, unverhersehbarste Zufallsprozess überhaupt. Gauss-Prozesse sind durch erstes und zweites Moment voll spezifiziert.
2.2.2
Autokorrelation und Leistungsdichtespektrum von Zufallsprozessen
Eine Dichtefunktion kann ein Zufallssignal (z.B. sample function) nicht genau beschreiben, da sie
kein Wissen über die Änderungsrate des Signals besitzt. Diese Information steckt in den gemeinsamen Dichten von Zufallsvariablen X(t1 ) und X(t2 ), die τ auseinanderliegen. Die Ähnlichkeit der
Zufallsvariablen ist durch die Korrelation gegeben und die Autokorrelationsfunktion bei ergodischen
Prozessen durch:
(X −
X)2
1
= lim
T →∞ T
Z
T /2
−T /2
x(t)x(t − τ )dt = Rx (τ )
[V 2 ]
Die Autokorrelationsfunktion und das doppelseitige Leistungsdichtespektrum von x(t) bilden ein
Fouriertransformations-Paar:
Rx (τ ) ⇔F T Gx (f )
auch als Wiener-Kintchine Theorem bekannt. Eine normalisierte Autokorrelationsfunktion erhält man
durch Abziehen der Gleichstromkomponente von x(t) und dividieren durch den RMS-Wert.
2.2.3
Weißes Rauschen
Weißes Rauschen ist ein Zufallssignal mit extremen Spektralen und Autokorrelations-Eigenschaften.
Normalerweise korrelieren Abtastwerte eines Signals umso höher je kürzer das Abtastintervall ist.
Weißes Rauschen hat jedoch kein Gedächtnis“ - es hat keine Ähnlichkeit mit zeitverschobenen Ver”
sionen von sich selbst. Die Autokorrelationsfunktion besteht aus einem einzelnen Impuls bei keiner
Verzögerung und das Leistungsdichtespektrum ist flach. Abtastwerte von weißem Rauschen sind immer unkorreliert, egal wie knapp hintereinander sie abgetastet wurden. Da diese Eigenschaft nicht
natürlich ist, sind solche Signale nicht realisierbar. Gauss’sches und weißes Rauschen hängen nicht
zusammen.
2.2.4
Kreuzkorrelation von Zufallsprozessen
Für zwei reelle, ergodische Prozesse:
1
Rxy (τ ) = lim
T →∞ T
Z
T /2
x(t)y(t − τ )dt
−T /2
Die Fourier-Transformierte von Rxy (τ ) wird Kreuz-Leistungsdichtespektrum mit Einheit V 2 /Hz genannt.
7
3
Lineare Systeme
Ein System ist linear, wenn seine Antwort auf die Summe zweier Inputs gleich der Summe der Outputs
auf jeden einzelnen Input ist. Antworten auf einzelne Inputs werden am Ausgang einfach überlagert.
Proportionalität folgt direkt aus der Linearität.
Lineare Systeme sind außerdem gedächtnislos, d.h. die momentane Ausgabe hängt nur von der
momentanen Eingabe ab. Außerdem sind Systeme oft zeitinvariant. Lineare Systeme verändern die
Kurvenform von Sinusschwingungen am Eingang nicht.
3.1
Lineare Systeme im Zeitbereich
Sei folgende Differentialgleichung gegeben:
a0 y + a1
dy
d2 y
dn−1 y
dx
d2 x
dm−1 x
+ a2 2 + . . . + an−1 n−1 = b0 x + b1
+ b2 2 + . . . + bm−1 m−1
dt
dt
dt
dt
dt
dt
Jedes System, dass sich durch solche lineare Differentialgleichungen beschreiben lässt, folgt dem
Prinzip der Überlagerung (bzw. Superposition) und ist daher linear.
3.1.1
Ausgangssignal im Zeitbereich
Stellt man sich ein lineares System mit diskreten Inputs x1 . . . xn und diskreten Outputs y1 . . . ym vor,
so ist jeder Output yi durch eine gewichtete Summe aller Inputs gegeben:
n
X
yi =
Gij xj
j=1
Ersetzt man die diskreten Inputs und Outputs durch kontinuierliche Äquivalente y(t) und x(τ ), so
wird aus der diskreten Summe das Integral
N ∆τ
Z
G(t, τ )x(τ )dτ
y(t) =
0
wobei N Abtastwerte ∆τ Sekunden auseinanderliegen. Für kausale Systeme, deren Ausgabewerte
nicht von der Zukunft sondern nur von der Vergangenheit bis zum aktuellen Zeitpunkt abhängen,
reicht als obere Schranke für das Integral t. Weiters kann als untere Schranke −∞ für Signale, die
beliebig weit in der Vergangenheit anfangen, angenommen werden.
Wird als Input die Impulsfunktion verwendet, so erhält man die Impulsantwort h(t) des Systems.
G(t, T ) kann als Antwort auf einen Impuls, der zum Zeitpunkt τ = T angewendet wird, interpretiert
werden, d.h. h(t − T ) = G(t, T ). Setzt man nun dieses Äquivalent in das obige Integral ein, so ergibt
sich:
Z
t
h(t − τ )x(τ )dτ
y(t) =
−∞
Dieses Integral ist unschwer als Faltungsintegral zu erkennen. Der Output eines zeitinvarianten linearen Systems ist demnach durch die Faltung von Input und Impulsantwort gegeben:
y(t) = h(t) ∗ x(t)
8
3.1.2
Sprungantwort
Die Sprungfunktion ist wie folgt definiert:
u(t) =


 1.0, t > 0
0.5, t = 0
t<0

 0,
Setzt man die Sprungfunktion in das Faltungsintegral ein, so können die Schranken auf 0 und t eingeschränkt werden, da u(t − τ ) = 0 bei τ > t ist. Weiters ist aber u(t) im Bereich 0 bis t gleich 1 und
kann somit ergibt sich für die Sprungantwort q(t):
Z
t
h(τ )dτ
q(t) =
bzw.
h(t) =
0
3.2
d
q(t)
dt
Lineare Systeme im Frequenzbereich
Im Frequenzbereich ist der Output eines linearen Systems durch Anwendung der Fouriertransformation und des Faltungstheorems auf beide Seiten der Ausgangsgleichung im Zeitbereich gegeben:
Y (f ) = H(f )X(f )
Wobei Y (f ) das Ausgansspannungsspektrum, X(f ) das Eingangsspannungsspektrum und H(f ) die
Frequenzantwort des Systems ist. Bei Frequenz f0 ist die Frequenzantwort eine komplexe Zahl, die
die Spannungsverstärkung (oder -dämpfung) sowie die Phasenverschiebung einer Sinusschwingung
mit Frequenz f0 angibt.
3.3
Zufallssignale und lineare Systeme
Zufällige Signale können nicht als deterministische Funktionen wie x(t) spezifiziert werden. Ihre
Eigenschaften werden durch ihre Dichtefunktion und das Leistungsdichtespektrum festgelegt.
3.3.1
Leistungsdichtespektren linearer Systeme
Quadriert man die Beschreibung eines linearen Systems im Frequenzbereich, so erhält man |Y (f )|2 =
|H(f )X(f )|2 . Da |Y (f )|2 und |X(f )|2 Leistungsdichtespektren sind, ergibt sich
Gy (f ) = |H(f )|2 |Gx (f )|
Über die Fouriertransformation und das Wiener-Kintchine-Theorem ergibt sich schließlich für den
Zeitbereich:
Ryy (τ ) = Rhh (τ ) ∗ Rxx (τ )
3.3.2
Rauschbandbreite
Die Rauschbandbreite eines Filters ist die Breite, die eine rechteckige Frequenzantwort bräuchte, um
die gleiche Rauschleistung wie der Filter zu haben. Ist fp die Frequenz der höchsten Amplitude der
Antwort, so ist die Rauschbandbreite BN gegeben durch:
Z
∞
BN =
0
|H(f )|2
df
|H(fp |2
Die Rauschbandbreite ist nicht gleich der 3dB-Bandbreite. Bei einem Tiefpass-Filter ist die Rauschbandbreite um den Faktor π/2 größer als die 3dB-Bandbreite.
9
3.3.3
Wahrscheinlichkeitsdichte von gefiltertem Rauschen
Bei nicht-gedächtnislosen Systemen gibt es keine generelle Methode um von der Eingabe- auf die
Ausgabedichte zu schließen, bis auf die Dichte von gefiltertem Gauss’schem Rauschen. Das Ausgangsrauschen ist durch die Faltung von Eingangsrauschen und Frequenzantwort gegeben. Man kann
den Output auch als Summe gewichteter Inputimpulse sehen. Sind die Inputimpulse nun weißes
Gauss’sches Rauschen, so sind die einzelnen benachbarten Impulse unabhängige Gauss’sche Zufallsvariablen. Das Ausgangsrauschen zu jedem Zeitpunkt ist daher eine lineare Summe Gauss’scher Zufallsvariablen und daher selbst eine Gauss’sche Zufallsvariable. Gefiltertes weißes Gauss-Rauschen
ist also Gauss’isch.
Teilt man die Frequenzantwort in zwei Funktionen, wobei die erste nicht-weißes Gauss’sches
Rauschen ergibt und die zweite das Endergebnis Gauss’sches Rauschen, so ist klar, dass prinzipiell
gilt, dass gefiltertes Gauss-Rauschen wieder Gauss’isch ist.
3.4
Nichtlineare Systeme und die Transformation von Zufallsvariablen
Nichtlineare Systeme sind schwer zu analysieren, jedoch kann die Dichte des Outputs von gedächtnislosen nicht-linearen Systemen durch die Transformation von Zufallsvariablen leicht ermittelt werden.
Transformation von Zufallsvariablen bedeutet, dass z.B. bei einem Paar bivariater Zufallsvariablen
X, Y und S, T jeder Punkt aus der x, y-Ebene einem Punkt in der s, t-Ebene zugeordnet werden
kann. Jeder der Punkte (xn , yn ) hat seine Fläche dAn in der x, y-Ebene, die einem Rechteck in der
s, t-Ebene zugeordnet ist. Die Wahrscheinlichkeit, dass X, Y in einer der (xn , yn )-Flächen liegt ist
gleich der Wahrscheinlichkeit, dass S, T in dem Rechteck um (s1 , t1 ) liegt:
X
px,y (xn , yn )dAn = ps,t (s1 , t1 )dsdt
n
Diese Gleichung kann auch als Gesetz der Erhaltung der Wahrscheinlichkeit interpretiert werden.
Wenn Gauss’sches Rauschen am Eingang eines Hüllkurvendetektors3 anliegt, so ist die Ausgangsdichte Rayleigh-verteilt. Zu diesem Ergebnis gelangt man, wenn man Rauschamplitude und -phase als
(r, θ) in die rechte Seite der obigen Gleichung einsetzt und dAn durch drdθ ersetzt.
Wenn Gauss’sches Rauschen am Eingang eines square-law4 Detektors anliegt, so ist die Ausgangsdichte Chi-Quadrat-verteilt. Der Detektor wird durch Y = X 2 charakterisiert, d.h. das beide
Wahrscheinlichkeitsbereiche aus X, also px (x)dx und px (−x)dx beide zum gleichen Wahrscheinlichkeitsbereich py (y)dy transformiert werden. Einsetzen und Umformen ergibt die Chi-Quadrat-Dichte.
4
Abtasten, Multiplexen und PCM
Man spricht von einem Basisband-Signal, wenn B ≥ fL gilt und von einem Bandpass-Signal wenn
B < fL gilt.
4.1
Pulsmodulation
Pulsmodulation beschreibt einen Prozess, bei dem die Amplitude, Breite oder Position einzelner Pulse
einer periodischen Pulsreihe entsprechend der Amplitude des Basisband-Informationssignals variiert
3
Wird zur Demodulation von AM-Signalen verwendet
Im linearen“ Bereich ist die Spannung proportional zur Quadratwurzel der Leistung. Im square-law“ Bereich ist das
”
”
Verhältnis von Leistung zu Spannung quadriert“; die Spannung ist proportional zur Leistung
”
4
10
werden. Pulsamplitudenmodulation (PAM) benötigt einen höheren Signal-Rauschabstand5 als Pulspositionsmodulation (PPM) und Pulsweitenmodulation (PWM). Ist die Pulsrate hoch genug (NyquistKriterium), so kann das Informationssignal mit einem idealen Tiefpass aus dem pulsmodulierten Signal herausgeschnitten werden.
4.2
Abtasten
Unter Abtasten (Sampling) versteht man das Aufzeichnen der Ordinaten-Werte (Amplitude) einer
kontinuierlichen Funktion zu bestimmten, normalerweise äquidistanten Werten der Abszisse (Zeit).
Werden bei einer Abtastrate fs ein konstantes Gleichstromsignal und ein periodisches Inputsignal
mit einer Frequenz, die ein ganzzahliges Vielfaches von fs beträgt, abgetastet so ergeben beide die
gleichen Ausgabewerte. Daraus folgt, dass sich im Frequenzbereich das abgetastete Basisbandspektrum bei fs und ganzzahligen Vielfachen von fs wiederholt.
Es gibt zwei Arten von Sampling:
Natural Sampling Ein natürlich abgetastetes Signal ergibt sich, wenn man das Basisband-Informationssignal
mit der periodischen Pulsreihe multipliziert. Dabei entspricht die Form der Pulsspitzen der Form
des abgetasteten Signals. Im Frequenzbereich entspricht der Multiplikation die Faltung und so
ergibt sich ein Signalspektrum, bei dem sich das Spektrum des Informationssignals, gewichtet durch die Amplituden des Pulsreihen-Spektrums, um die ganzzahligen Vielfachen von fs
wiederholt. Nun ist auch klar, warum ein Tiefpassfilter vonnöten ist, um das (Spektrum des)
Informationssignals rückzugewinnen.
Flat Top Sampling Beim natural Sampling entsprechen die Pulsspitzen des Resultats der Form des
abgetasteten Signals. Beim flat top Samping werden sie künstlich abgeflacht. Dieses Signal
erhält man, wenn das Informationssignal mit einer Impulsreihe abgetastet (multipliziert) wird
und die resultierenden, gewichteten Impulse mit einem Rechteckimpuls gefaltet werden. Ebenso wird das Frequenzspektrum des Resultats mit dem Spektrum des Rechteckimpulses multipliziert. Um hier das (Spektrum des) Informationssignals rückzugewinnen muss nach dem
Tiefpass noch eine Entzerrung (Equalisation), nämlich eine Multiplikation mit der Inversen des
Rechteckpulsspektrums, durchgeführt werden.
4.3
Aliasing
Die Bandbreite der Spektral-Repliken muss kleiner sein als ihr Abstand im abgetasteten Signal. Wird
ein Basisband-Signal mit einer zu niedrigen Frequenz abgetastet, so überlappen die sich wiederholenden Frequenzsspektren. Der Tiefpass wird dann nicht mehr bei fH sondern bei fs /2 angewandt und
enthält die abgeschnittenen“ Frequenzen in zurückgeklappter“ Form. Um fehlerloses Abtasten zu
”
”
ermöglichen muss das Nyquist-Kriterium am besten übererfüllt sein.
4.4
Abtasten von Bandpassignalen
Ist die zentrale Frequenz weit höher als die Signalbandbreite, so ist es möglich, auch mit einer Abtastrate unter der Nyquist-Rate das Signal so zu erfassen, sodass es nachher wieder vollständig rekonstruiert werden kann. Für die Abtastrate fs muss dann in folgendem Frequenzband liegen:
2B
5
Q
n
≤ fs ≤ 2B
SNR, Signal to Noise Ratio
11
Q−1
n−1
wobei Q = fH /B und n eine positive Ganzzahl mit n ≤ Q ist, die das Frequenzband festlegt. Ist
Q eine Ganzzahl so ist mit n = Q die Abtastrate genau auf die Nyquist-Rate festgelegt. Ist Q keine
Ganzzahl so ist die am niedrigsten mögliche Abtastrate mit n = bQc gegeben. Ein höheres n würde
die Abtastrate unnötig steigern. Ist Q < 2 so gilt n = 1 und man erhält (da BQ = fH ) das NyquistKriterium.
Die Richtigkeit des Abtastkriteriums ergibt sich bei Betrachtung folgender Fälle der Faltung des
Frequenzspektrums des Bandpassignals mit der Impulsreihe:
• Das Bandpassspektrum kreuzt nfs - bei der Faltung ergeben sich Interferenzen zwischen positiven und negativen spektralen Frequenzrepliken.
• Das Bandpassspektrum kreuzt (n + 21 )fs - es ergeben sich ähnliche Interferenzen.
• Das Bandpassspektrum kreuzt keine der obigen Frequenzen und es ergibt sich für korrektes
Abtasten: fH ≤ n f2s und fL ≥ (n − 1) f2s , was umgeformt obiges Abtastkriterium ergibt.
4.5
Multiplexen analoger Impulse
Oft müssen mehrere Signale über das gleiche Medium (Kabel, Funk, . . . ) übertragen werden. Die
Signale müssen daher genügend getrennt werden - die Güte ihrer Getrenntheit wird mit Orthogonalität
bezeichnet. Orthogonale Signale können unabhängig voneinander empfangen werden. Orthogonalität
kann auf mehrere Arten erreicht werden:
Frequency Division Multiplexing Bei FDM werden die Signale auf unterschiedliche Trägerfrequenzen aufmoduliert und belegen so unterschiedliche Frequenzbänder des Kanals. Empfängerseitig
können sie dann mittels eines Bandpassfilters rückgewonnen werden. Bei Glasfaser-Kanälen
wird das gleiche Prinzip mit Wellenlängen verwendet und Wavelenght Division Multiplexing
genannt.
Time Division Multixplexing Bei TDM werden die PAM-Signale auf unterschiedliche Zeitschlitze
aufgeteilt. Dabei steigt allerdings die Bandbreite, da die Abstände zwischen Pulsen entsprechend verkürzt werden. Die nötige Bandbreite kann jedoch stark reduziert werden, wenn man
bedenkt, dass das TDM-Signal zu den Abtastzeitpunkten lediglich einen korrekten Amplitudenwert liefern muss und laut Nyquists Theorem gibt es eine Kurvenform mit der Bandbreite 2fh ,
die durch diese Punkte führt. Zu den Abtastzeitpunkten selbst ist die Amplitude der Kurvenform
der Wert eines Abtastimpulses, dazwischen eine Überlagerung mehrerer Abtastimpulsewerte.
Die Kanäle können auch Übersprechen, wenn das Medium die Bandbreite limitiert und die nicht
mehr steilen Flanken der Abtastwerte sich überlappen.
4.6
Quantisierte Pulsamplitudenmodulation
Ein PAM-Signal ist zwar diskret im Zeitbereich, aber kontinuierlich im Wertbereich, da alle Amplitudenwerte erlaubt sind - die Dichte der Pulsamplituden ist kontinuierlich. Wird das PAM-Signal
quantisiert, d.h. die Amplituden können nur mehr einen Wert aus einer endlichen Menge an Werten
annehmen, wobei natürlich immer der der tatsächlichen Amplitude am nächsten gelegene ausgewählt
wird, so ist das entstehende Signal digital und besitzt eine diskrete Dichte. Das digitale Signal kann
durch eine endliche Menge an Symbolen repräsentiert werden, wobei ein Symbol einem Quantisierungslevel entspricht.
12
Quantisieren ist mit Qualitätsverlust verbunden, da das quantisierte Signal nicht mehr dem Originalsignal entspricht. Der Unterschied zwischen den letzteren ergibt ein neues Zufallssignal, das
Quantisierungsrauschen. Der Spitzenquantisierungsrauschabstand (SNq R)peak beträgt 3M 2 , wobei
M die Anzahl der Quantisierungsstufen ist.
4.7
Pulscodemodulation
Nachdem ein PAM-Signal quantisiert wurde, kann man anstatt der Pulse selbst lediglich Nummern,
die die Höhe der Pulse angeben, übertragen. Acht Amplitudenlevel könnten durch eine dreistellige
Binärzahl6 repräsentiert werden, wobei die Einsen und Nullen durch unterschiedliche Spannungen
dargestellt werden. Generell ist bei M Amplitudenleveln das Codewort n = log2 M bit lang.
PCM benötigt mehr Bandbreite als das native PAM-Signal - im obigen Beispiel müssen drei Pulse
statt einem übertragen werden. Jedoch können die Spannungslevel bei PCM weitaus leichter unterschieden werden als bei PAM.
4.7.1
Companded PCM
Bei gewöhnlichen“ Signalen kann nicht davon ausgegangen werden, dass alle Quantisierungslevel
”
gleichmäßig genutzt werden, d.h. die Dichte des Informationssignals Uniform verteilt ist. Um das
Quantisierungsrauschen zu minimieren, ist es also sinnvoll, die Quantisierungslevel an den häufig genutzten Stellen zu verdichten und an den weniger genutzten Stellen zu erweitern. Diese nicht-lineare
Quantisierung ist äquivalent zu Companding7 , das das Signal mit einer nicht-linearen Amplitudencharakteristik komprimiert und dann das empfangene Signal mit der inversen Charakteristik dekomprimiert.
Leider ist die Dichte des Informationssignals oft nicht bekannt, z.B. bei der menschlichen Stimme.
In diesem Fall ist es übliche Companding-Strategie, einen konstanten Quantisierungsrauschabstand
für alle Signallevel zu erzielen. Da die Quantisierungsrauschleistung proportional zu q 2 ist, wobei q
den Abstand zwischen zwei Quantisierunsleveln bezeichnet, muss q proportional zum Signallevel, d.h.
v
q konstant sein. Das Signal sollte also so komprimiert werden, dass das Erhöhen des Inputs um einen
Faktor den Output um eine zusätzliche Konstante erhöht. Der konstante Quantisierungsrauschabstand
wird daher durch eine logarithmische Funktion realisiert.
4.7.2
PCM Multiplexing
PCM-Multiplexing kann auf zwei verschiedene Arten erfolgen:
• Ein bereits gemultiplextes (PAM-)Signal wird PCM-kodiert
• Die zu multiplexenden Signale werden zuerst PCM-kodiert und dann per TDM gemultiplext
Die zweite Methode hat den Vorteil, dass die A/D-Wandlung näher an der Signalquelle stattfindet
und dass nicht nur ganze Codewörter, sondern auch die einzelnen Bits der Codewörter ineinander
geschachtelt werden können.
6
7
ein Codewort → PCM
Companding = Compression & Expanding
13
4.8
Möglichkeiten zur Bandbreitenreduktion
Da Bandbreite ein begrenztes und wertvolles Gut ist und es außerdem teuer ist z.B. zusätzliche Leitungen zu legen muss die vorhandene Bandbreite effizient genutzt werden. Dies geschieht durch spektral
effiziente Signalgebungstechniken für (Sprach-)Signale.
4.8.1
Delta PCM
Bei Delta PCM wird statt der Abtastwerte selbst nur die Differenz zum vorangegangenen Abtastwert
übertragen. Da die Differenz üblicherweise kleiner als die tatsächlichen Abtastwerte ist, da nahe bei
einanderliegende Abtastwerte üblicherweise korrelieren, sind kürzere Codewörter vonnöten. Delta
PCM kann sich schnell ändernde Signale allerdings nicht so gut behandeln wie konventionelles PCM.
4.8.2
Differentielles PCM
Differentielles PCM (DPCM) macht sich ebenfalls die Korrelation benachbarter Abtastwerte zunutze
und benutzt einen Algorithmus um zukünftige Abtastwerte vorauszusagen. Übertragen wird dann
nur ein Wert zur Korrektur des vorhergesagten Signals - dieses Korrektursignal beschreibt also den
unvorhersehbaren Teil des Informationssignals. Die Vorhersage-Einheit besteht oft aus einer linear
gewichteten Summe vorheriger Abtastwerte und wird durch ein Schieberegister realisiert.
4.8.3
Adaptives DPCM
Bei adaptivem DPCM (ADPCM) sind die Koeffizienten bzw. Gewichte der Vorhersage-Einheit nicht
fix festgelegt, sondern werden entsprechend der sich ändernden Signalstatistik des Informationssignals angepasst. Die neuen Koeffizienten werden auch übertragen.
4.8.4
Deltamodulation
Wird bei einem DPCM-System die Auflösung des Quantisierers auf 1 bit reduziert, so erhält man das
Schema der Deltamodulation. Der Vorhersage-Algorithmus wird darauf beschränkt, stets anzunehmen, dass der neue Abtastwert gleich dem vorigen ist.
Aus den Anforderungen für geringes Quantisierungsrauschen und Kantenneigungsrauschen8 ergibt sich ein Konflikt: für das Quantisierungsrauschen sollte die Korrekturschrittgröße ∆ möglichst
klein sein um das Signal fein aufzulösen; für das Kantenneigungsrauschen sollte die ∆ relativ groß
sein, damit das vorhergesagte Signal das Informationssignal bei steiler Kantenneigung schnell einholt
und ihm nicht hinterherläuft“. Um beide das Rauschen beider Arten gering zu halten, kann man die
”
∆ klein halten und dafür die Abtastfrequenz erhöhen.
Bleibt das Informationssignal konstant für eine nennenswerte Zeitdauer, so wird das resultierende
rechteckige Quantisierungsrauschen Ruherauschen9 genannt. Durch einen Glättungsfilter wird dieses
hochfrequente Rauschen weggefiltert.
Ist der Signalrauschabstand nicht ausreichend hoch, so interpretiert der Empfänger gelegentlich
ein empfangenes Symbol falsch und es kommt zu einem Fehler in Höhe der ∆.
8
9
slope noise
idle noise
14
4.8.5
Adaptive Deltamodulation
Bei konventioneller Deltamodulation wird, um sowohl Quantisierungs- als auch Kantenneigungsrauschen gering zu halten, ∆ klein und die Abtastfrequenz hoch gesetzt. Bei adaptiver Deltamodulation
ist ∆ variabel. Die Korrekturschrittgröße wird dabei gemäß der Vergangenheit des Quantisierungsfehlers q angepasst - ist q immer gleich +∆, so steigt das Informationssignal schneller, als das
vorhergesagte Signal folgen kann und ∆ wird erhöht. Ist q abwechselnd −∆ und +∆, so ändert sich
das Informationssignal nur langsam und ∆ wird erniedrigt.
5
5.1
Basisbandübertragung und Basisbandmodulation
Basisband Centre Point Detection
Die Erkennung digitaler Signale beinhaltet zwei Prozesse: erstens das Reduzieren jedes empfangenen
Spannungspulses auf einen numerischen Wert und zweitens das Vergleichen dieses Wertes mit einer
Referenzspannung um festzustellen, welches Symbol übertragen wurde.
Bei der centre point detection wird das Signal in der Mitte der Symbolperiode abgetastet und mit
einer Referenzspannung, die bei zwei Spannungsleveln für Null und Eins genau zwischen eben diesen
liegt, verglichen. Je nachdem ob die Spannung über oder unter der Referenz liegt, wird eine Null oder
eine Eins gelesen.
5.2
Bitfehlerwahrscheinlichkeit einer binären Basisbandübertragung
Nimmt ein binäres Signal zwei Spannungslevel V0 und V1 an und ist das Signal mit Gauss-Rauschen
belegt, so erhält man die Dichte des Signals durch Falten der Dichte des Gauss-Rauschens (Glockenkurve) mit den Impulsspitzen der Dichte des Binärsignals. Die gesamte Fläche der neuen Dichte ist
wiederum 1, wobei auf jede der beiden Glockenkurven die Hälfte entfällt. Für den Schwellwert ergibt
1
sich bei den gleichwahrscheinlichen Symbolen V0 +V
2 .
Wird eine Null übertragen, so ist die Wahrscheinlichkeit Pe1 , dass das Signal zum Entscheidungszeitpunkt über dem Schwellwert liegt, durch die doppelte Fläche der Dichte“ p0 vom Schwellwert bis ∞
”
gegeben. Durch Substitution und Verwendung der komplementären und der normalen Fehlerfunktion
erhält man schließlich:
1
V1 − V0
√
Pe1 =
1 − erf
2
2σ 2
Wird eine Eins übertragen, so ist die Wahrscheinlichkeit Pe0 , dass das Signal zum Entscheidungszeitpunkt unter dem Schwellwert liegt, durch die doppelte Fläche der Dichte“ p1 von −∞ bis zum
”
Schwellwert gegeben. Durch die Symmetrie von p0 und p1 ist klar, dass die Fehlerwahrscheinlichkeit
gleich ist, egal welches Symbol übertragen wird. Da die Fehlerwahrscheinlichkeit eigentlich nur vom
Spannungsunterschied ∆V = V1 − V0 abhängt, ergibt sich für Pe :
1
∆V
√
1 − erf
2
2σ 2
Pe =
Da das Ergebnis nur vom Spannungsunterschied zum Abtastzeitpunkt und nicht vom über die Zeit
gemittelten Signalrauschabstand abhängt, variiert es für die unterschiedlichen Pulslevel und -formen.
15
∆V
2
Für unipolares NRZ ist die Spitzensignalstärke Speak = ∆V 2 und die mittlere Signalstärke S =
. Die normalisierte Gauss’sche Rauschstärke beträgt N = σ 2 . Daraus folgt:
2
∆V
=
σ
S
N
1/2
peak
√ S 1/2
= 2
N
"
und daher
1
1
Pe =
1 − erf
2
2
S
N
1/2 #
Für polares NRZ sind die Spitzensignalstärke und die mittlere Signalstärke gleich Speak = S =
∆V
2
2
. Daraus folgt:
∆V
S
=2
σ
N
5.3
"
1/2
und daher
1
1
Pe =
1 − erf √
2
2
S
N
1/2 #
Fehlersummierung über mehrere Hops
Übertragungsmedien dämpfen Signale. Bei der Übertragung über längere Strecken werden daher Repeater eingesetzt, die die Signale wieder verstärken, wobei zwischen verstärkenden und regenerativen
Repeatern unterschieden wird.
Verstärkende Repeater heben das Signal bei Empfang lediglich auf die ursprüngliche Signalstärke
an und verstärken dabei das Rauschen ebenso, so dass nach n Hops das Signal die gleiche Stärke hat
wie zu Beginn, die Rauschstärke allerdings um den Faktor n zugenommen hat.
Regenerative Verstärker entscheiden ob eine Eins oder Null an ihrem Eingang anliegt und erzeugen dann aufgrund ihrer Entscheidung ein neues Signal, wodurch sich das Rauschen nicht pro Hop
aufsummiert.
5.4
Signalisierung (line coding)
Binäre Daten können mittels unterschiedlichster Pulstypen übertragen werden. Diese unterscheiden
sich unter anderem durch Aspekte wie Gleichstromanteil, Leistungsdichtespektrum (besonders im
Hinblick auf den Wert bei 0 Hz), Bandbreite, Rauschimmunität und Taktrückgewinnung.
5.4.1
Unipolare Signalisierung
Unipolare Signalisierung, auch On-Off Keying (OOK) genannt, repräsentiert ein Binärsymbol durch
die Abwesenheit eines Pulses und das andere durch das Auftreten eines Pulses. Dabei wird zwischen non-return to zero (NRZ) und return to zero (RZ) unterscheiden - bei NRZ ist die Dauer des
Pulses gleich der Länge des Symbolzeitschlitzes, bei RZ ist die Pulsdauer kürzer als der Symbolzeitschlitz. RZ-Signale, die üblicherweise ein Tastverhältnis (=Pulsdauer/Symbolzeitschlitz) von 50%
haben, benötigen so die doppelte Bandbreite von NRZ-Signalen. Sie haben allerdings auch den Vorteil einer Spektrallinie bei der Symbolrate f0 = 1/T0 Hz und ermöglichen damit eine einfachere
Taktrückgewinnung.
Sowohl RZ als auch NRZ haben in ihrem Spektrum bei 0 Hz eine Linie, also einen Gleichstromanteil. Bei der Übertragung über Wechselstrom-gekoppelte Repeater wird dieser Gleichstromanteil entfernt und das Signal in ein polares umgeformt. Da sich die AC-gekoppelten Medien wie Hochpassfilter verhalten, kommt es zu einem exponentiellen Abflachen der Signalspitzen nach jedem Übergang
( signal droop“).
”
16
5.4.2
Polare Signalisierung
Bei polarer Signalisierung wird eine Eins durch einen Puls g1 (t) und eine Null durch einen Puls
g0 (t) = −g1 (t) repräsentiert.
5.4.3
Dipolare Signalisierung
Dipolare Signalisierung hat keinen Gleichstromanteil und eignet sich daher gut für AC-gekoppelte
Medien. Das Symbolintervall T0 wird in zwei gleich große Pulse, einer negativ und einer positiv,
aufgeteilt. Somit ist die Fläche unter jedem Puls gleich Null. Beim Manchester-Coding“ wird eine
”
Eins durch einen Null-Eins-Übergang und eine Null gegengleich dargestellt.
5.5
Signalrückgewinnung
5.5.1
Entzerrung von Impulsen
Verzerrung von Amplitude und Phase eines Signals durch das Übertragungsmedium stellt ein signifikantes Problem dar. Bei einer Datenrate von 2Mbit/s hat ein bipolarer RZ-Puls eine Breite von einer
Viertelmikrosekunde und daher eine Bandbreite von ungefähr 2MHz. Bei der Übertragung über ein
Metallkabel wird der Puls stark verzerrt, gedämpft und in der Folge zeitlich gestreckt. Es kommt weiters zu einer Symbolinterferenz der einzelnen empfangenen Symbole. Diesem Phänomen kann man
durch einen Entzerrfilter, der die inverse Übertragungscharakteristik des Übertragungsmediums hat,
entgegenwirken - wo das Medium dämpft, verstärkt der Filter.
5.5.2
Übersprechen
Man spricht bei der kapazitiven Kopplung zwischen den Pulsen eines ausgehenden, noch starken Signals und eines schwachen Eingangssignals von near end crosstalk (NEXT). Far end crosstalk (FEXT)
bezeichnet die Kopplung zwischen den Pulsen zweier ausgehender Signale.
5.6
Taktrückgewinnung
Um die Abtastrate richtig einzustellen muss aus dem bereits entzerrten Signal der Takt rückgewonnen werden. Durch Quadrieren oder Gleichrichten eines biploaren RZ Signals wird das alternierende
Pulsformat entfernt und die Signalbandbreite so verdoppelt. Weiters wird so die Kerbe bei f0 Hz
im Spektrum entfernt und der neue f0 -Anteil kann durch eine Resonanzschaltung extrahiert werden.
Während nur Nullen übertragen werden und kein Takt aus dem Signal entnommen werden kann,
springt die Resonanzschaltung, die mit ihrer natürlichen Frequenz schwingt, ein.
Bei plesiochronem Multiplex kann es durch zusätzliche Bits, die zur Erhaltung der korrekten
Bitrate dienen, zu unregelmäßigem Symbol-Timing und damit zu Timing-Jitter kommen. Timing Jitter
führt zu Frequenzmodulation des zurückgewonnenen Taktsignals führen.
6
Entscheidungstheorie
Bei der Entscheidungstheorie geht es darum, optimale Empfängertrennspannungen zu finden, um sich
zu entscheiden, welches Symbol dem Signalwert zugeordnet wird. Bei weichen (soft) Entscheidungen
wird das Signal zum Entscheidungszeitpunkt auf mehrere Level (üblicherweise acht) quantisiert um
die Vertrauenswürdigkeit der Entscheidung mit angeben zu können. Letztere ist von Interesse sofern
17
man eine Sequenz mehrerer Entscheidungen in Hinblick auf Fehlererkennung betrachtet. Bei harten
Entscheidungen gibt es nur zwei Level.
6.1
A priori, bedingte und a posteriori Wahrscheinlichkeiten
Es gibt unterschiedliche Wahrscheinlichkeiten und Dichten bei der Symbolübertragung:
• P (x) - a priori Wahrscheinlichkeit, dass Symbol x übertragen wird
• p(v|x) - bedingte Dichte der Wahrscheinlichkeit Spannung v zu messen, wenn Symbol x gesendet wurde
• P (x|v) - a posteriori Wahrscheinlichkeit, dass Symbol x gesendet wurde, wenn Spannung v
gemessen wurde
Die a priori Wahrscheinlichkeiten sind normalerweise bereits im Vorhinein bekannt. Die a posteriori
Wahrscheinlichkeiten können erst nach vielen Übertragungen ermittelt werden.
6.2
Das Entscheidungskriterium von Bayes
Das Ziel des Bayes’schen Kriteriums ist es, die Kosten (Fehler oder verlorene Information) zu minimieren: die Kosten wenn Symbol x empfangen und als y missinterpretiert wird, werden mit Cy
bezeichnet. Korrekter Empfang ist kostenlos. Die erwarteten bedingten Kosten C(0|v), die anfallen
wenn Spannung v als Null interpretiert wird, belaufen sich auf: C(0|v) = C0 P (1|v), und vice versa
für C(1|v).
Eine rationale Entscheidungsregel entscheidet sich nun anhand der bedingten Kosten für ein Symbol: gilt C(1|v) < C(0|v), sind also die Kosten für das Interpretieren einer Eins geringer, so wird für
eine Eins entschieden; umgekehrtes gilt für eine Null. Da die verwendeten a posteriori Wahscheinlichkeiten normalerweise nicht bekannt sind, lässt sich über das Bayes’sche Theorem und Umformungen
das Kriterium folgendermaßen angeben:
p(v|0) <1 C0 P (1)
>0
p(v|1)
C1 P (0)
Die linke Seite ist eine Funktion der Spannung und gibt das Wahrscheinlichkeitsverhältnis an und die
rechte Seite einen Wahrscheinlichkeitsschwellwert Lth , der bei gleicher Wahrscheinlichkeit den Wert
1.0 annimmt. Ersetzt man das Ungleichheitszeichen durch ein Gleichheitszeichen, so ergibt sich für
gegebenes Lth eine Gleichung für die optimale Schwellenspannung.
Das Bayes’sche Entscheidungskriterium minimiert auch die mittleren Entscheidungskosten.
6.3
Das Neyman-Pearson Entscheidungskriterium
Das Neyman-Pearson Kriterium basiert nur auf a posteriori Wahrscheinlichkeiten. Es wird vor allem
beim Radar eingesetzt, wo die Kosten von C0 (ein Flugzeug fehlerhaft nicht erkennen) weitaus größer
sind als C1 (ein Flugzeug fehlerhaft zu erkennen). Für eine bestimmte Schwellspannung sind die
Wahrscheinlichkeiten ein Ziel zu erkennen PD und eines Fehlalarms PF A gegeben durch:
Z
∞
PD =
Z
p(v|s + n)dv
bzw.
vth
∞
PF A =
p(v|n)dv
vth
18
wobei s Signal und n Rauschen bezeichnet. Der Schwellwert wird so gewählt, dass die Falschalarme unter einer akzeptablen Wahrscheinlichkeit liegen. Die Erkennungsleistung hängt sowohl von der
Wahl von PF A als auch dem Verhältnis zwischen empfangener Pulsenergie und Rauschleistungsdichte
ab: E/N0 .
7
Optimale Filterung für die Übertragung und Detektion
Es gibt zwei Filtertechniken, die bei digitaler Kommunikation von essentieller Bedeutung sind: das
Filtern bei der Übertragung um die Signalbandbreite zu minimieren und das Filtern beim Empfang
um den Signal-Rauschabstand zum Abtastzeitpunkt zu maximieren.
7.1
Pulsformung für optimales Senden
7.1.1
Intersymbolinterferenz (ISI)
Signalisierung mit Rechteckimpulsen hat theoretisch unendliche Bandbreite, praktisch können Rechteckpulse auch über Kanäle mit begrenzter Bandbreite übertragen werden, wenn ein gewisses Maß an
Verzerrung in Kauf genommen wird. Ist die Verzerrung allerdings zu stark, so überlappen sich die
Pulse im Zeitbereich und die Spannung zum Abtastzeitpunkt kann nicht nur vom gewünschten, sondern zusätzlich von einem oder mehreren vorigen Pulsen herrühren. Das Verschmieren eines Pulses
in einen anderen wird als Intersymbolinterferenz bezeichnet.
Die Performanz digitaler Kommunikation wird dabei allerdings nur von ISI zum Abtast- bzw.
Entscheidungszeitpunkt beeinträchtigt. Außerhalb des Entscheidungszeitpunktes ist irrelevant. Für ein
ISI-freies Signal genügt es also, wenn es zu allen Abtastzeitpunkten bis auf einen einen Nulldurchgang
hat. Ein gutes Beispiel dafür ist der sinc-Puls, der allerdings praktisch nicht realisierbar ist10 , und
außerdem langsam abklingt.
Um ein schnelleres Abklingen zu erreichen, müsste man den sinc-Puls mit einer schnell abklingenden, monotonen Funktion multiplizieren. Solange die abklingende Funktion reell und gerade ist,
ist auch das Spektrum reell und gerade und das Spektrum des Ergebnis ist ungerade um die Trennfrequenz des sinc-Pulses.
Daraus ergibt sich eine alternative Definition eines ISI-freien Signals, nämlich dass es ein ungerades Spannungsspektrum um 2T1 0 Hz bzw. zwischen dessen zentraler Frequenz fc und fc ± 1/T0 Hz
hat.
7.1.2
Das Nyquist’sche Symmetrietheorem
Das Nyquist’sche Symmetrietheorem definiert eine Symmetriebedingung die H(f ) erfüllen muss um
eine ISI-freie Impulsantwort zu geben:
Wird die Amplitudenantwort eines rechteckigen Tiefpassfilters mit linearer Phase und
Bandbreite fχ durch Addition mit einer reellwertigen Funktion mit ungerader Symmetrie um die Trennfrequenz des Filters modifiziert, dann besitzt die sich daraus ergebende Impulsantwort zumindest die in der originalen sinc(2fχ t)-Impulsantwort enthaltenen
Nulldurchgänge und ist damit ISI-frei.
10
da rechteckige Tiefpass-Filter nicht realisierbar sind
19
Das Theorem muss nicht weiter begründet werden, da es direkt aus den Spektraleigenschaften eines
ISI-freien Signals folgt. Ein Filter, der aus dem Nyquist-Symmetrietheorem hervorgeht, heißt NyquistFilter.
7.1.3
Raised-Cosine Filter
Die raised-cosine Filter bilden eine Untermenge der Nyquist-Filter. Die ungerade Symmetrie wird
durch eine halbe Cosinusschwingung - den abschwingenden Teil von der Spitze bis zum Nulldurchgang - erreicht. Das Amplitudenspektrum hat folgende Form (siehe Abb. 1):
|H(f )| =



1
2
n
1 + sin
h 1.0,


π
2
1−
0,
|f |
fχ
fχ
∆f
io
|f | ≤ (fχ − ∆f )
, (fχ − ∆f ) < |f | < (fχ + ∆f )
|f | ≥ (fχ − ∆f )
Dabei bezeichnet fX die Trennfrequenz des zugrundeliegenden rechteckigen Tiefpassfilters und verhält
sich zur Symbolperiode T0 durch fχ = 1/(2T0 ). ∆f bezeichnet die absolute bzw. Exzess-Bandbreite
fχ
des Filters über fχ hinaus. Die normalisierte Exzess-Bandbreite ist durch α = ∆f
gegeben und wird
roll-off Faktor genannt. Der Einfluss des roll-off Faktors ist ebenfalls aus Abb. 1 ersichtlich.
Abbildung 1: Amplitudenspektrum eines Raised-Cosine Filter
7.1.4
Duobinäre Zeichengebung
Duobinäre Zeichengebung verwendet statt des schwierig zu konstruierenden rechteckigen Tiefpasses
einen Cosinus-Tiefpass, der ebenfalls eine Trennfrequenz bei 1/2T0 hat. Der abgestuftere roll-off des
Cosinusfilters verglichen mit dem rechteckigen Tiefpass hat eine längere Impulsantwort und damit
höhere ISI zur Folge. Die ISI tritt allerdings nur zwischen benachbarten Symbolen auf und ist von
vorhersagbarem Ausmaß.
7.2
Pulsfilterung für optimales Empfangen
Bei der centre point detection Methode wird aufgrund eines Abtastwertes eine Entscheidung für ein
Symbol getroffen. Betrachtet man mehrere Abtastwerte innerhalb der Symboldauer, so kann man
zuverlässigere Entscheidungen treffen. Dazu werden die n Abtastwerte summiert und mit dem nfachen des Schwellwertes verglichen. Bildet man dabei den Grenzwert n → ∞, so wird aus der
Summe der Abtastwerte (inklusive Rauschen) eine Integration des Signals (inklusive Rauschen) über
20
die Symboldauer. Dieses Verfahren wird integrate and dump (I+D) detection genannt. I+D ist ein
Sonderfall eines generellen Entscheidungsprozesses, der auf jede Signalform angewandt werden kann,
nämlich matched filtering.
7.2.1
Matched Filtering
Ein Filter, der dem Entscheidungsschaltkreis eines Empfängers direkt vorgeschalten ist, wird mat”
ched“ (also ansprechend auf, oder passend zu) einem bestimmten Symbolpuls genannt, wenn er den
Signalrauschabstand zum Abtastzeitpunkt maximiert, sofern der Puls dieses bestimmte Symbols, auf
das er matched“, am Filtereingang anliegt.
”
Betrachtet man das Energiedichtespektrum eines Pulses verglichen mit dem Leistungsdichtespektrum weißen Rauschens (eine konstante Linie), so sieht man, dass manche Frequenzbänder des Pulses
einen hohen und manche einen niedrigen Signalrauschabstand haben. Die Frequenzbänder mit hohem
SNR sollten einen höheren Einfluss im Entscheidungsprozess haben, als diese mit niedrigem SNR.
Dieser Umstand führt auf das Bilden einer gewichteten Summe der einzelnen Frequenzband Rauschund Signalenergien hin, wobei die Gewichte direkt proportional zum SNR des jeweiligen Frequenzbandes sind. Da das Leistungsdichtespektrum des Rauschens konstant ist, ist SNR proportional zu
|V (f )|2 . Da weiters die Leistung bzw. Energie, die von einem Filter weitergegeben wird proportional zu |H(f )|2 ist, muss das Quadrat der Amplitudenantwort eines matched filter formgleich zum
Energiedichtespektrum des Pulses sein, auf den er abgestimmt ist.
Bleibt noch die Frage nach der Phasenantwort des matched filter. Zuerst zerlegt man eine periodische Version der Pulsfolge in seine einzelnen Cosinusschwingungen. Damit die Signalstärke zum
Entscheidungszeitpunkt maximal ist müssen alle einzelnen Schwingungen zum Entscheidungszeitpunkt ihren Spitzenwert erreichen. Dies wird dadurch erreich, dass die Phasenantwort des matched
filter genau dem invertierten Phasenspektrum des Pulses entspricht. Der gefilterte Puls hat dann ein
Nullphasenspektrum.
In der Praxis muss noch eine Phasenverschiebung um e−jωT0 , die einer Zeitverschiebung um T0
entspricht, hinzugefügt werden, damit die einzelnen Cosinuskomponenten genau zum Zeitpunkt T0
ihre konstruktive Interferenz bilden. Schließlich ergibt sich für die Übertragungsfunktion des matched
filter:
H(f ) = kV ∗ (f )e−jωT0
Um die Impulsantwort zu erhalten, muss lediglich die Frequenzantwort invers Fourier transformiert werden. Dabei ergibt sich:
h(t) = k v ∗ (T0 − t)
D.h. die Impulsantwort eines matched filter ist die zeitumgekehrte Version des Pulses, die zusätzlich
um die Pulsdauer verzögert ist.
Das Ausgangssignals des Filters ergibt sich durch Faltung der Impulsantwort mit dem Eingangssignal. Die Faltung besteht bekannterweise aus dem Umkehren einer Funktion und der Zeitverschiebung
des Resultats über die andere Funktion. Da die Impulsantwort bereits eine umgekehrte Kopie des erwarteten Eingangssignals ist, und die Faltung noch eine Umkehrung erfordert ist das Ausgangssignal
durch das Integral über das Produkt des Eingangssignals (oder der Impulsantwort) mit sich selbst
gegeben. Das Ausgangssignal ist daher die Autokorrelation des Eingangssignals:
vout (t) = vout (T0 − τ ) = k Rvin vin (τ )
21
7.2.2
SNR zum Entscheidungszeitpunkt
Das Rauschen am Eingang, multipliziert mit dem Eingangssignal wird durch die Autokorrelationsfunktion beschrieben:
Rxx (τ ) = hn(t)v(t) n(t + τ )v(t + τ )i =
N0
δ(τ )Rvv (0)
2
wobei x(t) = v(t)n(t); δ(τ ) ist überall Null, außer bei τ = 0. Weiters ist Rvv (0) der quadratische
Mittelwert von v(t):
1
N0
δ(τ )
Rxx (τ ) =
2
T0
T0
Z
v 2 (t)dt =
0
N0
Es
δ(τ )
2
T0
[V2 ]
Über das Wiener-Kintchie Theorem erhält man das Leistungsdichtespektrum von x(t):
Gx (f ) =
N 0 Es
2 T0
[V2 /Hz]
Die Impulsantwort eines Gerätes, das von 0 bis T0 integriert (und das tut der Filter), ist ein Rechteckimpuls der Dauer T0 . Über die Fouriertransformation erhält man die Frequenzantwort:
H(f ) = T0 sinc(T0 f )e−jωT0 /2
Die Rauschleistungsdichte am Ausgang des Integrators beträgt:
Gy (f ) = Gx (f )|H(f )|2 =
N0
Es T0 sinc2 (T0 f )
2
Für die Rauschstärke am Korrelatorausgang ergibt sich daher:
N=
N0
Es T 0
2
Z
∞
−∞
sinc2 (T0 f )df =
N0
Es
2
[V2 ]
Die Ausgangsspannung eines Korrelationsdetektors ist bei orthogonalen Signalpulsen gleich der normalisierten Symbolenergie:
f (kt0 ) = Es
[V ]
→
S = |f (T0 |2 = Es2
[V2 ]
Daher ergibt sich für den Signalrauschabstand:
2Es
S
=
N
N0
Der Signalrauschabstand hängt also nur von der Pulsenergie und dem Rauschleistungsdichtespektrum,
nicht jedoch der Pulsform ab.
7.2.3
Matched Filter Detektion vs. Korrelationsdetektion
Korrelations- und matched filter Detektoren geben zwar bei gleichem Eingangssignal identische Rauschund Signalspannungen zum Abtastzeitpunkt ab, erzeugen jedoch nicht notwendigerweise die gleiche
Ausgangspulsform. Das liegt daran, dass der Korrelator den empfangenen Puls und den Referenzpuls
über die gesamte Pulsdauer miteinander verbindet, wohingegen beim Filter der empfangene Puls über
den Referenzpuls gleitet und so das Rauschen vernachlässigend die wahre Autokorrelationsfunktion
repräsentiert.
22
7.3
Root Raised Cosinus Filterung
Die Nyquist-Frequenzantwort beinhaltet bei idealem Frequenzgang des Kanals den Pulsformfilter
beim Sender und jegliche Filterung im Empfänger vor dem Entscheidungsschaltkreis: HN (f ) =
HT (f )HR (f ). Die Frequenzantwort kann also beliebig zwischen Sender und Emfpänger aufgeteilt
werden. Stehen Sender- und Empfängerfilter im Verhältnis HT∗ (f ) = HR (f ), so ist das Spektrum
der gesendeten Pulse die konjugierte Frequenzantwort des Empfängers. Abgesehen von der Phasenverschiebung ist dies genau das Kriterium für einen matched filter. Es ist also möglich durch aufteilen der gesamten Systemfrequenzantwort sowohl das Nyquist als auch das matched filter Kriterium
gleichzeitig zu erfüllen. Diesem Umstand wird der root raised cosine filter gerecht:
( p
cos2 (πf /4fx ), f ≤ 2fx
0,
f > 2fx
HT (f ) = HR (f ) =
wobei fx = 1/(2T0 ).
8
Informationstheorie, Quellkodierung und Verschlüsselung
Die Informationstheorie beschäftigt sich mit der Repräsentation von Information durch Symbole und
ermöglicht die Messung der Effizienz von Kommunikationssystemen. Folgende Termini werden benutzt:
• Symbol: ein Zeichen des Quellalphabets
• Baud: Symbolübertragungsrate (Symbole/sec)
• Bit: Informationsmenge eines Symbols mit Wahrscheinlichkeit P = 0.5
8.1
Information und Entropie
Der Informationsgehalt steht im Bezug zur Wahrscheinlichkeit: desto wahrscheinlicher es ist, dass
eine gewisse Nachricht übertragen wird, desto niedriger ist deren Informationsgehalt. Der Informationsgehalt sollte also mit steigender Nachrichtenwahrscheinlichkeit P (m) abnehmen und für eine
Wahrscheinlichkeit von P (m) = 1 Null betragen. Weiters sollte der Informationsgehalt zweier Nachrichten die Summe des Informationsgehaltes der einzelnen Nachrichten sein. Da die Wahrscheinlichkeit der gesamten Nachricht gleich dem Produkt der Wahrscheinlichkeiten der einzelnen Nachrichten
ist, muss also der Informationsgehalt summiert werden, wenn die Wahrscheinlichkeiten multipliziert
werden. Diese Anforderung erfüllt der Logarithmus und der Informationsgehalt Im einer Nachricht
m ist folgendermaßen definiert:
Im = log
8.2
1
= − log P (m)
P (m)
Entropie einer binären Quelle
Entropie ist die mittlere Information, die pro Symbol übertragen wird. Für ein Alphabet der Größe 2
und unter der Annahme, dass alle Symbole statistisch unabhängig sind, gilt:
H=
2
X
m=1
P (m) log2
1
P (m)
23
[Bit/Symbol]
Die Entropie erreicht ihr Maximum wenn die Symbole gleichwahrscheinlich sind (siehe Abb. 2). Hat
irgendeine Nachricht eine Wahrscheinlichkeit von Eins, so ist die Entropie Null - die entsprechende
Nachricht wird fortwährend gesendet.
Abbildung 2: Entropie einer binären Quelle
8.3
Informationsverlust durch Rauschen
Bei einem verrauschten Übertragungskanal, besteht empfängerseitig immer eine gewissen Ungewissheit, welches Symbol gesendet wurde. Diese Ungewissheit lässt sich durch die bedingte Wahrscheinlichkeit von P (iT X |jRX ) ausdrücken. Die tatsächliche Entropie beim Empfänger ist um diese Ungewissheit (E)11 kleiner. Die Ungewissheit kann auch als unechte oder negative Information angesehen
werden.
8.4
Quellkodierung
Quellkodierung beeinflusst die Quellentropie nicht; die Entropie ist also eine fundamentale Eigenschaft der Quelle selbst. Quellkodierung beeinflusst allerdings die Symbolentropie und kann auch
Fluktuationen in der Informationsrate reduzieren.
8.4.1
Codeeffizienz
Die größtmögliche Entropie einer Quelle Hmax wird erreicht, wenn alle Symbole gleichwahrscheinlich sind. Die Codeeffizienz wird durch den Quotient von tatsächlicher und maximale Entropie definiert:
H
ηcode =
× 100%
Hmax
Werden Quellsymbole in binäres Alphabet übersetzt, so haben die einzelnen Codewörter eine Länge
lm und eine mittlere Codewortlänge L ist folgendermaßen definiert:
L=
M
X
P (m)lm
m=1
Und bei der Codeeffizienz kann dann statt Hmax die mittlere Codewortlänge L eingesetzt werden.
11
E für equivocation (=Mehrdeutigkeit)
24
8.4.2
Dekodieren von Codewörtern variabler Länge
Ein effizienter Code repräsentiert Information mit möglichst wenigen Ziffern. Dies hat eine variable
Codewortlänge zur Folge. Zwei Eigenschaften sind von essentieller Bedeutung, sollen solche Codewörter variabler Länge dekodiert werden:
• Eindeutiges Dekodieren: Ein Code, bei dem ein A durch 0 und ein B durch 00 repräsentiert
wird, lässt sich die Folge 0000 nicht eindeutig dekodieren - es könnte sich um ABA, AAAA,
BB oder ähnliches handeln.
• Sofortiges Dekodieren: Um sofortiges Dekodieren zu ermöglichen, darf kein vollständiges Codewort Teil eines größeren Codewortes sein.
8.5
Beispiele für Quellkodierung
Morsecode Der am öftesten auftretende Buchstabe, das E, hat das kürzeste Codewort, das Y ein
4-bittiges.
Vocoder Vocoder benutzen Modelle des phyischen Mechanismus der Spracherzeugung, um verständliche Sprachsignale kleiner Bitrate zu erzeugen. Dazu werden die Modellparameter in Form
adaptiver Filterkoeffizienten übertragen. Die adaptiven Filter werden beim Empfänger durch
einen Pulsgenerator mit der entsprechenden Frequenz für stimmhafte Töne angeregt.
Subbandkodierung Bei der Subbandkodierung wird das übertragene Signal in zwei oder mehrere
Subfrequenzbänder unterteilt. Da die unterschiedlichen Frequenzbänder Signale unterschiedlicher Energie enthalten kann die Genauigkeit (Anzahl der Bits) der einzelnen Quantisierer im
Encoder für niedrigenergetische Bänder reduziert werden.
Audiokodierung Effiziente Audiokodierung nutzt die Frequenzcharacteristik des menschlichen Ohrs
aus: Signale mit hohem Level maskieren (im Frequenzbereich) benachbarte Signale mit niedrigem Level.
Stringkodierung Stringkodierung ist besonders effizient um zeichenbasierte Daten zu kodieren: oft
vorkommende Zeichenketten werden durch kürzere Codewörter repräsentiert. Der zeitliche
Aufwand ist jedoch hoch, da die oft auftretenden Zeichenketten erst herausgefunden werden
müssen.
9
Kanalkodierung
Fundamentale Ressourcen bei digitaler Kommunikation sind Signalstärke, -zeit und -bandbreite, die
gegeneinander eingetauscht werden können. Ziel ist es üblicherweise, bei einer maximalen Datentransferrate und einer minimalen Bandbreite noch eine akzeptable Qualität der Übertragung zu gewährleisten. Error control coding (Kanalkodierung) dient dazu, Fehler in der Übertragung der Symbole zu
entdecken und eventuell auch zu korrigieren.
Es gibt zwei Messgrößen für die Fehlerperformanz: die Bitfehlerrate (BER, bit error rate) und die
bekannte Wahrscheinlichkeit eines Bitfehlers Pb . Die Bitfehlerrate ist die mittlere Rate zu der Fehler
auftreten und durch das Produkt von Pb Rb gegeben, wobei Rb die Bitübertragungsrate des Kanals ist.
25
9.1
Kanalkodierungs-Konzepte
Ist die Fehlerrate eines Systems zu hoch, so gibt es mehrere Möglichkeiten, sie zu verbessern:
Senderstärke Das Erhöhen der Senderstärke ist ein einfaches Konzept, aber ungünstig im Fall begrenzter Energieressourcen (z.B. Batteriebetrieb).
Diversität Es gibt drei Arten von Diversität: Raumdiversität, Frequenzdiversität und Zeitdiversität.
Bei allen drei Konzepten wird Redundanz umgesetzt: Raumdiversität benutzt zwei Antennen;
Frequenzdiversität sendet ein Signal auf zwei unterschiedlichen Frequenzen; bei Zeitdiversität
wird eine Nachricht öfters hintereinander gesendet.
Full Duplex Sobald ein Sender Daten an den Empfänger überträgt, sendet letzterer sie sofort auf
einem seperaten Kanal zurück. Sieht der Sender, dass eine Nachricht fehlerhaft war, so sendet
er sie erneut. Diese Technik benötigt die doppelte Bandbreite einer Half Duplex Übertragung.
ARQ Wird bei automatic repeat request ein Fehler in der Übertragung erkannt, so fordert der Empfänger
über einen Feedback-Kanal den fehlerhaften Datenblock erneut an.
FECC Bei forward error correction coding wird mittels eines data check Bits unter den Informationsbits Redundanz implementiert. Ein Nachteil ist die benötigte Zeit um die Nachrichten zusammenzusetzen und empfängerseitig zu prüfen.
9.1.1
ARQ-Techniken
Es gibt prinzipiell zwei ARQ-Techniken, wobei beiden gemein ist, dass, sofern der Sender keine (weder positive noch negative) Rückmeldung erhalten hat, ein Datenblock spätestens nach dem Ablaufen
eines Time-Outs erneut übertragen wird.
• Bei stop and wait ARQ wird jeder Datenblock vom Empfänger als positiv oder negativ bestätigt,
bevor ein neuer Datenblock übertragen wird
• Bei continuous ARQ werden, ohne die empfängerseitige Bestätigung abzuwarten, Datenblöcke
gesendet. Dabei wird wiederum zwischen zwei Varianten unterschieden:
– Bei der go-back-N Version hat jeder Datenblock eine Sequenznummer N . Jedes Quittungssignal enthält die Sequenznummer eines Datenblocks und bestätigt damit den Empfang aller Datenblöcke bis N − 1. Bei Time-Out oder einer negativen Quittierung werden
alle Datenblöcke ab dem fehlerhaften erneut übertragen.
– Bei der selective repeat Version werden nur die Datenblöcke mit negativer Quittierung
bzw. Time-Out erneut übertragen.
9.1.2
Der Schwelleneffekt in der Bitfehlerwahrscheinlichkeit
Betrachtet man Abbildung 3, so fällt auf, Dass das FECC-kodierte Signal bei einem SNR von 6dB
praktisch Null ist, dann mit abnehmendem SNR allerding steil ansteigt und sogar das unkodierte Signal übertrifft. Grund dafür ist, dass in einem Bereich geringen Signal-Rauschabstandes der Dekoder
durch den Versuch Fehler zu korrigieren, die Fehleranzahl verdoppelt.
26
Abbildung 3: Schwellwert-Phänomen
9.2
Güteparameter für Codes
Es gibt zwei Güteparameter für Codes:
• Die Hammingdistanz gibt an, um wie viele Bits sich zwei Codewörter unterscheiden, d.h. wie
leicht es ist ein Codewort falsch als ein anderes zu interpretieren.
• Das Gewicht eines Codewortes gibt an, wie viele Einsen das Codewort enthält.
9.3
Block Codes
Ein Blockkodierer nimmt ein k-stelliges Informationscodewort und macht daraus ein n-stelliges kodiertes Codewort. Das n-stellige Codewort besteht daher aus k Informationsbits und (n − k) Bits
redundanter Paritäts-Bits. Das Verhältnis von k zu n ist die Rate oder Effizienz des Codes R = nk und
bewegt sich normalerweise zwischen 0,5 und 1.
Es gibt zwei Arten von Blockcodes:
• Bei systematischen Codes werden, wie soeben beschrieben, die Informationsbits explizit zusammen mit den Paritätsbits übertragen. Gemäß der strengen Definition müssen die Informationsbits und die Paritätsbits jeweils als konsistenter Block übertragen werden, bei der lockeren
Definition müssen die Informationsbits lediglich im Codewort enthalten sein.
• Bei nicht systematischen Codes darf das n-stellige Codewort keine der Informationsbits explizit
enthalten.
Ein Beispiel ist der single parity check code. Dem Codewort wird ein Paritätsbit P angehängt:
enthält das Codewort eine ungerade Anzahl an Einsen, so ist P = 0, bei einer geraden Anzahl an
Einsen ist P = 1. Die Effizienz beträgt 87 und zeigt so von geringer Redundanz. Einfache Paritätsüberprüfung kann nur eine ungerade Anzahl an Fehlern erkennen.
27
Paritätsbits können auf Basis einer Paritätsüberprüfungsmatrix H berechnet werden. Eine solche
Matrix sieht z.B. folgendermaßen für einen (7, 4) Blockcode aus:


1011 : 100


H =  1101 : 010 
1110 : 001
Dabei gibt die linke Seite die Koeffizienten für die Nachrichtenbits an und die rechte Seite die Information darüber, welches Paritätsbit betroffen ist. So gibt die erste Reihe die Information für das
Paritätsbit P1 an: P1 = 1I1 ⊕ 0I2 ⊕ 1I3 ⊕ 1I4 .
9.4
Fehlerwahrscheinlichkeit eines Codewortes
Die Wahrscheinlichkeit von genau j Fehlern in n Zeichen mit einer Fehlerwahrscheinlichkeit von Pe
pro Zeichen in einem Codewort beträgt:
P (j Fehler) = (Pe )j (1 − Pe )n−j ×n Cj
Die Wahrscheinlichkeit von mehr als R0 Fehlern beträgt somit:
0
P (Fehleranzahl > R0 ) = 1 −
R
X
P (j)
j=0
Die Anzahl an Fehlern in einem großen Datenblock ist nahe bei Pe n. Die Anzahl der Blöcke mit von
Pe n stark unterschiedlichen Fehlerraten sinkt wenn die Blocklänge n steigt. Ein Code, der Pe n Fehler
in einem Block korrigieren kann, ist bei hohem n also ein Garant dafür, dass das Kodiersystem nur
in wenigen Fällen fehlschlägt. Blockcodes, im speziellen lineare Gruppencodes lassen sich sehr gut
hinsichtlich ihrer Performanz analysieren.
9.5
Lineare Gruppencodes
Gruppencodes beinhalten das Null-Codewort und sind abgeschlossen - nimmt man zwei Codewörter
Ci und Cj so gilt Ci ⊕ Cj = Ck , wobei Ck ebenfalls ein Codewort ist. Gruppencodes werden normalerweise polynomiell generiert und lassen sich in zwei Hauptgruppen unterteilen: die binären BoseChaudhuri-Hocquenghem (BCH)-Codes und die in CD-Playern und Computerspeichern eingesetzten
Symbol-weise organsierten Reed-Solomon Codes.
9.5.1
Performanz von Gruppencodes
Die wichtigste Messgröße für die Vorhersage von Code-Performanz ist die minimale Hammingdistanz
zwischen allen Codewortpaaren. Normalerweise müssen dazu alle Codewortpaare untersucht werden.
Bei Gruppencodes reicht es jedoch jedes des Codewörter mit dem Null-Codewort zu vergleichen: Die
Wahrscheinlichkeit, dass Ci als Cj missinterpretiert wird, hängt von dem Abstand zwischen Ci und
Cj ab. Der Abstand ist aber das Gewicht des Codewortes Ck , wobei Ci ⊕ Cj = Ck gilt.
28
9.6
Hamming-Bound
Die Fehlerkorrigierungsstärke eines Codes beträgt t, wenn er alle Codewörter mit t oder weniger
Fehlern korrigieren kann. Der Hamming Bound gibt eine obere Schranke für die Performanz von
Blockcodes an. Für einen Code mit Codewortlänge n und k Informationsbits gilt:
2k ≤
2n
1 + n +n C2 +n C3 + . . . +n Ct
Es gibt insgesamt 2k dekodierte Codewörter. Für jedes dieser dekodierten Codewörter gibt es 1 Codewort ohne Fehler, n kodierte Codewörter mit einem Fehler, n C2 Codewörter mit zwei Fehlern bis n Ct
Codewörter mit t Fehlern, die als dieses dekodierte Codewort missinterpretiert werden können. Dividiert man die Anzahl aller möglichen n-stelligen Codewörter, also 2n durch die soeben aufgestellte
Summe (der Divisor in obiger Ungleichung), so erhält man die maximale Anzahl an InformationsCodewörtern.
9.7
9.7.1
Syndrom
Kodierung
Lineare Gruppencodes können mittels einer Generator-Matrix, einer Matrix aus Basisvektoren, konstruiert werden. Eine G-Matrix für einen (7, 4)-Blockcode sieht wie folgt aus:




G=
1000 : 111
0100 : 011
0010 : 101
0001 : 110





Auf der linken Seite befinden sich die Basisvektoren, die rechte Seite enthält die Paritätsbits (der transponierte linke Teil der H-Matrix). Da der Code einzelne Fehler korrigieren soll, muss die minimale
Hammingdistanz bzw. das Gewicht des Codewortes drei betragen. Da der Basisvektoren-Teil immer
nur eine Eins enthält, muss die Paritätssektion zumindest zwei Einsen enthalten.
Die Berechnung des Codeworts erfolgt gemäß der Matrixgleichung:
yi =
n
X
Gij xj
j=1
Das heißt, die obige Matrix würde eine Eingabe von [1001] in das Codewort [1001001] wandeln. Man
kann die Erzeugung eines Codeworts auch als die gewichtete Summe modulo 2 von Zeilen aus G
betrachten. Die Eingabe gibt dabei die Gewichte an: für 1001 wird die erste Zeile mit 1, die zweite
und dritte mit 0 und die vierte wiederum mit 1 gewichtet. Nach der Gewichtung werden die einzelnen
Stellen der Zeilen aus G antivalent verknüpft.
9.7.2
Dekodierung
Die Syndrom-Dekodiertabelle ist unabhängig vom übertragenen Codewort und damit um den Faktor
2k kleiner als eine Nachbarschaftstabelle. Ist d ein k-stelliger Nachrichtenvektor, G die GeneratorMatrix und c das n-stellige Codewort, so gilt: d G = c und H c = 0. Ist r = c ⊕ e die Datensequenz
29
nach Übertragung von c und e ein Fehlervektor, der angibt an welchen Stellen in r Fehler auftreten,
so ist der Syndrom-Vektor s definiert durch:
s = Hr = H(c ⊕ e) = Hc ⊕ He = 0 ⊕ He
Sind keine Fehler aufgetreten, so ist s gleich dem Nullvektor. Die Berechnung von s ermöglicht direkten Zugriff auf sämtliche Fehlerpositionen, die ja durch e angegeben sind. Zum Aufbau der Syndromtabelle wird von einer Übetragung des Nullvektors ausgegangen und für alle möglichen korrigierbaren
Fehlermuster (e) der Syndromvektor berechnet.
9.8
Zyklische Codes
Zyklische Codes sind eine Unterklasse der Gruppencodes, die kein Null-Codewort besitzen (z.B.
Hamming-Code). Ihre Code-Struktur kann in Hardware einfach mittels Schiberegistern und Antivalenzgattern implementiert werden. Die Codewörter von zyklischen Codes sind laterale oder zyklische
Verschiebungen anderer Codewörter. RS und BCH sind zyklische Codes.
9.8.1
Kodierung & Dekodierung
Ein CRC (cyclic redundancy check) ist der Rest einer binären Division modulo 2. CRCs werden
vielfach zur Fehlererkennung eingesetzt. Wird eine Nachricht der Länge k mit den Bits mk−1 . . . m0
übertragen, so wird sie als Polynom der Ordnung k − 1 betrachtet:
M (x) = mk−1 xk−1 + . . . + m1 x + m0
Die Nachricht M (x) wird durch das Generatorpolynom P (x) modifiziert um daraus die kanalkodierte
Version von M (x) zu erzeugen. Dazu wird zuerst M (x) um i Stellen nach links geschoben, wobei
i die Ordnung von P (x) bezeichnet. Danach wird die nun erweiterte Version von M (x) durch P (x)
durchdividiert. Der Rest, der bei dieser Division überbleibt, überschreibt dann die im ersten Schritt zu
M (x) hinzugefügten Nullen.
Beim Empfänger wird die empfangene Nachricht durch P (x) durchdividiert - ist der Rest Null,
so wurde die Nachricht korrekt übertragen. Ist der Rest nicht Null, so können über eine Syndromtabelle die Fehlerstellen ermittelt bzw. die Fehler durch Addition mit dem entsprechenden Fehlermuster
korrigiert werden.
Das Generator-Polynom wird sorgfältig ausgewählt, um möglichst viele Fehler korrigieren zu
können. Ein Generatorpolynom der Ordnung k erlaubt die Fehlererkennung von bis zu k Bits in Folge.
9.8.2
Interleaving
Werden Daten in Blocks unterteilt und diese nachfolgend aufgetrennt sowie zwischen einander gelegt,
so hat ein burst-Übertragungsfehler nur Auswirkungen auf Teile der ursprünglichen Blöcke.
Nimmt man den Zeitaufwand in Kauf, so ist es möglich, mittels FECC durch lange burst-Übertragungsfehler entstandene Fehler zu korrigieren. Interleaving kann sowohl blockweise, wie bei der
Audio-CD und RS, als auch bitweise implementiert werden.
9.9
Faltungscodes
Der Name Faltungscode kommt daher, dass die Ausgabe aus der Faltung von Eingabedaten und der
Impulsantwort des Kodierers besteht.
30
9.9.1
Kodierung
Faltungscodes werden generiert, indem eine Datensequenz (Nachricht) durch ein Schieberegister geschoben wird. Diese Schieberegister hat zwei oder mehrere Gruppen von Abgriffen, wobei die Abgriffe einer Gruppe jeweils in einem Antivalenzgatter enden. Die Ausgabefunktion, die durch das Antivalenzgatter und dessen entsprechenden Eingänge festgelegt ist, kann durch ein Generatorpolynom
beschrieben werden. Die Ausgabe erfolgt im Takt des Schieberegister und besteht aus der Aneinanderreihung der Ausgabewerte aller Antivalenzgatter.
Die Fehlerkorrekturstärke steigt mit der Länge des Schieberegisters. Die Rate der Kodierers gibt
den reziproken Wert der Stelligkeit der Ausgabe eines Kodierschrittes an (zwei Ausgabebits für ein
Eingabebit → R = 1/2. Der Kodierer ist nicht systematisch, da die Eingabebits nicht explizit im
Ausgabedatenstrom enthalten sind.
Der Kodierer kann als endlicher Automat beschrieben werden. Betrachtet man einen Kodierer mit
einer Schieberegisterlänge von drei, so enthält die erste Stufe des Kodierers immer das neueste Bit
(das als letztes reingeschoben wurde), die beiden letzten Stufen enthalten die vorigen Bits und bilden
das Gedächtnis“. Im entsprechenden endlichen Automaten beschreiben die beiden Bits der letzten
”
Stufe den aktuellen Zustand und das Bit der ersten Stufe entscheidet in welchen Zustand gewechselt
wird. Für das dreistufige Schieberegister ergeben sich also vier Zustände: 00, 01, 10 und 11. Ein nstufiges Schieberegister hätte 2(n−1) Zustände. Im Initialzustand geht man von einem leeren, also mit
Nullen gefüllten Schieberegister aus.
Ein Zustandsdiagramm beschreibt einen solchen Automaten am anschaulichsten, Baum- und Gitterdiagramme werden auch zur Beschreibung verwendet, sind aber nicht minimal, d.h. beinhalten
mehr als vier Zustände. Beim Trellisdiagramm handelt es sich im Wesentlichen um ein seitliches
Baumdiagramm, das nach rechts wächst. Die x-Achse repräsentiert den zeitlichen Verlauf und entspricht der Anzahl der zu kodierenden Bits plus eins. Vertikal sind die Zustände angeordnet, wobei
ein Zuständ bzw. Knoten natürlich (ungleich dem Baumdiagramm) mehrere Vorgänger haben kann.
9.9.2
Dekodierung
Mit Faltungscodes kodierte Nachrichten haben eine enorme Länge. Da der Speicherbedarf des Dekodierers mit der Länge der Nachricht wächst, werden kleinere Datenblöcke verarbeitet. Diese Datenblöcke enden immer mit Nullen um den Kodierer wieder in den Anfangszustand zu bringen. Der
Viterbi-Algorithmus wird bei jedem Dekodierschritt benutzt um den wahrscheinlichsten Pfad durch
das Dekodiergitter zu finden.
Bei der nun folgenden Beschreibung des Dekodieralgorithmus bezeichnen die Kantengewichte immer die Hammingdistanz zwischen zwei Codewörtern und die Zustandsgewichte die Pfadkosten vom
Beginn bis zum entsprechenden Zustand (also die Summe der Kantengewichte).
1. Das Trellisdiagramm beginnt im Startzustand
2. Ein Codewort wird eingelesen. Die Hammingdistanz zwischen dem eingelesenen Codewort und
und allen möglichen Codewörtern wird berechnet und als Kantengewicht eingetragen.
3. Die in Schritt 2 berechneten Kantengewichte werden vom Startzustand aus aufsummiert und in
die Zustände eingetragen.
4. Für jeden Zustand, zu dem mehrere Pfade existieren, wird nur der Pfad mit den geringsten
Kosten übernommen; alle anderen werden verworfen.
31
5. Sprung zu Schritt 2 bis alle empfangenen Codewörter abgearbeitet sind.
6. Bestimmung des Pfades mit den geringsten Kosten
7. Ausgabe der Informationsbits des in Schritt 6 ermittelten Pfades.
Ein Beispiel für ein teilweises Trellisdekodierdiagramm ist in Abbildung 4 ersichtlich.
Abbildung 4: Trellis-Dekodierdiagramm
Da normalerweise große Datenblöcke verarbeitet werden und es nicht möglich ist, den ganzen
Pfad zu speichern, muss die Pfadlänge im Speicher eingeschränkt werden. Dabei ist zu beachten, dass
die gespeicherte Pfadlänge groß genug ist, um Burst-Fehler abzudecken.
10
Bandpassmodulation eines Trägersignals
Modulation bezieht sich auf die Modifizierung der Signalcharakteristiken eines Trägersignals aufgrund eines Informationssignals. In der Folge wird Zwischen- oder Hochfrequenzmodulation behandelt, wobei der Träger eine Sinusschwingung ist. Die Eigenschaften des Trägers, die verändert werden
sind: Amplitude, Frequenz oder Phasenlage.
10.1
10.1.1
Binäre Zwischenfrequenzmodulation
Amplitudenmodulation
Bei binary amplitude shift keying (BASK) werden Null und Eins durch Pulse der Träger-Sinusschwingung
mit unterschiedlichen Amplituden A0 und A1 repräsentiert. Eine der Amplituden, meistens A0 wird
in der Praxis meistens auf Nullpegel festgelegt. Dies ergibt sogenanntes on-off keying (OOK):
(
f (t) =
A
0,
Q
(t/T0 ) cos 2πfc t, digitale Eins
digitale Null
Ein OOK-Modulator kann auf mehrere Arten realisiert werden: als ein simpler Schalter, der das
Trägersignal ein- und ausschaltet, oder als Multiplikator, der den Träger mit einem unipolaren BasisbandOOK-Signal multpliziert.
Die Erkennung von OOK-Signalen kann auf zwei Arten erfolgen:
32
• Beim kohärenten Emfpang bleibt die Phasenlage des Informationssignals erhalten. Dazu werden matched-filter oder Korrelatoren vor dem Abtastungs- und Entscheidungsprozess eingesetzt.
• Beim inkohärenten Empfang bleibt die Phasenlage des Informationssignals nicht erhalten. Dazu
wird ein Hüllkurvendetektor gefolgt von centre point Abtastung oder I+D Entscheidung eingesetzt. Alternativ kann ein inkohärenter Detektor auch mittels zweier Korrelationskanäle, einer
für Inphase und einer für Quadraturkomponenten realisiert werden - ein solcher Empfänger
überwindet die Anforderung einer exakten Phasensynchronisation. Die beim inkohärenten Empfang verlorene Information ist äquivalent zu einem Anstieg des Träger-Rauschabstandes um
1dB.
Da der Entscheidungsprozess nach der Filterung lgiech dem eines binären Basisbandentscheidungsprozesses ist, erhält man die Bitfehlerwahrscheinlichkeit durch Einsetzen in die entsprechende
Formel unter Abschnitt 5.2. Dabei ist ∆V = k(E1 − 0), wobei E1 die normalisierte Energie einer
Eins ist und k die Einheit [V/Hz] hat. Die Null ist energielos“. Weiters ist σ 2 = k 2 E1 N0 /2 und somit
”
ergibt sich:
"
#
1
1 E1 1/2
Pe =
1 − erf
2
2 N0
Drückt man E1 durch das zeitliche Mittel hEi = (E1 + E0 )/2 aus, so erhält man:
"
1
1
1 − erf √
Pe =
2
2
hEi
N0
1/2 #
Die Bitfehlerwahrscheinlichkeit kann weiters durch den Träger-Rauschabstand (C/N ) ausgedrückt
werden, wobei C = hEi/T0 und N = N0 B:
"
√
#
1
T0 B C 1/2
Pe =
1 − erf √
2
N
2
10.1.2
Phasenlagenmodulation
Bei binary phase shift keying (BPSK) wird die Basisbandinformation durch änderung der Phasenlage
des Trägers auf den Träger moduliert:
(
f (t) =
Q
A (t/T0 ) cos(2πfc t),
digitale Eins
Q
A (t/T0 ) cos(2πfc t + φ), digitale Null
Sind die Zeiger von Null und Eins antipodal, d.h. um 180◦ verschieden, so spricht man von phase
reverersal keying (PRK). Zum Empfang sind natürlich nur kohärente Empfänger geeignet, wobei bei
PRK nur ein Empfangskanal vonnöten ist.
Für die Bitfehlerwahrscheinlichkeit setzt man wieder in die Formel unter Abschnitt 5.2 ein. Dabei
ist ∆V = 2kE, wobei E die Energie eines Symbols ist und σ 2 = k 2 EN0 /2:
"
E
1
Pe =
1 − erfm
2
N0
1/2 #
"
bzw.
p
C
1
Pe =
1 − erf T0 B
2
N
1/2 #
Dabei ist der Modulationsindex m = sin(∆θ)/2, wobei ∆θ die Differenz der Phasenlage der Zeiger angibt. Der Modulationsindex gibt die Größe des Teils der Signalspannung an, der Information
überträgt und folglich m2 den entsprechenden Teil der Symbolenergie.
33
10.1.3
Frequenzmodulation
Bei binary frequency shift keying (BFSK) werden Nullen und Einsen durch unterschiedliche Pulsfrequenzen des Trägersignals repräsentiert:
(
f (t) =
Q
A (t/T0 ) cos(2πf1 t), digitale Eins
Q
A (t/T0 ) cos(2πf2 t), digitale Null
In der Praxis wird BFSK meist mittels eines numerisch gesteuerten Oszillators implementiert, zum
Empfang kann sowohl ein kohärenter als auch ein inkohärenter Emfpänger benutzt werden. Die Bandbreite eines BFSK-Signals ergibt sich als B = f2 − f1 + 2f0 . Sie Spannungsspektren der einzelnen
Symbole überlappen einander (Faltung der einzelnen OOK-Spektren).
10.2
Trägerrückgewinnung
Um eine minimalst mögliche Fehlerrate zu erreichen, muss kohärente Detektion eingesetzt werden.
Dazu wird ein Referenzsignal benötigt, dass die Phase des Trägersignals repliziert. Die Reste des
Trägers können mittels Filters oder einer phase locked loop (PLL) extrahiert, verstärkt und als Referenzsignal verwendet werden. Diese Art der Trägerrückgewinnung funktioniert bei Amplituden-,
Frequenz- und Phasenmodulation. Bei der Phasenmodulation muss die Differenz der Zeiger dabei
allerdings weniger als 180◦ betragen.
Beträgt die Differenz bei Phasenmodulation 180◦ , so hat das empfangene Signal keine Spektrallinie bei der Trägerfrequenz und obige Methoden schlagen fehl. In diesem Fall gibt es zwei verschiedene Möglichkeiten der Trägerrückgewinnung:
• Quadrieren des empfangenen Signals. Man erhält dadurch ein Signal mit der doppelten Trägerfrequenz, aus der mittels einer PLL als Frequenzteiler das kohärente Referenzsignal generiert
wird. Durch das Quadrieren ist das Referenzsignal allerdings um 90◦ phasenverschoben.
• Die Costas Schleife besteht aus zwei PLLs, die um 90◦ phasenverschoben arbeiten und so auf
den unterdrückten Träger fixieren.
Beide Möglichkeiten haben einen Nachteil: eine 180◦ Phasenzweideutigkeit, d.h. das Referenzsignal
kann entweder phasengleich mit dem Träger oder um 180◦ verschoben sein, was zu einer Invertierung
der Symbole führt. Wiederum gibt es zwei Möglichkeiten diese Zweideutigkeit zu beheben:
• Mittels einer bekannten Datensequenz, die den Nutzdaten vorausgesendet wird, kann eine Inversion des Signals erkannt werden.
• Differentielle Kodierung vor der Modulation. Dies hat zur Folge, dass z.B. eine Eins durch eine
Phasenverschiebung und eine Null durch das Fehlen einer Phasenverschiebung repräsentiert
wird. So wird die Zweideutigkeit irrelevant. Systeme, die ein Symbol als kohärente Referenz
für das nächste Symbol verwenden, werden differentielles PSK genannt.
10.3
10.3.1
Weitere Varianten von PSK
MPSK
MPSK steht für M -symbol PSK, das heißt die Erweiterung von PSK auf M = 2n Symbole. Das Zeigerdiagramm für 16 Symbole ist in Abbildung 5 ersichtlich. 4-PSK kann als die Superposition zweier
34
Abbildung 5: 16-PSK mit Fehlerabstand
PRK-Signale, die um 90◦ phasenverschobene Träger benutzen, betrachtet werden. Diese Variante wird
auch als QPSK bezeichnet.
Multisymbolsignalisierung kann als Kodierungsprozess angesehen werden, wobei mehrere binäre
Symbole in ein M-äres Symbol kodiert werden. Ein Erkennungsfehler in einem Symbol kann daher
in mehrere Fehler in der dekodierten Bitsequenz ausarten. Der wahrscheinlichste Fehler ist eine Missinterpretation eines Zeigerzustands mit seinem Nachbarn. Wird ein Gray Code12 benutzt um binäre
Symbole den Zeigerzuständen zuzuweisen, so hat solch ein Fehler nur einen einfachen dekodierten
Bitfehler zur Folge.
Bei differentiellem MPSK werden binäre Symbole den Phasenunterschieden zwischen benachbarten Symbolen zugewiesen und jedes Symbol wird empfängerseitig durch das vorherige Symbol als
kohärente Referenz dekodiert.
10.3.2
(O)QPSK
Durch Superposition zweier PRK-Signale, die um 90◦ phasenverschobene Träger (I und Q) benutzen
erhält man quadrature phase shift keying. Dabei bestehen Sender und Empfänger aus je zwei PRK
Sendern und Empfängern, die um 90◦ phasenverschoben mit der halben Bitrate des gesamten QPSK
Systems operieren. Die spektrale Effizienz von QPSK ist doppelt so hoch wie bei BPSK, da die Symbole in jedem Quadraturkanal den gleichen Spektralraum und die halbe Spektralbreite eines BPSK
Signals gleicher Datenrate benötigen. Die prinzipielle Fehlerwahrscheinlichkeit von QPSK ist höher
als die von BPSK, die Bitfehlerwahrscheinlichkeit ist jedoch gleich groß: da die Kanäle unabhängig
(orthogonal) zueinander sind, könnten die binären Signale jedes Kanals nacheinander übertragen werden. Da ein QPSK-Symbol nur halb so lang und halb so stark eines äquivalenten BPSK-Symbol ist,
ist die gesamte Nachrichtenenergie gleich groß.
Offset QPSK (OQPSK) ist identisch zu QPSK bis auf den Umstand, dass vor der Aufmodulierung
auf den Träger der Datenstrom des Q-Kanals um eine halbe QPSK-Periode, d.h. eine Bit-Periode
versetzt wird. Da so nie auf beiden Kanälen gleichzeitig ein Null-Eins-Übergang stattfindet werden
Phasensprünge von 180◦ unterbunden. Übergänge treten so häufiger auf; ihre Auswirkungen sind
allerdings geringer: starke Veränderungen der Hüllkurve haben bei nicht-linearen Geräten Signalverzerrungen zur Folge.
12
Code, bei dem sich zwei aufeinanderfolgende Werte nur durch ein Bit unterscheiden
35
10.3.3
(G)MSK
Minimum shift keying (MSK) ist eine modifizierte Form von OQPSK. Bei MSK werden der I- und QDatenstrom bevor sie auf den Träger aufmoduliert werden in eine Sinusschwingungs-Form gebracht
(siehe Abb. 6. Ein MSK-Symbol wird durch eine Zeigerbewegung repräsentiert; der Zeiger rotiert
mit konstanter Winkelgeschwindigkeit vom Anfangspunkt“ eines Symbols bis zum Endpunkt“, der
”
”
gleichzeitig Anfangspunkt des nächsten Symbols ist. Wie auch in OQPSK ist die SMK Symbolperiode
gleich der Bitperiode des unmodulierten Datenstroms.
Abbildung 6: Minimum shift keying
Bei MSK ist zwar die Phase des Signals kontinuierlich, die Frequenz allerdings nicht. Wird
das MSK Signal mittels eines spannungsgesteuerten Oszillators direkt als BFSK-Signal generiert
und zusätzlich der Datenstrom vor der Modulation in Form einer Gauss’schen Glockenkurve geformt, so erhält man kontinuierliche Frequenzübergänge. Diese Modulation nennt sich Gaussian MSK
(GMSK). Durch die Gauss-Formung kommt es zwar zu nennenswerter ISI, die Vorteile der Spektralen
Effizienz des Verfahrens überwiegen jedoch oft.
36
11
Mobile Kommunikation
Private mobile radio (PMR) benützt Teile der VHF und der UHF-Frequenzbänder. Jeder Kanal hat
eine Bandbreite von 12,5kHz. Die Probleme bei PMR ist einerseits die eingeschränkte Anzahl an
Kanälen - 1000 - und andererseits die Tatsache, dass die mobilen Geräte nur dann gut funktionieren,
wenn sie sich nahe der Basisstation befinden.
11.1
Kanaleigenschaften
Der Mobilfunkkanal leidet unter mehreren Problemen bei Verbindungen mit Sichtbehinderung:
• Dopplereffekt durch relative Bewegung zwischen den Terminals
• Langsamer räumlicher Schwund durch topographische Abschattung auf der Übertragungsstrecke
• Schneller räumlicher Schwund durch konstruktive und destruktive Interferenz zwischen gleichen Signalen, die unterschiedliche Übertragungsstrecken benutzt haben
• Zeitlicher Schwund durch die Bewegung des Terminals durch das sich räumlich verändernde
Feld
• Frequenzselektiver Schwund bei Breitbandsignalen
• Zeitstreuung durch unterschiedliche Übertragungsstrecken
• Zeitliche Veränderung der Kanaleigentschaften durch Bewegung des Terminals
Einige dieser Probleme zeigen unterschiedliche Auswirkungen des gleichen physikalischen Prozesses
auf.
11.1.1
Mittlere Empfangsleistung
Durch die unterschiedlichen Arten von Schwund lassen sich nur statistische Aussagen über die empfangene Leistung treffen. Die mittlere Empfangsleistung hängt außer von Größen wie der Senderleistung, Senderantennengewinn und Empfängerantennengewinn auch vom Landnutzungsfaktor L und
dem Urbanisierungsfaktor U ab. L leitet sich aus dem Anteil verbauten Gebiets und U aus dem Anteil mit 4-stöckigen Gebäuden verbauten Gebiets ab. Weiters wird auch noch der Höhenunterschied
Sender und Empfänger mit einbezogen.
11.1.2
Langsamer und schneller Schwund
Langsamer Schwund, der aufgrund von topographischer Beugung entlang der Übertragungsstrecke
auftritt folgt log-normal Statistiken und tritt in urbanem Gebiet ab einer Größenordnung von 10 Metern auf. Schneller Schwund, der durch den zeitlich versetzten Empfang von Signalrepliken, die unterscheidliche Übertragungsstrecken gefolgt sind, auftritt, folgt Rayleigh Statistiken. Bei einer Größenordnung von wenigen zig Metern ist Schwund daher Rayleigh verteilt.
37
11.1.3
Zeitdispersion
Breitet sich ein Signal über mehrere Übertragungsstrecken aus, so erhält der Empfänger mehrere
zeitversetzte Signalkopien. Bei digitaler Signalisierung führt dies zu ISI. Der Grad an ISI hängt von
dem Verhältnis von Zeitdispersion zu Symboldauer ab.
Die Streuung der Übertragungsstrecken-Verzögerung kann im Frequenzbereich durch die Kohärenzbandbreite ausgedrückt werden. Die Kohärenzbandbreite gibt an, über welchen Bereich ein Kanal ein
flaches“ Spektrum besitzt, d.h. in welchem Bereich zwei Frequenzen eines Signals annährend glei”
chem Schwund ausgesetzt sind. Liegen zwei Signalkomponenten weiter als die Kohärenzbandbreite
auseinander, so schwinden sie unabhängig voneinander und das Gesamtsignal ist frequenzselektivem
Schwund ausgesetzt.
11.2
Zelluläre Kommunikation
Die Kapazität des PMR-Spektrums ist verglichen mit den Anforderungen klein. Darum werden Basisstationen mit bescheidener Sendeleistung eingesetzt, die alle Teilnehmer in einem beschränkten
Bereich, der Zelle, versorgen. Benachbarte Zellen setzen unterschiedliche Betriebsfrequenzen ein. So
kann die gleiche Frequenzverteilung in einem benachbarten Zellcluster wieder eingesetzt werden.
Das protection ratio ist das Verhältnis von Sendersignalstärke zu Empfangssignalstärke und steigt
mit der Größe des Clusters.
Die Zellengröße hängt von den Anruf-Anforderungen ab. Über die Anzahl der Teilnehmer ist die
Wahrscheinlichkeit ihres Zugriffs und die mittlere Dauer ihrer Gespräche kann die Verkehrsintensität
berechnet werden. Die Clustergröße lässt sich aus dem gewünschten Träger zu Interferenz-Verhältnis
und dem daraus folgenden Zellenradius r zu Wiederverwendungsabstand d Verhältnis mittels der
Formel
d √
= 3n
r
ableiten. Dabei bezeichnet n die Zellanzahl. Der Wiederverwendungsabstand gibt den Abstand von
zwei Zellzentren an, deren Zellen mit gleicher Frequenz arbeiten. Die Formel lässt sich wie folgt
herleiten:
Clusterfläche
n=
Zellfläche
Das Verhältnis von Cluster- zu Zellradius ist daher:
√
R
Clusterfläche √
= √
= n
r
Zellfläche
Bei 7-Zell Clustern beträgt der Winkel zwischen R und d 30◦ , daher:
√
d
d √
= R cos 30◦ → d = 3R →
= 3n
2
r
11.3
Terrestrische Mobilfunksysteme
Mobilfunksysteme basieren in der Regel auf TDMA. Bei GSM 900 und DCS 1899 kommunizieren
acht TDMA Benutzer über einen Träger und teilen sich eine Basisstation. Das GSM TDMA Format besteht aus acht Zeitschlitzen mit einer Dauer von rund einer halben Millisekunde, die in einen
TDMA-Rahmen gepackt werden. Uplink und Downlink haben unterschiedliche Frequenzen. GSM ist
relativ komplex und hat hohen Overhead für die Kanalkodierung. Die resultierende Redundanz wirkt
sich jedoch positiv auf die Signalqualität aus.
38
GSM benutzt GMSK und hat eine Datenrate von rund 270kbit/s bei einer Bandbreite von 200kHz.
Das Sprachsignal wird mittels eines erweiterten LPC-Vocoders kodiert. Aufgrund der niedrigen Bitrate des Kodierers, der die Sprachqualität stark unter Bitfehlern leiden lässt, wird ein 3bit CRC eingesetzt.
11.4
CDMA
In spread-spectrum Systemen wird der langsame Bitdatenstrom jedes Teilnehmers mit einem Spreizcode sk (n) hoher Datenrate multipliziert. Somit füllt das schmalbandige Datensignal nun eine breite Kanalbandbreite aus. Bei code division multiple access wird jedem Teilnehmer ein spezifischer
Spreizcode zugewiesen. Die Signale, die sich im Übertragungskanal aufsummieren, haben ein flaches, rauschähnliches Spektrum.
Der Empfänger filtert das gewünschte Signal mittels Korrelation mit einem lokalen Referenzcode, der dem senderseitigen Spreizcode entspricht. Da die Spreizcodes alle orthogonal sind, gibt der
Korrelator wirklich nur das gewünschte Signal aus.
12
Übertragung und Speicherung von Videosignalen
Ein Videosignal muss, um ein Fernsehbild darstellen zu können, zwei Grundinformationen übertragen: eine Beschreibung des repräsentierten Bildteils (z.B. Hellligkeit) und den Ort (und Zeit) dieses
Bildteils. Das Fernsehbild ist aus einer Vielzahl dieser Bildteile, auch Pixel oder Bildpunkte genannt,
aufgebaut.
12.1
Farbdarstellung
Ein Bildpunkt eines Farbbildes wird meist auf eine der folgenden zwei Arten repräsentiert:
• Ein unabhängiges Intensitätssignal (oder Bildhelligkeits, sprich Luminanzsignal) und zwei Farbsignale (Chrominanzsignal), nämlich Farbton und Sättigung.
• Drei Farbsignale, üblicherweise die Intensitätswerte von Rot, Grün und Blau.
Das Farbdreieck (siehe Abb. 7) zeigt, wie die unterschiedlichen Farben repräsentiert werden. Der Vorteil der Luma/Chroma-Variante liegt darin, dass die Luminanzkomponente ausreicht, um ein Schwarzweißbild zu repräsentieren.
12.2
12.2.1
Konventionelle TV Übertragungssysteme
PAL
Der PAL-Standard überträgt Farbsignale. Ein Einzelbild wird dazu in eine Sequenz von 625 Linien
aufgeteilt; es werden 25 Einzelbilder pro Sekunde übertragen. Spezielle Pulse geben Anfang einer
neuen Zeile bzw. eines neuen Bildes an. Bei PAL wird ein Einzelbild in zwei Halbbilder unterteilt,
wobei ein Halbbild alle geraden und eines alle ungeraden Zeilen umfasst. So erhält man eine Bildwiederholrate von 50Hz.
Von den 625 übertragenen Linien enthalten nur 575 tatsächlich Bildinformation; die restlichen
Linien enthalten Halbbild-Synchronisationspulse und Information für Teletext.
39
Abbildung 7: Farbdreieck
Um Bandbreite zu sparen wird die Chrominanz-Information bandbreitenreduziert in einen Teil
des Hochfrequenzabschnitts des Luminanz-Signals eingefügt. Dies ist nicht weiter tragisch, da das
menschliche Auge Farbinformation schwächer als Helligkeitsinformation auflöst.
12.2.2
andere Standards
NTSC ist PAL ähnlich, hat aber eine unterschiedliche Übertragungsrate: es werden 30 Bilder pro
Sekunde übertragen; die dafür aber nur mit 525 Linien. Außerdem hat NTSC keine Phasenverzerrungskorrektur wie PAL und so können bei schwachem NTSC-Empfang starke Farbfehler
auftreten.
SECAM ist PAL noch ähnlicher, überträgt aber pro Linie nur eine Chrominanzkomponente.
12.3
HDTV
HDTV ist definiert als ein System, dass es erlaubt Bilder in dreifacher Höhe anzuzeigen, um eine
Qualität wie am Originalschauplatz zu erzielen. Um dies zu ermöglichen sind zumindest doppelt so
hohe Auflösungen wie bei konventionellem TV vonnöten. Weiters haben die Bilder ein Seitenverhältnis von 16:9 anstatt 4:3 (Stichwort Breitbild), dass dem menschlichen Blickfeld besser angepasst ist.
HDTV wird zumeist digital übertragen.
40

Zugehörige Unterlagen

Wir haben drei Abbildungen für Wahrheitswerte wahr (w) und falsch

Einf¨uhrung in die Telekommunikation - Informatik

Zugehörige Unterlagen

Produkte

Unterstützung

Einf¨uhrung in die Telekommunikation - Informatik

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können