dspace cover page - Research Collection

Werbung
Research Collection
Doctoral Thesis
Probleme der Realisierung digitaler Filter
Author(s):
Bonzanigo, Federico
Publication Date:
1976
Permanent Link:
https://doi.org/10.3929/ethz-a-000087750
Rights / License:
In Copyright - Non-Commercial Use Permitted
This page was generated automatically upon download from the ETH Zurich Research Collection. For more
information please consult the Terms of use.
ETH Library
j)is*.
Nr. 56^5
PROBLEME DER REALISIERUNG
DIGITALER FILTER
ABHANDLUNG
ZUR ERLANGUNG
DES TITELS EINES DOKTORS DER TECHNISCHEN WISSENSCHAFTEN
DER
EIDGENOESS ISCHEN TECHNISCHEN
HOCHSCHULE ZUERICH
vorgelegt
FEDERICO
BONZANIGO
Dipl. El.-Ing.
geboren
von
am
1.
von
ETH Zürich
Juli 1941
Bellinzona (Kt. Tessin)
Angenommen
Antrag
Baumann,
auf
Prof. Dr. E.
Prof. Dr. G. S.
von
Referent
Moschytz,
Korreferent
1976
iaparafririiinlfr
nus
AGEN-Mitteilungen
Nr. 21
ww
up
Seite Leer /
Blank leaf
.
INHALTSVERZEICHNIS
1.
Einleitung
7
1.1
7
1.2
Digitalfilter?
Prinzipielle Möglichkeiten
Was ist ein
von
1.3
2.
Abtastfiltern
Realisierung
10
Die Fehler der endlichen Arithmetik
Grundlagen
2.1
zur
12
für die
Realisierung digitaler Filter
Realisierungsstrukturen von Digitalfiltern
14
14
2.1.1
Direkte Formen
17
2.1.2
Zerlegte
Formen
21
2.1.2.1
Parallelform
Kaskadenform
21
2.1.2.2
24
2.1.3
2.2
Andere Filterstrukturen
Die Darstellung der Zahlen
2.2.1 Zahlencodes
2.2.2
Darstellung
von
positiven
tiven Binärzahlen
2.2.3
2.3
Fest- und
27
27
und nega¬
30
Gleitkommazahlen
Der Abschnitt bei der
2.3.1
26
33
Festkommaarithmetik
36
Einfacher Abschnitt
Wertabschnitt
37
38-
-
Betragsabschnitt
2.3.2 Rundung
Die Quantisierung bei Gleitkommazahlen
40
-
2.4
3.
Ueberlauf und Skalierung
3.1 Der Ueberlauf bei der Festkommaarithmetik
3.1.1 Eigenschaften des Ueberlaufs
3.1.2 Die Eigenschaften der Restklassen
3.1.3
Ueberlaufdetektion
Die Ueberlaufdetektion bei der
Die
-
Addition
42
'
43
46
.46
47
50
53
u-54
3.2
Die
Skalierung
3.2.1
4.
Die
4.1
4.2
Maximale
bei der Festkommaarithmetik
Signalamplitude
für
beliebige
3.2.2
Eingangssignale
Maximale Signalamplituden
sche Eingangssignale
3.2.3
Praktische
3.2.4
Abschnittfehler und Unterlauf
Quantisierung
Die
Durchführung
für
der
spezifi¬
Skalierung
der Koeffizienten
Empfindlichkeit
der
67
70
74
75
Uebertragungsfunktion
>76
Eine indirekte Betrachtung der Empfindlichkeit
4.2.1 Empfindlichkeit der Uebertragungsfunktion
auf Aenderungen der Pole und Nullstellen
4.2.1.1 Empfindlichkeit des Amplituden¬
ganges auf Aenderungen der Pole
und Nullstellen
4.2.1.2 Empfindlichkeit des Phasenganges
gegenüber Aenderungen der Pole
und Nullstellen
80
Empfindlichkeit
der
der Nullstellen
4.2.1.4
Anwendung
auf dem
selektiver Filter
Spezialfall
Empfindlichkeit der Pole und Nullstellen
gegenüber Aenderungen der Koeffizienten
4.2.2.1 Empfindlichkeit der Wurzeln
eines Polynoms
Folgerungen für die Quantisierungsfehler
a) Ordnung der Teilfilter
4.2.2
4.2.3
b) Bandbreite
c)
Die
Empfindlichkeit
kleinen
4.3.1
.86
,.,.87
88
91
92
95
95
100
und der Nullstellen
100
der Uebertragungsfunktion auf
der Koeffizienten
101
Aenderungen
Direkte Berechnung der Empfindlichkeit der
Uebertragungsfunktion auf Aenderungen der
Koeffizienten
82
96
Mittelfrequenz
d) Verteilung der Pole
80
Gruppenlaufzeit
gegenüber Aenderungen der Pole und
XI
60
gegenüber Variationen ihrer Parameter
4.2.1.3
4.3
58
102
-
-
-
-
4.3.2
Parallelform
Kaskadenform
104
Allgemeine Filternetzwerke
106
-
4.3.3
114
115
Abweichung
des
Amplituden-
115
Amplitudenganges
117
Filter mit Nullstellen auf dem Einheits¬
kreis
119
und Abschnitt der
122
Einleitung
5.2
Die
Quantisierung
Signalgrössen
122
der
Signale
124
Korrelation zwischen Signal und Quanti¬
sierungsfehler
125
a) Wertabschnitt
b) Rundung
126
c) Zwischenwerte der Amplitude
132
129
Abschnittfehler der Signale
5.3.1 Die Verteilung der Abschnittfehler
5.3.2 Die Varianz der Abschnittfehler
-
-
-
5.3.3
108
Kaskadenform
Parallelform
5.1
5.3
Uebertragungs¬
114
ganges
Die Empfindlichkeit des
bei der Kaskadenform
Quantisierung
der
Direkte Form
Die maximale
-
5.2.1
105
Abweichung
funktion
-
5.
102
Die maximale
-
4.3.4
Direkte Form
133
133'
136
Wertabschnitt
137
Betragsabschnitt
Rundung
139
140
Der Abschnitt des Resultates einer
Multiplikation
140
5.3.3.1
.145
Verteilung der Abschnittfehler
5.3.3.2 Streuung der Abschnittfehler
155
5.3.3.3 Korrelation
155
m
5.4
Das
Quantisierungsrauschen
5.4.1
Stationärer Wert des
rauschens
-
-
5.4.2
5.4.3
5.4.4
5.4.5
5.4.6
Anteil einer
Gesamtes
in
Digitalfiltern
Quantisierungs¬
Rauschquelle
159
159
160
Quantisierungsrauschen
Transientes Verhalten des Quantisie¬
162
rungsrauschens
163
Verteilung
168
Quantisierungsrauschens
Das Quantisierungsrauschen bei Berück¬
sichtigung der Skalierung
Ueber den Zusammenhang zwischen
Empfind¬
169
Digitalfiltern
175
des
lichkeit und Rauschverhalten
Ueberlegungen
in
von
über die Abschnittsteilen
Digitalfiltern
5.4.6.1
Die "zwischengenaue" Addition
in Digitalfiltern
179
180
Anhang: Korrelationskoeffizient
zwischen einer Zufalls¬
variablen und einer Funktion dieser Variablen
Literatur
IV
185
I87
Probleme der
von
F.
Realisierung digitaler
Filter
Bonzanigo
Quelques problemes
dans la realisation de filtres
Realization Problems in
digitaux
Digital Filters
Alcuni problemi inerenti alla realizzazione dl filtri
digital!
Zusammenfassung
Diese Arbeit befasst sich mit einigen Problemen, die sich
bei der Realisierung digitaler Filter stellen, insbesondere
mit den dabei auftretenden Quantisierungs- und Abschnitt¬
fehlern. Nach einer Einführung werden die wichtigsten Filter¬
strukturen und die für Digitalfilter geeigneten Zahlendar¬
stellungen beschrieben und die allgemeinen Eigenschaften des
Abschnittes von Fest- und Gleitkommazahlen untersucht. Es
werden die Eigenschaften des Ueberlaufs diskutiert und es
wird gezeigt, wie der Ueberlauf in der Arithmetik detektiert
und gegebenenfalls korrigiert werden kann. Die praktische
Durchführung der Skalierung und die dazu nötige Bestimmung
der maximalen Signalamplituden werden behandelt. Es wird
dann auf die Quantisierungsfehler der Koeffizienten einge¬
gangen. Zuerst wird eine indirekte Betrachtung angestellt,
die einige qualitative Schlüsse gestattet. Nachher werden
die Empfindlichkeit der Uebertragungsfunktion auf Koeffi¬
zientenänderungen und daraus Schranken für die Fehler be¬
rechnet. Am Schluss werden die Abschnittfehler der Signalgrössen behandelt, und zwar mit dem Modell des Quantisierungsrauschens. Zuerst werden die Gültigkeitsgrenzen dieses
Modells untersucht: Die Korrelation zwischen Quantisierungs¬
rauschen und Signal, die Verteilung und die Varianz des Ab¬
schnittfehlers werden berechnet. Für den wichtigen Fall des
Abschnitts des Produktes wird der Zusammenhang zwischen Ab¬
schnittfehler und Eingangssignal am Multiplikator gezeigt;
numerische Resultate dafür, wie auch für die Verteilung der
ihre Streuung und die Korrelation zwischen Fehler und
Eingangssignal werden vorgeführt. Schliesslich wird das
Fehler,
Berechnung von Mittelwert und Streuung des
Quantisierungsrauschens am Ausgang eines Digitalfilters im
stationären und im transienten Zustand angewendet. Der Ein¬
fluss der Skalierung auf das Quantisierungsrauschen und das
Verhalten der Doppelrundung werden am Schluss untersucht.
Rauschmodell
zur
Weder die durch die Nichtlinearität des Abschnitts und des
Ueberlaufs verursachten parasitären Schwingungen, noch die
speziellen Probleme der Hardware-Realisierung werden in
dieser Arbeit behandelt.
Resume
Ce travail traite quelques problemes se posant dans la
realisation de filtres digitaux,en particulier des fautes
de quantification et d'arrondi.
les structures de filtre les plus
representations des nombres les plus
et
les
proprietes principales de l'arrondi des
appropriees
nombres en virgule fixe et en virgule flottante sont decrites.
Les proprietes du debordement sont donnees et on montre
comment il peut etre detecte et eventuellernentcorrige.
L'execution pratique de la normalisation et la determination
de l'amplitude maximale du Signal sont examinees. Ensuite,
les fautes dues ä la quantification des coefficients sont
considerees. Une consideration indirecte amene ä des conclusions qualitatives simples. La sensibilite de la fonction
de transfert aux changements des coefficients est calculee
et de lä des limites pour les erreurs de la fonction de
transfert. A la fin les fautes dues ä l'arrondi des signaux
sont traitees ä l'aide du modele du bruit de quantification.
D'abord les limites de validite de ce modele sont examinees:
la correlation entre le bruit de quantification et le signal
est calculee ainsi que la distribution et la variance des
fautes d'arrondi. Pour le cas tres important de l'arrondi
du produit, la dependance fonctionelle entre l'erreur et le
Signal d'entree du multiplicateur est montree par des examples
numeriques pour la distribution de l'erreur, sa variance et
la correlation entre le bruit et le signal d'entree. Ensuite
le modele du bruit de quantification est utilise pour calculer
la moyenne et la variance du bruit ä la sortie du filtre ä
l'etat stationnaire et ä l'etat transitoire. Enfin l'influence
de la normalisation sur le bruit et le comportement du double
arrondi sont examines.
Apres
une
introduction,
importantes,les
Dans ce travail ni les effects de la non-linearite de l'arrondi
et du debordement (comme les oscillations parasites), ni les
problemes pratiques de la realisation hardware ne sont traites.
Abstract
This paper deals with some problems which appear when implementing digital filters.
After an introduction, the most important filter structures
and the most suitable number representations are described
and the general roundoff properties of fixed point and
floating point numbers are discussed. The properties of the
overflow are treated and it is shown, how overflow can be
detected and if necessary, corrected. The practical implementation of scaling along with the necessary determination of
the peak signal amplitudes is examined. Next, the errors due
to coefficient quantization are treated. An indirect consideration leads to some simple qualitative rules. Then, the
sensit!vities of the transfer function are calculated to
obtain some bounds on the transfer function error. At the
end the errors due to Signal rounding are examined using the
quantization noise model. First, the limits of validity of
this model are examined: the correlation between quantization
noise and signal is calculated, as well as the distribution
and the variance of the roundoff error. For the important
case of product roundoff the functional dependence of the
error from the multiplier input is shown and numerical examples
for the distribution and the variance of the error and for
the correlation between the error and the multiplier input
are presented. The noise model is then used to calculate
the mean and the variance of the noise at the filter output
under stationary and under transient conditions. Finally
influence of scaling on roundoff noise and the Performance
of double rounding are examined.
This paper treats neither the nonlinear effects of roundoff
and overflow, as limit cycle oscillations, nor the practical
aspects of hardware Implementation.
Riassunto
II presente lavoro si occupa di alcuni problemi che si pongono
nella realizzazione di filtri digitali, in particolare degli
errori di quantificazione e di arrotondamento.
Dopo un'introduzione,
principali strutture dei filtri di¬
gitali, le rappresentazioni dei numeri le piü adatte e le
proprietä generali dell'arrotondamento dei numeri in virgola
fissa e in virgola mobile sono descritte. Le proprietä dello
le
overflow sono discusse e viene mostrato come questo possa
essere scoperto ed eventualmente corretto. L'esecuzione
pratica dello scaling con la necessaria determinazione dei
livelli massimi dei segnale vengono trattati. In seguito si
considerano gli errori dovuti alla quantificazione dei coefficienti. Una considerazione indiretta conduce a conclusioni
qualitative semplici. In seguito viene calcolata la sensi-
bilitä della funzione di trasferimento a modificazioni dei
coefficienti e da ciö dei limiti per gli errori della funzione
di trasferimento. Alla fine vengono trattati gli errori
dovuti all"arrotondamento dei segnali usando il modello dei
rumore di quantificazione. Dapprima vengono esaminati i
limiti di validitä di tale modello: la correlazione fra
errore di quantificazione e segnale, la distribuzione e la
varianza dell'errore di arrotondamento sono calcolati. Per
il caso importante dell'arrotondamento dei prodotto e mostrata
la dipendenza funzionale fra errore e segnale d'entrata dei
moltiplicatore; vengono mostrati esempi numerici per la dis¬
tribuzione e la varianza dell'errore, come pure per la corre¬
lazione fra errore e segnale d'entrata. II modello viene
utilizzato in seguito per calcolare il valore medio e la
varianza dei rumore all'uscita di un filtro sia allo stato
stazionario che a quello transitorio. Infine vengono esami¬
nati l'effetto dello scaling sul rumore ed il comportamento
dei doppio arrotondamento.
gli effetti
overflow, come
della non-linearitä dell'arrotondamento e dello
oscillazioni parassite, ne i problemi specifici alla realizzazione in hardware vengono trattati in questo
lavoro.
Ne
1. EINLEITUNG
1.1
Was ist ein
Um den
Digitalfilter?
Begriff "Digitalfilter"
den wir zuerst den
Begriff
klar definieren zu
können,
wer¬
des Abtastfilters einführen.
Ein eindimensionales
Abtastfilter ist ein lineares, zeitinvariantes System, das eine oder mehrere 2 Zeitfolgen x(nT)
2
(Eingang) in eine oder mehrere Zeitfolgen y(nT) (Ausgang)
transformiert. Ein solches Abtastfilter lässt sich durch ein
linearen, zeitunabhängigen Differenzengleichungen
beschreiben. Die dynamischen Eigenschaften sind durch die
System
von
Koeffizienten dieses
Differenzengleichungssystems,
die Filter¬
koeffizienten, gegeben.
digitalen Filter werden folgende Operationen durch¬
geführt: Multiplikationen mit konstanten Koeffizienten, Ad¬
ditionen und Zeitverzögerungen von ganzen Vielfachen der Ab¬
tastperiode T. Falls diese Operationen mit digitalen arithmeti¬
schen Elementen durchgeführt werden (siehe Kap. 1.2), wird das
In einem
Abtastfilter Digitalfilter im engsten Sinn
genannt.
Es gibt daneben auch mehrdimensionale Digitalfilter. Am verbreitetsten sind die zweidimensionalen Filter, bei welchen die
Variablen je 2 Parameter enthalten, die als Koordinaten eines
Punktes in einer Ebene aufgefasst werden können. Sie werden u.a.
zur Verarbeitung von Bilddaten und in der Geophysik eingesetzt.
Mehrdimensionale Filter werden in dieser Arbeit nicht behandelt.
2
Dies sind die sogenannten Mehrfach- (multivariable) Filter, wo
die Ein- und Ausgänge Folgen von Vektoren sind [25]. In dieser
Arbeit werden solche Systeme nicht betrachtet, die Resultate kön¬
nen aber im allgemeinen leicht auf solche Mehrfachfilter erweitert
werden.
3
heutzutage die meisten Abtastfilter digital realisiert werden,
häufig in der Literatur das Wort Digitalfilter eingesetzt, um
Abtastfilter (sampled-data filters) allgemein zu bezeichnen.
Da
wird
die
Dieses System
eine
von
Differenzengleichungen
lässt sich auf
einzige Differenzengleichung reduzieren:
N
y(n)
+
M
b±-y(n-i)
/
i=l
Diese
£
=
a.-x(n-i)
i=0
Differenzengleichungen (1)
lässt sich nach
lösen:
M
Y(n)
Das
=
(1)
y(n)
auf¬
N
ai'x(n-i)
Z—
i=0
Digitalfilter
sei
den wir als
jetzt
Y~
"
i=l
bis
b^yfn-i)
(2)
einem gewissen Abtastpunkt,
wählen, in Ruhe, d.h. alle Eingänge und
daher auch die Ausgänge) seien für diesen
zu
Nullpunkt
Speichervariablen(und
Moment gleich Null. Im Zeitpunkt n
0 setze man einen einzigen
Wert x(0)
1 am Eingang, für alle anderen n ^ 0 sei der
Eingang
immer gleich Null. Das Ausgangssignal, das sich bei einer sol¬
chen Erregung ergibt, wird als die Impulsantwort h(n) des
=
=
Filters bezeichnet.
Wir haben unsere
Digitalfilter
als lineare Systeme definiert:
es gilt daher das
Superpositionsgesetz. Deswegen kann die Ant¬
wort einer beliebigen Eingangsfolge x(n) durch die
Ueberlage¬
der
Antworten
rung
auf der einzelnen Eingangswerte berechnet
werden.
Falls x(n) =0 für n < 0 und falls bei n
0 alle Speicher¬
variablen gleich Null sind, ergibt sich die Faltungssumme
=
y(n)
=
y
n
i=0
x(i)-h(n-i)
Wir können auf die
Folgen y(n), x(n)
und h(n) die z-Trans-
formation anwenden. Bei der z-Transformation
(siehe z.B. LI]) die Faltung in eine
Y(z)
H(z)
der
der
=
geht bekanntlich
Multiplikation über:
X(z)-H(z)
ist die
Uebertragungsfunktion: sie ist die z-transformierte
Impulsantwort h(n). X(z) und Y(z) sind die z-transformierte
Eingangsfolge x(n), bzw. der Ausgangsfolge
y(n).4
Eingang
Wenn am
x(nT)
eine
Cosinusfolge eingegeben
A.cos(ü).nT)
=
=
A.Re
wird:
e^™1}
{
ist die Antwort im eingeschwungenen Zustand (d.h. für n-*-<» )
durch die Uebertragungsfunktion am Punkt z
gegeben
=
y
H(Z)
II z=eJiooT
dengang,
Die
(nT)
*
=
=
A Re
H(ü)T)
{ H(z)
z=e jü)T
•
e
e3U)T
jntüT,'\
ist der Freguenzgang,
|H(wT) |
der Amplitu-
H(u)T) der Phasengang des digitalen Filters.
Uebertragungsfunktion
aus
der
des Filters berechnet werden. Wenn
Differenzengleichung(en)
man
Gl. (2) z-transformiert
(wobei jede Verzögerung
ersetzt
4
kann
um
wird), ergibt sich:
T durch eine
Multiplikation
mit
z-1
Normalerweise bezeichnet man Zeitfolgen mit Kleinbuchstaben
entsprechende z-transformierte mit Grossbuchstaben, so
und die
dass ps gilt X(z)
=
Z{x(n)}
M
H(z)
H v*-1
=
1=0
N
1
-ZIv1
i=l
Zähler und Nenner durch die
Durch^Division
ergibt sich die
von
von z
Uebertragungsfunktion
,
Form
grösste Potenz
in der üblichen
M
H(z)
=
z
N-M
i=0
z
N"tbi ^
N
^
N
i=l
häufig der Term zN~M weggelassen, weil er eine
Verzögerung darstellt. Wir werden ihn in dieser Arbeit
Dabei wird
reine
ebenfalls nicht
merkt ist.
berücksichtigen,
Die
Uebertragungsfunktion
1,2
PrinzJPielle Möglichkeiten
Ein
Abtastfilter (Digitalfilter
ausser wenn es
anders
ver¬
eines digitalen Filters kann immer
als eine rationale Funktion in z
ausgedrückt werden.
weder mit
den.
im
zur
Realisierung
im weitesten
von
Abtastfiltern
Sinn) kann
ent¬
analogen oder mit digitalen Elementen realisiert wer¬
Digitale Realisierungen von Abtastfiltern (Digitalfilter
eigentlichen Sinn) können entweder als Programme für
Digital¬
rechner oder als spezialisierte
Hardware realisiert werden.
Um ein
Abtastfilter
analog
loges Verzögerungselement.
10
realisieren, braucht man ein
Als Verzögerungselemente können
zu
ana¬
Verzögerungsleitungen [2], kapazitive Speicher (entweder dis¬
kret [3] oder integriert als Eimerkettenschaltungen (bücket
brigade) t4] oder ladungsgekoppelte Schaltungen (charge coupled
devices, CCD) [5]), ferromagnetische [6] oder ferroelektrisehe
Speicher [7]
verwendet werden. Die Multiplikationen werden mit
Widerständen oder Spannungsteilern, Additionen mit Operations¬
verstärkern realisiert. Mit Hilfe
von
Oberflächenwellen auf
piezoelektrischen
Materialien (surface waves) können Filter
gebaut werden, die ähnlich wie Transversalfilter (nichtrekursive
Digitalfilter)
sind.
Dispersive
Effekte bei der Wellenausbrei¬
tung bewirken aber, dass ihre Eigenschaften
digitalen Filtern abweichen [8].
etwas von denen der
hybride Lösungen wurden vorgeschlagen, wo die Speicherung
digital und die Operationen analog durchgeführt werden [9].
Auch
Bei
analogen
hybriden Realisierungen werden die Amplituden
nicht quantisiert. Die Toleranz- und Driftprobleme sind ähnlich
gelagert wie bei den analogen Filtern: die Toleranzen der Ele¬
mente können nicht beliebig klein gemacht werden. Dazu gibt es
noch Schwierigkeiten, welche durch die nichtidealen Eigenschaf¬
ten der analogen Verzögerungsglieder verursacht werden, wie
Verzerrungen durch Dispersion und Dämpfung in Verzögerungs¬
leitungen, Ladungsverluste in den kapazitiven Speichern, usw.
und
digitalen Realisierung werden alle im Filter vorkommende
Grössen
Koeffizienten und Signale
durch Zahlen dargestellt.
Die Zahlen werden mit Hilfe arithmetischer Schaltungen (Multi¬
plizierer und Summatoren) verarbeitet. Die Verzögerung der
Signale ist dabei besonders problemlos. Die Zahlen können fehler¬
frei und beliebig lang gespeichert werden. (Eine Ausnahme sind
die dynamischen Schieberegister, die eine minimale Schiebe¬
frequenz zur Erhaltung der Information erfordern.)
Bei einer
-
-
11
Toleranzprobleme sind anders gelagert. Mit entsprechendem
Aufwand kann eine beliebige Genauigkeit erreicht werden: es
müssen nur genügend lange Worte für die Zahlen vorgesehen werden.
Die Zahlen sind auch keinen Drifterscheinungen unterworfen,
welche durch die Temperatur oder die Alterung bedingt wären.
Das heisst nicht, dass bei Digitalfilter die Genauigkeits¬
probleme nicht beachtet werden müssen. Aus wirtschaftlichen
Gründen ist man interessiert, mit der kleinstmöglichen Wort¬
länge auszukommen, die nötig ist, um gewisse, vorgegebene
Die
Genauigkeitsanforderungen
erfüllen. Daher besteht ein Inte¬
resse, die Effekte, welche durch die beschränkte Genauigkeit
der Zahlen verursacht werden, zu beherrschen. Das Ziel der
vorliegenden
zu
1.3
Arbeit ist es, ein
Beitrag
in dieser
Richtung
liefern.
Die Fehler der endlichen Arithmetik
Die durch die beschränkte
Arithmetik)
folgt
-
zu
verursachten
Genauigkeit der Zahlen (beschränkte
Fehler in Digitalfilter können wie
klassifiziert werden:
Wegen der Darstellung der Koeffizienten durch Zahlen
einer beschränkten
Wortlänge
mit
werden diese in ihrem Wert
verändert. Man bekommt damit ein verändertes Filter, dessen
Koeffizienten von den berechneten abweichen: die Uebertragungs¬
funktion des Filters wird durch die Quantisierung der Koeffi¬
zienten verändert. Dieses Problem wird im Kapitel 4 behandelt.
-
Die Zahlen haben einen nach den absolut grossen Werten hin
beschränkten Bereich. Falls die
überschreiten, ergeben
Signalverzerrungen und
Signalgrössen
diesen Bereich
sich Ueberlauffehler. Sie führen
zu
können Instabilitäten verursachen.
Die Ueberlauffehler können durch geeignete Massnahmen, ins¬
besondere durch eine geschickte Skalierung, vermieden werden.
12
Wir werden sie im
-
Kapitel
3 behandeln.
vermeiden, dass die Wortlängen der Signalgrössen mit
jeder durchgeführten Multiplikation wächst, müssen an ge¬
Um zu
eigneten Stellen die weniger gewichtigen Ziffern der Zahl
abgeschnitten werden.. Die so verursachten Abschnittfehler
führen zu Störsignalen im Filter. Wir werden diese Fehler
im Kapitel 5 analysieren.
-
Verarbeitung analoger Signale notwendige Analog/
Digitalwandlung verursacht Quantisierungsfehler der Signale.
Sie werden auch im Kapitel 5 betrachtet.
Die bei der
Das sind die
Fehler, die in der vorliegenden Arbeit untersucht
werden. Weitere, nicht systembedingte Fehler, wie Abtastjitter,
Unregelmässigkeiten
der
Digital/Analogwandlern,
wandlern,
usw.
Stufung
Analog/Digitalwandlern und
Vorgänge in Digital/Analog¬
von
transiente
werden nicht betrachtet.
13
2. GRUNDLAGEN FUER DIE REALISIERUNG DIGITALER FILTER
In diesem
die bei
Kapitel werden wir ein paar Probleme betrachten,
der Realisierung digitaler Filter wichtig sind.
In einem ersten Abschnitt
(2.1) werden
wir
einige Strukturen
betrachten, die bei der Realisierung digitaler Filter
deutung
Im
von
Be¬
sind.
folgenden
Abschnitt 2.2 werden wir uns überlegen, welche
Zahlendarstellung sich für Digitalfilter am besten eignet
und die allgemein getroffene Wahl der binären Arithmetik
rechtfertigen.
Abschnitt 2.3 werden wir die allgemeinen Eigenschaften des
Abschnittes von Festkommazahlen und im Abschnitt 2.4 die des
Abschnittes von Gleitkommazahlen behandeln. Diese Resultate
Im
werden in den
2.1
Kapiteln
4 und 5
Realisierungsstrukturen
von
gebraucht.
Digitalfiltern
Wir haben
gesehen, dass ein Digitalfilter durch ein System von
Differenzengleichungen gegeben ist und dass dieses System sich
auf eine einzige Differenzengleichung reduzieren lässt, welche
die
Ausgangsfolge
direkt mit der Eingangsfolge verknüpft. Die
z-Transformierte dieser Differenzengleichung ist die Uebertragsfunktion in ihrer rationalen Form. Es ist leicht einzusehen,
dass viele verschiedene Strukturen
Digitalfiltern existie¬
ren, welche alle die gleiche Uebertragungsfunktion besitzen.
Sie würden im idealen Fall alle dieselben Eigenschaften haben,
von
sie verhalten sich aber unterschiedlich
ten
gegenüber der erwähn¬
Begrenzung der Genauigkeit, (d.h. gegenüber Abschnittfehler,
Quantisierung
14
der
Koeffizienten, usw.).
notwendige Bedingung, damit ein System von Differenzen¬
gleichungen ein realisierbares digitales Filter darstellt, ist,
Eine
dass darin keine
verzögerungsfreieSchleifenvorkommen,
da
jede Durchführung von arithmetischen Operationen eine gewisse
Zeit beansprucht. Deswegen kann das Differenzengleichungs¬
system stets in die Form der Zustandsgieichungen gebracht
werden:
'w(n+l)
=
y(n)
=
[A] -w(n)
C *w(n)
+
B
•
+
D
•
x(n)
x(n)
w(n) ist der Vektor der Speicherausgänge (Zustandsvariablen)
nach_dem,n-ten Abtastpunkt, w(n+l) ist der Vektor der Speicher¬
eingänge vor dem (n+1)-ten Abtastpunkt, x(n) und y(n) sind
die Ein- und Ausgangswerte. [A] ist die Systemmatrix, B der
Steuervektor, C der Beobachtungsvektor und D der Durchgangs¬
koeffizient.
Zwei lineare
Systeme werden als äquivalent definiert,
wenn
sie
gleiche Uebertragungsfunk¬
tion besitzen [25]. Ein zu einem gegebenen System äquivalentes
System kann durch eine Aehnlichkeitstransformation gefunden
werden [10]. Man muss die Zustandsvariablen mit einer regulären
Transformationsmatrix [T] multiplizieren
die
gleiche Impulsantwort,
w'
Die
=
[T]
•
w
Systemmatrix [A1],
vektor C1 für den
[A']
=
[T]"1
bzw. die
den Steuervektor
neuen
[A][T]
Bj_
und den
Beobachtungs¬
Satz von Zustandsvariablen ist dann
;
B'
=
[T]"1 B
;
C
=
C
[T]
15
unendlich viele reguläre Matrizen existieren, gibt es auch
unendlich viele Systeme, die zu einem gegebenen System äqui¬
valent sind. Es können immer äquivalente Systeme
gefunden
werden, die eine höhere Ordnung als das Originalsystembesitzen:
Da
Der Vektor der Zustandsvariablen muss zuerst durch die Ein¬
führung redundanter Zustände, die weder mit den Ein- und Aus¬
gängen, noch mit den anderen Zustandsvariablen verkoppelt
sind, erweitert werden.
einem
digitalen
eine kleinere
Zustände
Es stellt sich daher die
Filter ein
Frage, ob zu
äquivalentes System existiert, das
Ordnung besitzt,
besitzt,
d.h. ob ein Filter redundante
die eliminiert werden können. Bei gewissen
Transformationsmatrizen kann eine Kaiman'sehe kanonische
Systemdarstellung [24]
in vier
ein
Teilsysteme
beobachtbares
erhalten werden. Das System kann dabei
zerfallen, die in Fig. 1 dargestellt sind:
und erreichbares
(BE),
ein
erreichbares,
nicht beobachtbares (BE), ein beobachtbares, aber nicht
erreichbares (BE) und ein nicht beobachtbares und nicht er¬
reichbares (BE)
Teilsystem.
B E
"^O
B E
B E
Bf E
Fig.
16
1
Kaiman"sehe kanonische
Systemdarstellung
aber
Nur der erreichbare und beobachtbare Teil ist für
inte¬
Impulsantwort bestimmt (und daher
Uebertragungsfunktion). Ein System, bei welchem alle
ressant, da
auch die
uns
er
allein die
sind, wird minimal genannt.
und daher
Die minimalen Systeme besitzen die kleinste Ordnung
aller äquivalenten Systeme,
die kleinste Anzahl Speicher
Zustände erreichbar und beobachtbar
-
-
realisieren. Ein Filter ist
sicher nicht minimal, falls der Zähler und der Nenner seiner
Uebertragungsfunktion nicht teilerfremd sind, d.h. falls es
Nullstellen und Pole besitzt, die sich aufheben. Von den
die eine bestimmte
Impulsantwort
minimalen Systemen sind diejenigen besonders interessant,
die eine minimale Anzahl an Koeffizienten verschieden von 0
oder
+
1 brauchen,
gegebener Ordnung
um
zu
alle rationale Uebertragungsfunktionen
realisieren. Solche Filterstrukturen sind
als kanonisch bezeichnet [14,25].
Man braucht für ein kanonisches Filter mit N Nullstellen und
N Polen N Speicher und 2N+1 Koeffizienten.
in der Literatur
Wir werden
häufig
jetzt einige wichtige
Filterstrukturen
besprechen.
2.1.1 Direkte Formen
Bei den direkten Formen sind die Filterkoeffizienten
die Koeffizienten der
Uebertragungsfunktion
zugleich
in rationaler Form,
also die Koeffizienten des Ausdrucks
Der
Begriff
"kanonisch" hat in der Mathematik eine recht vage
unter einer Anzahl gleichartiger Be¬
griffe heisst kanonisch, wenn er eine besonders grosse Bedeu¬
tung und eine besonders durchsichtige Gestalt hat", Der grosse
Brockhaus 1955, Bd. 6, S. 216). Deshalb herrscht in der Litera¬
tur über digitale Filter eine ziemlich grosse Verwirrung über
die Bedeutung dieses Begriffes: vergleiche z.B. [14] mit [11,
12] und [13].
Definition ("Ein
Begriff
17
V
H(z)
M
Z_ai
i=0
=
z
M-i
N
z
N
+
_L
2__b.
z
i=l
Die
eigentliche direkte
gleichung
digitalen
des
'
=
n
iL
iFig. 2) realisiert die Differenzen¬
Form
Filters
N
^£
a.
i
x
-
n-i
i=0
Sie ist nicht
V^
b.
£_ "i y*n-i
i=l
minimal, besitzt
aber
die minimale Anzahl
von
Koeffi zienten.
tthtt—r[!>-T-[5>
,X)a
[!>
(x)a,
x
Ja
M-l
X
a
T
X
~\ ^"bN-l
y
X>b„
(X)-b
<CrJ—• -<5j-^—<J]—»—<Ct]•
Fig.
2
Direkte Form
Es sind zwei
18
•
direkte kanonische Strukturen bekannt.
(nT)
erste6
Die
man
kanonische Form [11,12] (Fig. 3) bekommt man, indem
die Differenzengleichung wie folgt schreibt
max(N,M)
y«n
und dann
=
je
ao Xn
JZ
+
Ui Xn-i
i=l
-
bi Yn-i)
Speichervariable
dem Term der Summation eine
zu¬
weist. Man bekommt daraus
"y(n)
W.
x(nT)
aQ
=
(n+1)
=
a.
x(n)
w-^n)
+
;*(n)
Xvn;
-
y
l>^ y(n)
b.
~{^>^ ~^>~
rx-bN
3
X -b
.,
mit
*
*
*
""
i
=
wn+1
l...max(N,M)
=
0
^~~t^^*Xb
+
(nT)
XVb,
N-1
Erste kanonische Form
Wenn man die
¦
5v^
x)a.N
+
Fig.
«i+i (n) für
+ w.
viii
(M=N)
Uebertragungsfunktion
G(z)
=
N(z)
D(z)
folgendermassen zerlegt
6
W(z)
=
Y(z)
=
1
X(z)
D(z)
N(z)
•
Wir brauchen hier die
In
W(z)
Terminologie
[14] sind die Bezeichnungen
nach Schüssler
[11,12]
für beide Formen vertauscht.
19
bekommt
Form
die
Differenzengleichungen
[11,12,13,14](Fig. 4)
man
der zweiten
kanonischen
N
w(n)
'=
x(n)
-
y
b. w(n- i)
i=l
M
y(n)
=
y
a.
w(n-i)
i=0
I
x(nT)
<}
0aN
©-Vi
4
i
G>bN
w(nT)
¦
¦
x)-b
<\
•
©aN-
i
Fig.
4
Zweite kanonische Form
2 2
y(nT)
(M=N)
Die beiden direkten kanonischen Formen lassen sich durch
Transponieren [15,16] ineinander überführen. Bei der Transpo¬
nierung wird die Richtung des Signalflusses im Filternetzwerk
gekehrt, insbesondere wird der Eingang und der Ausgang ver¬
tauscht und Knoten werden Summatoren und Summatoren
zu
Knoten.
Systemmatrix wird dabei transponiert. Es ist dabei zu
bemerken, dass die beiden als kanonisch bezeichneten Formen
nur kanonisch im Sinne der von uns gegebenen Definiton sind,
Die
falls der Zähler und der Nenner ihrer
teilerfremd sind.
20
Uebertragungsfunktion
2.1.2
Zerlegte
Formen
Uebertragungsfunktion in eine
Teilübertragungsfunktionen
Bei diesen Strukturen wird die
Summe oder in ein Produkt von
niederer Ordnung zerlegt. Das Filter wird dann realisiert
als eine Parallelschaltung oder eine Kaskadenschaltung von
Teilfiltern.
niedrigste mögliche Ordnung ist eins. Damit wird in jedem
Teilfilter ein Pol der Uebertragungsfunktion realisiert. Falls
das Filter komplexe Pole besitzt, sind Teilfilter erster Ord¬
nung ungünstig, da sie komplexe Multiplikationen enthalten,
die 4 reelle Multiplikationen und 2 reelle Additionen (oder
3 reelle Multiplikationen und 5 reelle Additionen) bedingen.
Die
Da
man
meist mit reelen
imaginären
Signalen arbeitet,
müssen sich die
günstiger,
arbeiten, wobei jedes ein
Anteile aufheben. Es ist daher
Teilsystemen
2.
Ordnung
zu
mit
Paar
konjugiert komplexer Pole realisiert.
Die zerlegten Strukturen sind kanonisch oder nicht kanonisch
je nachdem ob die einzelnen Teilfilter kanonisch sind oder
nicht.
2.1.2.1 Parallelform
Die Parallelform entsteht bei der
PartialbruchZerlegung
der
Uebertragungsfunktion: somit wird die Uebertragungsfunktion
als Summe von Teilübertragungsfunktionen dargestellt [12].
Sie kann realisiert werden, indem die Ausgänge der Teilfilter
zusammen addiert werden, wobei der Eingang jedes Teilfilters
direkt an den Filtereingang angehängt wird (Fig. 5).
Man kann für ein
Digitalfilter
ähnliche Parallelformen
zerlegung
auf eine
aufstellen, indem
ausgedrückt
man
die Partialbruch-
Uebertragungsfunktion anwendet,
als rationale Funktion in
z
zwei verschiedene, aber ziemlich
z
die entweder
oder als rationale Funktion in
ist.
21
PU)
G1(z)
1
x(nT)
>
i
G2(z)
•
•
«
•
•
•
y (nT)
•
•
1
Parallelform
Fig.
5
Wenn
man
in
V«)
die
Uebertragungsfunktion
ausdrückt
z
y
H(z)
=
M
a.
hat die
P(z)
=
N
P(z)
fei
z"1
b.x
Np
ri
i=l
k=l
im
allgemeinen
die Form
+
(z
-
p.
x)
ist der Quotient der Division des Zählers durch den
ist die Vielfachkeit des i-ten Poles p.
*i
l
ist die Anzahl verschiedener Pole:
N
L>±
i=l
22
TT
Partialbruchzerlegung
Nenner, r.
N
z
1=0
1 +
H(z)
als rationale Funktion
-
N
es muss
dabei
H(z),
gelten
von
Fällen sind die Pole einfach. Durch Zusammen¬
In den meisten
fassen der Terme mit
zweiter
Ordnung
bekommt
N
h(z)
=
pu,
+
konjugiert komplexen
man
N
A. p.x
r
y-
—x
1
r—r-,
i=l
-.
.
Polen in Terme
p.
*i
-
r~
+
-
c'/2
Zr-T
^—-
z
1=1
a
+ a,
—oi
.
1 + b,
li z
_1
.
z
-1
u—-^~
+
.
b_. z
2i
(4)
wo N
diejenige
die Anzahl der reellen und N
der
komplexen
Pole ist.
Die
Uebertragungsfunktion
als rationale Funktion in
der rationalen Funktion in
z
kann
gefunden werden,
»m man
indem
den Zähler und den Nenner durch die höchste Potenz von z -1
aus
dividiert, die
) vorkommt. Es ergibt sich:
in H(z
M
r—
H(z)
ai
-i^l
=
z
M-N,(z N
M-l
„
Z_.
+
,
z
z
*
tr*
>
b.x
1=1
.
z
N-i,)
M-N
Der Faktor z"
ist bei dieser
Der bei dieser
Operation
Betrachtung wichtig.*
entstehende Grad des Nenners von
H(z)
kann nicht kleiner werden als der Grad des Zählers. Ferner
tritt falls M>N
scheinung.
Die
ist, ein (M-N)-facher Pol bei
Partialbruchzerlegung
N
H(z)
-E
=
r*
-A-
lo+C £
,
1=1
.
(Z
,
k=l
z
=
0 in Er¬
bekommt daher die Form
Aik
~
)
P.
*i
N
P
wo
p. der i-te Pol von
H(z) ist.
Hier ist
/
r.
=
max(M,N).
i=l
23
a
o
ist der Quotient der Division des Zählers durch den
H(z).
Falls die Pole (ausser
Nenner von
0) einfach sind und man
konjugiert komplexen Polen zusammenfasst,
die Terme mit
ergibt
=
y~
L-
——+
*
-
P±
"
=
P'
(z)
+
A!
_.
r
V~
—i
1
.—T
l-l
-
M-N
wobei
P
(z)
=
a0 +
ZI
1=1
einen transversalen Teil
2l
M
.
M-N
+ a„.
z
,
'
nur
falls H
Uebertragungsfunktion
N
H(z)
,
'
"
umwandelt, findet
z
=
°
7^
-r^—-—+
*o+Y^-x
Z_
+ b _z + b
z2
/_zi
1=1
"li"
"2i
i=l
a
letzte Term existiert
die letzte
in
N^/2
c'
w,
A.'
r
i=l
Der
z
sich
N
H(z)
der bei
z
N. Wenn
>
man
jetzt
wieder in eine Funktion
man
Nc/2
-1
—
+
p.z
*i
,
a.
V~" —Ü
4—r
1=1
.
z
-1
1 + b.
li
.
+
z
a9. z
-2
-y-^ib_.z
2i
—
+
(5)
ciz"i
darstellt, der
nur
existiert falls
N. Es existieren zwei sehr ähnliche Parallelformen: die
Nenner der
Teilübertragungsfunktionen
identisch, die Zähler
in
(4) und (5) sind
und der eventuell vorhandene transver¬
sale Teil sind aber verschieden.
2.1.2.2 Kaskadenform
Durch Faktorisieren von Zähler- und
tragungsfunktion [12] ergibt
24
sich:
Nennerpolynom
der Ueber¬
M
H
1=0
H(z)
z
N
a.
N
+
,
\r~ b
2—
M
M-i
z
.
z
a
TT (z
o
1=1
N
N-i
TT
(z
i=i
1=1
z
-
-
)
P±)
die Nullstellen und p. die Pole von H(z) sind,
i
Durch Zusammenfassen der konjugiert komplexen Pole und Null¬
wobei
z.
l
Ordnung
Teilübertragungsfunktionen
bekommt
stellen in Faktoren zweiter
von
H(z)
-•jr
z
-
z.
z
P±
z
1
z
-
Kaskadenschaltung
(Fig. 6).
das als
kann
-üi£L_0—
Fig.
Für
von
GL(z)
2
man
+
a,Ii z +
a_
+
b..z
Ii
b~.
.
+
ein Produkt
2i
.
2i
Teilfiltern realisiert
werden
GN(z)
G2(z)
y(nT)
6 Kaskadenform
jede Uebertragungsfunktion gibt
es
viele Kaskadenanord¬
nungen, die sich nach der Art unterscheiden, wie man die
Faktoren des Zählers und des Nenners zu Teilübertragungs¬
funktionen
paart
und wie
man
die einzelnen Teilfilter in
der Kaskade ordnet. Diese verschiedenen Anordnungen unterschei¬
den sich in ihrem Rauschverhalten (d.h. in der Auswirkung der
Abschnittfehler),
wie wir im
Kapitel
5.4.8 sehen werden.
25
2.1.3 Andere Filterstrukturen
Neben den
besprochenen
der letzten Zeit
"klassischen" Filterstrukturen sind in
Formen
vorgeschlagen
worden. Mit diesen
kann man ein ganzes Filter realisieren oder aber diese Struk¬
turen können als Teilfilter in Parallel- oder Kaskadenformen
eingesetzt werden. Hier werden kurz einige dieser neuen Filter¬
neue
strukturen aufgezählt.
-
[18], Mitra [19] u.a. [14,20].
Kettenbruchzerlegungen der Uebertragungs¬
Kettenfilter nach Hemmer
Sie beruhen auf
funktion
-
Filter mit Kreuz- und Kettenglieder nach Gray und Marke1
[21] u.a. [22,25]. Die Koeffizienten des rekursiven Teils
dieser Formen können mit der Divisionsmethode zur Prüfung
der Stabilität abgetasteter Systeme [1] erhalten werden.
Bei diesen Strukturen ist die Stabilität leicht aus den
Koeffizienten
-
zu
bestimmen.
Wellendigitalfilter
Im
Gegensatz
zu
[23]
den übrigen Digitalfiltern beruhen diese
nach Fettweis
auf einer direkten
Uebertragung Element für Element der
einzelnen Komponenten eines analogen RLC-Filters, das auch
Verzögerungsleitungen enthalten kann. Sie sollen sehr günstig
in Bezug auf Quantisierungsfehler sein.
In [14] sind insgesamt 14 kanonische Strukturen aufgeführt.
Es stellt sich die
Frage, welche Filterstruktur die beste
bezüglich Empfindlichkeit gegenüber Quantisierung der Koeffi¬
zienten und
ses
bezüglich
Problem ist immer noch offen: es sind
stematischen
z.B.
26
Verhalten auf Abschnittfehler ist. Die¬
[26,50].
Untersuchungen
der
nur
Ansätze von sy¬
Empfindlichkeit bekannt,
/
wie
2.2
Darstellung
Die
der Zahlen
digital realisierten digitalen Filtern werden alle
Bei den
im Filter vorkommenden Grössen
Signale
mit Hilfe arithmetischer Operatio¬
allen heute gebräuchlichen arithme¬
dargestellt, die
nen manipuliert werden. Bei
tischen Schaltungen werden die
mit Zahlen
von
-
Koeffizienten und
Zahlen durch eine Kombination
logischen Zuständen (0 und 1) dargestellt.
zwei
sehr viele
logischen
Möglichkeiten,
-
eine Zahl mit Hilfe
von
Es
gibt
binären
codieren. Wir werden hier versuchen,
eine Systematik anzugeben, um daraus die für die Digital¬
filter geeignetsten Zahlencodierungen herauszuschälen.
Zuständen
zu
2.2.1 Zahlencodes
Zuerst können wir zwischen
gewichteten
und
ungewichteten
Zahlencodes unterscheiden.
Bei den
gewichteten Codes wird die Zahl durch eine Folge
von
Ziffern dargestellt
{dn dn_l
'••
dm+2 dm+l dm}
Jeder Ziffer wird ein Gewicht
der Ziffer in der Zahl
zugeordnet, das von der Stelle
abhängt. Wenn im betrachteten Zahlen¬
system b verschiedene Ziffern existieren, die die Werte
b-1 annehmen können (b heisst die Basis des
0, 1, 2,
...,
Zahlensystems),
zahlige) Potenz
dann ist das Gewicht einer Ziffer eine
(ganz¬
der Basis. Der Wert der Zahl ist dann die ge¬
wichtete Summe der Ziffernwerte
n
d.l
-b1
i=m
27
gewichteten Codes ist,
Der grosse Vorteil der
dass die arithme¬
tischen Operationen auf iterative Operationen zwischen den Zif¬
fern zurückgeführt werden können. Insbesondere kann die
Addition zweier Zahlen
x
=
{x^n
x
n-1
...
x
m+1
x
m
}
und
y
(y n
=
J
2
auf die Addition der einzelnen Ziffern
n
y
=
,
y _,_-, Jm
y }
Jm+1
...
zurückgeführt
werden
n
Y~ x±bi V" y-b1 V~ (x± y±) b1
i=m
+
i=m
+
=
*famn->«r>™i»
*¦—^
i=m
tf,,
berücksichtigt werden,
Es muss dabei
,i .
|
+
x
n
y n-1
J
m
dass der Wert einer
einzelnen Ziffer höchstens (b-1) betragen kann: die Summie¬
rung der Ziffern muss modulo b erfolgen. Falls ein Ueberlauf
d.h. falls die Summe der Ziffern grösser als (b-1)
wird, muss ein Uebertrag (carry) "1" zur benachbarten Ziffer
erfolgt,
mit höherem Gewicht hinzuaddiert werden. Das
die Addition mit der
und
zu
Bei den
immer höher
niedriger gewichteten
Ziffer
gewichteten Ziffern führen
nichtgewichteten
Codewörter
bewirkt,
Zahlencodes ist die
dass
beginnen
muss.
Zuordnung
der
den Zahlenwerten anders (ein
Beispiel für solche
Codes ist der Gray-Code). Diese Codes sind im allgemeinen für
eine Arithmetik ungeeignet, da eine Zerlegung der Operationen
normalerweise nicht möglich ist und diese nur über umfangreiche
gespeicherte Tabellen oder mittels komplizierter logischer
Schaltungen erfolgen können.
zu
Es haben sich
logische Systeme mit zwei Zuständen einge¬
bürgert. Deshalb nimmt das Zahlensystem mit der Basis 2 eine
ausgezeichnete Stellung ein, da seine Ziffer direkt mit den
zwei
nur
logischen
Zuständen 0 und 1 darstellbar sind: das ist
der reine oder natürliche Binärcode.
28
Zahlensystemen müssen die einzelnen Ziffern
entsprechend mit den zwei logischen Zuständen 0 und 1
Bei den anderen
zuerst
codiert werden. Wenn die Basis eine Potenz
von
2 ist und die
einzelnen Ziffern binär codiert werden, ergibt sich ein Code,
der wieder genau dem reinen Binärcode entspricht (Beispiel:
Octalcode, Hexadezimalcode). Wenn die Basis keine Zweierpotenz ist, ist eine gewisse Redundanz vorhanden: Bei der Co¬
dierung der Ziffern stellen nicht alle möglichen Bit-Kombina¬
tionen auch eine Ziffer dar. Diese
auch mehr
zu
Bits,
um
einen
gewissen
Systeme
Zahlenbereich darstellen
können und auch die arithmetischen
komplizierter.
Das
brauchen deshalb
wichtigste solche
Schaltungen werden
System ist dasjenige
10, das Dezimalsystem, und zwar weil der Mensch
Jahrhunderten angewöhnt hat, dezimal zu zählen und
mit der Basis
sich seit
Dezimalsysteme
(BCD-Systeme im weitesten Sinn) für Ein- und Ausgabeoperationen
durch den Mensch besonders günstig, bedingen aber gegenüber
den reinen Binärsystemen einen Mehraufwand bezüglich Speicher¬
platz und arithmetischen Operationen. Aus diesem Grund werden
zu
rechnen. Deshalb sind die binärcodierten
die BCD-Systeme dort verwendet, wo der Mehraufwand für eine
BCD-Arithmetik kleiner ist als der Aufwand für die Umwandlung
der
Zahlensysteme,
wie bei
Tischrechnern, Computern
kommerzielle Anwendungen, usw. Bei
hingegen praktisch nie verwendet.
Eine weitere
Sie wird
den
Möglichkeit
aber,
version in andere
[27].
der Addition, wegen
Multiplikation
Zahlensysteme sozusagen
bei der
deswegen
werden sie
ist die Residuenarithmetik
trotz ihrer Vorteile bei
Komplikationen
Wir werden uns
Digitalfiltern
für
im
folgenden
nur
und bei der Kon¬
nie
gebraucht.
mit dem reinen Binär¬
code befassen.
29
2.2.2 Darstellung
Digitalfiltern
In
von
Darstellung
positiven Zahl,
positive und negative
naheliegendste Weise, um das
muss man
stellen können. Die
die
7
positiven und negativen Binärzahlen
Zahlen dar¬
zu
tun, ist
durch Betrag und Vorzeichen. Es wird einer
die den Absolutwert der Zahl darstellt, ein
zusätzliches Vorzeichenbit
angehängt.
Die übliche Konvention
ist, dass das Vorzeichenbit 0 für eine positive Zahl und 1
für eine
negative gesetzt wird. Bei dieser Darstellungsart
ist die Multiplikation am einfachsten: man muss nur beide
Beträge miteinander multiplizieren. Das Vorzeichen des Pro¬
duktes ist die "Exklusiv-Oder"-Funktion der Vorzeichen der
Faktoren. Die
Addition_jLst
dafür
komplizierter:
es muss
erst anhand der Vorzeichen der Addenden entschieden
ob
man
muss.
die
Beträge
werden,
der Addenden addieren oder subtrahieren
Wenn die Vorzeichen verschieden
aber zuerst
zu¬
muss man
sind, subtrahiert
man,
noch bestimmen, welcher der beiden
ist.
Beträge der grössere
In Digitalfiltern werden
Weise dargestellt.
die Koeffizienten meistens in dieser
Komplementdarstellungen günstiger.
unabhängig von den Vorzeichen der
Für die Addition sind die
Damit wird die Addition
durchgeführt. Die Subtraktion wird auf die Addition
zurückgeführt und zwar mit Hilfe einer Komplementierung des
Subtraktors. (Das Komplement einer Zahl ist jene Zahl mit
dem gleichen Betrag, aber mit umgekehrtem Vorzeichen). Die
einfachste Weise, einen solchen Komplementcode zu erhalten,
ist, die (positiven und negativen Zahlen x in rein positive
Zahlen x* abzubilden. Wenn der Zahlenbereich von -m/2 bis
m/2 -q geht (q sei dabei das Gewicht des leichtesten Bit),
Addenden
7
Als Literatur für diesen Abschnitt kann jedes Buch über
Computer-Hardware oder Computer-Arithmetik, wie z.B. [27,93j
angegeben werden.
30
kann dieser mit
x*
in das
+
x
=
positive
m/2
Intervall
[0, m-q] abgebildet
werden. Der
erhaltene Code heisst "offset binary" Code [28j. Man er¬
hält diesen Code, wenn man einen unipolaren Analog/Digital¬
so
wandler oder
Digital/Analogwandler
polarer Spannungswerte
für die Konversion bi¬
verwendet: Die Addition des Wertes
Bereichsumfangs, also die Addition von m/2, er¬
folgt dabei auf der analogen Seite. Bei diesem Code entspricht
des halben
das Vorzeichenbit nicht der üblichen oben erwähnten Konvention,
und der Wert Null wird hier durch die Bitfolge 10 0
0
gekennzeichnet.
In der Arithmetik bedient man sich daher
dem sehr verwandten Zweierkomplementcode. Man erhält ihn
aus dem Offset Binary Code durch Invertierung des Vorzeichen¬
bits. Diese Inversion ist gleich der Addition modulo m des
Wertes 10 0
Zahlenwert
x*
m/2. Somit ist die Abbildung von
zugehörigen positiven Abbildungswert
0
...
zum
x +
=
=
(mod m)
m
=
x
-
m
einem
(mod m)
Bei den Zahlen in
Zweierkomplement ist das Gewicht des Vor¬
zeichenbits negativ (= -m/2), während das Gewicht aller an¬
deren Bitstellen positiv geblieben ist.
Komplementdarstellung ist die EinerkomplementDarstellung. Man erhält sie aus dem 2-er Komplement durch
Eine andere
die Subtraktion des Gewichtes q des leichtesten Bit wenn
die Zahl negativ ist. Der Zahlenbereich ist hier symmetrisch
(~2
0
+
0
q»
...
j
0
-
q)•
Der Wert Null besitzt zwei
(als +Q bezeichnet) und 1
1
1
Darstellungen:
...
1 (-0).
Das Gewicht der Vorzeichenstelle ist hier keine
Es
beträgt
--?
+
Zweierpotenz:
q.
jetzt einige wichtige Operationen
mentdarstellungen
Wir betrachten
in den
Komple¬
.
31
Komplementbildung, d.h. die Bildung der mit -1 multi¬
plizierten Zahl, ist besonders einfach beim 1-er Komplement:
Die
man muss nur
alle Bits der
Zahlendarstellung
Komplement zu bilden, bildet
Komplement und addiert eine "1"
Um das 2-er
man
das 1-er
an
invertieren.
meistens zuerst
der leichtesten
Stelle. Für eine serielle Verarbeitung ist der folgende, äqui¬
valente Algorithmus [27] günstiger: Man untersucht das Wort
bitweise
von
der leichtesten Stelle
an.
Die ersten Nullen
werden unverändert, wie auch die erste "1". Alle nach der
ersten "1" folgenden Bits werden invertiert.
Die Addition
erfolgt
ähnlich wie die Addition positiver
Zahlen: Die Vorzeichenbit werden mitaddiert.
Zweierkomplement wird der Uebertrag aus der Vorzeichen¬
stelle ignoriert. Beim Einerkomplement muss eine Korrektur
eingeführt werden: der Uebertrag aus der Vorzeichenstelle
Beim
wird
leichtesten Bit der Summe hinzuaddiert. Bei Parallel¬
addierern geschieht das, indem man den Uebertrag-Ausgang aus
der Vorzeichenstelle mit dem Uebertrag-Eingang an der leich¬
zum
testen Stelle
verbindet? bei einer seriellen Addition
ein zusätzlicher
Die
Additionszyklus eingeführt
Multiplikation
von
Zahlen in
muss
werden.
Komplementdarstellung
ist
komplizierter als die von Zahlen, die mit Betrag und
Vorzeichen dargestellt sind. Bei Digitalfiltern werden daher
in der Regel die Filterkoeffizienten mit Betrag und Vorzeichen
dargestellt, die Signale aber mit Komplement wegen der nach¬
folgenden Additionen. Eine Möglichkeit ist, dass man die
Signalgrössen vor der Multiplikation von der Komplernentdaretwas
8
Paralleladdierer mit
geschlungenem Uebertrag (ripple carry)
Einerkomplement ein wenig mehr Zeit (gleich der
Verzögerung des Uebertrags durch zwei Volladdierer) als beim
Zweierkomplement. Die Additionszeit wird in einem Paralleladdie¬
rer mit vorbestimmten Uebertrag
(carry look-ahead) bei Verwendung
des Einerkomplements praktisch verdoppelt [93].
Ein
braucht beim
32
in die Betrag- und Vorzeichendarstellungumwandelt
und sie nach der Multiplikation wieder in die Komplement¬
Stellung
darstellung zurückwandelt. Die direkte Multiplikation mit
der Signalgrössen in Komplernentdarstellung ist auch möglich:
Die Methoden hängen von der Komplernentdarstellungund von
der Art, wie die Multiplikation durchgeführt wird, ab. Es
sei hier auf die Literatur verwiesen
[27,29].
allgemeinen kann man sagen, dass die Einerkomplemntdar9
Stellung vorteilhafter ist für eine parallele Arithmetik
wegen der einfacheren Komplementbildung und das ZweierkompleIm
ment
hingegen
Arithmetik, 9 weil man dabei
Additionszyklus braucht. Bei der Verwendung
für eine serielle
keinen zweiten
Zweierkomplementes für eine Parallelarithmetik braucht
man zur Bildung des Komplementes eine Kette von Halbaddierern,
um den Wert l.q zu addieren. Falls man höchstens einen der
Addenden vor einer Summierung komplementiert, kann man sich
für die Bildung des Zweierkomplementes die Halbaddierer er¬
sparen: Man bildet das Einerkomplement und fügt den Wert l.q
erst bei der nachträglichen Addition hinzu, indem man eine
"1" an den Uebertrags-Eingang der leichtesten Stelle setzt.
In diesem Fall kann das Zweierkomplement auch für eine Parallel¬
des
arithmetik mit Vorteil eingesetzt werden.
2.2.3
Fest- und Gleitkommazahlen
jetzt
betrachteten Zahlen sind Festkommazahlen. Das
Gewicht der einzelnen Bits bleibt konstant: Insbesondere ist
Die bis
es
nicht Funktion der
Zahlengrösse. (Fig. 7)
9
Bei der parallelen Arithmetik wird das ganze Wort gleichzeitig
verarbeitet. Jedem Bit entspricht eine Leitung. Bei der seriel¬
len Arithmetik werden die Bits der Zahlen nacheinander ver¬
arbeitet, und zwar mit dem leichtesten Bit zuerst und dem Vor¬
zeichenbit zuletzt, wegen der Addition.
33
+
22 21 2° 2"1 2"2 2"3 2"4 2"5 q=2"6
Gewicht
Fig.
7
Festkommazahl
Festkommazahlen besitzen einen beschränkten Zahlenbereich.
Bei nur positiven Zahlen befinden sich die Zahlen x im
Intervall
£
0
x
q.
*-
n.
(2"b
-
1)
und bei Zahlen mit Vorzeichen heisst es
|x|
Das
q.(2(nb-1))
Gleichheitszeichen gilt
komplement.
Bit und
Die
*
nb
In
obigen
für negative Zahlen im Zweier¬
Formeln sind q das Gewicht des leichtesten
die gesamte
nur
Wortlänge.
Auflösung
der Zahlen ist konstant. Damit der Zahlenbereich
gut ausgenützt ist, muss man die Zahlengrösse dem vorhandenen
Bereich anpassen: diese
Operation heisst Skalieren.
Die Ska¬
lierung
ist fest und wird im voraus bestimmt. Sie wird ausführ¬
lich im Kapitel 3.2 behandelt werden.
Um die Nachteile der festen
Skalierung zu vermeiden, hat man
in der Computertechnik die Gleitkommazahlen (auch
rithmisch
dargestellte
halbloga-
Zahlen genannt) eingeführt. (Fig. 8)
Dabei stellt ein Teil des Wortes eine (meist fraktionäre)
Festkommazahl (Mantisse), der andere Teil einen
(ganzzahligen)
Exponenten einer Potenz der Basis b (d.h. bei binären Zahlen
der Basis 2) dar, mit welcher die Mantisse multipliziert
wird,
um
34
den Zahlenwert
zu
erhalten.
±
-!-..-
+
.
-K
V
Exponent
Fig. 8
Mantisse
Gleitkommazahl
Zahl
=
Mantisse
Zahl
=
Mantisse
Diese
•
•
im
b.
p
2
Zahlendarstellung
allgemeinen
bei binären Zahlen
ist redundant: Ein Zahlenwert kann
mit mehreren verschiedenen Gleitkommazahlen
werden.
Variante ist dabei die normalisierte, bei wel¬
genaueste
Die
dargestellt
grösstmöglichen
cher die Mantisse ihren
Wert annimmt. Wenn
die Mantisse fraktionär ist, heisst das bei der Basis 2
0,5
In der
Regel
|Mantisse|
^
ist
<
1
obige Bedingung
genau dann
erfüllt,
wenn
das
schwerste Bit der Mantisse das Inverse des Vorzeichenbits ist.
einzige Ausnahme zu dieser Regel beim Zweierkomple¬
ment: Der Wert -1, der noch zum Zahlenbereich gehört, wird
nämlich vermieden, da sein Komplement nicht mehr zum Zahlen¬
Es
gibt
bereich
eine
gehört.
Stattdessen wird bei einer normalisierten
Mantisse der Wert
Bit den Wert
1,
-0,5
genommen: Hier hat
nun
gewichtigste
genau wie das Vorzeichenbit.
Bei normalisierten Gleitkommazahlen ist die
fähr
das
proportional
zur
Zahlengrösse (siehe
Auflösung
unge¬
Abschnitt 2.4).
35
Nachteilig
ist bei den Gleitkommazahlen der
wand für die Arithmetik. Die
wesentlich
grössere
Multiplikation ist
Auf¬
zwar un¬
komplizierter
als bei der Festkommaarithmetik:
Die normalisierten Mantissen werden multipliziert und die
Exponenten addiert.
Die Addition ist aber erheblich
Mantissen werden
zusammen
komplizierter [27].
addiert, aber
Die beiden
zuerst muss der
kleinere Exponent durch eine Denormalisierung auf den Wert
des grösseren gebracht werden. Das Resultat der Addition muss
dann noch normalisiert werden.
Wegen dem grossen Aufwand wird die Gleiticoramaarithmetik
einer Filterhardware selten
bei
angewandt.
Digitalfiltern folgt normalerweise einerAddition sofort
eine Multiplikation. Deswegen ist die Block-Gleitkomma¬
arithmetik [30] dem Algorithmus besser angepasst. Dabei er¬
hält ein ganzer Zahlenblock, z.B. alle Signalgrössen in
einem Teilfilter, einen gemeinsamen Exponenten. Die Arithmetik
innerhalb des Blockes ist eine einfache Festkommaarithmetik,
die Exponenten bestimmen die Skalierung zwischen den Blöcken,
die bei der Block-Gleitkommaarithmetik signalabhängig wird.
Bei
2.3 Der Abschnitt bei der Festkommaarithmetik
Wenn man bei einer Zahl x die
niedrigstwertigen
besondere Bits bei Binärzahlen)
der anderen Ziffern zu ändern),
(roundoff)
um
vom
36
weglässt
spricht man
dieser Zahl. Man erhält
den Abschnittfehler
e
=
q
richtigen
x
-
Ziffern (ins¬
(ohne die Wertigkeit
x
q
Wert unterscheidet.
so
von
eine Zahl
Abschnitt
x
,
die sich
abschneiden, indem
Wir können eine Zahl
wir einfach die
oder wir können runden, indem wir
jene abgeschnittene Zahl x nehmen, die am nächsten bei der
letzten Bits
richtigen
weglassen,
Zahl x
q
liegt.
Einfacher Abschnitt (truncation)
2.3.1
gleich dem Wert der weggelassenen
verwendeten Zahlendarstellung.
Hier ist der Abschnittfehler
Ziffern in der
Wir betrachten zuerst den einfachen Abschnitt von
positiven
binären Zahlen
110
x
-
e
=
-
q
n.q„
q
-
SI 1 0 1
q
:
ursprüngliche Zahl
abgeschnittene Zahl
1 1 0 1
-110
(n: ganze Zahl, q
Der
v
Abschnittfehler
Gewicht der letzten Stelle von
Abschnittfehler ist
gleich
der
x
)
Zahl modulo q
das Gewicht des
richtigen
wo
q
^q
,
niedrigstwertigen Bit der
abgeschnittenen Zahl x ist,
Die Abschnittfunktion hat
a
die Form einer
»
•
>
• •
•-¦»
(Fig. 9a),
Treppenkurve
der Abschnitt¬
fehler die Form eines
zahns
•
m
•»
Säge¬
(Fig. 9b).
•
37
*e
b
2q
Fig. 9
Abschnitt
positiver Zahlen
a) Abschnittfunktion
b) Abschnittfehler
negativen Zahlen hängt
Bei
wendeten
der Abschnittfehler von der ver¬
Komplementdarstellung
ab.
Wertabschnitt (value truncation)
Wir nehmen für
den negativen Wert des
x
obigen Beispiels
in
Zweierkomplementdarstellung
x
x
=
-
q
n.q
SO
0 1 1
0 0 1
0
111 \0 0 0 0
5^
0 0 0
Der
s
1
J0
0 1 1
Zahl
ursprüngliche
-abgeschnittene Zahl
Abschnittfehler
Abschnittfehler ist immer positiv:
Es ist
*
x
-
q
x
und
folgender Betrachtung gesehen
werden, x sei eine negative Zahl in Zweierkomplementdarstel¬
lung und x* deren Darstellung als positive Zahl (siehe Kapitel
2.2.2), der Zusammenhang zwischen x und x* ist gegeben durch.
0
38
-
e
<
q
.
Das kann auch aus
x
x*
=
m
-
(mod m)
m/2 das Gewicht der Vorzeichenstelle
als positive Zahl ist.
wo
bei der Darstellung
e* sei der Wert des abgeschnittenen Wortteils bei der Darq
Stellung als positive Zahl, welcher, wie wir weiter oben
gesehen haben,
x
=
q
x*
—
q
immer
x*
m
und daher
positiv
=
e*
q
-
x-x
q
=
ist. Es
-
folgt:
m
e* ^ 0
q
Der Abschnittfehler einer Zahl in
Zweierkomplement
ist immer
positiv (siehe Fig. 10)
1
ix
q
Z"
0
/_^
/.
X
a)
b)
/_~~
Fig.
10
Wertabschnitt
a) Abschnittfunktion
b) Abschnittfehler
39
Betragsabschnitt (magnitude truncation)
Beim
gleichen Beispiel
haben wir im
p
0 1S 0 0 1 0
1.
x
=
q
n.q
^q
-
N
0. 1 1 0
CO
1. 1 1 1
00010
0 0 0
Einerkomplement
ursprüngliche Zahl
-abgeschnittene Zahl
=
-
110 1 Abschnittfehler
Der Abschnittfehler einer
negativen Zahl ist hier negativ:
der abgeschnittene Wert ist grösser (absolut kleiner) als
der richtige. Das kann man anhand einer ähnlichen Betrachtung,
wie jener, die wir für das Zweierkomplement angestellt haben,
allgemein
einsehen:
Einerkomplement ist die Darstellung einer negativen
Zahl um den Quantisierungsschritt q kleiner als im Zweier¬
komplement (siehe Kapitel 2.2.2)
Beim
x
=
x*
-
m +
q
Bei der
abgeschnittenen
Quantisierungsschritt q
jenige
der
Zahl
r*
x'
-
m +
q
muss man
nehmen,
ursprünglichen
=
x
q*
der
den entsprechenden
grösser
ist als der-
Zahl
=
X*
_
o*
-
m +
q*
Daraus
=
e*
q
-
(q*
Mq
-
q*)
M
q* ist eine Zahl, gebildet aus allen 1 in den Stellen
entsprechend den abgeschnittenen Stellen, e*q kann aber nicht
grösser werden als eine solche Zahl und deswegen ist
r*
40
-
e*
q*q
-
q
so
q*
-
dass der Abschnittfehler
komplement
Wenn alle
immer
negativ
e
q
negativen
Zahl im Einer-
ausfällt.
abgeschnittenen
der Abschnittfehler
einer
e
Bits
=0,
"1" sind, dann ist
alle gleich "0" sind, dann
gleich
wenn
wird der Abschnittfehler absolut maximal.
Zusammenfassend kann
sagen, dass das Vorzeichen des Ab¬
man
Einerkomplementdarstellung
schnittfehlers einer Zahl in
gleich
dem Vorzeichen der
0
-
e
q
<
und
-q
q
< e
-
q
q
0
q
richtigen
für
x >
0
für
x <
0
Zahl ist: es ist
(Fig. 11)
sehen, dass, wenn die Zahlen mit Vorzeichen
und Betrag dargestellt werden, der Abschnittfehler sich
Man kann leicht
gleich
wie bei der
Einerkomplementdarstellung
1
genau
¦e
verhält.
q
////.
v//
q
q
0
-q
a
Fig.
11
Betragsabschnitt: a)
Abschnittfunktion
x
q
b)
b) Abschnittfehler
41
2.3.2
Rundung
Um die Fehler etwas
zu
verringern,
kann man eine Zahl runden
statt sie einfach abzuschneiden. Runden heisst den nächsten
gröber quantisierten
Wert nehmen: Wenn der
abgeschnittene
Teil kleiner als ¦^•q ist, dann nimmt man den nächst-kleineren
2 q
1
Wert und wenn er grösser als -r-q ist den nächst-grösseren.
z
q
Falls der abgeschnittene Teil gleich r-*q ist, dann ist es
n
gleichgültig,
welchen der beiden nächsten Werte genommen wird:
Die Wahl wird sich aus der verwendeten Zahlendarstellung er-
geben.
Um
die
Rundung praktisch
zu
realisieren,
muss
bei
positiven
Zahlen und bei negativen Zahlen im Zweierkomplement einfach
die Zahl ~-*q
(gleich einer "1" in der ersten abgeschnittenen
z
q
Binärstelle)
vor
Wenn das erste
geschnittene
dem Abschneiden der Zahl hinzuaddiert werden.
abgeschnittene
Bit "0" war, dann wird die ab¬
Zahl durch diese Addition nicht
verändert,
aber
gleich
"1" war, dann entsteht ein Uebertrag zur
letzten nicht abgeschnittenen Stelle. Man kann also runden,
indem man das erste abgeschnittene Bit zur letzten Stelle der
wenn es
abgeschnittenen
Bei Zahlen in
von
Zahl addiert.
Einerkomplementdarstellung
der Wert j-q
z
q
der ungeschnittenen Zahl subtrahiert werden, wenn die
Zahl
negativ
muss
wird.
Bei Zahlen im Zweierkomplement wird dabei der nächsthöhere
Wert genommen (Wertrundung), bei Zahlen im Einerkomplement
oder in Betrag-und Vorzeichen-Darstellung der nächste betragsmässig höhere Wert (Betragsrundung). Es sind auch Verfahren denk¬
bar,
um
die verbleibende Asymmetrie der
Rundung
zu
verhindern,
z.B. indem man bei geraden Zahlen den höheren Wert und bei unge¬
raden den niedrigeren Wert nimmt (oder umgekehrt), oder indem
man die Grenzwerte zufälligerweise nach oben oder nach unten
rundet. Der zusätzliche Aufwand lohnt sich meistens nicht. Die
Unterschiede sind normalerweise belanglos,und wir werden daher
im folgenden die Behandlung der Grenzwerte unbestimmt lassen.
42
Rundung wird die Charakteristik
symmetrisch bezüglich der Nullinie:
Durch die
-
—*q
2 Mq
Das ist in
•<;
e
Figur
12
Rundungsfehler
K
«
q
der
dargestellt.
x
? e.
!a
la
2
a)
Fig. 12
Rundung a) Rundungsfunktion
b) Rundungsfehler
2.4
Quantisierung bei Gleitkommazahlen
Die
Gleitkommazahlen bestehen
in einem
einzigen
Wort
Exponent (Fig. 13)
zwei
Festkommazahlen,
zusammengefasst,
meistens
die Mantisse und der
.
*
+
aus
b)
1 1.
DB
+
\
"V
Exponent
Fig. 13
/
/\
Mantisse
Gleitkommazahl
43
Die Mantisse
Wert
liegt
ist meistens eine fraktionäre Zahl: ihr
m
im Bereich
i*|m|<l
(wenn die Zahl normalisiert ist).
Der
Exponent
exp ist eine ganze Zahl: Er ist der
einer Potenz (normalerweise der Basis
Mantisse
multipliziert wird,
x
Die
m
=
Beschränkung
Konsequenz
Der
Quantisierungsschritt
Wertes
der Mantisse q wird von dessen
m
bestimmt: Im Falle der fraktionären Mantisse
n
er
q
^m
2_nbm
=
Quantisierungsschritt
q
^
q
^m
=
2exP
•
q der
Es ist aber
2exp
so
dass
q
Da meistens
=
•=¦
x
ml
=
jlp qm -|x|
-|m|
x.qm
44
erhalten.
der
max.
Der
zu
2exP
•
des
beträgt
die Zahl
mit welcher die
Wortlänge einer Gleitkommazahl hat als
Quantisierung der Mantisse und die Beschränkung
des Exponenten bestimmt die Ueberlaufgrenze.
eine
Anzahl Bits
um
2),
Exponent
<
<
q
1
folgt
=¦
x.2q
^m
vollständigen
Zahl
x
ist dann
Der
Quantisierungsschritt
Grösse der Zahl
Zahl
zur
q wächst
In erster
x.
treppenförmig
Näherung
kann er als
mit der
proportional
selber betrachtet werden.
x
3
z
m
/2
q.m
oder besser
q
*
x
=
Der Fehler ist dabei kleiner als ein Faktor
2, d.h. kleiner als ein
halbes Bit.
Wenn
der
Quantisierungsfehler der Mantisse
Quantisierungsfehler e der ganzen Zahl
der
e
Die
q
m
=x +
Der
2exp
e
e
=
•
Zahl
=
-
m
x(l
=¦
m
e
m
/2
•
beträgt,
wird
x
ist dann
x
+ e
m
/2)
ist eine kleine Zahl
le
1 m1I
so
•
m
quantisierte
x
e
e
=
e
-
2_nbm
«
dass der Faktor (1
1
+ e
Quantisierungsfehler
Näherung
einen
m
fl)
sehr
wenig
von
1 abweicht.
bei Gleitkommazahlen hat in erster
multiplikativen Charakter, während
er
bei
Festkommazahlen einen additiven Charakter besitzt.
Festkommazahlen haben eine konstante absolute
Genauigkeit,
Gleitkommazahlen eine annähernd konstante relative Genauigkeit.
45
3. UEBERLAUF UND SKALIERUNG
3.1
Der Ueberlauf bei der Festkomma-Arithmetik
Wir werden hier die
Eigenschaften des Ueberlaufes bei der
Festkommaarithmetik und deren Folgen bei Digitalfiltern be¬
handeln.
Der Ueberlauf ist ein schwerer Fehler: Er kann zu einem in¬
stabilen Verhalten des Filters führen. Auch wenn letzteres
durch geeignete Massnahmen vermieden wird, resultieren Ver¬
zerrungen des Signals.
Ein Ueberlauf
eine Zahl
entsteht,
wenn
versucht
wird,
in ein
Register
einzuschreiben,
der Wert sich ausserhalb des Inter¬
valls der im Register darstellbaren Zahlen befindet, d.h.
wenn sie grösser ist als die grösste darstellbare
positive
Zahl oder kleiner als die kleinste darstellbare
negative
Zahl. Ueberlaufe können überall dort entstehen, wo die schwer¬
sten Bits eines Wortes abgeschnitten werden oder wo eine Zahl
grösser
werden
kann,
ohne dass die dazu
sehen worden sind. Das kann
-
-
nötigen
Bits vorge¬
geschehen
bei einer Addition
bei einer
Multiplikation
mit einem Faktor
grösser
als
1,
insbesondere
-
bei einer
Linksschiebung (left shift).
Der Ueberlauf kann durch eine
geeignete Skalierung vermieden
werden, die dafür sorgt, dass nirgends der zugelassene Werte¬
bereich überschritten wird. Die Skalierung ist Gegenstand von
Kapitel 3.2. Wir werden sehen, dass unter bestimmten Vor¬
aussetzungen der Ueberlauf an gewissen Stellen (nämlich den
Zwischenresultaten von Additionen) toleriert werden kann, so
dass nur an gewissen Stellen (Eingängen von Multiplikatoren)
46
bei der
Skalierung
auf Ueberlauf
geprüft
werden
muss.
gewissen Fällen müssen selten auftretende Ueberläufe
In
toleriert werden. Eine
Ueberlaufes in
und
zu
einer
jedem
Skalierung,
Fall
die ein Auftreten eines
verhindert, kann
zu
streng sein
unnötigen Verschlechterung des Verhältnisses
Signal-zu Quantisierungsrauschen führen.
Man muss dabei
sorgen, dass sich das Filter nach dem Auftreten eines
Ueberlaufes wieder erholen kann und dass es nicht ins
Schwingen gerät. Dazu muss man den Ueberlauf detektieren
können, um entsprechende Korrekturmassnahmen ergreifen zu
können [31].
3.1.1 Eigenschaften des Ueberlaufs
Wir werden in diesem Abschnitt die
laufs untersuchen. Wir werden
schen einer überlaufenen
und
Eigenschaften des Ueber¬
insbesondere zeigen, dass zwi¬
der entsprechenden richtigen
kongruenzähnliche Beziehung existiert. Wir betrach¬
zuerst Zahlen mit der Vorzeichen/Betragsdarstellung und
Zahl eine
ten
schauen,
wie sich der Ueberlauf hier auswirkt. Das Vorzeichen
sei hier
separat
vom
des Ueberlaufs einer
Betrag dargestellt, somit ist der Fall
positiven Zahl zu betrachten.
m
q
'
Fig.
14
Der Ueberlauf
Es ist keine
eigentliche Kongruenz,
weil diese
Aequivalenz-
relation nicht immer für die Multiplikation gilt, wie wir im
Kapitel 3.1.3 sehen werden. Wir werden trotzdem für diese Rela¬
tion das Symbol e (kongruent) verwenden.
47
Die
überzähligen Bits werden einfach abgeschnitten. (Fig. 14)
Man sieht sofort, dass sich als Resultat r nach dem Ueber¬
lauf ergibt:
+
10 110 1
1 0
a
1 0
n.m
10 110 1
+
die überlaufene Zahl durch Subtraktion eines ganzVielfachen des Gewichtes des ersten abgeschnittenen
der richtigen Zahl. Es gilt daher
Man erhält
zähligen
Bits von
a
=
n.m +
r
=
a
r
n
ganze Zahl
d.h.
(mod m)
Die überlaufene Zahl ist das Residuum der
modulo des Gewichtes
hier so
gewählt, dass
Der Modul
m
des ersten
m
richtigen Zahl a
abgeschnittenen Bits, n wird
den kleinsten positiven Wert annimmt.
ist bei binären Zahlen eine Zweierpotenz.
r
Die Ueberlaufcharakteristik hat eine
Fig. 15 dargestellt.
darstellungen
Bei
negativen
Sägezahnform,
Zahlen in
wie in
Vorzeichen/Betrags¬
wird auch das Resultat eines Ueberlaufs
m-q
negativ.
r
-m+q
Fig. 15
Ueberlaufcharakteristik bei
stellung
48
Vorzeichen/Betragsdar¬
Zweierkomplement dargestellt sind,
sehen die Verhältnisse auf den ersten Blick komplizierter aus.
Wenn zu der grössten positiven Zahl (= 0.11...11
q)
das Gewicht des leichtesten Bits (= q) addiert wird, ent¬
00
steht die negative Zahl mit dem grössten Betrag (= 1.00
Anderseits, wenn von der negativen Zahl mit dem
grössten Betrag das Gewicht des leichtesten Bits subtrahiert
wird (d.h. die Zahl 1.11...11 addiert wird), wird die grösste
positive Zahl erhalten. Ein Ueberlauf kann hier einen Vor¬
zeichenwechsel erzeugen. Wenn wir diese Ueberlegung weiter
verfolgen, bekommen wir die in Fig. 16 dargestellte Ueber¬
Wenn die Zahlen
hingegen
im
=
—
-
—
=
-
^)
.
.
r
1
i
laufcharakteristik
y
y
m
y
y
/ / / /
X / /
/
0
/
/
a
m
*
~~2
y
y
y
y
y
Fig.
Ueberlaufcharakteristik beim Zweierkomplement
16
Die Ueberlaufcharakteristik hat immer noch die Form eines
dieser befindet sich
Sägezahns,
^
m
m
jetzt
aber zwischen den Wer-
q. Die überlaufene Zahl
der Rest der ursprünglichen Zahl a modulo
ten
nur
-
und
j
-
a=n.m+r
d.h.
stellt sich hier
n
so
aEr
ein,
dass
r
ist immer noch
m
(mod m),
r
den kleinsten Absolut-
wert besitzt.
49
Einerkomplement verhält sich ähnlich wie das Zweierkomple¬
Das
gleichen Gedankengang wie vorhin
wiederholen: Wenn zu der grössten positiven Zahl (0.11...11
-y-q) das Gewicht des LSB addiert wird, entsteht auch hier
die negative Zahl mit dem grössten Betrag (1.00...00
—j +q)
Der Betrag der Differenz zwischen der richtigen und der überge¬
laufenen Zahl beträgt m-q. Das gleiche gilt für die Summe
anderer Zahlenpaare, die eine überlaufende Summe ergeben.
Wenn auch die Summe mehrerer Zahlen betrachtet wird, sieht man,
ment. Wir können hier den
=
=
übergelaufene
dass eine
stellung
a
die
=
richtige
n.(m-q)
Zahl
Zahl
a
r
•
Einerkomplementdar¬
(m-q) ist:
bei der
modulo
+ r
Dieses Resultat wird erhalten sowohl wenn die Ueberläufe in
einem
zu
kurzen Addierwerk entstehen als auch wenn die ge¬
wichtigsten
Beim
Bits der Summe
Einerkomplement
Zahlenbereich,
komplement ist
Das
wird wieder als
—2
ten
Komplemente aller Zahlen im
Symmetrie desselben. Beim Zweier¬
der Zahlenbereich
von
werden.
sind die
wegen der
Komplement
abgeschnitten
—r*
gehört
unsymmetrisch bezüglich
nicht mehr zum Zahlenbereich und
erscheinen. Aus diesem Grund wird
—~
Null.
man
in vielen Fällen als ausserhalb des Zahlenbereichs betrach¬
müssen,
3.1.2
Die
da
es
leicht einen Ueberlauf erzeugen kann.
Eigenschaften
Wir werden hier die
der Restklassen
Eigenschaften
12
der Restklassen
kurz ohne
12 Hier wird eine verallgemeinerte Definition von Restklasse
angewendet, indem die Zahlen (ausser n) rational und nicht
nur ganz sein dürfen.
50
Beweis angeben und auf überlaufene Zahlen anwenden.
Def. Alle Zahlen, die den gleichen Rest modulo m besitzen,
gehören
derselben Restklasse modulo
zu
ursprüngliche
Eine überlaufene Zahl und die
hören
zur
Summe
Es
Theorem
gleichen
m.
Zahl davon ge¬
Restklasse.
gilt folgende wichtige Eigenschaft: [33]
Wenn
a
=
b
(mod m)
und
c
e
d
(mod m)
dann sind auch
a ± c
=
b
±
d
(mod m)
(Addenden oder Zwischensummen)
einen Ueberlauf erlitten haben, ist ihre Summe immer in der
Wenn eine oder mehrere Zahlen
selben Restklasse wie die Summe der richtigen Zahlen.
Das lässt sich auf mehrere Summen ausdehnen, falls das Zahlen¬
format konstant bleibt, so dass auch m überall gleich ist.
folgt: Wenn das richtige Gesamtresultat mehrerer aufeinander¬
folgender Summen im gegebenen Register Platz hat, wird die
Richtigkeit dieser Summe von eventuellen Ueberläufen in den
Teilsummen nicht beeinträchtigt.
Es
Bei einer
Aenderung
Theorem
Wenn
des Moduls
a e
b (mod. m)
a e
b (mod
gilt:
dann ist auch
/ ),
k ganze Zahl.
Wenn 2 Zahlen in der
sie auch in der
gleichen Restklasse modulo m sind, sind
gleichen Restklassen modulo eines Bruchteils
von m.
51
Bew.
a
=
n-m +
b=k*n
m/.k
•
+
b
QED
Daraus
folgt,
Erhaltung
dass die
der Restklasse bei Ueber¬
laufen in fortlaufenden Summen auch
summen
gleiche
nicht das
tats muss
nur
gilt,
die Teil¬
wenn
Format haben: der Modul des Resul¬
dem kleinsten Modul der Teilsumme sein.
gleich
gilt für positive Zahlen und für die ZweierkomplementDarstellung, weil dort die Module verschiedener Wortformate
immer um ganzzahlige Faktoren (nämlich 2er Potenzen) abweichen.
Das
Multiplikation
Digitalfiltern kommen nur Multiplikationen
grössen mit konstanten Koeffizienten vor. Bei
In
lässt sich ein Ueberlauf verhindern,
betrachtet werden muss.
Theorem:
so
Signal¬
den Koeffizienten
dass dieser Fall nicht
Wenn
(mod. m)
e
b
a.c
=
a
n-m +
a
dann ist
Bew.
=
a.c
=
(mod. m.c)
b.c
n
•
b
(m.c)
+
b*c
Der Ueber1aufmodul wird mit dem Faktor
neue
von
Ueberlaufmodul wird
nur
QED
c
multipliziert.
Der
in den seltensten Fällen mit
dem Modul übereinstimmen, der durch das Wortformat des Resul¬
tates gegeben ist (d.h. eine 2er Potenz ist). Nur wenn der
Faktor c eine ganze Zahl
diesem Fall sind
a.c
wegen des vorletzten
52
ist, wird das der Fall
kongruent
Theorems, kongruent
und b.c
modulo
sein: in
cm
modulo c
.
und
—
=
jiuch
m.
anderen Fällen geht die Kongruenzeigenschaft bei
der Multiplikation verloren. Die Multiplikation einer über¬
laufenen Zahl mit einem nicht ganzzahligen Koeffizient liefert
ein Resultat, aus welchem das richtige Resultat nicht mehr
In allen
rekonstruiert werden kann.
Die Ueberlaufe in den Teilsummen können
Schlussfolgerungen:
ignoriert werden. Das Signal muss
plikatoren bei der Skalierung auf
d.h.
es
3.1.3
müssen
nur
nur am
Eingang
der Multi¬
Ueberlauf kontrolliert,
dort Korrekturmassnahmen getroffen werden.
Die Ueberlaufdetektion
wissen, ob bei der Ausführung einer Operation
in Festkommaarithmetik Ueberläufe entstanden sind. Das erlaubt
Es ist
wichtig
zu
einerseits eine falsche Skalierung
seits das Einführen von Massnahmen
laufschwingungen in
Digitalfiltern.
zu
zur
korrigieren,
Verhinderung
Dafür kann
zum
anderer¬
von
Ueber¬
Beispiel
die überlaufene Zahl durch die Zahl ersetzt werden, die am
wenigsten von der richtigen abweicht, d.h. durch die Zahl
mit dem grössten Betrag und mit dem Vorzeichen des richtigen
Resultates. Das
entspricht
Einführung einer Sättigungs¬
der
charakteristik [31]. Es ist in gewissen Fällen sogar möglich,
das richtige Resultat zu rekonstruieren. Das ist vor allem
interessant im Zusammenhang mit einer Gleitkomma- oder einer
Blockgleitkommaarithmetik,
viel
weniger
bei einer reinen
Festkommaarithmetik.
gesehen, dass ein Ueberlauf sich ergibt, wenn bei
einer Operation eine Zahl entsteht, die sich ausserhalb des
im gegebenen Wort darstellbaren Zahlenbereichs befindet. Die
Wir haben
Detektion des Ueberlaufes ist
am
einfachsten beim Abschneiden
53
gewichtigeren Bits eines Wortes: es liegt kein Ueberlauf
vor, wenn die abgeschnittenen Bits die Bedeutung von führen¬
den Nullen besitzen. Das heisst bei den Komplementdarstellungen,
dass alle weggeworfenen Bits gleich dem resultierenden Vor¬
der
zeichenbit sein müssen. Diese Methode lässt sich sehr leicht
bei anderen
Operationen
anwenden: Das Wort
bei der Ope¬
ration so weit erweitert werden, dass das Resultat sicher
darin Platz findet. Am Schluss wird das Resultat durch Ab¬
muss
einigen der gewichtigeren Bits wieder ins ge¬
gebene Wortformat zurückgeführt. Bei der Addition gibt es
aber Methoden, die eine Verlängerung der Wortlänge nicht
erfordern; wir werden sie anschliessend besprechen. Beim
Linksschieben kann obige Detektionsmethode direkt angewendet
werden, da der Test auf Gleichheit von zwei Bits sequentiell
durchgeführt werden kann.
schneiden
von
Die Ueberlaufdetektion bei der Addition
Wir wir im
Kap. 2.2.2 gesehen haben, werden
fast ausschliesslich mit Zahlen in
geführt.
Wir werden im
die Additionen
Komplementdarstellung
folgenden die Betrachtungen für
durch¬
Zahlen im Zweierkomplement durchführen, sie lassen sich
leicht, aber mit etwas Vorsicht, auf das Einerkomplement
erweitern. Das Wortformat sei das in Fig. 13 dargestellte:
q sei das Gewicht des leichtesten Bits (LSB), m das Gewicht
der Vorzeichenstelle. Zur Vereinfachung führen wir noch das
der Vorzeichenstelle ein. Wir nehmen auch an,
dass die Wortlängen der Addenden und des Resultates gleich
Gewicht
v
=
—
seien.
Bei der Summe von zwei Zahlen
-
die
-
das
ergibt sich ein Ueberlauf, wenn
Vorzeichen der Addenden gleich sind und
Vorzeichenbit des Resultates umgekehrt zu den Vor¬
zeichen der Addenden ist.
54
Wenn die Vorzeichen der Addenden verschieden
sind, haben
wir
eine Subtraktion und der Absolutwert des Resultates ist
kleiner als der grössere übsolutwert der beiden Addenden:
es ist kein Ueberlauf möglich. Wenn wir die Ueberlaufscharakteristik von Fig. 15 betrachten, sehen wir, dass, wenn
Resultat nur wenig grösser als die Ueberlaufgrenze ist, das Vorzeichen wechselt.
Die richtige Summe von zwei Zahlen ist aber nie so gross,
dass bei einem Ueberlauf das richtige Vorzeichen wieder er¬
das
richtige
gleich der grosst0.1111...) oder gleich der kleinstmögmöglichen Zahl (v-q
lichen Zahl (-v
1.0000...) im Zweierkomplement sind, be¬
scheinen kann. Wenn nämlich beide Addenden
=
=
kommen wir
1.00...00
0.11...11
+
0.11...11
+
p_.oo. ..00
J..11...11
Der
Uebertrag
aus
1.00...00
der Vorzeichenstelle kann nicht alleine
zur
Ueberlaufdetektion bei der Komplementdarstellung gebraucht
werden. Wenn man nämlich zwei Zahlen mit verschiedenen Vor¬
zeichen zusammenaddiert und die Summe positiv ist, entsteht
auch ein solcher Uebertrag. Eine andere
Regel
zur
Ueberlauf¬
detektion lautet [34]:
Uebertrag in die Vorzeichenstelle verschieden vom
Uebertrag aus der Vorzeichenstelle ist, liegt ein Ueberlauf
vor. Das richtige Vorzeichen ist gleich dem Uebertrag aus der
Wenn der
Vorzeichenstelle.
Bei der Summe
-
-
-
von
drei Zahlen sind
folgende
drei Fälle
möglich
kein Ueberlauf
ein Ueberlauf
zwei Ueberläufe.
55
Zwei Ueberläufe in der selben
Richtung (als Richtung
ist
gemeint), sind nicht möglich.
nämlich alle drei Addenden gleich der grosstmöglieher
0.111... oder gleich der negativen Zahl mit dem gröss¬
das Vorzeichen der Addenden
Wenn
Zahl
ten
Betrag 1.000... sind, dann erhalten
0.111...11
+
1.00...000
0.111...11
1.00...000
+
1.111...10
+
wir
Ueberlauf
0.00...000
0.111...11
1.00...000
+
0.111..101
kein Ueberlauf
1.00...000
Es tritt nur ein Ueberlauf auf. Wenn die drei Addenden be-
tragsmässig kleiner sind,
gleichen Richtung
zwei Ueberläufe in der
zwei Ueberläufe
tung
und
auftreten, haben
kompensieren
möglich,
ist es ebenfalls nicht
sich:
man
zu
erhalten. Wenn
entgegengesetzte Rich¬
erhält die richtige Summe.
sie
Wir behandeln
beim
jetzt die Ueberlaufdetektion und -Korrektur
allgemeinen Fall von mehreren aufeinanderfolgenden Summen,
wobei das Wortformat konstant bleibe. Bei der
Summierung
seien
Ueberläufe in positiver und n_ in negativer Richtung auf¬
getreten. Bei jeder der n positiven Ueberläufe wird die
n
Summe
um m
=
2v
gegenüber
der
richtigen
jeder der n_ negativen Ueberläufe wird
Es folgt, dass sich die richtige Summe
Summe
sie
S
Summe S mit Hilfe der Anzahl Ueberläufe in
negativer Richtung rekonstruieren
S
=
r
Wenn
n
dann
ist,
56
-
n_
S +
=
(n,+
-
0, d.h.
n
-
)
um m
aus
=
bei
2v erhöht.
der überlaufenen
positiver
und in
lässt:
•' m
wenn
wie wir schon
erniedrigt,
kompensieren,
Summe richtig.
sich die Ueberläufe
gesehen haben,
die
Wenn
n
^ 0,
n
-
Vorzeichen
von n
stimmt das
überein.
n_
-
richtige Vorzeichen
ist das Gewicht des ersten
m
(n+
Bit links ausserhalb des Wortes.
Zahl (n
-
angesetzt,
n
)
mit
Beim Addieren von (n
-
-
n_)«m
ist daher die
Summierung verwendeten
links am bei der
Vorzeichen,
mit dem
Wort
Zweierkomplement dargestellt.
im
n_)*m
S muss S mit seinem Vorzeichen
zu
positives Vorzeichen hat,
gleich 00...00, wenn es nega¬
links erweitert werden. Wenn S ein
Erweiterung des
ist die
tiv ist, ist sie
aber
günstiger,
richtige
die
Wortes
11...11. Für die Realisierung ist es
diese Addition vermieden werden kann und
gleich
wenn
Summe
lediglich
durch das Anhängen eines Korrektur-
gefunden werden kann. Man merkt, dass bei negativem S
das gleiche Resultat erhalten wird, wenn S nicht mit einser
erweitert wird, sondern der Wert -m zum Korrekturglied (n+
n_).m
hinzuaddiert wird. Es folgt, dass die richtige Summe Sr er¬
terms
-
halten wird, indem der überlaufenen Summe S die Zahl n+
links angehängt wird, wenn S positiv ist und die Zahl
n
-
-1 wenn S
n_
negativ
-
n_
ist.
obige Resultate auf die Fälle einer und zweier auf¬
einanderfolgender Summen an. Wie wir gesehen haben, können wir
Wir wenden
nur
einen Ueberlauf haben. Beim Ueberlauf können
folgende
Fälle auftreten:
Ueberlauf
+
-
1
01
0....®
00
1
1
11
0
10
1
@
Q
bezeichneten Fälle
bezeichneten Fälle können nur dann auf¬
möglich. Die mit
treten, wenn der Ueberlauf in der ersten der beiden Summen ge¬
schehen ist und wenn das Resultat der zweiten Summe das umge¬
Bei
nur
einer Summe sind
Q>
nur
die mit
kehrte Vorzeichen wie das der ersten Summe hat.
57
Das erste Bit kann
weggelassen werden,
zweiten ist: darum müssen in den Fällen
den Fällen
angehängte
Q)
2 Bits vorne
Bit muss
angehängt
umgekehrt
gleich
wenn es
®
dem
1 Bit und in
werden. Das leichtere
wie das Vorzeichenbit von S
sein und das zweite allenfalls
angehängte
Bit muss
gleich
wie das Vorzeichenbit von S sein [35],
3.2
Die
Skalierung
bei der Festkommaarithmetik
Bei der Festkommaarithmetikhaben wir es mit einem ziemlich
begrenzten
Zahlenbereich zu tun. In vielen Fällen werden die
Zahlen auf den maximalen Wert 1 normiert, so dass der Zahlen¬
bereich vom (offenen) Intervall (-1, +1) gebildet wird (frak-
Zahlen). Die Ueberschreitung dieses Zahlenbereichs
ergibt einen Ueberlauf, der einen schweren Fehler darstellt.
tionäre
Das Auftreten von Ueberläufen muss daher vermieden oder min¬
destens auf ein Minimum reduziert werden. Anderseits ist
man
Signalamplituden interessiert, damit der Zahlen¬
bereich gut ausgenützt wird. Das Quantisierungsrauschen ist
bei der Festkommaarithmetik im wesentlichen unabhängig von
der Signalamplitude: Um ein gutes Signal-zu-Rauschverhältnis
an
grossen
erhalten, muss das Signal möglichst gross sein. Zudem kann
ein Signal verschwinden, wenn seine Amplitude kleiner als
der Quantisierungsschritt wird (underflow)
zu
jT
.
Aus diesen Gründen muss man im Inneren der
im
allgemeinen
kommaarithmetik
in
-
Digitalfilter und
jedem anderen numerischen System mit Fest¬
eine gewisse Menge von (festen) Skalierungs¬
faktoren einführen. Diese müssen
so
werden, dass die Signalamplituden
angeordnet
-
und bemessen
in den einzelnen Teilen des
digitalen
Filters dem bestehenden Zahlenbereich angepasst wer¬
den, ohne dass die anderen Eigenschaften des Systems
insbe¬
sondere seine Uebertragungsfunktion
geändert werden. Diese
-
-
58
brauchen nicht genau
Skalierungsfaktoren
zu
sein: sie müssen
Grössenordnungen anpassen. Aus Einfachkeitsgründen nimmt
man dazu Zweierpotenzen: Somit reduzieren sich die dazu be¬
nötigten Multiplikationen zu einfachen Schiebeoperationen.
nur
Um die
Skalierfaktoren
maximalen
zu
bestimmen,
Signalamplituden
Stellen bestimmen,
Der Ueberlauf kann
wo
-
muss man
zuerst die
im unskalierten Filter
an
den
der Ueberlauf einen Fehler darstellt.
an bestimmten
unter gewissen Bedingungen
-
Stellen erlaubt werden (siehe Kap. 3.1) und zwar:
Ueberläufe an den Eingängen oder in den Zwischenresultaten
einer fortlaufenden Summe sind belanglos, wenn das rich¬
-
tige Resultat der
Summe
(ohne Ueberläufe) sich im Zahlen¬
bereich befindet.
-
Eine überlaufene Zahl darf
mit einem
ganzzahligen
am
Eingang
eines
Multiplikators
Koeffizienten auftreten. Das be¬
trifft insbesondere die
Skaliermultiplikatoren (siehe
Kap. 3.2.3).
-
Natürlich können in reinen
Verzögerungsketten
keine Ueber¬
(wenn man nicht innerhalb der Verzögerungs¬
kette die Wortlänge auf der Seite der gewichtigsten Bits
verkürzt).
läufe entstehen
folgt, dass zur Dimensierung der Skalierung die maximalen
Signalamplituden an den Eingängen der Multiplikatoren mit
nicht-ganzzahligen Koeffizienten bestimmt werden müssen.
Natürlich, wenn mehrere Multiplikatoren direkt an der gleichen
Verzögerungskette angehängt werden (wie z.B. bei den direkten
Formen der Fall ist), kann man sich begnügen, das Signal am
Eingang der ganzen Verzögerungskette zu überwachen.
Es
Wir werden
maximalen
den
uns
zuerst in diesem
Kapitel
Signalamplituden befassen,
allgemeinen Fall,
mit der Bestimmung der
im Abschnitt 3.2.1 für
im Abschnitt 3.2.2 für
gewisse spezifi-
59
Eingangssignale. Nachher werden wir im Abschnitt 3.2.3
sehen, wie man die Skalierung praktisch durchführen kann und
sehe
im ikbschnitt 3.2.4 mit den dabei auftretenden Fehler auseinan¬
dersetzen.
3.2.1 Maximale Signalamplitude für
beliebige Eingangssignale
Die maximale
Signalamplitude an den einzelnen Punkten im
Inneren eines digitalen Filters hängt offenbar vom ange¬
legten Eingangssignal ab. Die Amplitude des Eingangssignals
ist beschränkt, da auch der Zahlenbereich am Eingang be¬
schränkt ist. Man sieht sofort ein, dass die grössten Signal¬
amplituden im Inneren eines Filters bei der grössten Eingangs¬
amplitude erreicht wird.
Amplitude der Antwort eines
linearen Systems auf ein beliebiges Eingangssignal mit be¬
schränkter Amplitude. Bei einem linearen abgetasteten System
ist das Ausgangssignal
yk mit dem Eingangssignal x, durch die
Faltungssumme verbunden:
Es existiert ein Grenzwert für die
XI Wi
yk
i=0
hi
die Impulsantwort des Systems ist. Für die maximale
Amplitude von y, findet man unter Anwendung der Dreiecksunglei¬
chung den Absolutwert:
wobei
k
I*!
lXlmax ist
E>i-xk-i sE|hi! •¦xk-ii*ix*«xljhii
1=0
die maximal
i=0
i=0
mögliche Amplitude des Eingangssignals
Sie ist gleich der Grenze des Zahlenbereichs, d.h. bei den
üblichen fraktionären Zahlen 1-q.
60
Es
daher in diesem Fall:
folgt
k
k
|ykl
<
max
i=Q
i=0
beliebiges
Für
7~ lh±l y~\h±\
d-q)
*
k hat
man
[ 36]
13
oo
lyl
1 * ' max
<
y~|h.|
/
'
i '
1=0
Gleichheitszeichen in obiger Formel gilt genau dann,
Das
wenn
die Eingangssequenz
x.
i
ist,
die
=
I' xl'
•
max
sign(h.k-i )
^
.
Eingangsfolge das gleiche Vorzeichen
umgekehrte Impulsantwort besitzt (vgl. den Fall des
d.h. wenn die
"matched filter").
Wir wollen
nun
wie
CO
die Reihenentwicklung
\
i=0
|hi|
untersuchen.
Zuerst stellt sich die Frage, ob diese Reihe überhaupt
konvergiert. Wir werden sehen, dass sie es bei stabilen Fil¬
tern stets tut. Als zweites wollen wir die
besprechen.
Konvergenzfrage
Berechnung
dieser
Reihe
Zur
kann man feststellen:
konvergiert die Reihe
j> | h. |
1=0
13
wenn
Definitionsgemäss
die Reihe
00
£ h.^
absolut
1=0
als Eingangssignal die Abschnittfehler, die an
einer bestimmten Abschnittstelle entstehen, und als Impuls¬
antwort die des Teilfilters von der Abschnittsteile zum
Filterausgang nimmt, bekommt man eine Schranke für die
Abschnittfehler am Ausgang, insbesondere eine obere Schranke
für die Amplitude der vom Abschnitt verursachten Schwingungen
im ruhenden Filter [37,38,39,40,94]. Diese Schranke ist aber
in den meisten Fällen zu weit von den tatsächlich erhaltenen
Werten entfernt.
Wenn
man
61
konvergiert.
Wenn
jetzt
die Reihe
£
h. absolut
konvergiert,
i=0
sagt
uns
Theorem
folgendes
Theorem:
Bei einem
digitalen Filter,
dessen
Uebertragungs¬
funktion H(z) eine rationale Funktion in z ist,
00
konvergiert die Reihe l h(i) der Abtastwerte der
i=0
absolut
Impulsantwort h(i)
(gegen den Endwert der
Schrittantwort)dann und nur dann, wenn das Filter
stabil ist, d.h. wenn seine Pole innerhalb des Ein¬
heitskreises in der z-Ebene
Beweis
a)
liegen.
Bedingung ist hinreichend. Durch eine Partialbruchzerlegung der Uebertragungsfunktion H(z)
Die
bekommt man
n
H(Z)
=
Q(Z)
+
m
y~~
y~~
j=0
k=0
Der Term
Q(z)
ist ein
Polynom
Division des Zählers von
A*v
(z
p.)
in z: Es ist der Quotient der
H(z) durch den
entsprechende Impulsantwort
-
ist
Nenner von
zeitbegrenzt:
H(z).
Die
Die Summe aller
seiner Abtastwerte ist eine endliche Reihe.
Die anderen Terme entstehen durch die Partialbruchzerlegung
des Restes der Division, n ist dabei die Anzahl der Pole.
P
m. ist die Mehrfachkeit des Pols p.. Die Impulsantwort jedes
einzelnen Terms lässt sich mit Hilfe des Umkehrintegrals
berechnen:
62
jk (i)
h.,
^jk
<>
T
=
zi.=i
A.,
z1"1
(z-pj)
dz
-k-l
(k-1) '.
dz
,
3k
(k-l)1
(Als
-—
ist der
dx
(z
_
Die
/
z=P.
zu
k-l
konvergieren
,k-l
dp
W=T
i-l
Pi
verstehen.)
konvergiert absolut,falls
^T
1=0 dP
cj
.
z=p.
i-1
Xl
(k-l)1
Identitätsoperator
a
z
J
z=P.
)
k-l
,k-l ii_£ d,k-li-l
p.
3
Reihen V^
.k
(z-p )
(z-Pj)
i-1
(z-Pj)
k-l, i-l>
dz
i-1
£ p.~
Die Reihe
Jk
Res
JJL
k-l
d
=
z
auch
|p.|
<
1
absolut, falls
•
|p.|
<
1, da sie Ableitungen
Potenzreihen sind.
Es
folgt,
dass die Reihe
von
absolut
konvergierenden
00
J
h(i) absolut konvergiert,
da
i=0
sie sich als Summe absolut
konvergierender
Reihen darstellen
lässt.
63
b) Die Bedingung ist notwendig.
Definitionsgemäss ist ein lineares System stabil, wenn
für jeden beschränkten Eingang der Ausgang immer beschränkt
bleibt. Falls das System instabil ist, existieren beschränkte
Eingangssignale x, , bei welchen die Amplitude des Ausganges
y, mit der Zeit unbeschränkt wächst. In diesen Fällen muss
auch die obere Schranke der Amplitude
W
*
|x|max
l
i=0
lhJ
mit der Zeit k auch unbeschränkt wachsen.
instabilen Filtern die Reihe
00
nicht
I |h.|
X
1=0
Deswegen kann bei
konvergieren.
QED
00
Die Reihe der Absolutwerte der
£ |h(i)|
Impulsantwort
i=0
konvergiert
ist. Die
daher immer
wenn
das
Auswertung dieser Reihe
Filtern sehr leicht
eine endliche
entsprechende
Filter stabil
ist bei den nichtrekursiven
durchzuführen,
da deren
Impulsantwort
Länge
besitzt. Bei transversalen Filtern (nichtrekursive Filter direkter Form) ist die obere Schranke des
Ausganges einfach die
[42].
Summe der Absolutwerte der Koeffizienten
Die rekursiven Filter haben
dagegen
lange Im¬
pulsantwort. Die Reihe der Absolutwerte der Impulsantwort
kann langsam konvergieren, wenn die Impulsantwort langsam
abklingt. Die Konvergenz dieser Reihe ist jedenfalls langsamer
eine unendlich
£
Es ist ferner bei den rekursiven Filtern im
möglich,
h. gegen ihren
1=0
Endwert.
allgemeinen
nicht
00
den Ausdruck
£ |h.|
i=0
64
00
als die Konvergenz der Schrittantwort
geschlossen
zu
berechnen. Es ist
obigen Ausdruck
eine obere Schranke für
möglich,
aber immer
finden.
zu
Wir werden
einige einfache Beispiele untersuchen,
nun
00
£ |h |
zuerst auf Fälle führen, wo die Reihe
uns
die
geschlos¬
summierbar ist, dann aber einen Fall,
die Reihe nicht mehr geschlossen summierbar ist.
sen
wo
Filter 1.
Ordnung
Ein Filter 1.
H(z)
Seine
Ordnung
=
z
+ a
z
+
Impulsantwort
hj1
besitzt die
b
ist
(a-b).
=
Uebertragungsfunktion
]
-,
(-b)1"1
für i
>
0
für i
=
0
_..
i
und die Summe der Reihe der Absolutwerte der Abtastwerte
der
Impulsantwort
l
1=0 lhil
"
1
1+JiJTl7
|b|
1
-
00
Bei Filtern 1.
geschlossen
Filter 2.
Ordnung
lässt sich also die Reihe
£ |h.]
i=0
aufsummieren.
Ordnung
00
Schon hier lässt sich die Reihe
nicht immer
geschlossen
i=0
summieren.
Wir betrachten zuerst den
£ |h.|
Fall,
durch den einfachen Ausdruck
wo
die
gegeben
Uebertragungsfunktion
ist
65
z
H(z)
=
2
-=
+
z
b;.z
b
+
Wenn die Pole p. und p_ verschieden
hi
u
-
1
i+1
^r-fq (Pi
,
+
^
sind, ist
i+1,'
beide Pole reell sind, dann hat
der Filterantwort [39]
|h |
Falls ein
h±
so
=
IM
l-
doppelter
(i+1)
(b2)
+
b2
Pol vorhanden ist
2
(b.
4b_) dann gilt
=
V2
dass [39]
=
i=0
ihii
=
—h=rr
/bj)2
(1
Wenn beide Pole
Impulsantwort
h.l
.
=
r
i
-
(konjugiert) komplex sind,
die Form
an:
sin(i+l)y
r
—
sin/
mit
,
r
66
als Maximalwert
man
±
=
i=0
Impulsantwort
p2
Wenn
I
die
=
+/bZ,
*f=
arcos
1
2
m
¦
dann nimmt die
Von der Reihe
°°
l
r1
•
|sin(i+l)fj
i=0
geschlossene Summe bekannt (siehe [41] ) Man kann
aber durch Majorisierung obiger Reihe, z.B. durch die
r. eine obere Schranke für die maximal mögliche
Reihe T
i
ist keine
.
00
i=0
.
Antwort
in
der
«
angeben (siehe [39,94]). Solche obere Schranken führen
Regel zu ungünstigen Skalierungsfaktoren und sind daher
uninteressant.
Filter höherer Ordnung
Berechnungen werden im allgemeinen sehr kompliziert (es
sind jeweils beim Zerlegen der Absolutwerte viele verschie¬
dene Fälle zu unterscheiden). Zudem hat man in der Regel
konjugiert komplexe Pole, so dass keine geschlossenen Aus¬
Die
gefunden werden können und nur
gegeben werden können (siehe oben bei
Es empfiehlt sich also zur Bestimmung
drücke
eine numerische
Summierung
obere Schranken an¬
den Filtern 2.
der maximalen
Ordnung).
Amplituden
der Reihen
l |h±|.
1=0
3.2.2 Maximale
Signalamplituden
Die oben berechneten
allgemeinen
für
spezifische Eingangssignale
Grenzen für die maximale
Signal¬
sind normalerweise allzu stark auf der sicheren Seite,
für die Skalierung wirklich brauchbar zu sein. Es entsteht
amplitude
um
67
"pessimistische" Skalierung, die nur eine
schlechte Ausnützung des Zahlenbereiches gestattet und damit
ein schlechtes Signal-zu-Rauschverhältnis ergibt. Wenn nun
die Art der auftretenden Eingangssignale bekannt ist, dann
ist man deshalb eher geneigt, die Skalierung für die effektiv
auftretenden Signale vorzunehmen. Diese wird um so günstiger,
je einschränkender man die Klasse der möglichen Eingangssignale
angeben kann.
Wenn am Eingang nur reine Sinussignale mit einigen möglichen
nämlich eine
Frequenzen
zu
f
auftreten können, dann ist offenbar die maximale
Signalamplitude im stationären Zustand durch die grösste
Amplitudenantwort gegeben
|H(f) |
max
f.1
Frequenzen möglich sind,
Wenn alle
Maximum des
Amplitudenganges
max
(wobei f
fs
die
|h|
dann ist sie durch das
bestimmt [ 15]
||h||
=
Abtastfrequenz ist).
Berechnungen haben gezeigt, dass bei stark selektiven
obiger Wert die gleiche Grössenordnung wie die im Ab¬
3.2.1 beschriebene Grenze für beliebige Signale besitzt.
Numerische
Filtern
schnitt
Wir betrachten
jetzt
den Fall, wo wir am Eingang ein weisses
Gauss'sches Rauschen haben. Ein solches Signal hat theoretisch
eine unendlich grosse maximale
Amplitude:
Ueberläufe sind hier
unvermeidbar. Man hat daher in der Praxis immer mit
gauss'sehen Signalen
begrenzten
Wahrscheinlichkeit, dass ein
mittelwertsfreies gauss'sches Signal der Streuung a überläuft,
ist:
68
zu
tun. Die
P
{IXI
Xmax}
>
X
=
/
2
"
max
exP{-
2
%)dx
gauss'sches Rauschsignal behält bekanntlich seine
gauss'sche Amplitudenverteilung, wenn es durch ein lineares
System hindurchgeht. Ein nicht-gauss'sches stochastisches
Ein
unabhängigen Abtastwerten hat die Tendenz eine
gauss'sche Verteilung zu erhalten, wenn es durch ein lineares
System hindurchgeht (wegen des zentralen Grenzwerttheorems).
Der Spitzenwert wird gegenüber dem Effektivwert oder der
Streuung sehr gross. Man wird daher Ueberläufe, die selten
auftreten, dulden. 14
Signal
mit
haben will, dann
auch ein konstantes Verhältnis zwischen Ueberlauf-
Ueberlaufhäufigkeit
Wenn man eine konstante
wird
man
grenze
und Effektivwert o fordern. Die
x
max
dann nach den Effektivwerten des
für die Maximalwerte nimmt
X
y
Jmax
=
max
o
.
X
q
=
y
J
y
Jmax
o
X
man
g
x
Signals ausgeführt,
d.h.
den Ausdruck [15]
1
.
Skalierung wird
/|H(fT)|
2
-,1
d(fT)
2
=
IIH
x
max "
Skalierung gebrauchte Ueberlaufgrenze ist somit
das Produkt der Ueberlaufgrenze am Eingang (meistens gleich
1 genommen) und des quadratischen Mittelwertes des Amplituden¬
ganges. Für die Ableitung dieses Ausdruckes sei auf Kap. 5.
Die für die
verwiesen.
14
In dem
unbedingt
Fall,
wo man
seltene Ueberläufe
duldet,
muss man
eine stabile Ueberlaufcharakteristik verwenden
sonst ein Ueberlauf Schwin¬
die
nicht
mehr
abklingen, auslösen könnte.
gungen,
(z.B. eine Sättigung [31]), da
69
farbiges gauss'sches Rauschen
Einqan9 steht, dann hat man
Wenn ein
Sxx
am
mit der
-r
/
y max
J
=
x
S
xx
(fT)
|H(fT)|2 d(fT)
Leistungsdichte
1
2
max
/S
(fT) d(fT)
spezifischen Eingangssignalen empfiehlt
maximalen Amplituden durch eine Simulation des
In anderen Fällen von
es
sich, die
unskalierten Filters mit Gleitkommaarithmetik auf einem Gross¬
oder Kleinrechner
zu
3.2.3
Durchführung
Praktische
ermitteln.
der Skalierung
gesehen haben, wird mit der Skalierung eine möglichst
gute Ausnützung des beschränkten Wertebereichs der Festkomma¬
zahlen angestrebt mit der Randbedingung, dass keine überlaufene
Zahlen bei den Multiplikatoreingängen ankommen und dass die
Filterantwort nicht verändert wird. Dazu wird man die Signal¬
grössen an den kritischen Stellen (Multiplikatoreingängen)
Wie wir
auf ihren maximalen Wert
normieren, d.h.
die unskalierten
Grössen mit den Inversen ihres maximalen Wertes
ren.
Nach der
grössen
durch
werden aber
multiplizie¬
Prinzip die Signal¬
Multiplikation sollte man im
den vorhergehenden Skalenfaktor
sehen, dass
wir in der Praxis anders
vorgehen
wer¬
digitalen Filter belie¬
bige Bereiche definieren, wo der Signalpegel verschieden von
jenem seiner Umgebung ist. Man muss nur alle Signale an den
Eingängen eines Bereiches mit einer Konstanten multiplizieren
den. Im
und alle
allgemeinen
dividieren. Wir
Ausgänge
digitales
70
kann
man
in einem
durch dieselbe Konstante dividieren. Ein
Filter ist ein lineares
System
und seine
Teilsysteme
sind auch linear: es
Wenn
der
man
gilt daher das Superpositionsprinzip.
alle Eingänge x,.. eines solchen Teilsystems mit
gleichen
den Ausgang
Wenn wir
c
y,k«
(c'x(l)'
y(k)
nun
multipliziert,
Teilsystems
Konstanten
des
••'/
c
C'x(i)'
alle diese
•••>*
Ausgänge
dividieren, dann erhält
man
dann
gilt
(x(l)'
c*y(k)
für
*•"
je¬
x(i)"--)
gleiche Konstante
Ausgangssignale wie
durch die
dieselben
früher (d.h. wie ohne den Faktor c): Das System "merkt" nichts
von der Skalierung.
folgt insbesondere die Bedingung, dass das Produkt
der Skalierfaktoren, die man auf einer geschlossenen Schleife
(insbesondere auf einer Rückkopplungsschleife) einführt,
Daraus
gleich
Die
1 sein muss.
Multiplikatoren
mit den Skalenfaktoren
(d.h. mit der
inversen des maximalen Wertes) können von den Multiplikator¬
eingängen entgegen der Signalflussrichtung und die mit den
inversen Skalenfaktoren von den Multiplikatorausgängen in
die
Signalflussrichtung verschoben werden, bis sich die Ska¬
liermultiplikatoren benachbarter Gebiete treffen. Zwei auf¬
einanderfolgende Skaliermultiplikatoren werden dann zu einem
einzigen verschmolzen.
Es entstehen so Bereiche konstanter
Skalenfaktor. An der Grenze zwischen zwei solchen Bereichen
befinden sich die Skaliermultiplikatoren, dessen Koeffizient
(Skalierfaktor) gleich dem Verhältnis der Skalenfaktoren (in¬
versen
vor
Amplituden) des Bereichs
betrachteten Skaliermultiplikator
maximalen
dem
faktor zwischen zwei Bereichen wenig
nach und des Bereichs
ist. Wenn der Skalier¬
abweicht, werden die
zwei Bereiche zu einem einzigen verschmolzen, dessen Skalen¬
faktor gleich dem kleinsten Skalenfaktor ist (d.h. als maxi¬
male Amplitude wird die grösste maximale Amplitude genommen).
von
1
71
Die Skalierfaktoren brauchen nicht genau zu sein: sie müssen
lediglich Grössenordnungen
am
anpassen. Deswegen werden dazu
vorteilhaftesten Zweierpotenzen gewählt: damit verein¬
Multiplikationen zu Schiebeoperationen. Die
maximalen Amplituden werden zu der nächstgrösseren Zweier¬
potenz aufgerundet.
Diese rechnerische Ermittlung geschieht am einfachsten mit
fachen sich die
normalisierten Gleitkommazahlen, indem man den binären Expo¬
nenten der maximalen Amplituden nimmt. In diesem Fall erfüllt
ja
die Mantisse
m
die
Bedingung
i-N-l-q.
(q
ist der
Quantisierungsschritt
der Mantisse)
Skalierung werden die Signalgrössen um die Differenz
der Exponenten der maximalen Amplituden in den Bereichen vor
Bei der
Skaliermultiplikator geschoben.
Die für die Skalierung günstigste Anordnung ist die, bei
welcher die Bereiche so klein sind, dass die grössten Expo¬
nenten an den Eingängen der Multiplikatoren gleich gross
sind und wo die Skaliermultiplikatoren direkt an die Aus¬
gänge der Multiplikatoren geschaltet sind. Wenn nämlich eine
Zahl am Eingang eines Multiplikators keinen Ueberlauf auf¬
weist, dann hat auch das (komplette) Resultat der Multipli¬
kation, das am Eingang des Skaliermultiplikators steht, keinen
und nach dem
Ueberlauf. In vielen Fällen werden aber (um die Hardware zu
vereinfachen) die Skaliermultiplikatoren nicht direkt an die
Ausgänge der einzelnen Multiplikatoren angeschlossen. Zum
Beispiel genügt bei der Kaskadenform meistens je ein Skalier¬
multiplikator zwischen zwei aufeinanderfolgenden Teilfiltern
mit zwei zusätzlichen Skaliermultiplikatoren am Eingang und
am
72
Ausgang des gesamten
Filter.
Hier muss auch ein
allfälliger Ueberlauf
Skaliermultiplikators berücksichtigt
am
Eingang
werden. Es
gibt
des
zwei
Fälle:
a) Der Skalierfaktor ist
=
1 und daher eine ganze Zahl
(Zweierpotenz mit positivem Exponent). Hier muss man
nicht auf Ueberlauf am Eingang des Skaliermultiplika¬
tors testen.
b)
Skalierfaktor ist kleiner als 1 (d.h. eine Zweier¬
potenz mit negativem Exponent). Hier muss man seinen Ein¬
Der
gang auf Ueberlauf testen und allenfalls den Exponenten
des ganzen Bereichs korrigieren. Dieser Fall tritt auf,
falls der Exponent des nachfolgenden Bereichs grösser
ist als
derjenige
des betrachteten.
73
3.2.4
Abschnittfehler und Unterlauf
Wenn der Skalierfaktor nicht
ganzzahlig ist,
können Abschnitt¬
fehler bei der
Bei der üblichen Wahl
der
ist das der
Skalierung entstehen.
Skalierfaktoren als Zweierpotenz
der Faktor kleiner als 1 (d.h. sein Exponent
so dass die Zahl nach rechts geschoben wird,
die
Wortlänge
werde
um
mindestens den
Fall,
wenn
negativ) ist,
denn,
Betrag des Exponenten
es
sei
erweitert. Diese Abschnittfehler sind gleich wie die bei
den anderen Multiplikationen und werden im Kap. 5 behandelt.
Je kleiner der Skalierfaktor
werden die
Verzerrungen
des
gemacht wird, desto grösser
Signals. Bei zu kleinen Skalier¬
faktoren kann das Signal vollständig verschwinden: Es tritt
Unterlauf auf. Man spricht von Unterlauf, wenn der Zahlen¬
bereich, in dem die Werte des Signals sich befinden, so klein
wird, dass
keine Schwelle der
Quantisierungscharakteristik
enthält. Somit erscheint ein nichtkonstantes Eingangssignal
nach der Abschnittoperation am Ausgang als konstant, meistens
gleich Null. Bei Unterlauf geht die Information über das
Signal verloren.
Bei der
er
Skalierung
entsteht ein
Wert rechts aus dem verwendeten
Unterlauf, wenn der maximale
Wort herausgeschoben wird. Es
folgt daraus,
dass ein Skalierfaktor natürlich nie kleiner
als 2
sein darf, wo n die totale Anzahl Bits des vorgesehenen
Datenwortes ist.
Wenn der
ist als
Skalierungsfaktor nur um wenige Zweierpotenzen grösser
die Unterlaufgrenze, muss man mit grossen Verzerrungen
des Signals rechnen.
74
4. DIE QUANTISIERUNG DER KOEFFIZIENTEN
Da
digitalen Filters durch Zahlen
beschränkten Wortlänge dargestellt werden, können
die Koeffizienten eines
mit einer
eine endliche Anzahl von Werten annehmen. Deswegen
werden aich die Pole und die Nullstellen nur eine endliche
Anzahl von Lagen in der z-Ebene haben können und es existiert
sie
nur
deshalb nur eine endliche Anzahl
funktiorien.
Bei der
Synthese
von
von
Digitalfiltern
möglichen Uebertragungs-
wird meistens vorausge¬
setzt, dass die Filterkoeffizienten ein Kontinuum bilden:
Die Synthese wird mit einer grossen Stellenzahl durchgeführt.
Die
synthetisierten
Koeffizienten werden daher
nur
in den
Quantisierungsraster
der
späteren
seltensten Fällen auf dem
Realisation fallen. Die Beschränkung der Koeffizienten in
ihrer Wortlänge bewirkt eine Aenderung der Koeffizienten;
die Uebertragungsfunktion wird daher von der synthetisierten
abweichen. Diese Abweichung hängt von der Aenderung der Koef¬
der Wortlänge und der Rundungs¬
der Uebertragungsfunktion und der Realisie¬
fizienten (die seinerseits
abhängt), von
rungsform des Filters
In ungünstigen Fällen
art
von
ab.
kann dabei ein Pol ausserhalb des Ein¬
heitskreises verschoben werden: Ein stabiles Filter wird dabei
instabil.
Ganzzahlige
Koeffizienten erfahren keine Aenderung: Sie be¬
finden sich schon auf dem Quantisierungsraster.
Diese
Abweichung der Uebertragungsfunktion
vom
gewünschten
Verlauf ist ein unerwünschter Effekt. Man wird daher danach
streben, dass möglichst nur kleine relative Abweichungen auf¬
treten.
75
4.1
Empfindlichkeit
Die
der
Uebertragungsfunktion gegenüber
Variationen ihrer Parameter
Wir werden hier die verschiedenen
Empfindlichkeiten
und ihre
Eigenschaften
Wenn die
Uebertragungsfunktion G(z)
definieren
anhand der Literatur kurz beschreiben.
Parametern
von n
d
l,2,...,n) (z.B. Filterkoeffizienten oder Pole
Nullstellen) abhängig ist
Pi
=
G(z)
die
je
=
G(z;
Px,...,pif...,pn)
eine kleine Variation 6p. erfahren, dann wird die Ueber¬
tragungsfunktion
G
(z)
=
"
zu
G(z)
+
6G(z)
r(7\
G(Z)
+
3G(z)
dass
6G(z)
=
1?7 ÖP1
Die Glieder höherer
so
.
+
Ordnung
+
'••
können
3G(z)
~i?7
6pn
+
.
,
••'
vernachlässigt werden,
folgt
*
dG(z)
||3p1
=
6p.
cl
+
...
+
dp±
¦—-
6p.
ri
+
...
+
|^9pn
Die Variation
6G(z) kann durch das totale Differential
G(z) bezüglich seiner Parametern approximiert werden.
Glied 3G
j—pi
Ueblicherweise
pi.
76
_
6p
*n
.
von
Das
stellt die absolute Empfindlichkeit der Uebertra-
gungsfunktion G(z) gegenüber
G
S
und
3G
G
3p±
Pi
[43, 44, 45]
_
3G
3p±
.
pi
G
den i-ten Parametern dar.
werden die relative Empfindlichkeit
Un G
3lnpi
Empfindlichkeiten de¬
einerseits die Empfindlichkeit der Uebertragungs¬
gegenüber relativen Aenderungen eines Parameters
Typen
sowie zwei
finiert:
funktion
G
9G
=
P±
semi-relativen
von
3G
_
9 In
3P±
"Pi
P±
Empfindlichkeit der Uebertragungs¬
gegenüber absoluten Aenderungen eines Parameters
und anderseits die relative
funktion
_3G
G
QP±
G
=
3 In G
9Pi
_
*P±
Wenn die Filterkoeffizienten mit Festkommazahlen
sind,
ist ihr
Quantisierungsschritt unabhängig
dargestellt
von
ihrer
Grösse: in diesem Fall ist die Verwendung einer Empfindlich¬
keit gegenüber absoluten Aenderungen der Koeffizienten zu
empfehlen.
Darstellung mit Gleitkommazahlen sind
Empfindlichkeiten gegenüber relativen Aenderungen
Bei ihrer
hingegen die
der Koeffizienten
am
geeignetsten.
jetzt kurz einige interessante Eigenschaften
Empfindlichkeiten besprechen. [44, 45]
Wir werden
G(z)
Wenn man
G(z)
=
mit
|G|
•
Betrag
und Phase darstellt
ej*G
|G|
=
solcher
eJJB
dann erhält man, da
3G_
3p±
SlGp.
*!
=
=
eJB ÜGl
3p±
6
lGl
S^p.
*1
+
j
B
+
SBBp.
*1
j,G|_3B
D|t,|3p±
=
S
lGl
p.
*1
+
j
.
Q0Bp.
*1
77
Uebertragungsmass
Wenn man das
r
In G
=
=
]g|
ln
+
34.G
=
braucht
A +
jB
dann gilt
sG
Pi
31n G
31n p.
ri
=*
9A
31n
'
p±
3B
3 3in
p.
-
oA
Q
Pi
•
+ 1
^
«B
Q
gp±
und auch
<-
j
3B
3P,
Der Realteil der relativen
Empfindlichkeit der Uebertragungs¬
gleich der relativen Empfindlichkeit der Ampli¬
tude. Sie ist zugleich die semirelative Empfindlichkeit der
Dämpfung, falls diese in Neper ausgedrückt wird. Wenn die
Dämpfung in dB gegeben ist, müssen die beiden erst genannten
Empfindlichkeiten mit dem Faktor 20/ln 10 multipliziert werden,
Der Imaginärteil der relativen Empfindlichkeit der
Uebertra¬
gungsfunktion ist gleich der semirelativen Empfindlichkeit
funktion ist
der Phase.
Wenn die Parameter
von
Polen und
P*i
dann
3Pi
Nullstellen):
Jt^ii
•
aus
_
<•
78
komplexe Grössen
P
*ri + TP..
=
folgt
9G
p±
1
[57]:
2
3G
3pri
j
2
Pri
z
2
3G
3Pii
p
.
.
sind (wie z.B. im Fall
ln[G(z)] ist, abgesehen von den Polen und den
Nullstellen von G(z), analytisch. Daher müssen die CauchyRiemann'sche Gleichungen erfüllt sein. Aus den CauchyRiemann'sehen Gleichungen für die Polardarstellung der
Funktion [57] folgt
Die Funktion
0.|G|
P
3B_
=
3P•
rn
*ri
•
•
3B
-
Q.|G|
p..
rn
3prri
.
Wenn man auch für den
lung
komplexen
Parameter p.
die Polardarstel¬
braucht
p.
ci
r
=
.
1
'eJ
dann erhält man aus
SGp.
_L
.
i
[57]
sG
-
*i
r.
r.
ii
^1
11
j
S?$.
l
1
Anwendung der Cauchy-Riemann'sehen Gleichungen
Polardarstellung von G und von p. [57] ergibt
SIG|
_
Die
i
$.
l
3B
30.l
r.
q;|g|
bei der
-
-
qb
r.
i
79
4.2
Die
Eine indirekte
Betrachtung
Uebertragungsfunktion
der
Empfindlichkeit
eines Filters kann immer in Funktion
ihrer Pole und ihrer Nullstellen ausgedrückt werden. Die Pole
und die Nullstellen sind ihrerseits Funktionen der Filter¬
koeffizienten. Wegen der Kettenregel der
ist die
Differentialrechnung
Empfindlichkeit gegenüber Aenderungen eines Koeffi¬
zienten gleich der Summe der Produkte der Empfindlichkeiten
gegenüber Aenderungen der Pole und der Nullstellen mal der
Empfindlichkeiten der Pole und Nullstellen gegenüber der
Aenderungen des gegebenen Koeffizienten. Dieser Umweg ist
nicht günstig für eine Berechnung der Empfindlichkeit. Beide
Teilresultate sind aber recht übersichtlich und gestatten
das Aufstellen einfacher Regeln.
Wir werden im
nacheinander
folgenden die
besprechen.
beiden erwähnten
Empfindlichkeiten
4.2.1 Empfindlichkeit der Uebertragungsfunktion auf Aenderungen
der Pole und der Nullstellen
Wir wollen hier die
und der daraus
Empfindlichkeit
der
Uebertragungsfunktion
abgeleiteten Funktionen (Amplitudengang, Grup¬
penlauf zeitgang) untersuchen.
Ein digitales Filter n-ter Ordnung, gegeben
Nullstellen
z
=
und seine
z
=
zQi
80
=
1,
i
=
1,
...
,
n
...
,
n
Pole
n
zpi
besitzt die
i
Uebertragungsfunktion
durch seine
n
n
G(z)
z
-
H
aQ
=
z
z
1=1
,
.
z
-
.
Ol
Empfindlichkeit
Die absolute
.
pi
von
G(z) bezüglich der i-ten
Nullstelle ist daher
3G
—-=—
=
G(z)'—
-
wenn z
—
3z.
z
Ol
z
-
,
f
z
f-
z
.
Ol
.
Ol
und bezüglich des i-ten Poles
G(z)
3G
3z
z
.
pi
z
-
z
=
¦
Ol
3G/G
'
-
3z
pi
Empfindlichkeiten
Die semi-relative
„,G
Q'
wenn z
.
1
=
z
.
oi
-
z
sind daher
nlG
Q'
und
,
—
.
pi
z
.
oi
.
pi
z
-
z
pi
Empfindlichkeiten gegenüber Aenderungen
oder eines Pols sind umgekehrt proportional
Die semi-relativen
einer Nullstelle
dem Abstand
von
z
zum
betrachteten Pol oder Nullstelle.
Betrag der semi-relativen Empfindlichkeit des
Frequenzganges G(eJ ) beträgt
Der maximale
3G/G
3z.l
Er ist
1
max
~\zi
umgekehrt proportional
oder des Pols
z.
i
vom
zum
Abstand der Nullstelle
Einheitskreis.
81
4.2.1.1 Empfindlichkeit des Amplitudengangs auf
der Pole und Nullstellen
Wenn die Nullstellen
Phase
dargestellt
z
=
.
01
dann ist der
r
.
01
G(ejq)
mit
<t>
a
=
z
zpi
;
z
'
mit Betraq3 und
.
px
Pi
rpi «P^n-i
r
=
e
Amplitudengang
i i
-±^*
=
1
und die Pole
-e^oi
n
,
01
werden
n
i<t
z
o
|z-zoi1.I
n
a
=
n
n Iz-Z
I
pi'
i=l
1
-
1
"
n
o
1=1
,
2rQ1.cos(<)>-<J)
.)
Q1
+
r
2rniC°S(^"*r,i)
pi
Tpi
+
r
'
üjT
=
Durch Differenzieren erhält man die relativen
keiten des
Amplitudengangs [46]:
%\r\
/r
o I Gl /G
3r
_
.
.
oi
oi
0,|G|
r
3r
pi
*«*t
Ol
1 z
r
_
3*$
°*pi
z
.
bzw.
i
1
z
^
z
-
z
-
z
-
r
-
,2
Empfindlich¬
oi_
.
oi'
.
rpi
-
,2
pi>
.
|2
.
Ol
)
Ol '
.
rpl sin(d>-^pi)
_
•
,
z
sin (<J>-<|>
oi
i
1 z
3|G|/G
_
oi
82
pi
9* Ol
.
±
,
.
3|G|/G
_
< **>—4>^oi.. )
cos(^-^pi)
_
•
0.|G|
?
z
1
3|G|/G
_
.
Q ,|G|
cos
_
,
\r\
qiI^I
r
wenn
Aenderungen
z
.,
z
-
z
,
pi'
2
.
wobei hier
z
=
eD*
ist,
2
oi
.
ö~
pi
Gleichungen
graphisch interpretieren.
Die einzelnen Glieder dieser
Fig. 17
z=e
r
.
sin
lassen sich nach
T
(<j>-<|>i
-r,
co
Pol oder Nullstelle
eine Nullstelle:
Q'• '=
Falls z.
ein Pol:
q'I
Fig.
Graphische Darstellung
Falls
z.
1
1
17
tude auf
Aenderungen
-sina
;
I= sina
der
Q''
'= sinß
Q1I
'= -sin$
der
Empfindlichkeit
Ampli¬
eines Pols oder einer Nullstelle
Die semi-relativen
der Pole und der Null¬
stellen
durch ihr Vorzeichen.
Sie
Empfindlichkeiten
unterscheiden sieh lediglich
hängen
punktes
z
nur von
=
e^
der Phasendifferenz
(<j>
-
4-^)
des Frequenz¬
und des betrachteten Pols bzw. der Nullstelle
ab. In Fig. 18
Betrage r.1 des Pols, bzw. der Nullstelle
I
I
QI
QI
'und
'in
sind die semi-relativen Empfindlichkeiten
und
vom
Funktion der normierten
Betrag
r.
als Parameter
Q^[
Frequenzdifferenz (<j>
dargestellt.
Q^j
-
*±) /tt
mit dem
83
XJl
mmm^a!
0.00
-.1
.1
.5
-.1
—=s=^
-.3
-.2
N0RMPLIZED FREOUENCY
a)
Fig. 18
0.00
-.]
NflRMfiLIZED
.1
.1
.3
,H
FREOUENCY
b)
Semirelative
Empfindlichkeit der Amplitude
Aenderungen des Betrags eines Pols
Aenderungen der Phase eines Pols
a) auf
b) auf
in Funktion der normalisierten
(<J>
*±) /tt
~
für r.
=
Frequenzdifferenz
0.4, 0.5, 0.6, 0.65, 0.7, 0.75,
0.8, 0.85, 0.9, 0.95
Empfindlichkeit auf Aenderung des Betrages
eine gewisse Aehnlichkeit mit derjenigen
Die Kurven für die
in
Fig. 18a) haben
für den Anteil desselben Pols auf den
Amplitudengang (siehe
[46], Fig. 2.1).
<))= <J>.
gleich der
Bei
,
d.h.
wenn
normierten
Abtastfrequenz) wird,
84
das Argument des Pols oder der Nullstelle
Kreisfrequenz <J> (normiert bezüglich
dann ist
der
dl Gl
/ |G
r
3r
(1
Ol
"
3G
1
.
01
1
roi}
3|G|
3G
1
3r
r
-
'Pi
3(J) Ol
^Pi
/G
3ZOl
Ol
max
/G
Dl
Imax
3z
folgt,
=
3G
/IG
3z
dass auch die
4>. sein
proportional
0
.
17 sieht man, dass
Figur
3 |G
$
=
3 *
Aus der
bei
Pi
r
3|G|
3 IG
Es
3z
.
-
muss.
zum
gelten
muss
/G
Empfindlichkeit
der
Der maximale Wert ist
Amplitude maximal
auch umgekehrt
Abstand des Pols oder der Nullstelle
vom
Einheitskreis.
In
der
r.
l
Fig. 18b)
Amplitude
sehen wir, dass das Maximum der
auf
Aenderungen
Empfindlichkeit
der Phase auch mit dem Betrag
nächst.
85
4.2.1.2
Empfindlichkeit des Phasenganges gegenüber
Aende¬
rungen der Pole und Nullstellen
Die Phase der
Uebertragungsfunktion
der Abstände des Punktes
z
ist die Summe der
den Polen und
von
von
den Null¬
stellen
n
*G(z)
n
yL
=
.*(z
z
-
.)
-
01
1=1
*(z
folgen
Daraus
i£G_
3r
z.)
1
-
die
1 z-z
r
34-G
3(1) oi
in
_
.
oi
,
pi1
ri
sin^i )
ri cos<j>i
des
Phasenganges
t)
2
z
.
[r oi -cos (<f>-<J>
r
yoi ) ]
.
.
' z-z
.
r
d&G
<wr-_
_
31»Ypl
•
pi
I
z-z
•
^
z
,
T-
.
Ol
tr pi."COS (<|>-(f>
.
86
-
Tpi
,
.
pi
z
.)
pi'
sin(d>-d> .)
_
wenn
z
.
Ol
34-G
3'r
~
Empfindlichkeiten
Iz-zOl1|z
.
-
) ergibt sich
sinf
3
8in(«»-»
=
e3
=
arctg ( cos<()
=
*(z
^v
i=l
Phasengang (z
Für den
yL
bzw.
z
^
VY..
.
|
z
.
P1
)]
pi•
z
.,
wobei hier
z
=
e^*
Argumente
ist,
Empfindlichkeit
4.2.1.3
Gruppenlaufzeit gegenüber
der
Aenderungen der Pole und der Nullstellen
Die
Gruppenlaufzeit
Digitalfilters
ist definiert durch
[11]
den Ausdruck
¦g
eines
=
_d*G(ej*)
dcj)
Wenn das Filter durch seine Pole und
Nullstellen definiert
ist, gilt:
n
n
Lg
T
Die totale
=
_
V
L
1=1
A*(e^dcj>
z
.)
oi'
+
yL -£-*(ej<))
d<J»
i=l
durch die einzelnen Pole und Nullstellen
betragen
Tgi
_d_ arctg ,sinc(>
d<|>
(cos<J)
*
1
1
3x
-
g
8ri
3t
8(|)i
1-2 ri
cos
(<f-<t>i)
Empfindlichkeit
(1
_
+
(1
-
r.
-
rjsin-jjj.
ricoscfji
ricos (4>-a>i)
-
.
Die
-
der
z
.)
pi
ist die Summe der Anteile, die
Gruppenlaufzeit
Anteile
-
+
(+
-
gegeben
sind. Diese
wenn z.
wenn
ein Pol,
eine Nullstelle
ist)
zL
r±z
Gruppenlaufzeit
ist daher
[46]:
cos (et)-*. )
2r,
r.2)
il
l
2r. cos(<))-<)). )+ r. 2)2
+
-
(1-r.
(1-2
2)sin(<|)-(f)i)
r.cos(<|>-<j)i) + r±2)2
87
In
Fig. 19
sind die absoluten
Empfindlichkeiten
der
Gruppen¬
laufzeit
3T„
T-2
3r±
™d
3t
—2
34>i
dargestellt, in der gleichen
der Amplitude in Fig. 17.
Weise wie die
_
Empfindlichkeiten
s
K
0.00
NORMALIZED FREOUENCY
N0RMBLIZED FREOUENCY
a)
Fig.
19
b)
Absolute Empfindlichkeiten der Gruppenlaufzeit
a) auf Aenderungen des Betrags eines Pols
b) auf Aenderungen der Phase eines Pols
in Funktion der normalisierten
(<j)
-
Fig.
<j>.i ) /tt für
17. Die
Frequenzdifferenz
gleichen Werte von r.i
Empfindlichkeiten gegenüber
die
stellen haben die
umgekehrten
wie in
den Null¬
Vorzeichen.
4.2.1.4 Anwendung auf den Speziallfall selektiver Filter
Bei den
frequenzselektiven
Durchlassbereiche,
DB
88
G(ej<l>)
wo
Filter haben wir ein oder mehrere
Sperrbereiche,
und ein oder mehrere
SB:
|G(e^) |
^
wo
«1
e
Insbesondere wird die Amplitude dort exakt Null,
Nullstelle auf dem Einheitskreis haben.
wo
wir eine
Durchlassbereich
|G(ej<(>)|
Amplitude
lichkeiten ungefähr gleich
Da die
-
1 ist, sind die absoluten Empfind¬
den relativen. Bei den selektiven
Filtern befinden sich die Pole normalerweise im Sektor der
zum
z-Ebene unterhalb des Bogens auf dem Einheitskreis, der
Durchlass- und zum
Uebergangsbereich gehört.
sich dem Einheitskreis, d.h. sie haben eine
sie sich näher der
Bandgrenzen befinden.
Die Pole nähern
grössere
Wenn der
Güte,
wenn
Uebergangs¬
bereich schmal ist, dann häufen sich die Pole bei den Band¬
grenzen. Da die maximale Empfindlichkeit des Frequenzganges
gegenüber
zum
den
Aenderungen
Abstand dieses Pols
eines Pols
vom
umgekehrt proportional
Einheitskreis ist, werden die
Fehler des Frequenzganges in der Nähe der Bandgrenze
als in der Bandmitte.
Sperrbereich:
Wenn
man
grösser
Nullstellen auf dem Einheitskreis
Dämpfung
Filter mit einer hohen
im
Sperrbereich
wünscht, sollten alle oder fast alle Nullstellen auf dem
Einheitskreis liegen, so dass sich Dämpfungspole (d.h. Punkte
Dämpfung) ergeben. Die relative Empfindlich¬
Amplitude gegenüber der Frequenz des Dämpfungpols
mit unendlicher
keit der
yoi wird
d>
3
.
Ig
/|G|
34)oi
sin(cj>-ct>
=
)
—
2[1
-
cos(4>-<l>oi) ]
=
1
<t>-4>oi
^ cotg ~2
89
Bei einer Nullstelle auf dem Einheitskreis wird die relative
Empfindlichkeit
3G
3z
/G
wenn
z
z
->¦
.
Ol
Ol
da G gegen Null strebt.
Empfindlichkeit
Die absolute
n
ü(z
2
k=l
3G
3z
=
z-z
.
Ol
k^i
a
-
n
Zpk>
ü(z
Ol
k=l
strebt
dagegen
gegen einen endlichen Grenzwert
n
n
=
Ol
z=z
Bei der
9*oi
90
z
.)
ok
Mi
o
n
-
z
pk.)
z
ok1
z
pk
haben wir
0
n
Ol
n
k=l
=
Ol
-
.
=
z=z
.
n (z
oi
k=l
Amplitude
z=z
a
Ol
3 ] G|
3r
Ol
-
(z oi
.
k=l
.
3G
3z
, )
ok'
±
a
n
n
k=l
z
|
z
.
oi
oi
-
.
Gruppenlaufzeit
Für die Phase und die
kann
die
man
Empfindlich¬
keit nicht definieren, da beide Funktionen in diesem Punkt
nicht
stetig
4.2.2
Empfindlichkeit der Pole und Nullstellen gegenüber
Aenderungen der Koeffizienten
sind.
Wir betrachten
jetzt
der Pole und der Null¬
Empfindlichkeit
die
digitalen Filters auf Aenderungen der Koeffizienten.
einem Digitalfilter direkter Form sind die Koeffizienten
Uebertragungsfunktion
stellen eines
Bei
der
A(z)
B(z)
az
°
,..
C(y)
=
zugleich
=
z
n
+
a. z
n-1
+
+...+a^.z
Sil
l
n^Kn_1^
+
+
bxz
X
+
...
bn_lZ
K
a
ü
bn
4- K
+
*,
die Koeffizienten des Filters.
Die Wurzeln der
Gleichung B(z)
tragungsfunktion;
=0 sind die Pole der Ueber¬
die Wurzel der
Gleichung A(z)
=0 sind
deren Nullstellen.
Wenn
obiges G(z)
die
Uebertragungsfunktion
eines Teilfilters
(d.h. Kaskaden- oder
Parallelform) ist, sind die Pole von G(z) zugleich Pole des
gesamten Filters. Wenn G(z) ein Teilfilter eines Filters in
Kaskadenform ist, dann sind die Nullstellen von G(z) zugleich
eines
Digitalfilters zerlegter
Form
Nullstellen des gesamten Filters.
A(z) und B(z) sind Polynome mit reellen Koeffizienten
Grades des Typs
-_
P(z)=cz
n
o
+ c.z
1
-i
+
...
+
c
,z
n-1
+ c
n
n-ten
4.2.2.1 Empfindlichkeit der Wurzeln eines Polynoms
die Nullstellen und die Pole
digitalen Filtern die
Wurzeln des Zählerpolynoms, bzw. des Nennerpolynoms der Ueber¬
tragungsfunktion sind, untersuchen wir zuerst die Empfindlich¬
keit der Wurzeln eines Polynoms.
Die rationale Gleichung n-ten Grades mit reellen Koeffizienten
Da
P
n
(z)
c
=
besitzt
+C.Z~
Z
ol
Wurzeln
n
giert komplex
(i
z±
+...+C
n-1nz
=
1,
...,
Zi(V cl
=
=¦
1
Man kann
n
=0
n), welche
reell oder
3z±
-r—-
'
3c
von P
n
(z)
(j=0, 1, ...,n)
erfahren,
von
+
o
...
+
—i 6c.
3c.
3
P
n
(z) je
werden die Wurzeln
3z.
6c
°
j
3z.l
3c.
Aenderung
z
+
...
6c
3cn
——
n
einer
eines Koeffizienten
l
=
n
3
c
o
II
k=l
)
(z.-z,
l
k
k^i
beträgt.
Die totale Variation der Wurzel z.
i
—
6z.l
92
=
(z 6c
£o—i—-
(zi-zl>
+...+
•
zT}~36c.
i
2
+...+
l
3z.
+
zeigen [47,48,49], dass die Empfindlichkeit
Wurzel auf die
konju¬
cn}
Wenn die Koeffizienten c.
3
eine kleine Variation 6c.
3
sich um 6z. verschieben.
6z
+ c
sein können. Die Wurzeln sind kontinuierliche
Funktionen der Koeffizienten
Zi
von
beträgt
6c )
ü_
(zi-Zi-l)(zi-zi+l)-"(zi-Zn)
dann
Der Zähler dieses
noms
an
gleich dem Wert eines Poly¬
Polynom besitzt als Koeffizienten
Ausdrucks ist
der Stelle z.. Dieses
die relativen Variationen der Koeffizienten
auf den Wert des ersten Koeffizienten c
von
Pn(z),
bezogen
.
Der Nenner ist das Produkt der
und den anderen Wurzeln
von
Abstände zwischen der Wurzel
pn(z).
Wenn die Variationen 6c. der Koeffizienten
Festkomma-Rundung
|6c.|
3
verursacht wurden,
jetzt abschätzen,
Wir möchten
durch eine
c.
gilt
q/2
^
'
1
von c.
z±
|6zi|
wie gross
Bedingung werden kann.
Der Nenner ist keine Funktion der
unter dieser
Variationen 6c..
Für den Zähler haben wir
|6C|
Da
|zJ-6co
+
...
+
zj"j6c.
+
...
+
6cnl
6C eine lineare Funktion der 6c. ist und da der Absolutwert
eine
|6C|
Funktion ist, die kein Maximum besitzt, kann
maximal werden, wenn alle 6c. sich auf einem der
stetige
nur
Ränder ihres
6c.
3
so
=
Gültigkeitsbereichs
=
±
befinden
^2
dass gilt
1
6C 'max
=
•
a
*
2
i' ± ,n
zV ±
i
...
...
±
i
*n-3
z
l
+
Die Vorzeichen der einzelnen Terme müssen so
dass
I6CI
gewählt werden,
maximal wird.
93
Wegen
6C|
Dreiecksungleichung
der
? (iz"i +|Zr1i
^
max
|n
2 (|Zj
i
/
g
Zi"
s|
Der
+
¦
|z,
l11"1
'i
"
'
(n+1)
6z,
max
+1)
+
...
i)
zj*
1
z.
1
1
' =.
Variation einer Wurzel eines
daher:
Zll
Co
+
1
grösste Absolutwert der
Polynoms beträgt
+...
n+1
' z.i
<
=
haben wir
.
\z
' i'|n+1
|z.|
-
-
1
1
n
n
k=i
'>
lzil^
1
i
lzil=
1
|z.-z,
x
k
Mi
^<
LI (n+1)
co
\
1
n
n
k-i
z.-z.
x
k
Mi
Der erste Faktor
der Koef¬
fizienten im
ist.
gibt an, wie grob die Quantisierung
Vergleich zum Wert dieser Koeffizienten
Faktor wächst mit steigendem Betrag der Wurzel z.,
um so stärker, je höher der Grad des Polynoms ist.
Der zweite
und
zwar
dritte Faktor ist umgekehrt proportional zum Produkt der
Beträge der Abstände zwischen der Wurzel z.l und den anderen
Wurzeln.
Der
94
Folgerungen
4.2.3.
Wir werden hier
Fehler, die bei
Quantisierungsfehler
für die
einige qualitative Aussagen machen über die
der Beschränkung der Wortlänge der Koeffizien¬
entstehen. Diese Aussagen gründen auf die vorher gefundenen
Resultate über die Empfindlichkeit der Uebertragungsfunktion
ten
auf
Aenderungen
der Pole und Nullstellen und über die
Empfind¬
auf
Aenderung
dessen
der Pole eines
gegebenen
Filters
lichkeit der Wurzeln eines
Polynoms
Koeffizienten.
a) Ordnung der Teilfilter
Die
Quantisierungsfehler
steigen
Ordnung
mit zunehmender
der Teilfilter.
Tat, bei einem Teilfilter 2-ter Ordnung sind die Fehler
In der
umgekehrt proportional
6z.1
zum
Abstand
vom
konjugiert komplexen
z.
l
Beim Einbeziehen eines zusätzlichen
filter wird dessen
6z.1^
Z
.
Ordnung
¦7*1-7.
Z*
Z
.
um
7.
Z
Polpaars (z.,
2 erhöht. Es wird
\ \
7.
-
Die zusätzlichen Faktoren im Nenner
ins Teil¬
|z.-z.|und | z -z*j |
sind
Einer davon wird kleiner als 1 oder im besten
<
Fall
1 sein. Wenn die Pole nahe beieinander
2.
z^)
7*
sicher
=¦
Pol
liegen,
kann
einer dieser Faktoren viel kleiner als 1 sein: der Zuwachs
des Fehlers wird dann erheblich.
95
empfiehlt
Es
filtern (in Kaskade oder in
Ordnung
zusammenzusetzen. Um
Hilfe reeller Koeffizienten
ordnung
von
Grund, digitale Filter aus Teil¬
Parallel) möglichst niedriger
sich aus diesem
2
benötigt.
konjugiert komplexe
zu
realisieren,
Bei Filtern höherer
Pole mit
wird eine Mindest¬
Ordnung
weist die
direkte Form die grössten Quantisierungsfehler auf.
Der Unterschied bezüglich Qunatisierungsfehler wird am grössten
bei schmalbandigen Bandpässen mit der Mittelfrequenz bei 1/4
der
Abtastfrequenz.
b) Bandbreite
Die Fehler werden umso
sehr schmal oder sehr
grösser, je extremer (d.h. entweder
breit) die Bandbreite eines Filters
wird.
Filter, die alle durch Frequenztranformation
einzigen normalisierten Tiefpass hergeleitet wurden.
Wir betrachten
aus
einem
Grenzfrequenz eines
1/4 der Abtastfrequenz.
Die
normalisierten
Tiefpasses liegt
bei
Tiefpass. Tiefpässe können aus einem normalisierten Tiefpass
durch folgende Frequenztransformation gewonnen werden [46]:
z
z
=
+
n
B-z
n
B
+
1
wobei
B
=
tg
tt
(1/4
ist die
-
f )
lich der
Grenzfrequenz des Tiefpasses,
halben Abtastfrequenz.
Wenn die
Grenzfrequenz
f
lim B-1
f -»-0
c
96
f
normalisiert
gegen Null strebt, dann ist
bezüg¬
und daher auch
lim
f +0
z
=
1
c
Die
digitalen Filters
Fig. 20 dargestellt.
der Pole eines
Bewegung
der Bandbreite ist in
n
V2
Fig. 20
Wenn
Verkleinerung
bei
f
/2
P
Bewegung der Pole bei Verkleinerung der Bandbreite
eines digitalen Tiefpasses. fc ist hier die Grenz¬
frequenz, f die Abtastfrequenz.
hingegen
die
Grenzfrequenz
gegen die halbe Abtast¬
frequenz strebt, gilt
lim B
f +1
=
1
c
und daher auch
lim
f +1
z
=
c
97
beiden Fällen gehen die Pole und die Nullstellen gegen
einen einzigen Punkt. Ab einer gewissen Grenzfrequenz müssen
In
sie daher sich einander nähern: dabei werden die
Quantisierungs-
fehler grösser [48].
Bandpass
Bandpass
Ein
mit den
(wiederum normalisiert
kann durch
folgende
z
=
Transformation
1
+
n
Grenzfrequenzen f.. und f»
bezüglich der halben Abtastfrequenz)
Aü—TT
+
A
*
k cos (TTf
A
=
1
B
1
=
-
-
=
cos
f
ist die
Wenn die
k
Grenzfrequenzen
k
-*
0
B
¦*
1
A
98
o
Bz
B
+
n
n
+
1
)
=
tgir(l/4
cotgiT(f
(irf o )
-
f
-
(f2-f1))
)
COSTT
(f +f )
COSTT
(f-f)
=
Mittelfrequenz
f. und f_ gegen f
streben
und daher
z
werden L 46 j:
k
1 + k
k
1
.bT-TTn
n
mit
gefunden
cos
(
TTf
o
)
streben, dann
z
-»-
(irf o )
cos
e
=
Wenn der
±
cos
y
(irf o )
-
1
=
cos(iTf o )-± j. sin (irf o )
±JTTfQ
Bandpass
selektiver wird, dann häufen sich die
Pole und die Nullstellen
welcher der
um
jenen
Punkt auf dem Einheitskreis,
Mittelfrequenz entspricht.
Das ist in
Fig.
21 dar¬
gestellt.
f
Fig.
21
Bewegung
?
2
der Pole bei der
Verkleinerung
f. 72
der Band¬
digitalen Bandpass. fQ ist
Mittelfrequenz, f die Abtastfrequenz.
breite in einem
die
Wenn der
Bandpass
sehr
breitbandig wird,
d.h. wenn
dabei
f1
gegen 0
und f_ gegen 1 gehen, dann strebt ein Teil der Pole und der
Nullstellen gegen z = +1 und der andere Teil gegen z = -1.
99
Hochpass
Bandsperre:
Hochpässen liegen die Ver¬
hältnisse genau wie bei den Tiefpässen,und bei den Bandsperren
liegen sie genau wie bei den Bandpässen, da die Transformatio¬
nen jeweils ähnlich sind.
und
Bei den
Ausführungen ist ersichtlich, dass die Quantisie¬
rungsfehler des Frequenzganges wachsen, je breiter oder ex¬
Aus diesen
trem schmaler die Bandbreite
Pole näher
am
Einheitskreis
ist, weil
liegen
einerseits dann die
und somit die maximale
Empfindlichkeit des Frequenzganges auf Aenderungen der Pol¬
lage grösser wird, und weil anderseits die Pole und die Null¬
stellen näher aneinander rücken und somit ihre Empfindlichkeit
auf Aenderung der Koeffizienten höher wird. Die Situation ist
etwas besser bei schmalbandigen Bandpässen und Bandsperren in
Kaskadenform, da hier der
jugiert komplexen
Abstand eines Pols von seinem kon¬
Verkleinerung der Bandbreite nicht
viel ändert, so dass die Empfindlichkeit der Pole und der Null¬
stellen auf Aenderungen der Koeffizienten ungefähr konstant
bei einer
bleibt.
c) Mittelfrequenz
schmalbandigen Bandpässen und Bandsperren werden die
Fehler grösser, wenn die Mittelfrequenz gegen Null oder gegen
die halbe Abtastfrequenz geht. Die günstigsten Verhältnisse
werden hier erhalten, wenn die Mittelfrequenz bei einem Vier¬
tel der Abtastfrequenz (f
V2) liegt.
Bei
=
d) Verteilung der
Die
der
Pole und der Nullstellen
Quantisierung der Koeffizienten bewirkt, dass die Anzahl
möglichen Koeffizientenwerte endlich ist. Deswegen ist
auch die Anzahl der Orte, wo sich Pole oder Nullstellen befin-
100
den können, endlich. Die Dichte der realisierbaren Pole oder
der realisierbaren Nullstellen hängt unter anderem von der
Filterstruktur ab.
Empfindlichkeit des Frequenz¬
ganges auf Aenderungen der Pollage umgekehrt proportional
zum Abstand des Poles vom Einheitskreis ist. Es folgt, dass
Strukturen mit gleichmässiger Verteilung der Pole und Null¬
stellen auf der z-Ebene nicht die günstigsten sind. Die günstig¬
sten Strukturen bezüglich der Rundungsfehler der Koeffizienten
Wir haben
gesehen, dass die
die, bei welchen
umgekehrt proportional
wären
4.3 Die
Empfindlichkeit
Aenderungen
Wir haben im
funktion auf
max.
die Dichte der Pole und der Nullstellen
zum
Abstand
vom
Einheitskreis ist.
Uebertragungsfunktion
der
der Koeffizienten
Kapitel 4.2
Aenderungen
der Uebertragungs¬
der Koeffizienten auf eine indirekte
die
Empfindlichkeit
erlaubt,
und einige allge¬
Weise, d.h. in zwei Stufen, betrachtet. Dies hat
gewisse qualitative Folgerungen
meine Richtlinien aufzustellen,
In
diesem Abschnitt soll
nun
Empfindlichkeit der
Amplitudenganges durchgeführt
nung der
drücke für die maximale
erhalten, welche
auf kleine
zu
ziehen
uns
welche sehr anschaulich sind.
quantitative
Uebertragungsfunktion und
eine direkte
Berech¬
des
werden. Wir werden damit Aus¬
Abweichung
eine unmittelbare
der
Uebertragungsfunktion
Berechnung gestatten, je¬
doch nicht so anschaulich wie die Richtlinien des
vorhergehen¬
den Abschnittes sind. In einem ersten Abschnitt (4.3.1) wird
die Berechnung der Empfindlichkeit bei verschiedenen Filter¬
strukturen
durchgeführt.
Anschliessend
wir eine Schranke für die maximale
gungsfunktion angeben.
legungen
Im Abschnitt
über die maximale
(Kap. 4.3.2)
Abweichung
werden
der Uebertra¬
4.3.3 werden einige Ueber¬
Abweichung
des
Amplitudenganges
101
angestellt. Im letzten Abschnitt (4.3.4) wird die Empfindlich¬
keit des Amplitudenganges für den wichtigen Fall der Kaskaden¬
form angegeben.
Empfindlichkeit
der Uebertragungs¬
funktion auf Aenderungen der Koeffizienten
4.3.1 Direkte Berechnung der
Empfindlichkeit
Wir werden hier die
der Koeffizienten bei der direkten Parallel-
Aenderungen
auf
Uebertragungsfunktion
der
und Kaskadenform untersuchen. Es wird auch darauf hingewiesen,
wie die Empfindlichkeit beliebiger Filterstrukturen berechnet
werden kann.
Direkte Form
Wenn
digitalen
G
-
/
x
=
eines
Filters in direkter Form
az
z)
kleine
Uebertragungsfunktion
den Koeffizienten der
man
n
n-1
+a.z
,
1
o
—
zn
+
6a..
,
A(z)
+
...
+
bn
B(z)
zufügt,
bzw. 6b.
<
.
,
,
b^11-1
1
Aenderungen
n
+...+a
.
dass diese Koeffi¬
so
zienten
a
=
.
qi
a.
l
+
6a.
l
b.=b.+6b.
l
l
qi
werden,
wird eine neue
G
*
(z)
G(z)
102
0, 1,
i
=
1,
2
,
...,
n
.
n
.
.
,
erhalten
6G(z)
=
+a.z
z
zn
+...+a
31
-32-
+
b
lZn_1
ql
32L
+
...
+
b
qn
ergebende Variation 6G(z) der Uebertragungs¬
G(z) genügend klein ist, dann kann man sie durch das
Wenn die sich dabei
funktion
+
=
Uebertragungsfunktion
a
=
i
totale Differential
G(z) gegenüber den Koeffizienten
von
ersetzen:
n
6G(z)
=
dG(z)
ff-
l
=
l
Die
Polynome
in
i=l
6aii
z
i=0
l
6a. +
X
i=0
B(z)
n
ff-
A(z)
"
1
R2fz1
B
(z)
6b.
X
^
Z
i=l
5
i
z
n
dA(z)
l
=
Sa.
z
6b.i
z
n-i
i=0
n
und
dB(z)
y
=
^
n-i
i=l
welche selber die Variationen der Koeffizienten von G(z) als
Koeffizienten haben, sind die totalen Differentiale von
bzw. B(z)
gegenüber
ihren Koeffizienten. Die Variation der
Uebertragungsfunktion
6G(Z)
,
Mizj.
B(z)
_
wird damit
G(z) dBjzl
v
Man kann die Effekte der
erster
Näherung
Filter 6G(z)
als eine
zum
A(z),
'
B(z)
Quantisierung
der Koeffizienten in
Parallelschaltung
idealen Filter
eines
G(z) darstellen,
parasitären
wie in
Fig.
22
103
dargestellt
ist. Dabei ist 6G(z) durch
G(z)
obige Gleichung gegeben.
O
6G(z)
Fig.
Gq(z)
22
.J
Parallelform
Uebertragungsfunktion G(z)
Uebertragungsfunktion der Teilfilter G.(z)
Bei der Parallelform ist die
die Summe der
G(z)
=
l Gi(z)
i
Filter 6G(z) die Parallel¬
den Teilfiltern gehörenden Parasitärfiltern
Daher ist auch das
schaltung
der
zu
parasitäre
6G±(z)
6G(z)
l 6G±(z)
i
=
Die resultierende
Anordnung
ist in
Fig.
23
6G z)
^
GX(z)
6Gi(z)
Gi(z)
6Gi(z)
G„
6Gn(z)
z
Gz
104
dargestellt.
Fig. 23
+<D
Kaskadenform
Uebertragungsfunktion G(z) das
Uebertragungsfunktionen der Teilfilter G^z)
Bei der Kaskadenform ist die
Produkt der
G(z)
aQnGi(z)
i
=
Man bekommt daher für das
6G(z)
l
n
i=l
j=l
=¦
G.(z)
l
n
i=l
j=l
j^i
G(z)
=
parasitäre
G
(z)
•
•
6G.(z)
i
Filter
+
6aQ
G(z)
•
aÄ
Gi(z) ei(z)
+
G(z)
—
(
l £i(z)
i=0
wobei
e±(z)
dA. (z)
G(z)
A±(z)
6a_
eo(z)
parasitäre
gestellt.
Das
dG±(z)
dB. (z)
B±(z)
für
i=l,
Filter bei der Kaskadenform ist in
Fig.
.
.
.
,
m
24 dar¬
:r
G(z)
i
6G
.
G(z)
frt
Fig.
24
105
Allgemeine
Filternetzwerke
Wir haben vorhin die absoluten
Empfindlichkeiten für einige
wichtige Filterformen angegeben. Für einige andere Realisie¬
rungsformen lassen sich die Empfindlichkeiten analytisch an¬
geben. In [50] wurden die Empfindlichkeiten der in [14] ange¬
gebenen vierzehn kanonischen Formen berechnet. Im allgemeinen
ist es zu kompliziert, die Empfindlichkeiten analytisch zu
berechnen: es empfiehlt sich hier, numerische Methoden zu
verwenden.
Man kann
beweisen
tragsfunktion
gegeben ist,
[51, 52, 53],
dass die Ableitung der Uebernach einem Filterkoeffizient c. durch den Ausdruck
H.„(z)
Uebertragungsfunktion vom Filter¬
eingang zum Eingang des betrachteten Multiplikators, der c.
als Koeffizient besitzt, und H,.(z) die Uebertragungsfunktion
vom Multiplikatorausgang bis zum Filterausgang ist. Die knordnung zur Berechnung der Empfindlichkeit nach dieser Methode
ist in Fig. 25 dargestellt.
wobei
die
Netzwerkgleichungen eines digitalen Filters für eine
bestimmte Frequenz ((>= 10T aufgelöst werden (nachdem z durch
coscj) + j sin<|> ersetzt wurde) erhält man ausser einem Punkt
des Frequenzganges
rec
G(e i<J> ), je einen Punkt aller Frequenzgänge
j-*. vom Filtereingang bis zu den Multiplikatoreingängen.
H19(eJT)
1
.j* von den Multiplikatorausgängen zum Filterausgang
Die H_.(eJT),
Wenn die
,
gleichen Arbeits¬
gang gefunden werden [26] durch die Verwendung des Begriffes
des transponierten Netzwerkes [54]. Das transponierte Netzwerk
genommen, können mit
wird
106
vom
gegebenen
geringem
Mehraufwand im
Netzwerk durch Umkehr der
Signalfluss-
richtung gefunden: Insbesondere werden
und Summatoren
umgewandelt.
transponiert. Wenn
Knoten
zu
Knoten
zu
Summatoren
Die Knotenmatrix
[A]
die Netzwerkgleichungen
wird dabei einfach
des gegebenen Netzwerkes mit Hilfe der LR-Zerlegung (Gauss1
sehe Eliminationsmethode) gelöst wurden [55],
[A]
=
LL][R]
ergeben die gleichen Faktoren [L] und [R] auch die Lösung des
transponierten Netzwerkes L56j, da gilt
[A]T
Ein
Programm
ganges eines
[R]T[L]T
([L][R])T
=
Berechnung der Empfindlichkeit des Frequenz¬
beliebigen digitalen Filternetzwerkes ist in
zur
[26] angegeben.
r^>4>
o
1
H,„
12
v
H,.
34
z
z
g(z:
g(z:
3G(z)
3c.
l
Fig.
25
Anordnung
zur
Berechnung der Empfindlichkeit
Uebertragungsfunktion
eines
digitalen
auf Aenderungen eines Koeffizienten
der
Filters
c
107
4.3.2
Die maximale
Abweichung
der
Uebertragungsfunktion
Uebertragungsfunktion G (z) eines digitalen
(beliebiger Form), dessen Koeffizienten c schon
Wir betrachten die
Filters
.
quantisiert worden sind. Dieses Filter ist das Resultat der
Quantisierung
der Koeffizienten einer ganzen Schar von
Filtern, dessen Koeffizienten c. nach der Quantisierung alle
c
ergeben. Alle c.1 liegen dabei in einem bestimmten Inter.
qi
vall
die Lage und die Grösse dieses Intervalls hängen
von der Art der Quantisierung ab.
Wenn die Koeffizienten c
Festkommazahlen sind, die durch
um c
.:
.
qi
von c. bestimmt worden
die Rundung
gleich
valle
c
sind alle Inter¬
gross:
^
2 q
s
¦=¦
-
qi
.
wobei q der
sind, dann
c.
-
c
qi
i
.
+
M
2 q
•=-
Quantisierungsschritt (=
Wert des LSB) ist.
Die Variation der Koeffizienten
6c.i
c.
=
l
c
-
.
qi
befindet sich dabei im Intervall
0Ci
2
Alle
sich
2
unquantisierten Uebertragungsfunktionen G(z) befinden
in einem "Schlauch" um die quantisierte Uebertragungs¬
funktion G (z)
.
q
Wir werden hier den maximalen "Durchmesser" dieses
d.h.
|6G|'max
1
6G ist
-
berechnen.
in erster
Näherung
der Koeffizienten 6c.
l
108
Schlauches,
-
eine lineare Funktion der Variation
M
6G
=
dG
l
=
1=1
(M
Der
ist die totale Anzahl
Betrag
3G
*„
3c. 6c.l
%z
Koeffizienten)
davon
M
I
dGl
6G
i=l
l
Quadrat
des
Betrags
von
dG ist eine
quadratische
in 6c
M
I
dGl
i=l
M
Re(gf )6c
I
i-1
Diese Funktion hat die Form einer
6^.
der
stetige, positiv semidefinite Funktion
ist eine
Das
3c.
Funktion
1
2
Im(3f)6ci
elliptischen
Paraboloid-
fläche in einem mehrdimensionalen Raum. Sie besitzt kein
(nur ein Minimum
Maximum bei unbeschränkten Werten von
wenn
alle 6c
Da die
6ci
0).
=
(positive) Quadratwurzel
einer
positiven
len eine monoton zunehmende Funktion ist, wird
2
ein Maximum hat.
mum haben, wo
reellen Variab¬
|dG|
ein Maxi-
|dG|
Die Werte der 6c befinden sich aber in ganz bestimmten Inter¬
wird daher ein Maximum dann und nur dann annehmen,
die 6c sich an einem der beiden Ränder ihres Definitions¬
vallen:
wenn
|dG|
intervalls befinden
6c
+
_
a
2
109
M
Daher
dG
q
_
3G
3c.1
I
max
1=1
(6)
max
Die Vorzeichen der einzelnen Terme sind dabei so zu
wählen,
dass der Betrag der Summe maximal wird. Wegen der Dreiecks¬
ungleichung haben wir
M
dG|
Wir wollen
Wert
vom
lA
max
1=1
jetzt abschätzen,
(6)
3G
ac,
I
wie weit weg die Schranke (7)
kann, d.h.
sein
(7)
wie gross die
grösste Abweichung
des Verhältnisses
n
R
_2G
I i-1
I
=
3C,
M
I
1=1
max
3G
3c
l
R, der
abweicht, wollen wir mit Q bezeichnen.
vom
Im
Wert 1 sein kann. Den Wert
allgemeinen
kann
man
von
dieses Problem
so
am
meisten von 1
formulieren: Gesucht
wird
M
II
Q
=
min
max
+
x.
l
i-1
M
I
i=l
wobei x.
l
beliebige
3
x
I
|x±|
1
um
ein Problem der
Menge kontinuierlicher Grössen des
Satzes
110
x
Vektoren auf einer Ebene sind,
Es handelt sich also
eine
±
zweiwertiger
Grössen.
Minimalisierung
über
Maximums über eines
Das Maximum
(= 1) wird erreicht,
R
von
alle
wenn
xi
besitzen oder wenn ein bestimmtes
gleiche Richtung
die
xi
sehr
viel grösser als alle anderen ist.
Man kann daher
wird, wenn wir
befinden, d.h.
alle
-
vermuten,
am
uns
TT
.
x'
=
i
R
erreicht
obiger Situation entfernt
sind
möglichst weit auseinander liegen,
Richtungen gleichmässig aufgeteilt sind
d.h. wenn die
x.
von
von
wenn
die Richtung der
-
dass das Minimum
weitesten
gleich lang
x.
15
eJ3—
n
x.
.
i
Das Maximum der Summe
M
S
I I
=
+
i=l
ist
-
x± |
Symmetriegründen
aus
-
die Summe der
Richtung, wobei
Vektoren x. auf eine mittlere
x.
Projektionen
wählen sind, dass diese
so zu
Sinn haben. Für M
ungerade
haben wir
max
iy
=
'L
-
i-1
1 c
Diese
|
i'max
+ x.
=
fällen (M =2, 3,
jedoch
'
[1
+
die Vorzeichen der
gleichen
alle den
2
YL
i=l
cos(-^ i)]
M
konnte bis jetzt nur in Spezial¬
...) bewiesen werden. Die numerischen Resul¬
bisher nie einen Widerspruch geliefert.
Arbeitshypothese
tate haben
|x|
'
der
1
~2~
M
S
Projektionen
.
111
gilt [41,
Da
104]
S.
m
£
i=l
erhält
sin(6/2)
2
man
.
sin
x
max
Für M
sin[(m+l/2)9 1
1
2
i(
cos
f,M-l
(—z—
L
2
+
ttI
1
—)
2' MJ\
—
x
8ln(2M)
gerade haben
sm
2M
wir
25-x
2
M
x
S
=
max
X
V
2
o
x'
'
i=0
Hier
gilt [41,
S.
cos(n6+a)
=
/Tr
COS(S
•
1
+
.
TT
2M>
-1
|x|[2cos(i,+ I coslii^,]
.
=
1=1
104]
m
l
-cosa+cos
(a+9)-cos[a+(m+l)6]
2(1
i=l
so
S
dass
=
max
man
x
'
'
cos(a+me)
auch hier erhält
2cosi
+
ZM.
Lfüi^üi
-
cos
<T^>
M
112
+
cos8)
-
+ cos
(I-JL,
cos^
2
=
x
-
cos£ cos^ cos^ cosf^
2
2 Sin
,
=
x
+
-
.
2
+
2 sin
^
TT
2M
TT
Sin
2M
dabei in beiden Fällen
Man hat
M
I 7.
l ±x.|
i
1
Q
mm max
=
-
*
Xi
1=1
'
M
M
I |x.|
1
i=l
TT
•
Sin2M
Wenn M wächst, strebt Q gegen
Q
lim
M
-
co
1
lim
=
m-
-
——
M
Sin(2M)
=
12
-—
M
=
-
=
0,6366
2M
feststellen, dass der tatsächliche Wert für
die grösste Abweichung der Uebertragungsfunktion ganz allgemein
stets zwischen einer unteren und einer oberen Schranke liegt.
Dabei ist die obere Schranke nach Gl. (7) zu rechnen; die
untere Schranke ist 0,6 366 mal die obere Schranke.
Wir können also
explizite Berechnung der oberen Schranke
Fehlers der Uebertragungsfunktion für verschie¬
Wir wollen nun die
des maximalen
dene Filterformen vornehmen.
113
Direkte Form
gesehen,
dass
dG
dA
dB
G
A
B
Wir haben
SG
„
~
G
d.h. für den
1 dG I
gilt:
=
A
i
.
n
I 6a.l
A 7»
Tg|
der
zn_1
v
)
7.
i=l
—
B
6b.
,,
l
z
n-i
.
<
q
¦^
s
n-i
1=1
n
(TÄT
2
n
i l 6b.
B 7.
l
-
Ln-1
'
'
.,
.
y
7,
i=0
n+1
=
1
-
A
Dreiecksungleichung ergibt
3 ( 1
±
z
n-i
Betrag
Anwendung
dG
7>6a.i
i=0
—
1=0
Die
n
n
In.
.
/n + 1 +
(—-—
—jr~)
6a
dA.
_-i
.
n
V |zn_1'
TIT
7I 'Z
'"' i=l
i
-
n
1
i
,
n
z
,
z
für
.
•,)
j-..
|z|
i
i
-
-1
1 )
Izl f
für
1
(Frequenzgang)
=1
i
,„
%
Kaskadenform
gilt
Es
6G
G
dG
G
_°
+
O
l
6a
-
1
o
Bei
Anwendung
IdGl max
114
"
J
+
l
dB.
-
A.
l
6a
.
oi
z
y —i
B.
l
l
+
6a..
li
Li
i
.
z
+
6a_
i
§ f IWJ+
+
<
.
l
i
Dreiecksungleichung
der
2i
?
T5
B.
1
6b,Ii z
.
+
B.
6b„.
2i_
Im Normalfall sind die
dG '
f
max
?
a
-
.
oi
0
<7j -rir
?i
*
d.h. die 6a
1,
=
.
oi
*
i '
'
'
i
Bei selektiven Filter mit Nullstellen auf dem Einheitskreis
sind auch die
dG
a_.
1
=
!
'max
<-*+
i
i
T^r
2
+
i'
'
l
i
tct>
i'
'
Parallelform
Dabei ist
dG
=
dA.
^
I
i
i
Wenn
man
dG|.
4.3.3
Gi
"
dB.
-IT }
+
6co
wie vorhin verfährt, erhält
=
q
y
i
+|Gj
1
IB.
Die maximale
Abweichung
Wir haben im Abschnitt 4.1
Empfindlichkeit
lichkeit der
der
des
Amplitudenganges
dass die semirelative
die gleich der absoluten Empfind¬
gesehen,
Amplitude,
Dämpfung ist,
Empfindlichkeit
man
der Realteil der semirelativen
des Frequenzganges ist.
115
G 3c.
c.
3c.
c.
111
i
Die totale relative
Abweichung des Amplitudenganges und
Abweichung der Dämpfung ist daher in erster Näherung
die totale
M
i=i
M
x
i=i
i
Beide sind eine lineare Funktion der Abweichungen 6c der
Koeffizienten. Das Maximum der Abweichung wird erreicht,
wenn
alle 6c
einen der beiden Extremwerte ihres Intervalles
annehmen. Bei Festkomma-Koeffizienten heisst das
äci
±
-
%
wobei die Vorzeichen aller 6c so gewählt werden müssen, dass
alle Terme der Summe entweder positiv oder negativ sind.
folgt
Daraus
M
3_LGJ
G|
'max
n\
i
=|6a.|
i'max
'
=
a
2
yL
1=1
M
3A
3cl
-?2 I |Re{Q'G}
l—^c
L
1=1
Die maximale
Abweichung der Dämpfung ist proportional
Quantisierungsschritt der Koeffizienten. Da
|
*
2~nb
ist, wobei nb die Wortlänge bedeutet, verdoppelt
116
zum
ein zusätzli-
ches Koeffizientenbit die
Genauigkeit der Amplitude.
Der
Faktor
M
|Re{Q;G}
I
±
i=l
hängt
der Filterform ab: Er kann als ein Gütemass für
von
die betreffende
4.3.4
Realisierungsform
Empfindlichkeit
genommen werden.
Amplitudenganges
des
bei der Kaskaden¬
form
Die Kaskade von Teilfiltern zweiter
häufig gebrauchte
Ordnung
ist eine sehr
Filterform. Wenn die Teilfilter direkter
geschlossene Formeln für die Empfindlich¬
keit des Amplitudenganges, so dass sich die vorher besprochenen
Approximationen erübrigen.
Eine Kaskade von N Filtern 2. Ordnung, jedes realisiert mit
einer direkten Form, besitzt die Uebertragungsfunktion
Form
sind,
erhält
man
M
N
G(z)
i
4-
x
=
a„
TT
n
a
.
Ol
i=l
z
2
z
+
a,ll z +
a_
2l
.
+
b,.z
Ii
+
.
b0.
2i
Es ist vorteilhaft die
a.
Ol
zu
i=l,...,N
=1
wählen. Man erspart damit einen
Multiplikator
pro Teil¬
filter, und die Hardware kann schneller arbeiten, weil in
diesem
Multiplikator
die
Verzögerung wegfällt.
Zudem
ergeben
117
Rundungsfehler.
sich geringere
Es wird dann
N
a
=£
o
a
a
n
o
•
Ol
i=l
a,Ii =^ a,ll
/
a
2i 4 a0.
2i
/
a
.
.
a_.
.
Ol
In diesem Fall wird der
N
jA
G(eD9)
=
a
o
|G(ej<())|
=
a
•
n
)coscj>
(1
=
Die
ao
_,
n
i=l
tt
a,
.
'*
+
j(l-a_ ) sin<i>
~
j(l-h2i)sin<t)
+
somit
j<|>
Zpi
"
.
pii
([(1+a£ ) cos*
([ (l+b2i)cos«|)
+ a
]2
+
~
Empfindlichkeiten
.
—
b2i)cos<t> + b1±
+
i=l i
N
+
—
Amplitudengang wird
N
Frequenzgang
(1+a
n
±=1
Der
.
01
des
+
b
]
2
2
sin
J:
Amplitudenganges gegenüber Aenderungen
der Koeffizienten sind daher
,|G|
äli
Qu G|
bli
118
=
V2
<t>]
2
2 \ V2
d-b2i) sin cf>)
(l-a„.)
—
+
2
(l+a2i)cos(t) + a1±
[ (l+a2i)cos<|> + a1±]2 + (l-a2i)2sin2<}>
d+b2i)coscf, + b1±
[ (l+b2i)cos4) + b1;L]2 + (l-b2i)2sin2<j)
u
=1
[ (l+a_
-^ x )coscj)
I
cos(2<|))
+
)cos(J>
+
[ (1+b
]
xx
5
(1-a,.)
+
.
a_
£x
j—jsin <j>
b^cos-j) + b2i
^
2
2
b1±] + d-b2i) sin et
=
2i
+
.
+ a
.
..
q I
an cosü>
+
.
a2i
i
(2<j))
cos
Die relativen und semirelativen
Empfindlichkeiten
Ampli¬
denjenigen
des
tudenganges sind, ausser von der Frequenz, nur von
Koeffizienten abhängig, die sich im gleichen Zähler
gleichen
Nenner der
befinden,
Empfindlichkeiten
sind daher
unabhängig
von
liegt.
Die
der Paarung der
Reihenfolge der Teilfilter. Diese Eigenschaft
allgemein aus der Kommutativität des Produktes
der
von
kann auch ganz
von
des Teilfilters
auch der betrachtete Koeffizient
wo
Terme und
Uebertragungsfunktion
oder im
komplexen
Zahlen
hergeleitet
werden.
Filter mit Nullstellen auf dem Einheitskreis
Wenn
man
selektive Filter mit einer hohen
Dämpfung
im
Sperr¬
bereich wünscht, müssen alle oder fast alle Nullstellen der
Uebertragungsfunktion auf dem Einheitskreis liegen.
Damit bei einem Teilfilter einer Kaskadenform die Nullstellen
liegen,
auf dem Einheitskreis
a„.
2i
Insbesondere,
a2i
a
=
In diesem Fall
gelten
.
oi
wenn a
=
muss
.
=
1
(siehe vorhergehenden Abschnitt)
L-
bleiben die Nullstellen immer auf dem Einheits-
119
Quantisierung der Koeffizienten: die
Dämpfungspole bleiben erhalten. Die Quantisierung der Koef¬
fizienten bewirkt lediglich eine Aenderung der Frequenz
kreis trotz der
Dämpfungspole.
dieser
wird sie überall dort wählen,
gewünscht werden.
der Kaskadenform:
Sperrdämpfungen
Die
gen
Das ist der entscheidende Vorteil
man
wo
Empfindlichkeit des Amplitudenganges gegenüber dem
quantisierten Koeffizienten des Zählers wird somit
Q.lGl
ali
2
cos<|>
+ a..
1.
2
cosü)
2
Für diesen Ausdruck
Sie ist in
Fig.
z
26
cos*
gibt es eine
dargestellt.
-
-
(-
hohe
einzi¬
—5—)
cos*Ol
einfache
Interpretation:
Ol
z=e
3*
1/Q
cos*
Fig.
26
Empfindlichkeit
des
Amplitudenganges
des Zählerkoeffizienten
a.
Aenderungen
bei Filter in Kaskadenform
mit Nullstellen auf dem Einheitskreis
120
auf
Die
Empfindlichkeit
a
ist in diesem Fall
.
Amplitude gegenüber dem Koeffizienten
umgekehrt proportional zur Differenz
der
zwischen dem Realteil
von z
=
ej<))
und dem Realteil der Null¬
stelle.
q:IGI
ali
wird
=
man
l
4
sin
V2(*+(j)oi)
•
sin V2
(4>-
<J»oi)
gleichbleibenden Abstand zwischen eD<t> und Dämpfungspol
die Empfindlichkeit höher, wenn die Nullstelle sich
Beim
z
-
Durch eine weitere Umformung erhält
+
1 nähert.
121
5. QUANTISIERUNG UND ABSCHNITT DER SIGNALGROESSEN
Einleitung
5.1
Signalgrössen werden in einem Digitalfilter, das mit
digitalen arithmetischen Elementen realisiert ist, auch durch
Zahlen dargestellt, die in Registern mit beschränkter Wort¬
länge gespeichert werden. Dadurch entstehen zusätzliche Feh¬
Die
ler:
-
Ueberlauffehler
-
Abschnittfehler
-
Quantisierungsfehler.
Quantisierungsfehler entstehen
am
Eingang
Analog-Digitalwandlung
Digitalfilters. (Bei der Wandlung können auch
bei Uebersteuerung des Wandlers entstehen.)
eines
Ueberlauffehler
Die
bei der
Wortlänge
der Summe der
des Resultates einer
Wortlängen
mit ihrer vollen
Multiplikation
der Faktoren. Wenn
man
Genauigkeit behalten wollte,
ist
gleich
die Zahlen
dann würde die
Wortlänge
gehen:
bei rekursiven Filtern mit der Zeit gegen Unendlich
Das ist offenbar unmöglich. Im Gegenteil, man wird
normalerweise mit höchstens zwei verschiedenen Wortlängen ar¬
beiten. Eine Beschränkung der Wortlänge ist unumgänglich. Wenn
man den am wenigsten gewichtigen (least significant) Teil des
Wortes
den
abschneidet,
dann erhält
man
Abschnittfehler,
gewichtigsten Teil abschneidet, kann
man
wenn man
Ueberlauffehler
haben.
Die Ueberlauffehler werden hier nicht behandelt: Sie können
durch eine
3.2.).
122
richtige Skalierung
vermieden werden (siehe
Es sei auf die Literatur verwiesen
Kap.
[31,58,59,60].
Die Abschnittfehler sind in ihrer Natur eng mit den Quanti¬
sierungsfehler verwandt: Der Hauptunterschied liegt darin,
dass die Quantisierungsfehler eine kontinuierliche Grösse
darstellen,
Die
die Abschnittfehler
hingegen
Quantisierungsfehler ergeben
schnittfehler,
wenn
die Abschnittfehler in
einen Grenzwert für die Ab¬
Länge des abgeschnittenen Teils des
die
Wortes gegen Unendlich
eine diskrete Grösse.
geht. Aus diesem Grund
der gleichen Weise wie
wird
die
man
häufig
Quantisie¬
rungsfehler behandeln. Insbesondere wird man das Modell des
Quantisierungsrauschens anwenden: Jede Abschnitt- oder Quan¬
tisierungsstelle wird durch eine Rauschquelle ersetzt [61,62].
Die
Quantisierung,
nichtlineare
bzw. der Abschnitt sind aber deterministische
Operationen.
Daher können
typische
nichtlineare
Effekte erscheinen, wie Schwingungen bei Filtern, die ohne
Quantisierung asymptotisch
sollten, wenn der Ein¬
gehalten wird [63, 64, 65, 66J.
stabil sein
gang auf einem konstanten Wert
des Rauschmodells auf den Abschnittfehler in
digitalen Oszillatoren [73, 74] führt zu falschen Schlüssen,
da diese eine stabile GrenzZyklusschwingung ausführen [75,64].
Die
Anwendung
Die deterministische
Betrachtung
der Abschnittfehler führt
aber nur in den einfachsten Fällen von Filtern erster und
zweiter
Ordnung
allgemeinen
zu
Behandlung
brauchbaren Resultaten. Die
Falls führt
zu
Grenzwerten, die allzu
des
pessimistisch
sind [37, 39, 40].
Das Modell des
Quantisierungsrauschens hingegen,
den meisten Fällen eine recht
gute Abschätzung
wertes der Abschnittfehler und hat sich daher
1
C
Es geht soweit, dass der Begriff
den Abschnitt angewendet wird.
liefert in
des Effektiv¬
eingebürgert.
Quantisierung
auch für
123
Bei diesem Modell werden die Abschnittfehler durch additive
unkorrelierte
Rauschquellen ersetzt,
die ein weisses
gleich¬
verteiltes Rauschen erzeugen. Wir werden in den nächsten zwei
Abschnitten (5.2 und 5.3) versuchen, die Annahmen des Rausch¬
modells
zu
verifizieren,
um es
dann im letzten Abschnitt (5.4)
anzuwenden.
5.2
Die
Quantisierung
der
Signale
Begriff Quantisierung bezeichnet man im allgemeinen
den Uebergang von einer kontinuierlichen zu einer diskreten
(d.h. quantisierten) Grösse.
Zur digitalen Signalverarbeitung werden zunächst durch den
Abtastvorgang zeitkontinuierliche Funktionen in zeitdiskrete
Mit dem
überführt. Die dabei auftretenden Effekte interessieren
hier nicht: Sie sind in der
uns
allgemeinen
Literatur über Abtastsysteme hinreichend behandelt worden.
Bei der anschliessenden Analog-Digitalwandlung wird sodann
eine in der Amplitude kontinuierliche Grösse in eine ampli¬
tudendiskrete
umgewandelt:
Man hat
hier eine
Amplitudenquan¬
tisierung.
x
4
Fig.
27
Die
Quantisierung
Es ist bekannt
[67, 68, 61, 69], dass
Fehler in erster
124
Näherung
sich der dabei auftretende
als ein weisses Rauschen
(Quantisie-
rungsrauschen) darstellen lässt, das gleichverteilt und
dem
Eingangssignal
unkorreliert ist. Dieses Modell ist
mit
gültig,
wenn:
-
-
Ä/D-Wandlers
die Charakteristik des
alle Stufen
hoch
sind,
das
eine
genügend
Spektrum
gleich
Eingangssignal
breites und verwischtes
ideal ist, d.h.
wenn
grosse Amplitude und ein
aufweist.
knapp über der Unterlaufgrenze befindet, d.h.
falls das Signal nicht sehr gross gegenüber dem Quantisierungs¬
schritt q ist, dann sind obige Eigenschaften nicht mehr gültig.
Das ist leicht einzusehen für die Verteilung: Falls im Extrem¬
Falls
man
sich
Signalamplitude
fall die maximale
Quantisie¬
Quantisierungs¬
kleiner als der
rungsschritt ist, dann ist die Verteilung der
fehler gleich der Verteilung der Signalamplituden.
Wir wer¬
den hier solche Abweichungen untersuchen, insbesondere die
Abhängigkeit der Quantisierungsfehler vom Eingangssignal.
Als Mass für die Abhängigkeit werden wir den Korrelationskoef¬
fizient nehmen.
5.2.1
Quantisierungsfehler
Korrelation zwischen Signal und
Wir wollen hier den Korrelationskoeffizienten zwischen einem
Signal
x
und dem
Quantisierungsfehler
berechnen. Der Kor¬
e
relationskoeffizient ist definiert als
E{(x-x)(e
r
3
=
o
x
wobei x, bzw.
ungen
'o
-e
3
)}
eq
e~~
q
die Mittelwerte und
(Effektivwerte)
rungsfehler
e
des
Signals
x,
o
x
,
bzw.
bzw. des
o
die Streu-
e
^
Quantisie¬
sind.
125
Der
Quantisierungsfehler
e
e
=
q
q
+»
r
.!f
=
Signals
(x)
Anhang)
dass (siehe
so
ist eine Funktion des
x»(e
-e
s
q
)-f(x)
dx
ax 'ae
wobei
f(x) die Wahrscheinlichkeitsdichtefunktion
ist.
dieses Ausdruckes ist die Kovarianz
Der Zähler
axeq
von x
E{(x-x)(eM -eM )}
=
und soll als erstes berechnet werden.
a) Wertabschnitt
Der Fehler e
unquantisierten
ist der Rest der
Zahl
x
modulo
dem Quantisierungsschritt q (siehe Abschnitt 2.3, sowie
Fig. 24).
e
=
x
-
i-q
Der Mittelwert ist
e
q
1
—
^
'
q
2
X
Fig.
126
28
¦e
=
x
-
<
(i+1)*q
a
2
q
S
/ /
-q
i«q
wenn
0
q
2q
Quantisierungskennlinie
\
i.q
(i+1)q
beim Wertabschnitt
x
die Kovarianz
Man erhält damit für
oxe q
(i + l)q
l
=
j
i.q
i
+°°
/
(x
i.q
-
»
x.f(x)
dx
|).f (x)
a
-
a.
-
-oo
~2
x
dx
+°°
Jx.f(x)
dx
£
-
i
_oo
-
q
^-x
£
-
-
i
(i+1)<3
/
i.q
i.q
Sofern die Dichtefunktion f(x)
wenigstens näherungsweise
i.q
(i+l)q
/
i.q
x.f(x)
x.f (x) dx
im Intervall
[i*q, (i+l)q)
als konstant betrachtet werden kann
(dies ist exakt erfüllt falls f(x) eine Gleichverteilung ist
näherungsweise für die meisten praktischen Verteilungen
falls der Quantisierungsschritt genügend klein gegenüber der
maximalen Signalamplitude ist), gilt
und
(i+Dq
/
(i+Dq
x-f(x) dx
/
f
-
i.q
wobei f.
1
x
dx
=
q2U-»-|)
f
i.q
=
(i+Dq
f f(x)
±
n
q
—
der Mittelwert der Wahrschein-
dx
x.q
•
«
lichkeitsdichte im Intervall
[i.q, (i+l)q)
ist. In diesem Fall
wird
2
xe
q
qJ3 v.c/*2,ix
\ f±(iZ +f)
-q
2
oder
2^-2
=a+x
o
xe
q
x
-
3
-^
2
~
•
x
-
q
M
3
}*¦
r
f.i ,.2
d
»
Li
—)
+
2
-i
127
dx
Betrachtet
man
als weitere
entsprechend Fig. 29,
Spezialisierung
schreiben,
kann man
so
eine
GleichVerteilung
zusätzlich
wenn man
annimmt, dass die Grenzen der GleichVerteilung ganzzahlige Viel¬
fache
q sind
von
|f(x)
e
q
/Ä///
0
(m-n)q
<
n.g
n.c
i
f.l
x
(m+n)q
m-q
=
0
=
m-q
x
ax
Fig.
2« n«q
=
für
m-n<i<m+n
sonst
n
29
dass
so
a
xe
2^-2
+ x
2
'
x
2
n
q
m+n-1
m+n-1
I
L
i=m-n
i=m-n
Es ist
?
7
i=p
i
1
2
2
(q
P) (q
+
•
1)
P +
-
2
und
m+n-1
l
n
i
m+n-1
=
I
v
i=m-n
i-0
m+n-1
m+n-1
l
i=m-n
128
.2
^2
l
i=0
.2
i
m-n-1
.2
I
v
V
-
i
falls Im I
>
In
In|
>
|m|
i-0
n-m
1
2
+
I
i=0
!
2
falls
2
(7)
gilt [41]
Bekanntlich
k. (k+1)
•
(2k+l)
i=0
Beim Einsetzen dieser
einiger Rechnung (sowohl
nach
|nl
Beziehungen
>
|m|)
für
in Gl.
|m|
(7)
|n|
>
bekommt man
wie auch für
für die Kovarianz
2
12
xe
Der Kreuzkorrelationsfaktor ist für diesen Fall
xe
r
xe
G
x
.0
1
2n
e
b) Rundung
Rundungsfehlers e ist symmetrischer
Abschnittfehlers im 2er Komplement: Hier gilt
Die Charakteristik des
als die des
(siehe Abschnitt 2.3, sowie Fig. 30):
x
=
Fig.
30
-
l
q
falls
(i--|)
-q
<
x
<
(i+|)
-q
Rundungskennlinie
129
Der Mittelwert e
ist hier
gleich Null,
Die Kovarianz ist somit
+00
x*(e
axe
-
=
e
q
q
)*f(x)
(i+f)q
l
j x*(x-i-q)
dx
f(x)
dx
(1-2) q
i
(i+ö-)q
+o°
=
/
x
2
f(x) dx
-
l
j
i*q
x'f(x) dx
(i~)q
1
Falls wir auch hier die Dichtefunktion f(x) im i-ten Inter¬
vall als konstant betrachten, gilt
(i+^Oq
1
/
(i+jjq
x
f(x)
dx
-
f.x
1
/
x
dx
=
f.1
q2i
und wir haben dann
3 ,2
q
i
Wir betrachten wiederum den
gleichverteilt gemäss Fig.
130
Fall,
31 sei.
wo
der
richtige
Wert
x
n
X
2 2
q
e
/ ,/
/L
¦7^7
2«n«q
i
n.
Fig.
Die Grenzen der
q
4f(x)
Z. £.
7^7
¦
m .q
n.q
31
GleichVerteilung
sind
so
gewählt
-
wie auch
im Fall des Wertabschnitts -, dass sie auf einem ganzen Viel¬
fachen
halb
von
q
liegen.
Daher sind die beiden Endintervalle
nur
gross wie die andern.
so
(m-n+l/2)q
2 2
rxe
=
q
V""
/
~
m+n-1
Vx
(m-n)q
dx
-
/ f±
q2i
i=m-n+l
(m+n) q
/
f-.
-
x
dx
(m+n-l/2)q
(m-n-t-^) q
x
f(x)
dx
=
Wm-n i}
x
f(x)
dx
=
h fi
(m-n)q
(m+n)q
(m+n--) q
Nach
einiger Rechnung
axe
"
+
(m
bekommt
+ n
man
-
i}
für die Kovarianz
24
q
und für den Korrelationskoeffizient
xe
1
4«n
131
c) Zwischenwerte der Amplitude
jetzt gleichverteilte Eingangssignale betrach¬
tet, bei denen die Grenze der Verteilung ein ganzzahliges
Vielfaches des Quantisierungsschritts ist. Wenn diese Gren¬
zen (in Fig. 32 als Amplitude bezeichnet) beliebig, aber
symmetrisch zum Nullpunkt gesetzt werden, erhält man die
Wir haben bis
Verläufe des Korrelationskoeffizienten, die in Fig. 32 dar¬
gestellt sind.
1/2N
/2N
-s
S
Ä5
A
A
s
A
"
8
S^ö
d
RMPLITUDE
AMPLITUDE
/-IN
/4N
a)
b) VflLUE
R0UND
Fig.
TRUNC,
32 Korrelationskoeffizient
zwischen Abschnittfehler und
Signal in
amplitude
Funktion der
Signal¬
bei verschiedenen
Abschnittsarten:
PMPLITUOE
a) Rundung
.C)
Man sieht aus
b) Wertabschnitt (2er-Komplement)
c) Betragsabschnitt (ler-Komplement)
MflGNo TRUNC.
Fig. 32, dass bei der Rundung und
beim Wertab¬
schnitt der Korrelationskoeffizient zwischen den beiden Grenzen
2-n
und
den Wert
132
4«n
//ö'
liegt.
wenn
Beim
Betragsabschnitt
die Aussteuerung
strebt er gegen
symmetrisch
ist
(gleich-
positive wie negative Werte). Ist die Aussteuerung
nicht mehr symmetrisch, wird dieser Grenzwert kleiner.
Weist das Signal nur positive oder negative Werte auf, ist
der Korrelationskoeffizient gleich wie beim Wertabschnitt.
viele
5.3
Signale
Abschnittfehler der
Wir haben
wir gezwungen sind,
Orten in
die
gesehen, dass
Digitalfiltern
Wortlänge
zu
an
bestimmten
beschränken,
so
dass Abschnittfehler unvermeidlich sind.
Wirkung der Abschnittfehler bei der Festkommaarithmetik
zu berechnen, benützt man das Modell des Quantisierungsrau¬
schens. Man nimmt dabei an, dass die für die Quantisierung
geltenden Voraussetzungen auch für den Abschnitt gelten.
Wir werden in diesem Kapitel untersuchen, wie weit diese
Annahme erfüllt ist. Eine der Abweichungen ist, dass die
Um die
Abschnittfehler eine diskrete Grösse darstellen: Ihre Ver¬
teilung ist eine diskrete Verteilung. Daraus folgt, dass der
Mittelwert und die Varianz
Bits
Die
abhängen.
Verteilung
von
der Zahlen nach einer
Lücken auf. Wenn
sie sofort
man
abgeschnittenen
der Anzahl der
Multiplikation
abschneidet,
weist
dann kann das
Verhalten der Abschnittfehler wieder von den Annahmen für
das Modell des Quantisierungsrauschens abweichen. Wenn man
dagegen
die Zahlen erst nach der Addition abschneidet, dann
weniger auf¬
Quantisierungs¬
sind die Chancen gross, dass die Lücken mehr oder
gefüllt
sind und dass daher das Modell des
rauschens besser stimmt.
5.3.1
Die
Verteilung
Wir wollen hier die
der Abschnittfehler
Verteilung
der Abschnittfehler betrachten.
unquantisierte
Zahl
x
fallsvariable. Dann ist der Abschnittfehler
e
Dazu nehmen wir an, die
dieser Zufallsvariablen
sei eine Zu¬
q
eine Funktion
133
eq
=
g(x)
Wir wollen die
Verteilung der Abschnittfehler P{e }
in Funktion der Verteilung der Eingangswerte P{x} kennen.
Wir haben gesehen, dass alle Zahlen, die sich um ein ganz¬
zahliges Vielfaches der Quantisierungseinheit der abge¬
schnittenen Zahlen q unterscheiden, den gleichen Wert
des Abschnittfehlers ergeben. Deswegen ist
P{eq]
=
l
i
(Es ist dabei
P{xi|g(xi) eq}
=
=
l
n
P{eg n-qq}
+
(8)
bemerken, dass (8) beim Betragsabschnitt
(Einerkomplement) separat für die positiven und für die
negativen Werte von x (und e ) gilt.)
zu
q
unabgeschnittene Zahl alle mögliche Werte annehmen
kann und diese alle die gleiche Häufigkeit besitzen, dann
ist leicht einzusehen, dass die Abschnittfehler auch gleich¬
Wenn die
verteilt sind.
Wenn die Zahlen nicht mehr
Verteilung
lung aufgefasst
ihre
als eine
gleichverteilt sind,
abgetastete
aber immerhin
kontinuierliche Vertei¬
werden kann (insbesondere sollen keine Lücken
im Wertebereich auftreten), dann ist die Lage ungefähr gleich
Quantisierung kontinuierlicher Grössen. Für die¬
sen Fall wurde gezeigt [61, 68], dass die Verteilung der
Quantisierungsfehler gegen eine Gleichverteilung strebt
und zwar recht schnell -, wenn die Signalamplitude gross
gegenüber dem Quantisierungsschritt wird.
Falls die Verteilung der Zahlen vor dem Abschnitt Lücken
aufweist, kann die Verteilung der Abschnittfehler erheblich
von der GleichVerteilung abweichen. Die genaue Form der Ver¬
teilung hängt davon ab, wie sich die Lücken der Eingangsver¬
teilung bei der Summenbildung nach Formel (8) überlagern,
d.h. von der Lage der Lücken gegenüber dem durch den Quantiwie bei der
-
134
sierungsschritt
q
abgeschnittenen
der
Zahlen
gegebenen
Wir werden solchen Fällen im Abschnitt 5.3.3.1
begegnen.
Raster,
Wir
werden dort sehen, dass in den meisten Fällen immerhin die
über einige benachbarten Werte gemittelte Verteilung der
Abschnittfehler
angenähert
GleichVerteilung
eine
ist.
der Abschnittfehler nähert sich also in den
meisten Fällen einer diskreten Gleichverteilung. Ihre Gestalt
hängt von der Darstellungsart der negativen Zahlen ab.
Die
Verteilung
(n
ist die Anzahl
abgeschnittene Bits.)
Wertabschnitt
Die
in
1
1
beim Wertabschnitt ist
Verteilung der Abschnittfehler
Fig. 33 dargestellt.
P (e<
-n__
q
,'
0 rr~
N =2
Fig.
33
<k
*q
Verteilung
q
der Abschnittfehler beim Wertabschnitt
Betragsabschnitt
Die
Verteilung hängt
vom
positiven
Anteil der
und
negativen
Zahlen ab. Wenn die Wahrscheinlichkeit für das Auftreten von
positiven
treten
die auf
Zahlen p
beträgt
=
pANIMM
"^
34
diejenige
für das Auf¬
1
negativen Zahlen p_
p ist, dann erhält man
Fig. 34 dargestellte Verteilung der Abschnittfehler.
von
2~nq P(eq)
Fig.
und daher
Verteilung
-
¦p
2"nq
*I
6C
der Abschnittfehler beim
Betragsabschnitt
135
Rundung
Rundung erhalten wir die
Verteilung der Rundungsfehler.
Bei der
i
()
in
Fig.
35
dargestellte
P< ec
o"na
2 q
i
i
i
i
"V 2
Fig.
V2
0
eq
Verteilung der Rundungsfehler
35
Verteilung an den Grenzen hängt
davon ab, wie die Rundung der Zahlen ausgeführt wird, die
sich in der Mitte des resultierenden Quantisierungsinter¬
valls befinden
(x
(2n+l).q /2). Dies ist insbesondere
von der Art der Darstellung negativer Zahlen abhängig
Das genaue Verhalten der
=
(siehe Fussnote 10).
5.3.2
Die Varianz der Abschnittfehler
Die Varianz der Abschnittfehler ist definiert als
a
wo e
2
e„
=
=
q
E{(eq
—
-
e
q
x
e
ist, haben
l
136
2
}
=
2
E{eqs}
-
—2
e
q
E{eq } der Mittelwert der Abschnittfehler
der Abschnittfehler
Variablen
)
P(x)
eine Funktion der
unabgeschnittenen
wir für den Mittelwert [70]
-eq(x)
ist. Da
und für den
e2q
{e2}
q
E
=
quadratischen
7L
=
Mittelwert
p(x)
-e2(x)
q
X
p(x) die Wahrscheinlichkeitsfunktion
unabgeschnittenen Variablen x ist.
wo
der (diskreten)
Mit der Annahme, dass die Abschnittfehler
gleichverteilt
sind, kann man die Varianz direkt berechnen. Wir haben ge¬
sehen, dass im Falle der Rundung und des Wertabschnitts gilt
P(eq)
wo n
2_nq
=
die Anzahl der
q
Wir wenden diese
abgeschnittenen
Beziehung
Bits ist.
für unsere drei Fälle an.
Wertabschnitt
Aus der
gesehen
der Abschnittfehler, die wir im Kap. 5.3.1
haben, erhalten wir für den Mittelwert
Verteilung
-¦£(-.- 2"»,)
^
und für den
e2q
quadratischen
2nq_1
—
=
2"nq
l
L
i=0
q
.i.2_nq)2
(q^qq .i.2
Die Varianz wird damit
er
e
=
q
2
e^
q
-
—2
e
q
=
2a_M
t^-(1
1Z
=
q2
qa
¦£6
(2
..
~-n„
3.2~nq
.
-
+
.-2n,
2
(vgl. [71, 72J)
2
2
Mittelwert
-
i~2'nr,\
2
q)
gross wird, dann konvergiert die Varianz gegen den Wert der Varianz der Fehler bei
der Quantisierung einer kontinuierlichen Grösse
Wenn die Anzahl
abgeschnittene
Bits n
137
BL'O
96T'0
SZ'9
9S'T
6e'o
83'0
890'0
Z.TO'0
OOT
%00T
OOT
I/j£
-
T366'0
0866'0
SZ.£6'0
fr*86'0
T966'0
3
£
fr
T 'CR*!
-
Z896'0
ßunnsj^g jap pun £J zubt-iba aap uoa
ßunnaj^s -isp pun C» o zueTjr-sA jap ßunqoTewqv
-
T
u
9U9^;TUUPsaßqe
Xqezuv
S1TH
b
S/L'O
z
998'0
o
-
=
0
ZX
0
e/3/&
D
-
T\
0
jraTHajsßunjSTST^irenö J9p
t^Tuqosq^jraM uiTsq aaTqaj^-FuipsqY aap o
Z'£
SZ'T
%00T
ßunqofawqv
9P
SZ
e/3/E>
ei/zb
n/jbV
V'£X
C/3/-Ö-D
(b.uz-7
lim
o
q
eo^
=
2
rk_
l2
C-
j2
Die Konvergenz der Varianz der Abschnittfehler gegen den
obigen Grenzwert ist sehr rasch: Nach einigen Bits wird die
wie in Tab. 1 ersichtlich ist.
Differenz
vernachlässigbar,
Betragsabschnitt
hängen Mittelwert und Streuung
Hier
den Anteilen der
positiven
und
der
Abschnittfehler
von
Zahlen ab. Der
negativen
Mittelwert beträgt
=
q
wo
\.q-q
2
die
p
In diesem
a2
=
q
-
2"nq)-(2-p+
Häufigkeit
der
Fall bekommt
q2[P+d
+2
(1
-
p+>
(1
na""°°
Die auf
von p
+
-
p+
-
1)•
für die Varianz:
2-2*nq)
+
^(1 2-2>nq)
-
+
-
abgeschnittenen
die Varianz gegen
a2
Zahlen ist (0
(p2 l)-2"nq]
Wenn die Anzahl
lim
1)
positiven
man
+
-
=
q
q2 [P+d p+)
q
—<L_
2-/3
-
+
Bits erhöht
wird,
dann strebt
3^]
bezogene Streuung
ist in
Fig.
36
in Funktion
aufgezeichnet.
139
.2
.1
.6
ANTEIL P0S= ZRHLEN P+
Fig. 36
Relative Streuung der Abschnittfehler bei Betrags¬
abschnitt in Funktion des Anteils positiver Zahlen p
Rundung
Für die Varianz der
Rundungsfehler
wird der gleiche Ausdruck
wie beim Wertabschnitt erhalten
2
q
7q
->
~*
ae q
"
12
(1
ii
"
-i~n
2 q)
x
Der Mittelwert ist im
der
Wertrundung (siehe
allgemeinen
Fussnote
Null oder sehr klein. Bei
10)
wird ein kleiner Mittel¬
wertanteil erhalten
e^
5.3.3
q
=
-
o
2
q
Der Abschnitt des Resultates einer
Wir betrachten
hier,
geschieht,
Multiplikation
das Resultat der
Multiplikation einer Variablen mit einer Konstanten abschnei¬
det. Die Betrachtungen werden für den Fall der Multiplikation
zweier positiver Zahlen gemacht. Die
Erweiterung auf die ande-
140
was
wenn man
ren
Fälle ist unter
Berücksichtigung dessen,
was
in den
früheren Abschnitten gesagt wurde, leicht durchführbar.
©
Fig.
37
I
Der Abschnitt nach einer
filter
Multiplikation
in
Digital¬
folgenden Ueberlegungen angenommen, dass das
Resultat der Multiplikation auf das Format des variablen
Faktors abgeschnitten wird. Das ist sicher der Fall, wenn
die Multiplikation in einer Rückkopplungsschleife geschieht,
was sehr häufig in rekursiven Filtern vorkommt (siehe Fig. 37).
Dieser Spezialfall ist aber durch eine einfache Anpassung der
Kommastelle des konstanten Faktors leicht auf den allgemeinen
Es wird in den
zu
Es
übertragen.
ist bekannt,
dass die
Multiplikation
zahlen (ohne Vorzeichen) ein Resultat
zahl
gleich
zweier Festkomma¬
ergibt,
dessen Stellen¬
der Summe der Stellenzahlen der Faktoren ist.
dargestellte Situation.
Vom Resultat y der Multiplikation werden die letzten n Bits
abgeschnitten. (Für die Rundung gelten die gleichen Ueber¬
legungen; nur ist ihre Charakteristik verschoben.)
Wir betrachten einfachheitshalber den Faktor x als ganzzahlig
und verlangen, dass das abgeschnittene Resultat y auch ganzzahlig sei. Es folgt, dass der Koeffizient c gebrochen sein
Wir haben die in
muss, und
(LSB)
Bit
qc
=
zwar
Fig.
34
befindet sich das Binärkomma
n
q
Bits vom letzten
weg. Das LSB des Koeffizienten hat den Gewicht
2"n<3.
141
n
X
*¦
¦
+
1
,
n
c
+
qc
•
n
q
nx+ nc
qc
+
Y' y.
|.
0*0
* \>
Fig.
38
n
q
Wortformate in der Anordnung nach Fig. 37
ganzzahlig ist, dann
geschnittene Teil gleich Null, und wir haben
Wenn der Koeffizient
bleibt der ab¬
c
keine Abschnitt¬
fehler.
Der
Abschnittfehler
hängt
nur vom
Teil des Koef¬
gebrochenen
fizienten ab. Wir werden sehen, dass er unabhängig vom ganz¬
zahligen Teil ist. Je nach dem Wert des gebrochenen Teils
des Koeffizienten ist ein bestimmter Zusammenhang zwischen
Abschnittfehler und Signalwert vorhanden.
Fig.
39
zeigt
den Abschnittfehler e
abgeschnittenen
e
Resultats der
q
in Funktion des nicht
Multiplikation
i
jL
y.
c
-
c
¦
c
-=
y=c.x
Fig.
142
39
Charakteristik des Abschnittfehlers
e
l.qc
2.qc
3.q
Wir stellen fest, dass in
fizienten
c
nicht
Fig.
jeder Punkt,
39
je
nach dem Wert des Koef¬
sondern
nur
jeder
(c/qc)-te
c«x angenommen werden kann.
vom Ausgang y
Wir zeigen nun das grundsätzliche Verhalten anhand einiger
des
leichtverständlicher Beispiele mit kleiner Bitzahl
=
gebrochenen
nq
Teils.
Nehmen wir zuerst an, dass der Koeffizient c
Dies ist der Spezialfall, wo alle Punkte der
abgeschnittenen Ausgang y angenommen
ist in Fig. 40 dargestellt.
gleich
Fig.
l-qc sei,
39 vom
un-
werden. Diese Situation
,e
e
/
y l .q
=
Fig.
40
Abschnittfehler bei
c
=
l«q.
ist, dann wird jeder zweite Punkt
in Funk¬
übersprungen, und wir haben in der Charkteristik von
Wenn der Koeffizient
tion von
x
die
c
doppelte
2-qc
=
Anzahl
von
eq
Sägezahnperioden (Fig.
41).
i,e
i,e
/
y=2.q
Fig.
.x
Abschnittfehler bei
41
c
=
2"qc
3-q c ist, dann sieht die Kennlinie schon
unregelmässiger aus (Fig. 42)•
Wenn
c
=
etwas
143
7
y=3*q
Fig.
Mit
Abschnittfehler bei
42
c
=
*x
1
-
q
c
hat man die in
3*q
=
Fig.
43
dargestellte Lage
y=(l-q ).x
Fig.
43
Abschnittfehler bei
c
1
=
-
q
leicht sehen, dass der Verlauf von e für positive
q
Koeffizienten gleich k«q und n
k
(n,
k-q
ganz) eine gewisse
Symmetrie aufweisen: alle Punkte ^ 0 sind symmetrisch geg.
Man kann
-
Sq
=
1
2'
Die Anzahl der
möglichen Werte,
die der Abschnittfehler 'e
q
annehmen kann, ist von der effektiven Länge des gebrochenen
Teils des Koeffizienten c, d.h. von der Anzahl der Bits vom
Binärpunkt
letzten Bit, das gleich eins ist, abhängig.
Da die Varianz der Abschnittfehler von der Anzahl der Werte
bis
zum
abhängt, die der Abschnittfehler annehmen kann (siehe Abschnitt
5.3.2), so folgt, dass sie auch vom Koeffizienten abhängig ist.
144
Diese
Abhängigkeit
ist aber im
allgemeinen
klein (siehe auch
Abschnitt 5.3.3.2).
Mit
sieht man, dass der Verlauf der
durch den gebrochenen Teil des Koeffizienten
obiger Betrachtungsweise
Abschnittfehler
nur
bestimmt wird: Der ganze Teil des Koeffizienten bewirkt nur,
dass eine ganze Zahl von Perioden der Abschnittfehlercharak¬
teristik in Fig. 39
Obige
übersprungen
werden.
Resultate lassen sich leicht auf andere Abschnittfälle
(negative Zahlen, Rundung) verallgemeinern. Man muss nur in
Fig. 39 die entsprechende Abschnittcharakteristik einsetzen.
In der nächsten Figur (Fig. 44) sind die Abschnittcharakteri¬
stiken für drei Abschnittsarten und für verschiedene Koeffi¬
zienten bei einer erhöhten Anzahl abgeschnittenen Bits
(n
=
q
8) dargestellt.
44 sehen wir, dass bei Koeffizienten, die sich
Aus
Fig.
von
einer ganzen Zahl
rer
Zusammenhang zwischen
unterscheiden, bereichsweise
dem
Signal
vor
der
wenig
ein linea¬
Multiplikation
und dem Abschnittfehler existiert. Diese Bereiche werden mit
wachsendemAbstand des Koeffizienten von einer ganzen Zahl im¬
mer kleiner. In der Mitte zwischen zwei ganzen Zahlen er¬
scheint meistens ein Abschnittfehler in Funktion des Eingangs¬
signals als ein regelmässiges Punktmuster. Es kann daher an¬
genommen
so
werden,
dass in der Mitte
genügend "Unordnung" herrscht,
gut erfüllt werden,
ganzzahliger Koeffizienten Abweichungen zu
dass die Annahmen des Rauschmodells dort
während in der Nähe
erwarten sind. Wir werden das in den nächsten Abschnitten
hand einiger
5.3.3.1
Beispiele
Verteilung
ansehen.
der Abschnittfehler
Wir werden hier anhand eines
Verteilung
an¬
Beispiels zeigen,
wie sich die
der Abschnittfehler bei verschiedenen Koeffizienten
verhält. Zur Berechnung wurde Gl. (8) in Abschnitt 5.3.1
ver-
145
Rundung
C0EFF»
=
o002B
C0EFFD
=
o002B
VflLUE TRUNCe
C0EFF-,
=
o002B
MflGNo TRUNC«
R0UND
Wertabschnitt
Betragsabschnitt
Fig. 44a) Charakteristik des Abschnittes nach
plikation mit c
l.q c bei n =8
=
q
146
einer Multi¬
Rundung
C0EFFc
004B
R0UND
Wertabschnitt
C0EFFo
=
o004B
VflLUE TRUNC.
C0EFF.
=
«004B
MflGNo TRUNC.
Betragsabschnitt
Fig.
4 4b)
Charakteristik des Abschnittes nach einer
Multiplikation
mit
c
=
2.q
147
Rundung
C0EFF«
=
0OO6B
C0EFF„
=
.006B
VRLUE TRUNC.
C0EFFo
=
0OO6B
MflGN. TRUNC.
R0UND
Wertabschnitt
Betragsabschnitt
Fig. 44c)
Charakteristik des Abschnittes nach einer
Multiplikation
148
mit
c
=
3.q
Rundung
^j-
R0UND
:0EFFo
=
o552B
"0EFFa
=
„552B
VflLUE TRUNCc
o552B
MflGNo TRUNCc
Wertabschnitt
Betrabsabschnitt
:0EFFa
Fig. 44d)
=
Charakteristik des Abschnittes nach einer
Multiplikation
mit
c
=
181.q
149
Rundung
C0EFFD
=
„776B
R0UND
C0EFF„
=
0776B
VRLUE TRUNC-
„776B
MflGNo TRUNCc
Wertabschnitt
Betragsabschnitt
C0EFFo
Fig. 44e)
Charakteristik des Abschnittes nach einer
Multiplikation
150
=
mit
c
=
255.q
=
1
-
q
wendet. In Fig.
sind die
45
Verteilungen aufgezeichnet.
Als
Eingangsverteilung wurde hier eine Gaussverteilung mit der
Streuung a
1/4 und dem Mittelwert 0 genommen. Die Wortlänge
der Signale und der Koeffizienten beträgt dabei 7 Bits. Für
die Rundung wurden die gleichen Resultate experimentell, d.h.
=
durch Messungen
an
Hardware,
realisierter
von
Eckhardt [76]
gefunden.
Aus
Fig.
len kann
-
45 und
anderen, hier nicht abgebildeten Beispie¬
aus
folgendes festgestellt
werden:
Koeffizienten, die sich sehr wenig von einer ganzen Zahl
unterscheiden, kann die Verteilung der Abschnittfehler sehr
Bei
verschieden
von
GleichVerteilung
einer
sein. Insbesondere
Verteilung der Abschnittfehler ähnlich aus wie
Eingangsverteilung, wenn der fraktionäre Teil des Koef¬
sieht die
die
fizienten
so
klein
ist, dass
er
allein einen Unterlauf
er¬
zeugen würde.
-
Sobald aber der Koeffizient etwas mehr
abweicht
eine
Rundung
gute Näherung
einer ganzen Zahl
Unterlaufgrenze),
Betragsabschnitt sehr schnell
die oben erwähnte
(einige Male
wird bei der
von
und beim
GleichVerteilung erhalten.
der
fizienten in der Nähe eines einfachen Teilers
eines Vielfachen davon
(d.h.
3/4, ...)
grössere
in der Nähe von
von
Bei Koef¬
1 oder
1/2, 1/4,
sichtbare Abweichung von
der GleichVerteilung. Wenn aber die Verteilung über ein
Paar benachbarten Werte gemittelt wird, ergibt sich wieder
-
hat
man
eine
eine
gute Näherung
Beim
Betragsabschnitt
GleichVerteilung.
der
ist die
teilung erheblich grösser.
Abweichung
Das ist durch die
schen Abschnittfehler und Polarität des
(siehe Abschnitt 2.3.1)
zu
von
der Gleichver¬
Beziehung
zwi¬
Eingangssignals
erklären.
151
Rundung
C0EFFo
R0UND0FF ERR0R
o004B
=
R0UND
Wertabschnitt
0.00
C0EFFo
R0UND0FF ERR0R
=
„004B
VflLUE TRUNCo
Betragsabschnitt
1.0
C0EFF„
Fig. 45a)
Verteilung
(Hier
152
ist
-.5
0.00
R0UND0FF ERR0R
=
o004B
MfiGNo TRUNCo
der Abschnittfehler bei c
n
q
=
7)
=
l.q
Rundung
3.00
R0UND0FF ERR0R
R0UND
,010B
C0EFF,
Wertabschnitt
C0EFFo
R0UND0FF ERR0R
=
VflLUE TRUNCo
oOlOB
Betragsabschnitt
-5
0.00
C0EFFo
Fig. 45b)
Verteilung
R0UND0FF ERR0R
=
oOlOB
MflGNo TRUNCo
der Abschnittfehler bei
c
=
2.q
153
Rundung
JVOQ
C0EFFo
R0UND0FF ERR0R
=
o404B
R0UND
Wertabschnitt
0.00
C0EFFD
R0UND0FF ERR0R
=
o404B
VflLUE TRUNC-
Betragsabschnitt
Q.00
C0EFFD
Fig. 45c)
154
Verteilung
R0UND0FF ERR0R
=
a404B
MflGNo TRUNCo
der Abschnittfehler bei
c
=
65.q
Streuung der Abschnittfehler
5.3.3.2
vorherigen Abschnitt haben wir gesehen, dass die Vertei¬
lung der Abschnittfehler bei gewissen Koeffizienten von
einer Gleichverteilung abweichen kann. Die Verteilung an
sich ist aber nicht wesentlich für das Rauschmodell; sie
Im
Berechnung der Streuung der Abschnittfehler.
dient zur
wollen wir daher den Einfluss des Koeffizienten der
Hier
Multipli¬
kation auf die Streuung der Abschnittfehler betrachten. In
d.h.
Fig. 46 wurde die relative Streuung der Abschnittfehler
-
die Streuung
teilung
q//T2
bezogen auf
-
den idealen Wert für die Gleichver¬
gleiche
aufgetragen.
in Funktion des Koeffizienten für das
gaussverteilte Eingangssignal
wie in
Fig.
45
sieht, dass bei der Rundung und beim Wertabschnitt die
relative Streuung praktisch überall 1 beträgt. Kleine Ab¬
weichungen hat man bei gewissen einfachen Teilern von 1 und
Man
ihren Vielfachen (also bei 1/2, 1/4, 3/4, 1/8, 3/8, 5/8, 7/8):
Diese Abweichungen sind nicht durch Abweichungen von der Gleich¬
verteilung, sondern durch die verkürzte effektive Länge des
Wortteils (siehe Abschnitt 5.3.2) zu erklä¬
ren. Auch in der Nähe von ganzzahligen Koeffizienten sind Ab¬
weichungen vorhanden: In der Unterlaufzone ist die Streuung
abgeschnittenen
der Abschnittfehler
gleich
dem Produkt der
Eingangsstreuung
mit dem Koeffizienten.
Beim
Betragsabschnitt
Wert
(der
5.3.3.3
Das
hier
2q//l2
sind die Abweichungen vom theoretischen
beträgt) bedeutend grösser.
Korrelation
Quantisierungsrauschen
trum
sollte ein weisses
Leistungsspek¬
aufweisen,und die einzelnen Rauschquellen sollten
sich und mit dem
hier die
unter
unkorreliert sein. Wir wollen
dieser Annahmen kurz untersuchen.
Eingangssignal
Gültigkeit
155
rl-
2.0
Rundung
5
"*
>
—
¦
o
n
m
A
/
Vi
8
"-0.00
•>
.1
.6
CBEFFICIENT
7 BITS
.'«
1
1.
R0UND
Wertabschnitt
8
3
""O-OO
7 BITS
°-
TS
3
CBEFFICIENT
VflLUE TRUNCo
».
Betragsabschnitt
""s
s
CBEFFICIENT
7 BITS
Fig.
46
Relative Streuung (1
nach einer
zienten.
156
=
3
MflGNo TRUNCo
q
Multiplikation
//12)
der Abschnittfehler
in Funktion des Koeffi¬
In
Fig. 47
und 48 ist der Korrelationskoeffizient zwischen
Eingangssignal
Abschnittfehler und
in Funktion des Koeffizienten
Multiplikation dargestellt, in Fig. 47 für ein gleichver¬
teiltes Eingangssignal, in Fig. 48 für ein gaussverteiltes
1/4. Der Korrelationskoef¬
Eingangssignal mit der Streuung o
fizient wurde nach der im Anhang dargestellten Methode nume¬
risch berechnet. Die Wortlänge der Signale und des Koeffizienten
beträgt hier 8 Bit.
Es ist ersichtlich, dass bei Wertabschnitt und bei Wertrundung
der
=
der Korrelationskoeffizient zwischen Abschnittfehler und Ein¬
fast überall sehr klein ist, ausgenommen in der
ganzen Zahlen und von einfachen Teilern von 1 und
gangssignal
Nähe
von
(1/2, 1/3, 2/3).
ihren Vielfachen
In der Nähe der ganzen Zahlen
fällt der Korrelationskoeffizient mit l/2n beim Wertabschnitt
und l/4n bei Wertrundung, wobei n der Abstand von der ganzen
Zahl
ist,
ausgedrückt,
bestätigt.
zienten
Beim
was
Betragsabschnitt
grösser
Quantisierungsstufen q des
die Ausführungen im Abschnitt
in Einheiten der
als
aus
5.2.1
ist der Korrelationskoeffizient viel
Ueberlegungen
den
Koeffi¬
von
Abschnitt 2.3.1
zu er¬
warten ist. In der Tat hat der Korrelationskoeffizient unge¬
fähr den Wert
0,7.
die meisten Werte
Bei der
liegen ebenfalls
des Korrelationskoeffizienten um Null, doch
sind hier bedeutende
fachen Teilern
Betragsrundung
von
1
Abweichungen bei den Vielfachen von
(1/2, 1/4, 3/4, 1/8, 3/8, 5/8, 7/8)
bemerken. Dies lässt sich damit
ein¬
zu
erklären, dass die Rundung
von
Werten, die ungerade Vielfache des halben resultierenden Quan¬
tisierungsschrittes sind, vom Vorzeichen abhängt. Bei einer
kleineren effektiven Wortlänge treten diese Werte häufiger auf.
157
^¦»
4 >«i> U
4
,
°
J
'
8 BITS
CBEFFICIENT
«,-*
'c^
Fig.
J
2-C0MPLo R0UND
Wertrundung
47
J*
¦
*
l'»P<fc fl J—
J
8 BITS
MHGNo TRUNCo
Betragsabschnitt
CBEFFICIENT
B7d
t >¦
CBEFFICIENT
VflLUE TRUNCo
¦t»'"t.i»-Js "'yi ^ 'y^ f*
II
S|
Wertabschnitt
,-.«i.i>*i\<ih'*'*-
f^«)¦¦J
s
£
j
%*Y*f I
% J^>T^T^W^l^l•l'py'^
^^r
Vr'^W'T'
I
tBEFF CIENTl
'
fJ
•
8 BITS
l-C0MPLo R0UND
Betragsrundung
Korrelationskoeffizient zwischen Abschnittfehler
Multiplikation und Eingangssignal des
Multiplikators in Funktion des Koeffizienten.
Eingangssignal gleichverteilt.
nach einer
158
Das
5.4.
Quantisierungsrauschen
Wir werden in diesem
Kapitel
die
in
Digitalfiltern
Abschnittfehler
am
Ausgang
Filtern berechnen", unter Annahme der Gültigkeit
des Modells des Quantisierungsrauschens, d.h. dass die Ab¬
schnittfehler durch
digitalen
von
-
additive
ersetzt werden können, die
Rauschquellen
-
ein weisses Rauschen erzeugen
-
mit der Varianz o
-
wobei die
xi
dass
=
q2
-f^
12
,
Rauschquellen untereinander
Wir haben in den
von
2
vorherigen
unkorreliert sind.
zwei Abschnitten die
Abweichungen
obigen Annahmen untersucht. Wir haben dabei gesehen,
diese bei der Rundung und beim Wertabschnitt meistens
den
vernachlässigbar sind.
die mittlere Amplitude
Zudem
gestattet
dieses Modell leicht
der Abschnittfehler
zu
bestimmen und
damit bekommt, weisen meistens eine genügende
bis gute Uebereinstimmung mit Simulations- und Messresultaten
auf.
Wir ersetzen also jede Abschnittsteile durch eine additive
so dass am Schluss des abschnittbehafteten Fil¬
die Werte, die
Rauschquelle,
ters durch ein
quellen
man
lineares Filternetzwerk mit zusätzlichen Rausch¬
Quantisierungsrauschens am
Superposition der durch die einzelnen
ersetzt wird. Der Wert des
Filterausgang wird durch
Quellen verursachten Rauschanteile berechnet.
4.5.1
Stationärer Wert des
Quantisierungsrauschens
Wir werden hier den Mittelwert und die Varianz des Rundungs¬
rauschens am Ausgang eines digitalen Filters im stationären
Zustand berechnen. Diese Berechnung wurde in der Literatur für
den Fall mit Mittelwert Null oft ausgeführt [15,16,36,48,62,
73,74,79]. Wir werden hier den etwas allgemeineren Fall behan¬
deln, dass ein Mittelwert ungleich Null vorhanden ist,
der Wertrundung der Fall ist.
was
bei
159
Anteil einer
Rauschquelle
Wir berechnen zuerst den Anteil einer
Rauschquelle
Mittelwert und
am
rauschens. Er ist offenbar
beliebigen,
der i-ten
der Varianz des Ausgangs¬
an
der
Uebertragungsfunktion H.(z)
betrachteten Rauschquelle bis zum Fil¬
von
Einspeisepunkt der
terausgang abhängig.
Das Leistungsspektrurader Rauschquelle ist die Ueberlagerung
des Spektrums eines weissen Rauschens mit Mittelwert 0 und
vom
eines "Gleichstrom"anteils
Sx.x.(fT)
=
+^x
'*0)
6(0) die Dirac'sche Stossfunktion,
wo
n
4.
11
11
i
der Mittelwert des
a
2
xi
die Varianz und
Quantisierungsrauschens
sind,
Der Mittelwert wird durch ein lineares
System
tragungsfunktion
übertragen [70].
r\
=
y
n
x.
.
H.
i
bei der Frequenz Null
(z)
n
=
•
x.
H.
z=l
1
mit der Ueber¬
(fT)
f=0
des Ausgangssignales y und
Leistungsspektrum S
demjenigen des Eingangssignals x eines linearen Abtastsystems
mit der Uebertragungsfunktion H(z) existiert bekanntlich [30,70]
die Beziehung
Zwischen dem
S
yy
(z)
=
S
xx
(z)
•
H(z)
•
H(z-1)
oder auf dem Einheitskreis der z-Ebene (S(ojT)
=
s(z)
z
SyyUT)
160
=
Sxx(wT). |H(WT) |2
=
eJjo)T
LeistungsSpektrums
Autokorrelationsfunktion (Wiener-Kintschin)[70]
Die inverse z-Transformierte des
R
yy
Da
(kT)
S
-zk
yy
(z)
x
dz
Iz|=l
die Autokorrelationsfunktion der Erwar¬
definitionsgemäss
Folge y(nT)
verschobenen Folge ist, d.h.
Produktes der
tungswert des
um
i
-£-21T3 y
=
kT
R
yy
(kT)
=
Mittelwert der
yy
Der
(0)
=
yy
(0)
=
E{y2(nT)}
Nullpunkt
=
a2y
^-r
2.T-3 <j>
S
v
yy
(z) *z~
Daraus
a
2
folgt
=
R
yy
y
=
=
=
z
eDÜ)T
e3*
=
bekommt
0
yy
UT) d(ü)T)
S
=
0
yy
-
n
2
y
[60]
(fT) d(fT)
der Wert der Varianz des Rauschens
(0)
man
1
S
tz
2 tt
demzufolge
dz
2tt
(0)
quadratische
=1
Durch die Substitution
yy
der
n2y
+
Mittelwert des Rauschens ist
z
R
gleichen,
Folge y(nT)
quadratische
R
mit der
E{y(nT)-y[(n+k)T]>
ist der Wert der Autokorrelation am
R
ist die
am
Ausgang
=
/ Svv(fT) |H(fT)
|2
d(fT)
-
[n
H(0)]2
161
1
a2|H(fT)|2 d(fT)
J
o
X
Systeme
Da wir
+
nJ|H(0)|2 n2H2(0)
-
X
X
mit reellen Koeffizienten
betrachten, ist die
Frequenz Null reell. Deswegen
Uebertragungsfunktion bei der
beträgt die Varianz des Anteils am Quantisierungsrauschen
am Filterausgang verursacht durch die i-te Rauschquelle
1
2
2
Gy* Gx.
=
1
x
,
o
|H.(fT)|2 d(fT)
Die Varianz des
Quantisierungsrauschens am Filterausgang wird
durch den quadratischen Mittelwert des Amplitudenganges be¬
stimmt. Sie ist unabhängig vom Mittelwert des Rauschens.
Quantisierungsrauschen
Gesamtes
Wir haben das abschnittbehaftete Filter durch ein lineares
Rauschquellen ersetzt. Daher
Superposition der durch die
Abtastnetzwerk mit zusätzlichen
kann das Gesamtrauschen durch
einzelnen
Rauschquellen
verursachte Rauschanteile bestimmt
werden.
Der Mittelwert des
gesamten Rauschens
ist daher die Summe
der Mittelwerte
L
y
yl
i
Die Varianz des Gesamtrauschens ist
allgemein
die Summe der
Varianzen der einzelnen Anteile und der Kovarianzen zwischen
den Anteilen
o
2
=
Ya2+2V
1
162
i-1
So
j=i+l
1
3
Wir haben aber angenommen, dass die einzelnen
Quellen
unter¬
einander unkorreliert sind. Somit werden die Kovarianzterme
gleich Null,und
die gesamte Varianz wird
der Varianzen der Anteile
o2
x
=
Y
i
2
wo
"
q. der
Beim
1
qi
°Y
l "12"
werden. Das wurde in
[77]
für den
der Rundung
H.(fT)|2 d(fT)
Quantisierungsschritt
Betragsabschnitt
und in
der Summe
o2
Y±
Man bekommt beim Wertabschnitt oder bei
2
gleich
bei der i-ten
Rauschquelle
berücksichtigt
Betragsabschnitt
sollten die Kovarianzterme
[81] speziell
allgemeinen
für den
Fall versucht. Das Problem ist
dabei, die Werte der Kovarianzen zu finden. Deswegen wurde
[77] mit "worst case"-Werten für die Kovarianzen operiert.
5.4.2
Im
Transientes Verhalten des
vorherigen
ist.
in
Quantisierungsrauschens
Abschnitt 5.4.1 haben wir das
Quantisierungs¬
rauschen im stationären Zustand berechnet.
Wenn sich das Filter im Ruhezustand
befindet,
dann sind auch
die Abschnittfehler Null. Wenn wir zu einem bestimmten Zeit¬
den Eingang geben, dann wird sich das Quanti¬
sierungsrauschen bis zum stationären Wert aufbauen. Wir wollen
hier diesen transienten Vorgang näher untersuchen.
punkt
ein
Signal
an
Wir untersuchen zuerst den transienten Vorgang beim Einschalten
eines stationären weissen Rauschens
Systems.
Eingang
eines linearen
folgenden Prozess: Wir
abgetasteten Systemen (Fig. 48),
Dafür betrachten wir den
eine Schar von linearen
am
haben
alle
163
mit der
gleichen Impulsantwort h(n),
Ruhe befinden. Bei der Zeit nT
die sich
0 wird an
=
2
X
angelegt,
wobei die einzelnen
Anfang
in
jeden Eingang
weisses stationäres Rauschen mit Mittelwert n
o
am
x
Rauschquellen
ein
und Varianz
untereinander
unkorreliert sind. Wir wollen den Schar-Mittelwert und die
Varianz der einzelnen
Filterausgänge
in Funktion der Zeit
berechnen.
»-
h(n)
-••y^n)
xi(n) •-
h(n)
yt(n)
xx(n)
Fig.
48
des
Der
Ermittlung des transienten
Quantisierungsrauschens
Prozess zur
Ausgang
Verhaltens
eines der Filter ist
n
yi(n)
l
=
k=0
Der Mittelwert der
y(n)
=
lim
N-*00
|
Der Mittelwert der
X;L(n-k)-h(k)
Ausgänge
N
n
£
£
funktion und
164
es
[70]
n
x.(n-k)-h(k)
i=l k=0
Ausgänge
auf den Mittelwert der
schalten stationär
ist
folgt
£
h(k)-x(n-k)
k=0
ist
Eingänge.
bleiben,
=
der Antwort des Systems
Da die Eingänge nach dem Ein¬
gleich
ist der Mittelwert eine Schritt¬
n
y(n)
l
nx-
=
k=0
Wir berechnen
der Methode
h(k)
von
folgen hier im wesentlichen
[73], [74], verallgemeinert auf
die Varianz. Wir
jetzt
Rader
Gold
u.
einen Mittelwert des Rauschens, welcher nicht Null ist. Der
quadratische Mittelwert der Ausgangssignale beträgt
n
y2
(n)
[ l Xi(n-k)-h(k)]2
l
=
k-0
n
I
i
£[x.(n-k)-h(k)]2
2
+
Eingangsrauschen
ist, hat
man
j f
für
l x.(n-k)•xi(n-j)
n
n
£
£
für
x±(n-k)-h(k)-x±(n-j)-h(j)
j=k+l
k-0
k-0
Da das
=
positive
Zeiten weiss und stationär
k
E{x(n-k)}-E{x(n-j)}
=
2
=n^
und daher
n
y^(n)
S2 \
-
=
2
hMk)
,
2n^
+
k=0
beträgt
Die Varianz
2/
ay(n)
x
=
y
2,(n)
x
n
=
x^
l
u
k-0
n
I
I
k=0
h(k)-h(j)
j=k+l
daher
-2,
y (n)
.
-
n
h2(k)
:.- ::.;
=
n
+
¦
2n22 l
„x
k=0
n
n
I
h(k)]'
h(k)'h(j)-nx[I
k=0
j=k+l
165
n
=
x2 l h2(k)
2n2
+
X
n
I
I
n
h2(k)
l
2n2
-
k=0
n
a\
h(k)-h(j)
j=k+l
k-0
k=0
n2
n
l
n
n
l
l
h(k)-h(j)
j=k+l
k=0
h2(k)
k-0
Wir haben hier ein lineares
Rauschen
am
Eingang,
folgt,
so
mit weissem
amplitudenmoduliert ist.
Eingangsprozesses einer Schritt¬
dessen Varianz
Wenn hier die Varianz des
funktion
System betrachtet
ist die Varianz des
Ausganges
durch die
Schrittantwort eines Hilfssystems gegeben, das als Impulsant2
wort das Quadrat h (n) der Impulsantwort des betrachteten
Systems besitzt. (Das ist die Spezialisierung des allgemei¬
neren Falls, wo am Eingang ein stationäres weisses Rauschen
multipliziert mit einer beliebigen Zeitfunktion a(t) angelegt
wird. Die Varianz des Ausganges ist dann die Antwort auf a(t)
Hilfssystems,
Impulsantwort des
des
welches als
Impulsantwort
das Quadrat der
betrachteten Systems besitzt [70, Probl.
12.2].)
Die Varianz der
Ausgänge
ist eine monoton
ansteigende
der Zeit. Wenn das Filter stabil ist, dann kann
man
Funktion
leicht
durch die Substitution
oo
l
u
k-0
h2(k)
=
'AZT]"}
zeigen, dass die
<j>
|z|=1
H(z)
H(z_1) z"1
Varianz gegen den Wert
dz
strebt,
der im
Abschnitt für den stationären Fall berechnet wurde.
166
vorigen
\7*J-
^=^*
berechnet
simuliert
0.00
Tiefpass
10.
Ordnung [88]
berechnet
simuliert
KM
0.00
Bandsperre
Fig.
49
22.
200
150
Ordnung [89]
der Streuung des Ausgangssignals
zwei verscheidenen digitalen Filter beim
Einschwingvorgang
von
Anbringen
eines weissen Rauschens
am
Eingang.
167
Zur Illustration wurde in
Fig.
49 der
Einschwingvorgang
Streuung
dargestellt,
der
des Ausgangssignals von zwei digitalen Filtern
wenn am Eingang ein weisses gleichverteiltes
Rauschen mit der grössten möglichen Amplitude angelegt wurde.
bemerken, dass die Varianz schneller
Wert einschwingt als die Schrittantwort.
Es ist dabei zu
stationären
Die Varianz des totalen
eines
Quantisierungsrauschens
am
zu
ihrem
Ausgang
digitalen
Filters ist durch die Summe der Varianzanteile
gegeben, die durch die einzelnen Rauschquellen verursacht
werden,
da wir angenommen
haben,
dass die
Rauschquellen
mit¬
einander unkorreliert seien. Die einzelnen Varianzteile werden
dabei, wie erwähnt, durch die zeitliche Summe der Quadrate
der Werte der Impulsantwort des Teilfilters zwischen der
Abschnittsteile und dem Ausgang,
betrachteten Zeitpunkt bestimmt.
5.4.3
Einschaltpunkt
vom
bis
zum
Verteilung des Quantisierungsrauschens
Es ist theoretisch zu erwarten, dass die
Verteilung
schnittfehler
Filters sich einer
am
Ausgang
eines
digitalen
Gaussverteilung nähert.
Die einzelnen Rauschquellen sind
die Verteilung der Rauschanteile
ursacht durch die einzelnen
der Ab¬
gleichverteilt. Schon
Ausgang des Filters, ver¬
zwar
am
Quellen, haben eine gaussförmigere
Gestalt. Qualitativ ist das mit einem Grenzwertsatz für lineare
Filter [90] zu erklären, der besagt, dass die Verteilung der
Ausgangswerte eines linearen Filters
mit einem
weissen, belie¬
big verteilten Eingangssignal gegen eine Gaussverteilung strebt,
die Bandbreite des Filters klein wird. Die Abweichung von
der Gaussverteilung kann mit Hilfe der Kumulanten [91] berech¬
net werden. Darauf wird hier verzichtet: Ansätze dazu können
wenn
in
168
[92] gefunden werden.
Bei der
zu
Summierung
bilden, nähert sich die
verteilung.
Das
Anteile, um das Gesamtrauschen
Verteilung noch mehr einer Gauss¬
der einzelnen
hängt
mit dem zentralen Grenzwertsatz
[70,
266] zusammen.
Obige Vermutung wurde mit Hilfe von Simulationen verifiziert.
In Fig. 50 und 51 sind einige Simulationsresultate wiederge¬
geben. Es wurde ein Signal am Eingang eines digitalen Filters
10. Ordnung [88] angelegt, und zwar im Beispiel von Fig. 50
S.
ein weisses
gleichverteiltes
Rauschen und in
demjenigen
von
tieffrequenter Sinus mit einer Periode von
ca. 1000 Abtastwerten, ein Signal also mit einer hohen Kor¬
relation zwischen aufeinanderfolgenden Werten. Die Amplitude
der Signale ist in beiden Fällen gleich der Ueberlaufgrenze
der Eingangszahlen.
Es sind die Histogramme der Verteilung der über 5000 Abtast¬
werte im eingeschwungenen Zustand ermittelte Abschnittfehler
dargestellt. Die kontinuierliche Kurve in Fig. 50 und 51 stellt
die Gaussverteilung mit gleichem Mittelwert und Streuung wie
die empirische Verteilung dar. Es ist aus den Figuren ersicht¬
Fig.
51 ein sehr
lich, dass beim Wertabschnitt und bei der Rundung die Ueber¬
einstimmung der empirischen Verteilung mit der Gaussverteilung
recht gut ist. Beim Betragsabschnitt und Sinuseingang erhält
man eine typische doppelhögerige Verteilung. Beim Betragsab¬
schnitt und Rauscheingang ist die sehr hohe Streuung der Ab¬
schnittfehler zu beachten, die viel grösser als das doppelte
der Streuung bei den andern Abschnittsarten ist.
5.4.4
Das
Quantisierungsrauschen
bei Berücksichtigung der
Skalierung
Kap. 3 gesehen, dass bei der Festkommaarithmetik
Skalierung der Filter unumgänglich ist. Damit wird die
Wir haben in
eine
Uebertragungsfunktion
des gesamten Filters nicht
geändert,
169
\
\
/
7
-*'
0.00
ERR0R
Fig. 50a)
Verteilung
Rundungsfehler am Ausgang eines
digitalen Filter 10. Ordnung [88] bei einem
der
weissen Rauschen
am
Eingang
~\
/
\
T
c.
n
.
Fig. 51a)
Ä
,l"l*1
Verteilung
J
S
V
'
1—!— -•>£
-10
0.00
10
ERR0R
Rundungsfehler am Ausgang eines
digitalen Filter 10. Ordnung [88] bei einem
sehr niederfrequenten sinusförmigen Signal am
Eingang
170
i
V
der
-W
^dl
ERR0R
Fig, 50b)
Abschnittfehler am Ausgang eines
Wert¬
digitalen Filters 10. Ordnung [88] mit
abschnitt bei einem weissen Rauschen am Eingang
Verteilung
der
/-
/ \\
\
V
I
f
\
[7
^fl
q
\
30
40
PdK.
ERR0R
Fig. 51b)
Abschnittfehler am Ausgang eines
digitalen Filter 10. Ordnung [88] mit Wertab¬
schnitt bei einem sehr niederfrequenten sinus¬
förmigen Signal am Eingang
Verteilung
der
171
\
/
V
o.oo
ERR0R
Fig. 50c)
Verteilung
digitalen
Ausgang eines
Ordnung [88] mit Betrags¬
der Abschnittfehler
Filters 10.
am
abschnitt bei einem weissen Rauschen
ä£=
am
Eingang
0.00
ERR0R
Fig. 51c)
172
Verteilung der Abschnittfehler am Ausgang eines
digitalen Filters 10. Ordnung [88] mit Betrags¬
abschnitt bei einem sehr niederfrequenten sinus¬
förmigen Signal am Eingang
wohl aber die
Teilübertragungsfunktionen
zwischen bestimmten
des Filters oder dem Eingang
Punkt im Innern oder zwischen fast jedem Punkt
Paaren von Punkten im Innern
jedem
und fast
im Innern und dem Ausgang.
Wir betrachten einen Punkt im Innern eines
sondere einen Punkt,
ein Abschnitt
wo
Filters,
erfolgt.
insbe¬
Die unskalierte
Teilübertragungsfunktion (vom Eingang bis zum betrachteten
17
divi¬
Punkt) muss durch die maximale Amplitude des Signals
diert
werden,
die im Bereich
auftritt,
in dem sich der Punkt
befindet (siehe Kap. 3.2.3). Damit die gesamte Uebertragungs¬
funktion nicht verändert wird, muss die unskalierte Teilüber¬
tragungsfunktion vom betrachteten Punkt bis zum Ausgang mit
dem gleichen .Skalierungsfaktormultipliziert werden [15,16].
Da das Quantisierungsrauschen am Ausgang des Filters durch
die Teilübertragungsfunktion zwischen Abschnittpunkt und Aus¬
gang gegeben ist, folgt, dass die Skalierung das Quantisie¬
rungsrauschen stark beeinflusst.
Wenn die
Wortlänge
gleich gross (gleich n^)
Zahlen gleich eins ist, dann
im ganzen Filter
ist und er maximale
Betrag
der
hat man
o
2
y
2
=
3_
n
12
vy
£
i
i
J
max
2 -2(nb-l)
12
H.(fT)|2 d(fT)
A2
A*
0
1*1
2
_
l
max
liHiii2
Eigentlich ist der Skalierungsfaktor aus Realisierungsgründen
nur dann gleich der maximalen Amplitude, wenn diese gerade eine
Zweierpotenz ist. In allen anderen Fällen ist er gleich der
nächsthöheren Zweierpotenz. Um eine einfache Darstellung zu er¬
halten, werden wir den Skalenfaktor im folgenden immer gleich
der maximalen Amplitude setzen.
Für eine Diskussion der
verwiesen.
Abweichungen
wird auf Kap. 3.2
173
die maximale
A.
wo
l
Amplitude (nach
dem
gewählten Kriterium,
max
siehe Kap. 3.2)
im Bereich der i-ten
Rauschquelle
ist.
sieht daraus, dass die Erhöhung der Wortlänge nfa um ein
Bit das Rundungsrauschen halbiert; d.h. das Signal-zu-Rauschen
Man
Verhältnis wird
um
6 dB verbessert.
Signalamplitude, die zur Bestimmung der Skalierung
gebraucht wird, wird am Eingang der Multiplikatoren ermittelt.
Die max.
Wir wollen nun hier den Fall
betrachten, bei dem
keine Ska¬
lierung zwischen dem Multiplikator und der betrachteten Ab¬
schnittsstelle erfolgt (sondern z.B. erst nach der Abschnitt18
die max. Amplitude am Multi¬
stelle), so dass im wesentlichen
plikator
den Skalierfaktor
Diese maximale
Amplitude
an
der Abschnittsteile bestimmt.
ist eine Funktion der Teilübertra¬
gungsfunktion H.. vom Eingang des ganzen Filters bis zum
Multiplikatoreingang. Erfolgt der Abschnitt direkt nach der
Multiplikation, erhalten wir die Anordnung nach Fig. 52 [15,16]
_
i-te
c.
H12/
2
1
3
Rauschquelle
\*34
4
1
G(z)
c_.
H
:
12
H_.:
Fig.
174
i-ter Koeffizient
Uebertragungsfunktion vom Filter eingang zum Eingang des
i-ten Multiplikators
Uebertragungsfunktion vom Ausgang des i-ten Multiplikators
zum Filterausgang (identisch zu H.)
52
Rauschquelle unmittelbar
in Digitalfilter
nach einer
Multiplikation
Empfindlichkeit
Uebertragungsfunktion
In diesem Fall lässt sich leicht mit Hilfe der
beweisen,
Skalierung die
H_. von der Abschnittsteile zum Filterausgang mit der maxi¬
malen Amplitude
A.
wird. In der Tat, wenn
multipliziert
c
c
imax
durch die Skalierung die gesamte Uebertragungsfunktion des
Filters G(z) nicht verändert wird, dann bleibt auch ihre Ab¬
leitung unverändert. Somit erhalten wir (siehe Kap. 4.3.1)
~-
3c.l
=
dass durch die
H1012
Die maximale
H_.
34
=
12
-
(A.imax .H,J
34
•
A.
imax
Amplitude
*
tragungsfunktion Hn0
A.
imax
vom
ist ein Funktional der Teilüber-
Filtereingang
zum
Multiplikatorein-
19 Somit wird der Anteil am
gang.
Quantisierungsrauschen
Ausgang verursacht durch die i-te Rauschquelle
ayi
=
f(H12) •HH34II
(10)
Er ist somit das Produkt eines Funktionais
tragungsfunktion
H1_
vom
Filtereingang
gang mit der L_-Norm (d.h. mit dem
Teilübertragungsfunktion
Filterausgang.
der
475.5
Der Ausdruck
(10)
Ausdruck für die
19
von
=
von
19 der Teilüber¬
zum
Multiplikatorein¬
quadratischen Mittelwert)
der Abschnittstelle
Ueber den Zusammenhang zwischen
Rauschverhalten
3^7l
am
zum
Empfindlichkeit
und
Digitalfiltern
gewisse Aehnlichkeit mit dem
Empfindlichkeit (siehe Kap. 4.3.1) auf
weist eine
H12*H34
Die Art dieses Funktionais ist durch das
rium (siehe Kap. 3.2) gegeben.
Skalierungskrite¬
175
Grunde wurde schon behauptet [82,83], dass zwischen
der Empfindlichkeit und dem Quantisierungsrauschen ein enger
Zusammenhang existiere, und zwar unabhängig von der Filter¬
Aus diesem
form. Tatsächlich ist dieser
Zusammenhang nicht
so
eindeutig
behauptet.
Behauptet wird nämlich [82,83], dass zwischen dem Verhältnis
Quantisierungsrauschen zum Signal a /y und dem relativen
wie
Empfindlichkeitskoeffizienten
Multiplikator bezogen)
i-ten
1
-
•
eine
3G
i
-f—
(beide auf den gleichen
Proportionalitätsbeziehung
der Form
ii
ki.^G
y
=
bestehe, wobei
wollen
uns
(id
3ci
k von der Filterform
unabhängig
sei.
20
Wir
das etwas genauer ansehen.
[82] und in [83] gemacht
Sinussignale am Eingang haben. In diesem
Wir nehmen an, wie dies auch in
wurde,
Fall
dass wir nur
gilt
A.
=
max
max| H.2 (oi )|
=
||H12(W)
und somit erhalten wir für den Effektivwert des Rauschens
am
das durch die betrachtete Abschnittsteile verursacht
Ausgang,
wird
a
20
yi
=
2/3
MH12(-)IIJIH34(-)I|2
<12>
hätte (falls er stimmen würde) zu einem
sehr bequemen Kriterium für die Evaluation von Filterformen
führen können: Man müsste die Filtertypen nur noch bezüglich
einer der beiden erwähnten Eigenschaften vergleichen. Leider
kann dieses Prinzip zu Trugschlüssen führen (siehe [84]).
176
Der
Zusammenhang
Empfindlichkeit der Uebertragungsfunktion auf Aenderungen
i-ten Multiplikatorkoeffizienten ist (siehe Kap. 4.3.1)
Die
des
9G(u-)
H
=
3c.l
12
H
"34
.
miteinander vergleichen
Um zwei Zahlen
zu
können, anstatt eine
Zahl mit einer Funktion, nehmen wir einen Mittelwert der
z.B. den quadratischen Mittelwert, da des¬
Empfindlichkeit,
(11)
sen Form
1
ähnlichsten ist.
1
iifim|2
3c.
d(fT)
1
6
am
=
x
Man kann
o
H12|2 .|H34|2 d(fT)
d3)
leicht einsehen, dass das Verhältnis von (12) und
abhängt, d.h. nicht unabhängig von
|H | und
|H34|
(4)
von
der
Filterrealisierung ist, ausgenommen
bei dem H
2(w)
konstant ist, z.B. wenn
für den
c±
sich
Spezialfall,
am
Filterein¬
gang befindet.
postulierte Beziehung
Die
wenn
erfüllt,
ist auch dann nicht besser
wir ein weisses Gauss'sches Rauschen als
Eingangssignal
Mittelwert des Amplituden¬
In
ganges für die Skalierung brauchen können (Kap. 3.2.2).
diesem Fall ist die Varianz des Quantisierungsrauschens am
annehmen und daher den
Ausgang
2
öyi
=
al
12
1
'
quadratischen
|H12(fT)|2 d(fT)
0
|H34(fT)|2 d(fT)
allgemeinen das Produkt
Integral des Produktes,und
Integrale
nicht
Leider ist im
der
gleich dem
die gleiche
wir treffen hier wieder
Für andere
zwischen
Situation
an
wie beim
Skalierungskriterien
Empfindlichkeit
sinusförmigen Eingang.
ist eine
und Rauschen im
Proportionalität
allgemeinen
noch
weniger erfüllt.
177
untersucht,
Wir haben hier
ob eine
Proportionalität
zwischen
quadratischen Mittelwert der Empfindlichkeit und dem
Quantisierungsrauschen besteht. In [84] wurde gezeigt,
dass eine Proportionalitätsbeziehung der Form (11) im allge¬
dem
meinen nicht existiert.
folgende Zusammenhang zwischen einerseits
fv-;
dem Verhältnis von Rauschen zu Signal —£*¦ am Ausgang bei
einem sinusförmigen Eingangssignal der Frequenz oo und
Dort besteht der
anderseits der
=
3r (oj )
o
1
2^
3c.l
Y
o
||H12II00
1
3G
—
.
C,
i
-r—
o C.
der
ii
mmtm
^
X
l|H12ll.
H12(%)|
—I..II—
¦
•
¦!-¦ —II
Proportionalität kann
(frequenzabhängigen) Grössen
'H12(V'
-
C.
Eine (direkte)
die
=
-—
G(w) auf Aenderungen des Koeffizienten
ln
-
I
Dämpfung T(oj)
3 T"
Empfindlichkeit
A
und
c.
I|H34I
|H34(u,0)|
nur
-
existieren, falls
'H34(%)1
llH34ll2
konstant bleiben. Wenn beide Grössen sich im
gleichen
Sinn wie
Empfindlichkeit der Dämpfung ändern oder wenn mindestens
die Aenderung der Empfindlichkeit grösser ist als eine gegen¬
läufige Aenderung des Produktes der beiden Grössen
die
H12IL
IV
dann ist die
Rauschen
ist
178
oft,
zu
und
I
1H34* '2
lH34l
Empfindlichkeit der Dämpfung und das Verhältnis
Signal zumindestens zueinander gleichläufig. Das
aber nicht immer der
Fall,
wie in
[84] gezeigt
wurde,
5.4.6
Ueberlegungen über die Abschnittsteilen bei Digital¬
filtern
Es ist
bekannt,
Multiplikation zweier Festkomma¬
ergibt, dessen Stellenzahl (ohne Vorzei¬
dass die
zahlen ein Resultat
chen) gleich der Summe der Stellenzahlen (wiederum ohne Vor¬
zeichen) der
Faktoren ist.
Digitalfilter nicht, dass die Wortlänge
bei jeder Multiplikation wächst. Man ist auch daran interes¬
siert, die Wortlänge der Signalspeicher möglichst klein zu
halten, da bei einer multiplexierten Filterhardware der Auf¬
Man
will aber in einem
wand der Arithmetik auf mehrere Filter verteilt wird, der
Speicheraufwand aber immer proportional zu der Anzahl Filter
die AbSchnittstellen zwischen den Aus¬
gang eines Multiplikators und den Eingang des nächsten Multi¬
plikators oder Speichers legen. Zwischen einem Multiplikator¬
ausgang und dem Eingang des nächsten Multiplikators oder Spei¬
wächst. Daher wird
man
chers befinden sich meistens einer oder mehrere Addierer:
daher in diesen Fällen die Abschnittstellen vor oder
nach die Addierer oder auch an beide Orte legen. Im ersten
Man kann
spricht man von einem einfachgenauen Addierer, im zweiten
von einem doppeltgenauen Addierer. Im dritten Fall wird die
Addition mit einer Wortlänge ausgeführt, die zwischen derjeni¬
gen der beiden ersten Fällen liegt: Dieser Fall wird im näch¬
Fall
sten Abschnitt
(5.4.6.1) ausführlich behandelt.
die Addition einfach genau ausführen will, wird man
bei den meisten Multiplikatoren den Abschnitt am Resultat der
Wenn
man
durchführen. Es gibt aber auch Multiplikatoren,
bei denen der Abschnitt während der Durchführung der Multipli¬
kation selber erfolgt. Bei einem Typ, der erstmals von
Multiplikation
[35] beschrieben wurde, werden alle Bitprodukte ge¬
bildet und aufsummiert: die überzähligen Summenbits werden
aber im Laufe der Summation fallen gelassen. Damit erreicht
Jackson
179
man
Zeitgewinn,
einen
die Abschnittfehler werden dabei nicht
vergrössert. Bei anderen Typen von Multiplikatoren, nämlich
beim Typ der erstmals von Köthmann [86] beschrieben wurde,
oder bei
Parallel-Parallel-Multiplikatoren
rigstwertigen Bitprodukte
man
Hardware ein,
plikatoren,
vor
gar nicht
werden die nied¬
gebildet.
Damit
spart
allem bei den Parallel-Parallel-Multi-
erhält aber dafür
grössere Abschnittfehler:
Die
Varianz des
Quantisierungsrauschens wird mit der Anzahl "1"
im Koeffizienten multipliziert. Auch hier kann die Verwendung
einer "zwischengenauen" Wortlänge von Vorteil sein.
5.4.6.1
Die
Wir haben
Wortlänge
"zwischengenaue"
Addition in Digitalfiltern
eingangs erwähnt,
dass wir die Addition mit einer
durchführen können, die zwischen jener der Multi¬
plikatorausgänge
jener des Eingangs des nächsten Multi¬
plikators oder Speichers ist. Wir wollen hier die Verbesserung
in Bezug auf Quantisierungsrauschen gegenüber dem einfachge¬
nauen Addierer bzw. die
Verschlechterung gegenüber dem doppelt¬
und
genauen Addierer berechnen.
Wir betrachten eine
Multiplikationen
Anordnung
werde zuerst
der Addition wird die Summe
dass im gesamten
nach
um
um
(n
Fig.
-n
53. Das Resultat der
) Bits gerundet. Nach
den restlichen n, Bits
gerundet,
abgeschnitten werden.
Die Quantisierungsschritte nach den Multiplikationen q
während der Addition
q2 und vor der Speicherung q_ sind
gendermassen miteinander verknüpft:
so
qx
q2
=
=
q3
Bits
2
'
Rundungsstellen
rauschen mit der Varianz
a±
180
fol¬
d
Jede der ersten
2
,
2_nq
•
q3
n
_
-
q2
q2 fn _-2(n -n,)
q d'
-jj [1~2
erzeugen
je
ein
Quantisierungs¬
o
N
E^
z
Rundung
o-
—
n^d
n
_l
"
q
TqQ
Gewicht
Fig.
a) Anordnung
Zwischengenauer Addierer
53
b) Wortformate
dabei berücksichtigt, dass Anzahl abgeschnittener
Bits endlich ist (siehe Abschnitt 5.3.2). Der Schlussab¬
schnitt erzeugt ein Quantisierungsrauschen mit der Varianz
Man hat
^3
2
°2
12
Weil
man
die
hält
man
für
02 N.02
.
(1
-
2"2nd)
Rauschquellen als unabhängig annehmen kann,
21
das totale Quantisierungsrauschen
er-
v
+
g2 ?3_ l,
_
wobei N die Anzahl der
+
,„.„
Eingänge
.2-2nd
.
„.2-2nq]
des Addierers ist.
Kürzlich ist in [87] eine gründlichere Analyse der zwischen¬
genauen Addition durchgeführt worden. Es wurden recht kompli¬
zierte Ausdrücke für den mittleren quadratischen Fehler gefun¬
den, die aber nach Subtraktion des Quadrates des Mittelwertes
den gleichen Ausdruck für die Varianz wie hier ergeben.
181
Darin sind auch die beiden Extremfälle enthalten. Man er¬
hält nämlich
für
n
(einfachgenaue Addition)
0
=
2
2
°s
=
_
und für
3
xi
N'
n,
(1
,,
12
=
n
~-2n
2
q)
.
"
(doppeltgenaue Addition)
2
2
ad
q3
12 (1
=
_
..
Verwendung
_-2n
2
q)
.
"
doppeltgenauen Addierers verbessert den
Effektivwert des Rundungsrauschens um den Faktor /n gegenüber
dem einfachgenauen Addierer, was einer Verbesserung des Ver¬
Die
hältnisses
eines
von
Signal
zu
Rauschen
Diese ist die obere Grenze der
von
10
lg
Verbesserung
N dB
bei
entspricht.
Verwendung
zwischengenauen Addierers.
Wir betrachten jetzt die Verminderung des Rundungsrauschens,
die mit Hilfe eines zwischengenauen Addierers in Bezug auf
den einfachgenauen Fall erreicht werden kann. Wir werden hier
eine Näherung vornehmen.
eines
Wenn man den Addierer
n
viel kleiner als
so
2
q
2
«
d
<
wenige Bits erweitert, d.h.
ist, dass gilt
nur um
n
wenn
1
erhält man
2
at
0
182
2
s
% 5
+
(i-
*>•
2-2nd
(14)
t
in
Fig. 54
ist in
doppellogarithmischem
Massstab
dargestellt.
of°
m-
Q
LU
UJ
>
oj
O
£z
Z
LO
jnrt=1
ig¬
en
-' < LU
O (/)
O
z
CD
rv.=
2
er
er
in-.
n„=3
fjj=4
2
Fig.
54
s
INPUTS
N
OF
ADDER
NUMBER
I
5
I—I—I—I
50
Verbesserung des Quantisierungsrauschens
zwischengenauen Addierer
i—i—r—i
r>d=r>q
100
mit einem
Wenn n, gross wird, dann strebt der Wert von (14) gegen 1/N:
d
Wir haben gesehen, dass dieser Wert mit den genauen Aus¬
drücken bei n d = n erreicht wird. Für N ->¦ « geht der Wert
~g
d: Der Rauschanteil der zweiten Rundung
von (14) gegen 2
vernachlässigbar gegenüber
wird
dem Anteil der ersten.
Fig. 54 sieht man, dass die ersten paar zusätzlichen
eine deutliche Verbesserung bringen, dass aber diese mit
Aus
gendem
n,
sionierung
N
•*¦
°°
recht
gering
wird. Als
Anhaltspunkt
können wir den Punkt nehmen, wo die
(= 2~nd) die
Dieser Punkt
liegt
Kurve
für
n= n
Bits
stei¬
für eine Dimen¬
Asymptote
für
schneidet (siehe Fig.54 )
bei
183
N
22nd
=
d.h,
n,
=
2
ldN
d.h. numerisch
nd
1
2
3
N
4
16
64
Bei diesem Punkt ist
2_2nd.(2 2_2nd)
=
-
Rundungsrauschen
d.h. das
als der Grenzwert für N
->-
vergleichen jetzt die
ist
ungefähr
um
den Faktor /2 grösser
<».
erzielte
Verbesserung des Rundungs¬
rauschens mit derjenigen, die wir durch eine Verkleinerung von
q, (d.h. durch eine entsprechende Vergrösserung der Wortlänge)
Wir
so
einfachgenauen Addierer erzielen können. Es ist
leicht einzusehen, dass wir, um die gleiche Verbesserung zu
erreichen, beim einfachgenauen Addierer die Signalwortlänge
bei einem
ld
at
as
—
vergrössern
Fig.
54
müssen. Dies ist auf der Skala "bit
dargestellt.
gross ist: Es
sichts des
184
der
sieht, dass der Gewinn nicht sehr
kann sich aber in vielen Fällen lohnen, ange¬
Man
geringen Aufwandes diese Lösung
eine zusätzliche
reichen.
gain"
Verminderung
des
zu
verwenden,
Rundungsrauschens
um
zu er¬
um
Korrelationskoeffizient zwischen einer Zufallsvariablen
und einer Funktion dieser Variablen
Wir suchen den Korrelationskoeffizient
=
xy
Ef (x-x)-(y-yn
o.o
y
x
zwischen einer stochastischen Variablen
x
dieser Zufallsvariablen y = g(x)
Der Korrelationskoeffizient kann auch wie
und einer Funktion
folgt geschrieben
werden [70,sec.7.3]
r
E{x.y>
=
xy
-
x-y
o.o
y
x
gilt definitionsgemäss
Für die Korrelationsfunktion
R
E{x-y]
=
=
E{x-g(x)}
Erwartungswert einer
Variablen x ist [70]
Der
E{g1(x)}
Funktion
g1(x)
einer stochastischen
+00
/ g1(x)-f(x)
=
dx
00
—
wo
f(x) die Wahrscheinlichkeitsdichtefunktion
von x
ist.
Wenn wir
g1(x)
x«g(x)
=
nehmen, dann erhalten
wir für die Korrelationsfunktion
+00
R
f(x)
xy
x«g(x)«f(x)
dx
ist die Wahrscheinlichkeitsdichtefunktion von x.
185
Wir erhalten für den Korrelationskoeffizienten
+ 00
/
x.g(x).f(x)
xy
0
o
.
x
dx
folgt
x.g(x)
g (x)
.
wobei sich der Mittelwert
wie
-
.
g(x)
und die Streuung
berechnen lassen:
'g(x)
+00
g(x)
=
E{g(x)
t
}
g(x)
f
•
(x)
dx
1
2
+ 00
r
g
g(x)
Falls
(x)
f(x)
•
dx
-
g(x)
eine diskrete Zufallsvariable ist, dann erhält
durch ähnliche Ueberlegungen
x
l \"3(\) *Pk
k
_
xy
o
mit
pk
x.g(x)
"
g(x)
.
P{x=xk}
=
g(x)
o
x
man
=
l gtj^) pk
•
k
l
g(x)
k
g
(\) -pk
-
g(x)
Der Zähler in den Ausdrücken für r
Es
gilt
axv
186
=
£{(x-x) (yy)}
=
xy
ist die Kovarianz o
E{(x-x)-y}
=
xy
E{x-(y-y)}= E{xy}-
x-y
LITERATUR
z-Transform",
[1]
Jury, "Theory and Application of
Wiley, New York, 196 4
[2]
H.E. Kallmann, "Transversal Filters", Proc. IRE, Vol.
No. 7, pp. 302-310 (July 1940)
[3]
W. Kuntz, "Entwurf und
E.I.
Anwendung
eines
the
28,
Abtast-Analog¬
rechners" , NTZ, Bd. 21, H. 2, S. 82-87 (Febr. 1968)
W. Kuntz, "A New Sample-and-Hold Device and its Appli¬
cation to the Realization of Digital Filters", Proc.
IEEE, Vol. 56, pp. 2092-2093 (Nov. 1968)
W. Kuntz, "Analoge Realisierung digitaler Filter" in
W. Kuntz, W. Schüssler, W. Winkelkempern, "Untersuchung
über Eigenschaften, Entwurf und Realisierung digitaler
Filter", Ausgewählte Arbeiten über Nachrichtentechnik
Nr. 10, Erlangen, 1969, S. 47-74
[4]
C.M. Puckette, W.J.
Butler,
D.A.
Smith, "Bucket-Brigade
Transversal Filters". IEEE Trans, on Communications,
Vol. COM-22, No. 7, pp. 926-934 (July 1974)
D.A.
Smith,
W.J.
Butler,
C.M. Puckette,
Filter, and Tone Generator Using
Bandpass
Delay Lines",
"Programmable
Bucket-Brigade
Communications, Vol. COM-22,
No. 7, pp. 921-925 (July 1974)
H. Wupper, "A Method for the Realization of Filters
with the Aid of Charge-Transfer Devices", Conf. Record
7th Asilomar Conf. (Nov. 1973), pp. 354-358
IEEE Trans, on
Szekely, "Method for Weighted Charge Summation in
Bucket-Brigade Circuits", Electronic Letters, Vol. 10,
V.
No. 20
[5]
D.D.
[6]
Y.
(Oct. 1974)
Buss, D.R. Collins, W.H. Baley, CR. Reeves, "Trans¬
versal Filtering Using Charge-Transfer Devices", IEEE
J. of Solid State Circuits, Vol. SC-8, No. 2, pp. 138146 (April 1973)
Takodoro, T. Higuchi, "Simple Magnetic Delay Unit with
High Accuracy and Reliability for Digital Filters", IEEE
Trans. Industr. Electronics and Control Instrum., Vol.
IECI-20, No. 3, pp. 130-137 (August 1973)
[7]
A. Shah, "Theoretische und praktische Untersuchungen über
dielektrische Anwendungen von Ferroelektr.ika", Diss. ETH
Nr. 4059 und AFIF Publ. Nr. 20 (1968)
187
[8]
Mathaei, "Acoustic Surface-Wave Transversal Fil¬
ters", IEEE Trans, on Circuit Theory, Vol. CT-20, No. 5,
G.L.
pp. 459-470
[9]
(Sept. 1973)
Leuthold, "Filternetzwerke mit digitalen Schiebe¬
registern", Diss. ETH Nr. 3934 und Philips Res. Repts.
Suppl. 1967, No. 5
P.E. Leuthold, "Microelectronic Versions of Digital
and Quasidigital Filters", Proc. of the Summer School
on Circuit Theory 1971, Tale,
Czechoslovakia, pp. 9-1
P.
to 9-20
[10]
[11]
H.
Schwarz, "Einführung
Vieweg, Braunschweig,
W.
Schüssler,
"Zur
in die moderne
1969
Systemtheorie",
allgemeinen
netzwerke", AEU, Bd. 22,
H.
Theorie der Verzweigungs¬
8, S. 361-367 (August 1968)
[12]
H.W.
[13]
L.R. Rabiner et al. "Terminology in Digital
Signal
Processing", IEEE Trans, on
and Electroacoustics,
Vol. AU-20, No. 5, pp. 322-337 (Dec. 1972)
[14]
S.Y. Hwang, "Realization of Canonical
Digital Networks",
IEEE Trans, on Acoustics, Speech and Signal Proc, Vol.
ASSP-22, No. 1, pp. 27-39 (Jan. 1974)
Schüssler, "Digitale Systeme
tung", Springer, Berlin, 1973
zur
Signalverarbei¬
Audio
S.Y. Hwang, "On Element-Values and Realizability Conditions of Canonical Digital Networks", IEEE Trans, on
Acoustics, Speech
pp. 152-153
and
Signal Proc,
(April 1974)
[15]
L.B.
[16]
L.B.
[17]
H. Freeman, "Discrete Time
[18]
F.
188
Vol.
ASSP-22,
No. 4,
Jackson, "An Analysis of Roundoff Noise in Digital
Filters", Ph.D. Thesis, Stevens Inst, of Technology,
Hoboken N.J., 1969
Jackson, "On the Interaction of Roundoff Noise and
Dynamic Range in Digital Filters", BSTJ, Vol. 49, No. 2,
pp. 159-184 (Febr. 1970)
Systems", Wiley,
New
York,
1965
Hemmer, "Simplification des conditions de stabilite
des systdmes echantillonnes lineaires de forme directe",
Diss. ETH Nr. 4690 und AFIF Publ. Nr. 26 (1971)
[19]
S.K. Mitra, R.J. Sherwood, "Digital Ladder Networks",
IEEE Trans, on Audio and Electroacoustics, Vol. AU-21,
No. 1, pp. 30-36 (Febr. 1973)
Huey, R.J. Sherwood, "New Methods of
Digital Ladder Realization", IEEE Trans, on Audio and
Electroacoustics, Vol. AU-21, No. 6, pp. 485-491
(Dec 1973)
S.K. Mitra, A.D. Sagar, "Additional Canonic Realizations
of Digital Filters Using the Continued-Fraction Ex¬
pansion", IEEE Trans, on Circuits and Systems, Vol.
CAS-21, No. 1, pp. 135-136 (Jan. 1974)
S.K.
[20]
Mitra,
D.C.
A.G. Constantinides, "Some New Digital Filter Struc¬
tures Based on Continued Fraction Expansion", Proc.
NATO Adv. Studies Inst, on Network and Signal Theory,
(Sept. 1972)
pp. 358-365
[21]
A.H.
Gray,
Filter
J.D.
Markel, "Digital
Synthesis",
Lattice and Ladder
Audio and Electro¬
6, pp. 491-500 (Dec. 1973)
IEEE Trans, on
acoustics, Vol. AU-21,
No.
[22]
Saito, "Digital Filtering Techniques
Speech Analysis", Proc. 7th Int'l. Congress on
Acoustics, Budapest, 1971, pp. 261-264
[23]
A. Fettweis,
sical Filter
F.
for
Itakura,
(Febr. 1971)
S.
"Digital Filter
Networks", AEU,
Structures Related to ClasBd. 25, H. 2, S. 79-89
Sedlmeyer, A. Fettweis, "Digital Filters with True
Configuration", Int. J. on Circuit Theory and
Applications, Vol. 1, pp. 5-10 (Jan. 1973)
A. Fettweis, H. Levin, A. Sedlmeyer, "Wave Digital Lat¬
tice Filters", Int. J. on Circuit Theory and Applica¬
A.
Ladder
tions, Vol. 2,
[24]
pp. 203-211
R.E. Kaiman, "Mathematical
mical Systems", SIAM J. on
(1963)
(1974)
Description
of Linear Dynapp. 152-192
Control, Vol. 1,
[25]
M. Morf, "Fast Algorithms for Multivariable Systems",
Ph.D. Thesis, Stanford University, August 1974
[26]
A.S. Ludvig, "A Comparative Study of Sensitiv!ty in
Recursive Digital Filters", M.E. Thesis, McGill Univer¬
sity, Montreal, Canada, March 1973
189
[27]
I. Flores, "The Logic of Computer Arithmetic",
Hall, Englewood Cliffs, N.J., 1963
[28]
Steingold, "Analog-Digital Conversion Handbook",
Analog Devices Inc., Norwood Mass., 1972, Part II, Ch.
[29]
Prentice-
D.H.
1
Landauro, "Realisation des filtres numeriques programmables", These, Facultg Polytechnique de Mons,
A.
Belgique,
1973
[30]
A.V.
[31]
P.M.
[32]
H.
[33]
H. Griffin, "Elementary Theory of
New York, 1954, pp. 53-57
[34]
H.W. Gschwind, "Design of
New York, 1967, p. 190
[35]
R.O.
[36]
R. Edwards, J. Bradley, J.B. Knowles, "Comparison of
Noise Performances of Programming Methods in the Rea¬
lization of Digital Filters", Proc. Symp. on Computer
Processing in Communications, New York, pp. 295-311
Oppenheim, "Realization of Digital Filters Using
Block-Floating-Point Arithmetic", IEEE Trans, on Audio
and Electroacoustics, Vol. AU-18, No. 2, pp. 130-136
(June 1970)
Ebert,
J.E. Mazo, M.G.
tions in Digital
3020 (Nov. 1969)
Filters",
Taylor,
"Overflow Oscilla¬
Vol.
BSTJ,
48, No. 9, pp. 2999-
Meschkowski, "Einführung in die
Bibliographisches Inst., Mannheim,
moderne
1966
Numbers",
Mathematik",
McGraw
Hill,
Digital Computers", Springer,
Berg, L.L. Kinney, "Serial Adders with Overflow
Correction", IEEE Trans, on Computers, Vol. CT-20,
No. 6, pp. 668-671 (June 1971)
(April 1969)
[37]
J.E. Bertram, "The Effect of Quantization in SampledFeedback Systems", Trans. AIEE, Part 2 (Appl. & Ind.),
Vol. 77, pp. 177-182 (Sept. 1958)
[38]
T.A.
Brubaker,
Filters", IEEE
No.
[39]
pp. 675-677
(July 1972)
J.L. Long, T.N. Trick, "An Absolute Bound on Limit Cycles
Due to Roundoff Errors in Digital Filters", IEEE Trans,
on Audio and Electroacoustics, Vol. AU-21,
No.l, pp. 27-
30
190
5,
J.W. Gowdy, "Limit Cycles in Digital
Trans, on Automatic Control, Vol. AC-17,
(Febr. 1973)
Parker, "Computation of Bounds for
Digital Filter Quantization Errors", IEEE Trans, on
Circuit Theory, Vol. CT-20, No. 4, pp. 391-396 (July 1973)
[40]
S.
Yakowitz,
[41]
V.
Mangoulis,
[42]
D.S.K. Chan, L.R. Rabiner, "Theory of Roundoff Noise
in Cascade Realizations of Finite Impulse Response
Digital Filters", BSTJ, Vol. 52, No. 3, pp. 329-345
Engineers",
S.R.
"Handbook of Series for Scientists and
Academic Press, New York, 1965
(March 1973)
[43]
H.W.
Bode, "Network Analysis and Feedback Amplifier
Van Norstrand, New York, 1945
Design",
Sensitivity
Collection
Theory, Vol. CT-
[44]
J.
of
[45]
S.
[46]
A.G. Deczky, "Computer Aided Design of Digital Filters
in the Frequency Domain", Diss. ETH Nr. 4890 und AFIF
Publ. Nr. 29 (1973)
[47]
CE. Maley, "The Effects of Parameters on the Roots
of an Equation System", Computer J., Vol. 4, No. 2,
pp. 62-63 (1962)
[48]
F.
[49]
Gorski-Popiel,
"Classical
Formulas", IEEE Trans, on Circuit
10, No. 2, pp. 300-302 (June 1963)
-
A
Stefanescu, "Filtres electriques", Masson, Paris,
1972, chap. 11: SensitivitSs
Pellandini, "Problemes de realisation
digitaux", AGEN-Mitteilungen Nr. 9 (Juli 1969)
Bonzanigo,
des filtres
F.
S.K. Mitra, R.J.
Displacement
Sherwood,
"
Estimation of Pole-Zero
Due to Coefficient
Quantization", IEEE
CAS-21, No. 1,
Trans, on Circuits and Systems, Vol.
pp. 116-124 (Jan. 1974)
Rothenbühler, "Untersuchung der Empfindlichkeit
[50]
H.
[51]
M. Sablatash, "A Tellegen's Theorem for Digital Filters",
IEEE Trans, on Circuit Theory, Vol. CT-18, No. 1, pp.
201-203 (Jan.
[52]
ver¬
schiedener Strukturen digitaler Filter", Diplomarbeit
am Inst, für Technische Physik an der ETHZ, WS 1974
1971)
A General Theorem for Signal-Flow Networks"
Fettweis,
AEU, Bd. 25, H. 12, S. 557-561 (Dez. 1971)
A.
"
191
[53]
S. Colonna, U. de Julio, M. Salerno, "Determination
of Sensitivity Functions of Digital Filters", IEEE Trans,
on Circuit Theory, Vol. CT-19, No. 5, pp. 538-539
(Sept. 1972)
[54]
S.W. Director, R.A. Rohrer, "The Generalized Adjoint
Network and Network Sensitivities", IEEE Trans, on
Circuit Theory, Vol. CT-16, No. 3, pp. 318-323 (Aug.
1969)
[55]
£. Björck,
[56]
S.W.
G.
Dahlquist,
bourg, München, 1972
"Numerische Methoden", Olden-
in Network Sensitivity
IEEE Trans, on Circuit Theory, Vol. CT-18
Director, "LU Factorization
Computation",
1, pp. 184-185 (Jan. 1971)
No.
[57]
H. Benke, F. Sommer, "Theorie der analytischen Funktionen
einer komplexen Veränderlichen", Springer, Berlin, 1955,
S. 54
[58]
A.N.
[59]
A.N.
[60]
L. Kristiansson,
Willson, "Some Effects of Quantization and Adder
Overflow on the Forced Response of Digital Filters",
BSTJ, Vol. 51, No. 4, pp. 863-887 (April 1972)
Willson, "Limit Cycles due to Adder Overflow in
Digital Filters", IEEE Trans, on Circuit Theory, Vol.
CT-19, No. 4, pp. 342-346 (July 1972)
"Jump
1974)
[61]
Phenomenon in
Electronic Letters, Vol.
B.
10,
No.
Digital Filters",
2, pp. 14-15
(Jan.
of Amplitude-Quantized
Trans. AIEE, Part 2 (Appl. & Ind.),
Widrow, "Statistical Analysis
Sampled-Data Systems",
Vol. 79, pp. 555-568 (Jan.
1961)
Knowles, R.E. Edwards, "Effect of a Finite Word
Length Computer in a Sampled-Data Feedback System", Proc.
IEE, Vol. 112, No. 6, pp. 1197-1206 (June 1965)
[62]
J.B.
[63]
Limit Cycles due to Multiplication Rounding in Recursive Digital Filters", Proc.
7th Allerton Conf., pp. 69-78 (Oct. 1969)
[64]
F.
192
L.B.
Jackson, "An Analysis of
Bonzanigo, "Constant-Input Behaviour of Recursive
Digital Filters", IEEE Arden House Workshop on Digital
Filtering, Harriman, N.Y., Jan. 1970 and Proc. 1970
Symposium on Digital Filtering, London, July 1970
[65]
S. Hess, "A Deterministic Analysis of Limit Cycle
Oscillations in Recursive Digital Filters due to
Quantization", Ph.D. Thesis, US Naval Postgraduate
School, Monterey (Dec. 1970)
S.R. Parker, S.F. Hess, "Limit Cycle Oscillations
Digital Filters",
CT-18,
No.
6,
IEEE Trans, on
pp. 687-697
Circuit
(Nov. 1971)
Theory,
in
Vol.
[66]
T.A.C.M. Claasen, W.F.G. Mecklenbräuker, J.B.H. Peek,
"Some Remarks on the Classification of Limit Cycles in
Digital Filters", Philips Res. Repts., Vol. 28, No. 4,
pp. 297-305 (Aug. 1973)
[67]
W.R.
[68]
[69]
Bennett, "Spectra
Vol. 27, pp. 446-472
Widrow, "A Study
of Quantized
(July 1948)
Signals", BSTJ,
cuit
Rough Amplitude Quantization by
Nyquist Sampling Theorem", IRE Trans, on Cir¬
Theory, Vol. CT-3, No. 4, pp. 268-276 (Dec. 1956)
A.A.
Kosyakin,
B.
Means of
of
"The Statistical
Theory
of
Amplitude
Quantization", Avtomatika i Telemekhanika, Vol. 22,
6, pp. 722-729 (June 1961)
No.
[70]
A. Papoulis, "Probability, Random Variables and Stochastic Processes", McGraw Hill, New York, 1965
[71]
J.S. Thomson, "An
Errors in Digital
Electroacoustics,
1973)
[72]
Improved
Model for Quantization
Filters", IEEE Trans, on Audio and
Vol. AU-21, No. 2, pp. 125-127 (April
T.W. Sjoding, "Noise Variance for Rounded Two's Complement Product Quantization", IEEE Trans, on Audio and
Electroacoustics, Vol. AU-21, No. 4, pp. 378-380 (Aug.
1973)
[73]
Gold, C.M. Rader, "Effects of Quantization Noise in
Digital Filters", Proc. AFIPS 1966 Spring Joint Computer
Conf., pp. 213-219
C.M. Rader, B. Gold, "Digital Filter Design in the
Frequency Domain", Proc. IEEE, Vol. 55, No. 2, pp.
149-171 (Febr. 1967)
[74]
C.M. Rader, B. Gold, "Digital
McGraw Hill, New York, 1969
B.
Processing of Signals",
193
[75]
J. Tödtli, J. Pfund, "Digitaler Oszillator", AGENMitt. Nr. 11, S. 32-39 (Juli 1970)
[76]
B.
[77]
P.E. Girard, "Correlated Noise Effects of Strueture
in Digital Filters", Ph.D. Thesis, Naval Postgraduate
Eckhardt, "On the Roundoff Error of a Multiplier",
AEU, Bd. 29, H. 4, S. 162-164 (April 1975)
School, Monterey, Calif., (June 1974)
S.R. Parker, P.E. Girard, "Correlated Noise in Fixed
Point Digital Filters", Paper submitted to the IEEE
Trans, on Circuits and Systems (April 1975)
[78]
J.B. Knowles, R. Edwards, "Autocorrelation Function
of the Quantisation-Error Process for a Sinusoid",
Electronic Letters, Vol. 4, No. 9, pp. 180-182 (May
1968)
[79]
E.
Avenhaus, "Zum
Speicherwortlänge
Diss.,
Universität
Entwurf digitaler Filter mit minimaler
für Koeffizienten und Zustandsgrössen",
Erlangen-Nürnberg (Mai 1971)
[80]
J.R.
[81]
Liu, M.E. Van Valkenburg, "On Roundoff Error in
Fixed-Point Digital Filters Using Sign-Magnitude Truncation", IEEE Trans, on Circuit Theory, Vol. CT-19,
No. 5, pp. 536-537 (Sept. 1972)
[82]
A.
Ragazzini,
Systems",
B.
Fettweis, "On
the Connection between Multiplier Word
Length Limitation and Roundoff Noise in Digital Filters",
IEEE Trans, on Circuit Theory, Vol. CT-19, No. 5, pp.
486-491
[83]
G.F. Franklin, "Sampled-Data Control
McGraw Hill, New York, 1958
(Sept. 1972)
Fettweis, "Roundoff Noise and Attenuation Sensitivity
in Digital Filters with Fixed-Point Arithmetic", IEEE
Trans, on Circuit Theory, Vol. CT-20, No. 2, pp. 174A.
175 (March 1973)
[84]
F.
[85]
L.B. Jackson, J.F. Kaiser, H.S. McDonald, "An Approach
to the Implementation of Digital Filters", IEEE Trans, on
Audio and Electroacoustics, Vol. AU-16, No. 3, pp. 413-
Bonzanigo,
"Comment on 'Roundoff Noise and Attenua¬
Sensitivity in Digital Filters with Fixed-Point
Arithmetic'", IEEE Trans, on Circuit and Systems, Vol.
CAS-21, No. 6, pp. 809-810 (Nov. 1974)
tion
421
194
(Sept. 1968)
Köthmann, "Vereinfachte seriell arbeitende Multipli¬
zierwerke für Digitalfilter", NTZ, Bd. 25, H. 11,
S. 492-496 (Nov. 1972)
[86]
W.
[87]
B. Eckhardt, H.W. Schüssler, "On the Quantization
Error of a Rounded Sum of Rounded Products", AEU, Bd.
29, H. 7/8, S. 308-311 (July-August 1975)
[88]
R.B.
Kieburtz, "An Experimental Study of Roundoff
Effects in a Tenth Order Recursive Digital Filter",
Proc. IEEE 1972 Int. Conf. on Communications
[89]
R.M.
Data
Golden, J.F. Kaiser, "Design of Wideband SampledFilters", BSTJ, Vol. 43, No. 4, pp. 1533-1546
(July 1964)
[90]
H. Davis, "A Central Limit Theorem for the Response
of Filters with Vanishing Bandwidths", J. Math. Anal,
and Appl., Vol. 3, No. 3, pp. 605-618 (Dec. 1961)
[91]
M.G.
[92]
F.
[93]
A.
in
[94]
U.
Kendall, A. Stuart, "Advanced Theory of Statistics",
Vol. 1, Griffin, London, 1958
mit Anwendung auf
Okt. 1974
PCM",
unabhängigen
Werten
Nr.
4
der
AFIF,
Aktenvermerk
Braun, "Diskrete Filterung
von
Weber, "Integrierte Schaltungen
Band 2, Kap. IX: Binäre Arithmetik,
Birkhäuser-Verlag, Basel, in Druck
Shah,
M.
Saglini,
C.
digitalen Systemen",
Appel, "Bounds on Second-Order Digital Filter Limit
Cycles", IEEE Trans, on Circuits and Systems, Vol. CAS-22,
No. 7, pp. 630-632 (July 1975)
Z. Uenver, A.
Khaldoun, "A Tighter Practical Bound
on
Quantization Errors in Second-Order Digital Filters
with Complex Conjugate Poles", IEEE Trans, on Circuits
and Systems, Vol. CAS-22, No. 7, pp. 632-633 (July 1975)
195
Die
vorliegende
der ETH Zürich
Arbeit wurde
am
Institut für Technische
Physik
ausgeführt.
Institutes, Prof.Dr.E.Baumann, hat diese
Arbeit durch grosszügige Unterstützung und durch wertvolle An¬
regungen und Ratschläge gelenkt. Es ist mir gleichzeitig eine
Freude und eine angenehme Pflicht, ihm dafür meinen Dank auszu¬
Der Vorsteher des
sprechen.
Auch Herrn
Prof.Dr.G.S.Moschytz gebührt
mein bester Dank für
seine sehr wertvolle und konstruktive Kritik dieser Arbeit und
für seine sehr nützlichen Hinweise.
Stiftung, Bern, sei bestens gedankt für
zügige finanzielle Unterstützung durch die AGEN.
Der Hasler
ihre gross¬
Kollegen Prof.Dr.F.Pellandini (vormals Leiter
Digitalfilter) und Dr.A.G.Deczky möchte ich für
Den früheren
der
Gruppe
die
für
ständige Anregung, sowie für die interessanten Diskussionen,
zu dieser Arbeit geführt haben,meinen Dank aussprechen.
die
Den Herren Dr.A.Shah und Dr.F.Braun möchte ich schliesslich für
die
sprachliche
danken.
196
Korrektur und
Verbesserung
des Textes bestens
Lebenslauf
1. Juli 1941 in Sorengo TI geboren. Nach Besuch
der Primarschule (1947-52) und des "Ginnasio Cantonale" (1952Ich wurde
56)
am
in Bellinzona TI, trat ich im Jahr 1956 ins "Liceo Canto¬
nale" in Lugano ein, wo ich 1960 das Maturitätszeugnis Typus
C erhielt. Im Herbst des gleichen Jahres begann ich das Studium
an
der
Abteilung
Hochschule,
ingenieur
Eidgenössischen Techn.
dem Diplom als Elektro¬
für Elektrotechnik der
das ich im Jahre 1964 mit
abschloss.
Anschliessend trat ich in den Dienst des Institutes für Tech¬
nische
Physik
an
der ETH Zürich als Assistent und wissenschaft¬
Projekte
hochgenauen
licher Mitarbeiter. Zuerst bearbeitete ich verschiedene
auf dem Gebiet der Messung magnetischer Felder, der
geregelten Antriebe, der Fernsehtechnik und des Schaltver¬
halten
von
"digitale
Transistorschaltungen.
Bei der
Gründung
der
Filter" im Jahre 1967 trat ich dieser bei,
wo
Gruppe
ich
Realisierung digitaler Filter und die
Quantisierungsprobleme behandle. Seit April
seitdem die Probleme der
damit verwandten
1973 leite ich die oben genannte Gruppe.
197
Seite Leer /
Blank leaf
Herunterladen