Research Collection Doctoral Thesis Probleme der Realisierung digitaler Filter Author(s): Bonzanigo, Federico Publication Date: 1976 Permanent Link: https://doi.org/10.3929/ethz-a-000087750 Rights / License: In Copyright - Non-Commercial Use Permitted This page was generated automatically upon download from the ETH Zurich Research Collection. For more information please consult the Terms of use. ETH Library j)is*. Nr. 56^5 PROBLEME DER REALISIERUNG DIGITALER FILTER ABHANDLUNG ZUR ERLANGUNG DES TITELS EINES DOKTORS DER TECHNISCHEN WISSENSCHAFTEN DER EIDGENOESS ISCHEN TECHNISCHEN HOCHSCHULE ZUERICH vorgelegt FEDERICO BONZANIGO Dipl. El.-Ing. geboren von am 1. von ETH Zürich Juli 1941 Bellinzona (Kt. Tessin) Angenommen Antrag Baumann, auf Prof. Dr. E. Prof. Dr. G. S. von Referent Moschytz, Korreferent 1976 iaparafririiinlfr nus AGEN-Mitteilungen Nr. 21 ww up Seite Leer / Blank leaf . INHALTSVERZEICHNIS 1. Einleitung 7 1.1 7 1.2 Digitalfilter? Prinzipielle Möglichkeiten Was ist ein von 1.3 2. Abtastfiltern Realisierung 10 Die Fehler der endlichen Arithmetik Grundlagen 2.1 zur 12 für die Realisierung digitaler Filter Realisierungsstrukturen von Digitalfiltern 14 14 2.1.1 Direkte Formen 17 2.1.2 Zerlegte Formen 21 2.1.2.1 Parallelform Kaskadenform 21 2.1.2.2 24 2.1.3 2.2 Andere Filterstrukturen Die Darstellung der Zahlen 2.2.1 Zahlencodes 2.2.2 Darstellung von positiven tiven Binärzahlen 2.2.3 2.3 Fest- und 27 27 und nega¬ 30 Gleitkommazahlen Der Abschnitt bei der 2.3.1 26 33 Festkommaarithmetik 36 Einfacher Abschnitt Wertabschnitt 37 38- - Betragsabschnitt 2.3.2 Rundung Die Quantisierung bei Gleitkommazahlen 40 - 2.4 3. Ueberlauf und Skalierung 3.1 Der Ueberlauf bei der Festkommaarithmetik 3.1.1 Eigenschaften des Ueberlaufs 3.1.2 Die Eigenschaften der Restklassen 3.1.3 Ueberlaufdetektion Die Ueberlaufdetektion bei der Die - Addition 42 ' 43 46 .46 47 50 53 u-54 3.2 Die Skalierung 3.2.1 4. Die 4.1 4.2 Maximale bei der Festkommaarithmetik Signalamplitude für beliebige 3.2.2 Eingangssignale Maximale Signalamplituden sche Eingangssignale 3.2.3 Praktische 3.2.4 Abschnittfehler und Unterlauf Quantisierung Die Durchführung für der spezifi¬ Skalierung der Koeffizienten Empfindlichkeit der 67 70 74 75 Uebertragungsfunktion >76 Eine indirekte Betrachtung der Empfindlichkeit 4.2.1 Empfindlichkeit der Uebertragungsfunktion auf Aenderungen der Pole und Nullstellen 4.2.1.1 Empfindlichkeit des Amplituden¬ ganges auf Aenderungen der Pole und Nullstellen 4.2.1.2 Empfindlichkeit des Phasenganges gegenüber Aenderungen der Pole und Nullstellen 80 Empfindlichkeit der der Nullstellen 4.2.1.4 Anwendung auf dem selektiver Filter Spezialfall Empfindlichkeit der Pole und Nullstellen gegenüber Aenderungen der Koeffizienten 4.2.2.1 Empfindlichkeit der Wurzeln eines Polynoms Folgerungen für die Quantisierungsfehler a) Ordnung der Teilfilter 4.2.2 4.2.3 b) Bandbreite c) Die Empfindlichkeit kleinen 4.3.1 .86 ,.,.87 88 91 92 95 95 100 und der Nullstellen 100 der Uebertragungsfunktion auf der Koeffizienten 101 Aenderungen Direkte Berechnung der Empfindlichkeit der Uebertragungsfunktion auf Aenderungen der Koeffizienten 82 96 Mittelfrequenz d) Verteilung der Pole 80 Gruppenlaufzeit gegenüber Aenderungen der Pole und XI 60 gegenüber Variationen ihrer Parameter 4.2.1.3 4.3 58 102 - - - - 4.3.2 Parallelform Kaskadenform 104 Allgemeine Filternetzwerke 106 - 4.3.3 114 115 Abweichung des Amplituden- 115 Amplitudenganges 117 Filter mit Nullstellen auf dem Einheits¬ kreis 119 und Abschnitt der 122 Einleitung 5.2 Die Quantisierung Signalgrössen 122 der Signale 124 Korrelation zwischen Signal und Quanti¬ sierungsfehler 125 a) Wertabschnitt b) Rundung 126 c) Zwischenwerte der Amplitude 132 129 Abschnittfehler der Signale 5.3.1 Die Verteilung der Abschnittfehler 5.3.2 Die Varianz der Abschnittfehler - - - 5.3.3 108 Kaskadenform Parallelform 5.1 5.3 Uebertragungs¬ 114 ganges Die Empfindlichkeit des bei der Kaskadenform Quantisierung der Direkte Form Die maximale - 5.2.1 105 Abweichung funktion - 5. 102 Die maximale - 4.3.4 Direkte Form 133 133' 136 Wertabschnitt 137 Betragsabschnitt Rundung 139 140 Der Abschnitt des Resultates einer Multiplikation 140 5.3.3.1 .145 Verteilung der Abschnittfehler 5.3.3.2 Streuung der Abschnittfehler 155 5.3.3.3 Korrelation 155 m 5.4 Das Quantisierungsrauschen 5.4.1 Stationärer Wert des rauschens - - 5.4.2 5.4.3 5.4.4 5.4.5 5.4.6 Anteil einer Gesamtes in Digitalfiltern Quantisierungs¬ Rauschquelle 159 159 160 Quantisierungsrauschen Transientes Verhalten des Quantisie¬ 162 rungsrauschens 163 Verteilung 168 Quantisierungsrauschens Das Quantisierungsrauschen bei Berück¬ sichtigung der Skalierung Ueber den Zusammenhang zwischen Empfind¬ 169 Digitalfiltern 175 des lichkeit und Rauschverhalten Ueberlegungen in von über die Abschnittsteilen Digitalfiltern 5.4.6.1 Die "zwischengenaue" Addition in Digitalfiltern 179 180 Anhang: Korrelationskoeffizient zwischen einer Zufalls¬ variablen und einer Funktion dieser Variablen Literatur IV 185 I87 Probleme der von F. Realisierung digitaler Filter Bonzanigo Quelques problemes dans la realisation de filtres Realization Problems in digitaux Digital Filters Alcuni problemi inerenti alla realizzazione dl filtri digital! Zusammenfassung Diese Arbeit befasst sich mit einigen Problemen, die sich bei der Realisierung digitaler Filter stellen, insbesondere mit den dabei auftretenden Quantisierungs- und Abschnitt¬ fehlern. Nach einer Einführung werden die wichtigsten Filter¬ strukturen und die für Digitalfilter geeigneten Zahlendar¬ stellungen beschrieben und die allgemeinen Eigenschaften des Abschnittes von Fest- und Gleitkommazahlen untersucht. Es werden die Eigenschaften des Ueberlaufs diskutiert und es wird gezeigt, wie der Ueberlauf in der Arithmetik detektiert und gegebenenfalls korrigiert werden kann. Die praktische Durchführung der Skalierung und die dazu nötige Bestimmung der maximalen Signalamplituden werden behandelt. Es wird dann auf die Quantisierungsfehler der Koeffizienten einge¬ gangen. Zuerst wird eine indirekte Betrachtung angestellt, die einige qualitative Schlüsse gestattet. Nachher werden die Empfindlichkeit der Uebertragungsfunktion auf Koeffi¬ zientenänderungen und daraus Schranken für die Fehler be¬ rechnet. Am Schluss werden die Abschnittfehler der Signalgrössen behandelt, und zwar mit dem Modell des Quantisierungsrauschens. Zuerst werden die Gültigkeitsgrenzen dieses Modells untersucht: Die Korrelation zwischen Quantisierungs¬ rauschen und Signal, die Verteilung und die Varianz des Ab¬ schnittfehlers werden berechnet. Für den wichtigen Fall des Abschnitts des Produktes wird der Zusammenhang zwischen Ab¬ schnittfehler und Eingangssignal am Multiplikator gezeigt; numerische Resultate dafür, wie auch für die Verteilung der ihre Streuung und die Korrelation zwischen Fehler und Eingangssignal werden vorgeführt. Schliesslich wird das Fehler, Berechnung von Mittelwert und Streuung des Quantisierungsrauschens am Ausgang eines Digitalfilters im stationären und im transienten Zustand angewendet. Der Ein¬ fluss der Skalierung auf das Quantisierungsrauschen und das Verhalten der Doppelrundung werden am Schluss untersucht. Rauschmodell zur Weder die durch die Nichtlinearität des Abschnitts und des Ueberlaufs verursachten parasitären Schwingungen, noch die speziellen Probleme der Hardware-Realisierung werden in dieser Arbeit behandelt. Resume Ce travail traite quelques problemes se posant dans la realisation de filtres digitaux,en particulier des fautes de quantification et d'arrondi. les structures de filtre les plus representations des nombres les plus et les proprietes principales de l'arrondi des appropriees nombres en virgule fixe et en virgule flottante sont decrites. Les proprietes du debordement sont donnees et on montre comment il peut etre detecte et eventuellernentcorrige. L'execution pratique de la normalisation et la determination de l'amplitude maximale du Signal sont examinees. Ensuite, les fautes dues ä la quantification des coefficients sont considerees. Une consideration indirecte amene ä des conclusions qualitatives simples. La sensibilite de la fonction de transfert aux changements des coefficients est calculee et de lä des limites pour les erreurs de la fonction de transfert. A la fin les fautes dues ä l'arrondi des signaux sont traitees ä l'aide du modele du bruit de quantification. D'abord les limites de validite de ce modele sont examinees: la correlation entre le bruit de quantification et le signal est calculee ainsi que la distribution et la variance des fautes d'arrondi. Pour le cas tres important de l'arrondi du produit, la dependance fonctionelle entre l'erreur et le Signal d'entree du multiplicateur est montree par des examples numeriques pour la distribution de l'erreur, sa variance et la correlation entre le bruit et le signal d'entree. Ensuite le modele du bruit de quantification est utilise pour calculer la moyenne et la variance du bruit ä la sortie du filtre ä l'etat stationnaire et ä l'etat transitoire. Enfin l'influence de la normalisation sur le bruit et le comportement du double arrondi sont examines. Apres une introduction, importantes,les Dans ce travail ni les effects de la non-linearite de l'arrondi et du debordement (comme les oscillations parasites), ni les problemes pratiques de la realisation hardware ne sont traites. Abstract This paper deals with some problems which appear when implementing digital filters. After an introduction, the most important filter structures and the most suitable number representations are described and the general roundoff properties of fixed point and floating point numbers are discussed. The properties of the overflow are treated and it is shown, how overflow can be detected and if necessary, corrected. The practical implementation of scaling along with the necessary determination of the peak signal amplitudes is examined. Next, the errors due to coefficient quantization are treated. An indirect consideration leads to some simple qualitative rules. Then, the sensit!vities of the transfer function are calculated to obtain some bounds on the transfer function error. At the end the errors due to Signal rounding are examined using the quantization noise model. First, the limits of validity of this model are examined: the correlation between quantization noise and signal is calculated, as well as the distribution and the variance of the roundoff error. For the important case of product roundoff the functional dependence of the error from the multiplier input is shown and numerical examples for the distribution and the variance of the error and for the correlation between the error and the multiplier input are presented. The noise model is then used to calculate the mean and the variance of the noise at the filter output under stationary and under transient conditions. Finally influence of scaling on roundoff noise and the Performance of double rounding are examined. This paper treats neither the nonlinear effects of roundoff and overflow, as limit cycle oscillations, nor the practical aspects of hardware Implementation. Riassunto II presente lavoro si occupa di alcuni problemi che si pongono nella realizzazione di filtri digitali, in particolare degli errori di quantificazione e di arrotondamento. Dopo un'introduzione, principali strutture dei filtri di¬ gitali, le rappresentazioni dei numeri le piü adatte e le proprietä generali dell'arrotondamento dei numeri in virgola fissa e in virgola mobile sono descritte. Le proprietä dello le overflow sono discusse e viene mostrato come questo possa essere scoperto ed eventualmente corretto. L'esecuzione pratica dello scaling con la necessaria determinazione dei livelli massimi dei segnale vengono trattati. In seguito si considerano gli errori dovuti alla quantificazione dei coefficienti. Una considerazione indiretta conduce a conclusioni qualitative semplici. In seguito viene calcolata la sensi- bilitä della funzione di trasferimento a modificazioni dei coefficienti e da ciö dei limiti per gli errori della funzione di trasferimento. Alla fine vengono trattati gli errori dovuti all"arrotondamento dei segnali usando il modello dei rumore di quantificazione. Dapprima vengono esaminati i limiti di validitä di tale modello: la correlazione fra errore di quantificazione e segnale, la distribuzione e la varianza dell'errore di arrotondamento sono calcolati. Per il caso importante dell'arrotondamento dei prodotto e mostrata la dipendenza funzionale fra errore e segnale d'entrata dei moltiplicatore; vengono mostrati esempi numerici per la dis¬ tribuzione e la varianza dell'errore, come pure per la corre¬ lazione fra errore e segnale d'entrata. II modello viene utilizzato in seguito per calcolare il valore medio e la varianza dei rumore all'uscita di un filtro sia allo stato stazionario che a quello transitorio. Infine vengono esami¬ nati l'effetto dello scaling sul rumore ed il comportamento dei doppio arrotondamento. gli effetti overflow, come della non-linearitä dell'arrotondamento e dello oscillazioni parassite, ne i problemi specifici alla realizzazione in hardware vengono trattati in questo lavoro. Ne 1. EINLEITUNG 1.1 Was ist ein Um den Digitalfilter? Begriff "Digitalfilter" den wir zuerst den Begriff klar definieren zu können, wer¬ des Abtastfilters einführen. Ein eindimensionales Abtastfilter ist ein lineares, zeitinvariantes System, das eine oder mehrere 2 Zeitfolgen x(nT) 2 (Eingang) in eine oder mehrere Zeitfolgen y(nT) (Ausgang) transformiert. Ein solches Abtastfilter lässt sich durch ein linearen, zeitunabhängigen Differenzengleichungen beschreiben. Die dynamischen Eigenschaften sind durch die System von Koeffizienten dieses Differenzengleichungssystems, die Filter¬ koeffizienten, gegeben. digitalen Filter werden folgende Operationen durch¬ geführt: Multiplikationen mit konstanten Koeffizienten, Ad¬ ditionen und Zeitverzögerungen von ganzen Vielfachen der Ab¬ tastperiode T. Falls diese Operationen mit digitalen arithmeti¬ schen Elementen durchgeführt werden (siehe Kap. 1.2), wird das In einem Abtastfilter Digitalfilter im engsten Sinn genannt. Es gibt daneben auch mehrdimensionale Digitalfilter. Am verbreitetsten sind die zweidimensionalen Filter, bei welchen die Variablen je 2 Parameter enthalten, die als Koordinaten eines Punktes in einer Ebene aufgefasst werden können. Sie werden u.a. zur Verarbeitung von Bilddaten und in der Geophysik eingesetzt. Mehrdimensionale Filter werden in dieser Arbeit nicht behandelt. 2 Dies sind die sogenannten Mehrfach- (multivariable) Filter, wo die Ein- und Ausgänge Folgen von Vektoren sind [25]. In dieser Arbeit werden solche Systeme nicht betrachtet, die Resultate kön¬ nen aber im allgemeinen leicht auf solche Mehrfachfilter erweitert werden. 3 heutzutage die meisten Abtastfilter digital realisiert werden, häufig in der Literatur das Wort Digitalfilter eingesetzt, um Abtastfilter (sampled-data filters) allgemein zu bezeichnen. Da wird die Dieses System eine von Differenzengleichungen lässt sich auf einzige Differenzengleichung reduzieren: N y(n) + M b±-y(n-i) / i=l Diese £ = a.-x(n-i) i=0 Differenzengleichungen (1) lässt sich nach lösen: M Y(n) Das = (1) y(n) auf¬ N ai'x(n-i) Z— i=0 Digitalfilter sei den wir als jetzt Y~ " i=l bis b^yfn-i) (2) einem gewissen Abtastpunkt, wählen, in Ruhe, d.h. alle Eingänge und daher auch die Ausgänge) seien für diesen zu Nullpunkt Speichervariablen(und Moment gleich Null. Im Zeitpunkt n 0 setze man einen einzigen Wert x(0) 1 am Eingang, für alle anderen n ^ 0 sei der Eingang immer gleich Null. Das Ausgangssignal, das sich bei einer sol¬ chen Erregung ergibt, wird als die Impulsantwort h(n) des = = Filters bezeichnet. Wir haben unsere Digitalfilter als lineare Systeme definiert: es gilt daher das Superpositionsgesetz. Deswegen kann die Ant¬ wort einer beliebigen Eingangsfolge x(n) durch die Ueberlage¬ der Antworten rung auf der einzelnen Eingangswerte berechnet werden. Falls x(n) =0 für n < 0 und falls bei n 0 alle Speicher¬ variablen gleich Null sind, ergibt sich die Faltungssumme = y(n) = y n i=0 x(i)-h(n-i) Wir können auf die Folgen y(n), x(n) und h(n) die z-Trans- formation anwenden. Bei der z-Transformation (siehe z.B. LI]) die Faltung in eine Y(z) H(z) der der = geht bekanntlich Multiplikation über: X(z)-H(z) ist die Uebertragungsfunktion: sie ist die z-transformierte Impulsantwort h(n). X(z) und Y(z) sind die z-transformierte Eingangsfolge x(n), bzw. der Ausgangsfolge y(n).4 Eingang Wenn am x(nT) eine Cosinusfolge eingegeben A.cos(ü).nT) = = A.Re wird: e^™1} { ist die Antwort im eingeschwungenen Zustand (d.h. für n-*-<» ) durch die Uebertragungsfunktion am Punkt z gegeben = y H(Z) II z=eJiooT dengang, Die (nT) * = = A Re H(ü)T) { H(z) z=e jü)T • e e3U)T jntüT,'\ ist der Freguenzgang, |H(wT) | der Amplitu- H(u)T) der Phasengang des digitalen Filters. Uebertragungsfunktion aus der des Filters berechnet werden. Wenn Differenzengleichung(en) man Gl. (2) z-transformiert (wobei jede Verzögerung ersetzt 4 kann um wird), ergibt sich: T durch eine Multiplikation mit z-1 Normalerweise bezeichnet man Zeitfolgen mit Kleinbuchstaben entsprechende z-transformierte mit Grossbuchstaben, so und die dass ps gilt X(z) = Z{x(n)} M H(z) H v*-1 = 1=0 N 1 -ZIv1 i=l Zähler und Nenner durch die Durch^Division ergibt sich die von von z Uebertragungsfunktion , Form grösste Potenz in der üblichen M H(z) = z N-M i=0 z N"tbi ^ N ^ N i=l häufig der Term zN~M weggelassen, weil er eine Verzögerung darstellt. Wir werden ihn in dieser Arbeit Dabei wird reine ebenfalls nicht merkt ist. berücksichtigen, Die Uebertragungsfunktion 1,2 PrinzJPielle Möglichkeiten Ein Abtastfilter (Digitalfilter ausser wenn es anders ver¬ eines digitalen Filters kann immer als eine rationale Funktion in z ausgedrückt werden. weder mit den. im zur Realisierung im weitesten von Abtastfiltern Sinn) kann ent¬ analogen oder mit digitalen Elementen realisiert wer¬ Digitale Realisierungen von Abtastfiltern (Digitalfilter eigentlichen Sinn) können entweder als Programme für Digital¬ rechner oder als spezialisierte Hardware realisiert werden. Um ein Abtastfilter analog loges Verzögerungselement. 10 realisieren, braucht man ein Als Verzögerungselemente können zu ana¬ Verzögerungsleitungen [2], kapazitive Speicher (entweder dis¬ kret [3] oder integriert als Eimerkettenschaltungen (bücket brigade) t4] oder ladungsgekoppelte Schaltungen (charge coupled devices, CCD) [5]), ferromagnetische [6] oder ferroelektrisehe Speicher [7] verwendet werden. Die Multiplikationen werden mit Widerständen oder Spannungsteilern, Additionen mit Operations¬ verstärkern realisiert. Mit Hilfe von Oberflächenwellen auf piezoelektrischen Materialien (surface waves) können Filter gebaut werden, die ähnlich wie Transversalfilter (nichtrekursive Digitalfilter) sind. Dispersive Effekte bei der Wellenausbrei¬ tung bewirken aber, dass ihre Eigenschaften digitalen Filtern abweichen [8]. etwas von denen der hybride Lösungen wurden vorgeschlagen, wo die Speicherung digital und die Operationen analog durchgeführt werden [9]. Auch Bei analogen hybriden Realisierungen werden die Amplituden nicht quantisiert. Die Toleranz- und Driftprobleme sind ähnlich gelagert wie bei den analogen Filtern: die Toleranzen der Ele¬ mente können nicht beliebig klein gemacht werden. Dazu gibt es noch Schwierigkeiten, welche durch die nichtidealen Eigenschaf¬ ten der analogen Verzögerungsglieder verursacht werden, wie Verzerrungen durch Dispersion und Dämpfung in Verzögerungs¬ leitungen, Ladungsverluste in den kapazitiven Speichern, usw. und digitalen Realisierung werden alle im Filter vorkommende Grössen Koeffizienten und Signale durch Zahlen dargestellt. Die Zahlen werden mit Hilfe arithmetischer Schaltungen (Multi¬ plizierer und Summatoren) verarbeitet. Die Verzögerung der Signale ist dabei besonders problemlos. Die Zahlen können fehler¬ frei und beliebig lang gespeichert werden. (Eine Ausnahme sind die dynamischen Schieberegister, die eine minimale Schiebe¬ frequenz zur Erhaltung der Information erfordern.) Bei einer - - 11 Toleranzprobleme sind anders gelagert. Mit entsprechendem Aufwand kann eine beliebige Genauigkeit erreicht werden: es müssen nur genügend lange Worte für die Zahlen vorgesehen werden. Die Zahlen sind auch keinen Drifterscheinungen unterworfen, welche durch die Temperatur oder die Alterung bedingt wären. Das heisst nicht, dass bei Digitalfilter die Genauigkeits¬ probleme nicht beachtet werden müssen. Aus wirtschaftlichen Gründen ist man interessiert, mit der kleinstmöglichen Wort¬ länge auszukommen, die nötig ist, um gewisse, vorgegebene Die Genauigkeitsanforderungen erfüllen. Daher besteht ein Inte¬ resse, die Effekte, welche durch die beschränkte Genauigkeit der Zahlen verursacht werden, zu beherrschen. Das Ziel der vorliegenden zu 1.3 Arbeit ist es, ein Beitrag in dieser Richtung liefern. Die Fehler der endlichen Arithmetik Die durch die beschränkte Arithmetik) folgt - zu verursachten Genauigkeit der Zahlen (beschränkte Fehler in Digitalfilter können wie klassifiziert werden: Wegen der Darstellung der Koeffizienten durch Zahlen einer beschränkten Wortlänge mit werden diese in ihrem Wert verändert. Man bekommt damit ein verändertes Filter, dessen Koeffizienten von den berechneten abweichen: die Uebertragungs¬ funktion des Filters wird durch die Quantisierung der Koeffi¬ zienten verändert. Dieses Problem wird im Kapitel 4 behandelt. - Die Zahlen haben einen nach den absolut grossen Werten hin beschränkten Bereich. Falls die überschreiten, ergeben Signalverzerrungen und Signalgrössen diesen Bereich sich Ueberlauffehler. Sie führen zu können Instabilitäten verursachen. Die Ueberlauffehler können durch geeignete Massnahmen, ins¬ besondere durch eine geschickte Skalierung, vermieden werden. 12 Wir werden sie im - Kapitel 3 behandeln. vermeiden, dass die Wortlängen der Signalgrössen mit jeder durchgeführten Multiplikation wächst, müssen an ge¬ Um zu eigneten Stellen die weniger gewichtigen Ziffern der Zahl abgeschnitten werden.. Die so verursachten Abschnittfehler führen zu Störsignalen im Filter. Wir werden diese Fehler im Kapitel 5 analysieren. - Verarbeitung analoger Signale notwendige Analog/ Digitalwandlung verursacht Quantisierungsfehler der Signale. Sie werden auch im Kapitel 5 betrachtet. Die bei der Das sind die Fehler, die in der vorliegenden Arbeit untersucht werden. Weitere, nicht systembedingte Fehler, wie Abtastjitter, Unregelmässigkeiten der Digital/Analogwandlern, wandlern, usw. Stufung Analog/Digitalwandlern und Vorgänge in Digital/Analog¬ von transiente werden nicht betrachtet. 13 2. GRUNDLAGEN FUER DIE REALISIERUNG DIGITALER FILTER In diesem die bei Kapitel werden wir ein paar Probleme betrachten, der Realisierung digitaler Filter wichtig sind. In einem ersten Abschnitt (2.1) werden wir einige Strukturen betrachten, die bei der Realisierung digitaler Filter deutung Im von Be¬ sind. folgenden Abschnitt 2.2 werden wir uns überlegen, welche Zahlendarstellung sich für Digitalfilter am besten eignet und die allgemein getroffene Wahl der binären Arithmetik rechtfertigen. Abschnitt 2.3 werden wir die allgemeinen Eigenschaften des Abschnittes von Festkommazahlen und im Abschnitt 2.4 die des Abschnittes von Gleitkommazahlen behandeln. Diese Resultate Im werden in den 2.1 Kapiteln 4 und 5 Realisierungsstrukturen von gebraucht. Digitalfiltern Wir haben gesehen, dass ein Digitalfilter durch ein System von Differenzengleichungen gegeben ist und dass dieses System sich auf eine einzige Differenzengleichung reduzieren lässt, welche die Ausgangsfolge direkt mit der Eingangsfolge verknüpft. Die z-Transformierte dieser Differenzengleichung ist die Uebertragsfunktion in ihrer rationalen Form. Es ist leicht einzusehen, dass viele verschiedene Strukturen Digitalfiltern existie¬ ren, welche alle die gleiche Uebertragungsfunktion besitzen. Sie würden im idealen Fall alle dieselben Eigenschaften haben, von sie verhalten sich aber unterschiedlich ten gegenüber der erwähn¬ Begrenzung der Genauigkeit, (d.h. gegenüber Abschnittfehler, Quantisierung 14 der Koeffizienten, usw.). notwendige Bedingung, damit ein System von Differenzen¬ gleichungen ein realisierbares digitales Filter darstellt, ist, Eine dass darin keine verzögerungsfreieSchleifenvorkommen, da jede Durchführung von arithmetischen Operationen eine gewisse Zeit beansprucht. Deswegen kann das Differenzengleichungs¬ system stets in die Form der Zustandsgieichungen gebracht werden: 'w(n+l) = y(n) = [A] -w(n) C *w(n) + B • + D • x(n) x(n) w(n) ist der Vektor der Speicherausgänge (Zustandsvariablen) nach_dem,n-ten Abtastpunkt, w(n+l) ist der Vektor der Speicher¬ eingänge vor dem (n+1)-ten Abtastpunkt, x(n) und y(n) sind die Ein- und Ausgangswerte. [A] ist die Systemmatrix, B der Steuervektor, C der Beobachtungsvektor und D der Durchgangs¬ koeffizient. Zwei lineare Systeme werden als äquivalent definiert, wenn sie gleiche Uebertragungsfunk¬ tion besitzen [25]. Ein zu einem gegebenen System äquivalentes System kann durch eine Aehnlichkeitstransformation gefunden werden [10]. Man muss die Zustandsvariablen mit einer regulären Transformationsmatrix [T] multiplizieren die gleiche Impulsantwort, w' Die = [T] • w Systemmatrix [A1], vektor C1 für den [A'] = [T]"1 bzw. die den Steuervektor neuen [A][T] Bj_ und den Beobachtungs¬ Satz von Zustandsvariablen ist dann ; B' = [T]"1 B ; C = C [T] 15 unendlich viele reguläre Matrizen existieren, gibt es auch unendlich viele Systeme, die zu einem gegebenen System äqui¬ valent sind. Es können immer äquivalente Systeme gefunden werden, die eine höhere Ordnung als das Originalsystembesitzen: Da Der Vektor der Zustandsvariablen muss zuerst durch die Ein¬ führung redundanter Zustände, die weder mit den Ein- und Aus¬ gängen, noch mit den anderen Zustandsvariablen verkoppelt sind, erweitert werden. einem digitalen eine kleinere Zustände Es stellt sich daher die Filter ein Frage, ob zu äquivalentes System existiert, das Ordnung besitzt, besitzt, d.h. ob ein Filter redundante die eliminiert werden können. Bei gewissen Transformationsmatrizen kann eine Kaiman'sehe kanonische Systemdarstellung [24] in vier ein Teilsysteme beobachtbares erhalten werden. Das System kann dabei zerfallen, die in Fig. 1 dargestellt sind: und erreichbares (BE), ein erreichbares, nicht beobachtbares (BE), ein beobachtbares, aber nicht erreichbares (BE) und ein nicht beobachtbares und nicht er¬ reichbares (BE) Teilsystem. B E "^O B E B E Bf E Fig. 16 1 Kaiman"sehe kanonische Systemdarstellung aber Nur der erreichbare und beobachtbare Teil ist für inte¬ Impulsantwort bestimmt (und daher Uebertragungsfunktion). Ein System, bei welchem alle ressant, da auch die uns er allein die sind, wird minimal genannt. und daher Die minimalen Systeme besitzen die kleinste Ordnung aller äquivalenten Systeme, die kleinste Anzahl Speicher Zustände erreichbar und beobachtbar - - realisieren. Ein Filter ist sicher nicht minimal, falls der Zähler und der Nenner seiner Uebertragungsfunktion nicht teilerfremd sind, d.h. falls es Nullstellen und Pole besitzt, die sich aufheben. Von den die eine bestimmte Impulsantwort minimalen Systemen sind diejenigen besonders interessant, die eine minimale Anzahl an Koeffizienten verschieden von 0 oder + 1 brauchen, gegebener Ordnung um zu alle rationale Uebertragungsfunktionen realisieren. Solche Filterstrukturen sind als kanonisch bezeichnet [14,25]. Man braucht für ein kanonisches Filter mit N Nullstellen und N Polen N Speicher und 2N+1 Koeffizienten. in der Literatur Wir werden häufig jetzt einige wichtige Filterstrukturen besprechen. 2.1.1 Direkte Formen Bei den direkten Formen sind die Filterkoeffizienten die Koeffizienten der Uebertragungsfunktion zugleich in rationaler Form, also die Koeffizienten des Ausdrucks Der Begriff "kanonisch" hat in der Mathematik eine recht vage unter einer Anzahl gleichartiger Be¬ griffe heisst kanonisch, wenn er eine besonders grosse Bedeu¬ tung und eine besonders durchsichtige Gestalt hat", Der grosse Brockhaus 1955, Bd. 6, S. 216). Deshalb herrscht in der Litera¬ tur über digitale Filter eine ziemlich grosse Verwirrung über die Bedeutung dieses Begriffes: vergleiche z.B. [14] mit [11, 12] und [13]. Definition ("Ein Begriff 17 V H(z) M Z_ai i=0 = z M-i N z N + _L 2__b. z i=l Die eigentliche direkte gleichung digitalen des ' = n iL iFig. 2) realisiert die Differenzen¬ Form Filters N ^£ a. i x - n-i i=0 Sie ist nicht V^ b. £_ "i y*n-i i=l minimal, besitzt aber die minimale Anzahl von Koeffi zienten. tthtt—r[!>-T-[5> ,X)a [!> (x)a, x Ja M-l X a T X ~\ ^"bN-l y X>b„ (X)-b <CrJ—• -<5j-^—<J]—»—<Ct]• Fig. 2 Direkte Form Es sind zwei 18 • direkte kanonische Strukturen bekannt. (nT) erste6 Die man kanonische Form [11,12] (Fig. 3) bekommt man, indem die Differenzengleichung wie folgt schreibt max(N,M) y«n und dann = je ao Xn JZ + Ui Xn-i i=l - bi Yn-i) Speichervariable dem Term der Summation eine zu¬ weist. Man bekommt daraus "y(n) W. x(nT) aQ = (n+1) = a. x(n) w-^n) + ;*(n) Xvn; - y l>^ y(n) b. ~{^>^ ~^>~ rx-bN 3 X -b ., mit * * * "" i = wn+1 l...max(N,M) = 0 ^~~t^^*Xb + (nT) XVb, N-1 Erste kanonische Form Wenn man die ¦ 5v^ x)a.N + Fig. «i+i (n) für + w. viii (M=N) Uebertragungsfunktion G(z) = N(z) D(z) folgendermassen zerlegt 6 W(z) = Y(z) = 1 X(z) D(z) N(z) • Wir brauchen hier die In W(z) Terminologie [14] sind die Bezeichnungen nach Schüssler [11,12] für beide Formen vertauscht. 19 bekommt Form die Differenzengleichungen [11,12,13,14](Fig. 4) man der zweiten kanonischen N w(n) '= x(n) - y b. w(n- i) i=l M y(n) = y a. w(n-i) i=0 I x(nT) <} 0aN ©-Vi 4 i G>bN w(nT) ¦ ¦ x)-b <\ • ©aN- i Fig. 4 Zweite kanonische Form 2 2 y(nT) (M=N) Die beiden direkten kanonischen Formen lassen sich durch Transponieren [15,16] ineinander überführen. Bei der Transpo¬ nierung wird die Richtung des Signalflusses im Filternetzwerk gekehrt, insbesondere wird der Eingang und der Ausgang ver¬ tauscht und Knoten werden Summatoren und Summatoren zu Knoten. Systemmatrix wird dabei transponiert. Es ist dabei zu bemerken, dass die beiden als kanonisch bezeichneten Formen nur kanonisch im Sinne der von uns gegebenen Definiton sind, Die falls der Zähler und der Nenner ihrer teilerfremd sind. 20 Uebertragungsfunktion 2.1.2 Zerlegte Formen Uebertragungsfunktion in eine Teilübertragungsfunktionen Bei diesen Strukturen wird die Summe oder in ein Produkt von niederer Ordnung zerlegt. Das Filter wird dann realisiert als eine Parallelschaltung oder eine Kaskadenschaltung von Teilfiltern. niedrigste mögliche Ordnung ist eins. Damit wird in jedem Teilfilter ein Pol der Uebertragungsfunktion realisiert. Falls das Filter komplexe Pole besitzt, sind Teilfilter erster Ord¬ nung ungünstig, da sie komplexe Multiplikationen enthalten, die 4 reelle Multiplikationen und 2 reelle Additionen (oder 3 reelle Multiplikationen und 5 reelle Additionen) bedingen. Die Da man meist mit reelen imaginären Signalen arbeitet, müssen sich die günstiger, arbeiten, wobei jedes ein Anteile aufheben. Es ist daher Teilsystemen 2. Ordnung zu mit Paar konjugiert komplexer Pole realisiert. Die zerlegten Strukturen sind kanonisch oder nicht kanonisch je nachdem ob die einzelnen Teilfilter kanonisch sind oder nicht. 2.1.2.1 Parallelform Die Parallelform entsteht bei der PartialbruchZerlegung der Uebertragungsfunktion: somit wird die Uebertragungsfunktion als Summe von Teilübertragungsfunktionen dargestellt [12]. Sie kann realisiert werden, indem die Ausgänge der Teilfilter zusammen addiert werden, wobei der Eingang jedes Teilfilters direkt an den Filtereingang angehängt wird (Fig. 5). Man kann für ein Digitalfilter ähnliche Parallelformen zerlegung auf eine aufstellen, indem ausgedrückt man die Partialbruch- Uebertragungsfunktion anwendet, als rationale Funktion in z zwei verschiedene, aber ziemlich z die entweder oder als rationale Funktion in ist. 21 PU) G1(z) 1 x(nT) > i G2(z) • • « • • • y (nT) • • 1 Parallelform Fig. 5 Wenn man in V«) die Uebertragungsfunktion ausdrückt z y H(z) = M a. hat die P(z) = N P(z) fei z"1 b.x Np ri i=l k=l im allgemeinen die Form + (z - p. x) ist der Quotient der Division des Zählers durch den ist die Vielfachkeit des i-ten Poles p. *i l ist die Anzahl verschiedener Pole: N L>± i=l 22 TT Partialbruchzerlegung Nenner, r. N z 1=0 1 + H(z) als rationale Funktion - N es muss dabei H(z), gelten von Fällen sind die Pole einfach. Durch Zusammen¬ In den meisten fassen der Terme mit zweiter Ordnung bekommt N h(z) = pu, + konjugiert komplexen man N A. p.x r y- —x 1 r—r-, i=l -. . Polen in Terme p. *i - r~ + - c'/2 Zr-T ^—- z 1=1 a + a, —oi . 1 + b, li z _1 . z -1 u—-^~ + . b_. z 2i (4) wo N diejenige die Anzahl der reellen und N der komplexen Pole ist. Die Uebertragungsfunktion als rationale Funktion in der rationalen Funktion in z kann gefunden werden, »m man indem den Zähler und den Nenner durch die höchste Potenz von z -1 aus dividiert, die ) vorkommt. Es ergibt sich: in H(z M r— H(z) ai -i^l = z M-N,(z N M-l „ Z_. + , z z * tr* > b.x 1=1 . z N-i,) M-N Der Faktor z" ist bei dieser Der bei dieser Operation Betrachtung wichtig.* entstehende Grad des Nenners von H(z) kann nicht kleiner werden als der Grad des Zählers. Ferner tritt falls M>N scheinung. Die ist, ein (M-N)-facher Pol bei Partialbruchzerlegung N H(z) -E = r* -A- lo+C £ , 1=1 . (Z , k=l z = 0 in Er¬ bekommt daher die Form Aik ~ ) P. *i N P wo p. der i-te Pol von H(z) ist. Hier ist / r. = max(M,N). i=l 23 a o ist der Quotient der Division des Zählers durch den H(z). Falls die Pole (ausser Nenner von 0) einfach sind und man konjugiert komplexen Polen zusammenfasst, die Terme mit ergibt = y~ L- ——+ * - P± " = P' (z) + A! _. r V~ —i 1 .—T l-l - M-N wobei P (z) = a0 + ZI 1=1 einen transversalen Teil 2l M . M-N + a„. z , ' nur falls H Uebertragungsfunktion N H(z) , ' " umwandelt, findet z = ° 7^ -r^—-—+ *o+Y^-x Z_ + b _z + b z2 /_zi 1=1 "li" "2i i=l a letzte Term existiert die letzte in N^/2 c' w, A.' r i=l Der z sich N H(z) der bei z N. Wenn > man jetzt wieder in eine Funktion man Nc/2 -1 — + p.z *i , a. V~" —Ü 4—r 1=1 . z -1 1 + b. li . + z a9. z -2 -y-^ib_.z 2i — + (5) ciz"i darstellt, der nur existiert falls N. Es existieren zwei sehr ähnliche Parallelformen: die Nenner der Teilübertragungsfunktionen identisch, die Zähler in (4) und (5) sind und der eventuell vorhandene transver¬ sale Teil sind aber verschieden. 2.1.2.2 Kaskadenform Durch Faktorisieren von Zähler- und tragungsfunktion [12] ergibt 24 sich: Nennerpolynom der Ueber¬ M H 1=0 H(z) z N a. N + , \r~ b 2— M M-i z . z a TT (z o 1=1 N N-i TT (z i=i 1=1 z - - ) P±) die Nullstellen und p. die Pole von H(z) sind, i Durch Zusammenfassen der konjugiert komplexen Pole und Null¬ wobei z. l Ordnung Teilübertragungsfunktionen bekommt stellen in Faktoren zweiter von H(z) -•jr z - z. z P± z 1 z - Kaskadenschaltung (Fig. 6). das als kann -üi£L_0— Fig. Für von GL(z) 2 man + a,Ii z + a_ + b..z Ii b~. . + ein Produkt 2i . 2i Teilfiltern realisiert werden GN(z) G2(z) y(nT) 6 Kaskadenform jede Uebertragungsfunktion gibt es viele Kaskadenanord¬ nungen, die sich nach der Art unterscheiden, wie man die Faktoren des Zählers und des Nenners zu Teilübertragungs¬ funktionen paart und wie man die einzelnen Teilfilter in der Kaskade ordnet. Diese verschiedenen Anordnungen unterschei¬ den sich in ihrem Rauschverhalten (d.h. in der Auswirkung der Abschnittfehler), wie wir im Kapitel 5.4.8 sehen werden. 25 2.1.3 Andere Filterstrukturen Neben den besprochenen der letzten Zeit "klassischen" Filterstrukturen sind in Formen vorgeschlagen worden. Mit diesen kann man ein ganzes Filter realisieren oder aber diese Struk¬ turen können als Teilfilter in Parallel- oder Kaskadenformen eingesetzt werden. Hier werden kurz einige dieser neuen Filter¬ neue strukturen aufgezählt. - [18], Mitra [19] u.a. [14,20]. Kettenbruchzerlegungen der Uebertragungs¬ Kettenfilter nach Hemmer Sie beruhen auf funktion - Filter mit Kreuz- und Kettenglieder nach Gray und Marke1 [21] u.a. [22,25]. Die Koeffizienten des rekursiven Teils dieser Formen können mit der Divisionsmethode zur Prüfung der Stabilität abgetasteter Systeme [1] erhalten werden. Bei diesen Strukturen ist die Stabilität leicht aus den Koeffizienten - zu bestimmen. Wellendigitalfilter Im Gegensatz zu [23] den übrigen Digitalfiltern beruhen diese nach Fettweis auf einer direkten Uebertragung Element für Element der einzelnen Komponenten eines analogen RLC-Filters, das auch Verzögerungsleitungen enthalten kann. Sie sollen sehr günstig in Bezug auf Quantisierungsfehler sein. In [14] sind insgesamt 14 kanonische Strukturen aufgeführt. Es stellt sich die Frage, welche Filterstruktur die beste bezüglich Empfindlichkeit gegenüber Quantisierung der Koeffi¬ zienten und ses bezüglich Problem ist immer noch offen: es sind stematischen z.B. 26 Verhalten auf Abschnittfehler ist. Die¬ [26,50]. Untersuchungen der nur Ansätze von sy¬ Empfindlichkeit bekannt, / wie 2.2 Darstellung Die der Zahlen digital realisierten digitalen Filtern werden alle Bei den im Filter vorkommenden Grössen Signale mit Hilfe arithmetischer Operatio¬ allen heute gebräuchlichen arithme¬ dargestellt, die nen manipuliert werden. Bei tischen Schaltungen werden die mit Zahlen von - Koeffizienten und Zahlen durch eine Kombination logischen Zuständen (0 und 1) dargestellt. zwei sehr viele logischen Möglichkeiten, - eine Zahl mit Hilfe von Es gibt binären codieren. Wir werden hier versuchen, eine Systematik anzugeben, um daraus die für die Digital¬ filter geeignetsten Zahlencodierungen herauszuschälen. Zuständen zu 2.2.1 Zahlencodes Zuerst können wir zwischen gewichteten und ungewichteten Zahlencodes unterscheiden. Bei den gewichteten Codes wird die Zahl durch eine Folge von Ziffern dargestellt {dn dn_l '•• dm+2 dm+l dm} Jeder Ziffer wird ein Gewicht der Ziffer in der Zahl zugeordnet, das von der Stelle abhängt. Wenn im betrachteten Zahlen¬ system b verschiedene Ziffern existieren, die die Werte b-1 annehmen können (b heisst die Basis des 0, 1, 2, ..., Zahlensystems), zahlige) Potenz dann ist das Gewicht einer Ziffer eine (ganz¬ der Basis. Der Wert der Zahl ist dann die ge¬ wichtete Summe der Ziffernwerte n d.l -b1 i=m 27 gewichteten Codes ist, Der grosse Vorteil der dass die arithme¬ tischen Operationen auf iterative Operationen zwischen den Zif¬ fern zurückgeführt werden können. Insbesondere kann die Addition zweier Zahlen x = {x^n x n-1 ... x m+1 x m } und y (y n = J 2 auf die Addition der einzelnen Ziffern n y = , y _,_-, Jm y } Jm+1 ... zurückgeführt werden n Y~ x±bi V" y-b1 V~ (x± y±) b1 i=m + i=m + = *famn->«r>™i» *¦—^ i=m tf,, berücksichtigt werden, Es muss dabei ,i . | + x n y n-1 J m dass der Wert einer einzelnen Ziffer höchstens (b-1) betragen kann: die Summie¬ rung der Ziffern muss modulo b erfolgen. Falls ein Ueberlauf d.h. falls die Summe der Ziffern grösser als (b-1) wird, muss ein Uebertrag (carry) "1" zur benachbarten Ziffer erfolgt, mit höherem Gewicht hinzuaddiert werden. Das die Addition mit der und zu Bei den immer höher niedriger gewichteten Ziffer gewichteten Ziffern führen nichtgewichteten Codewörter bewirkt, Zahlencodes ist die dass beginnen muss. Zuordnung der den Zahlenwerten anders (ein Beispiel für solche Codes ist der Gray-Code). Diese Codes sind im allgemeinen für eine Arithmetik ungeeignet, da eine Zerlegung der Operationen normalerweise nicht möglich ist und diese nur über umfangreiche gespeicherte Tabellen oder mittels komplizierter logischer Schaltungen erfolgen können. zu Es haben sich logische Systeme mit zwei Zuständen einge¬ bürgert. Deshalb nimmt das Zahlensystem mit der Basis 2 eine ausgezeichnete Stellung ein, da seine Ziffer direkt mit den zwei nur logischen Zuständen 0 und 1 darstellbar sind: das ist der reine oder natürliche Binärcode. 28 Zahlensystemen müssen die einzelnen Ziffern entsprechend mit den zwei logischen Zuständen 0 und 1 Bei den anderen zuerst codiert werden. Wenn die Basis eine Potenz von 2 ist und die einzelnen Ziffern binär codiert werden, ergibt sich ein Code, der wieder genau dem reinen Binärcode entspricht (Beispiel: Octalcode, Hexadezimalcode). Wenn die Basis keine Zweierpotenz ist, ist eine gewisse Redundanz vorhanden: Bei der Co¬ dierung der Ziffern stellen nicht alle möglichen Bit-Kombina¬ tionen auch eine Ziffer dar. Diese auch mehr zu Bits, um einen gewissen Systeme Zahlenbereich darstellen können und auch die arithmetischen komplizierter. Das brauchen deshalb wichtigste solche Schaltungen werden System ist dasjenige 10, das Dezimalsystem, und zwar weil der Mensch Jahrhunderten angewöhnt hat, dezimal zu zählen und mit der Basis sich seit Dezimalsysteme (BCD-Systeme im weitesten Sinn) für Ein- und Ausgabeoperationen durch den Mensch besonders günstig, bedingen aber gegenüber den reinen Binärsystemen einen Mehraufwand bezüglich Speicher¬ platz und arithmetischen Operationen. Aus diesem Grund werden zu rechnen. Deshalb sind die binärcodierten die BCD-Systeme dort verwendet, wo der Mehraufwand für eine BCD-Arithmetik kleiner ist als der Aufwand für die Umwandlung der Zahlensysteme, wie bei Tischrechnern, Computern kommerzielle Anwendungen, usw. Bei hingegen praktisch nie verwendet. Eine weitere Sie wird den Möglichkeit aber, version in andere [27]. der Addition, wegen Multiplikation Zahlensysteme sozusagen bei der deswegen werden sie ist die Residuenarithmetik trotz ihrer Vorteile bei Komplikationen Wir werden uns Digitalfiltern für im folgenden nur und bei der Kon¬ nie gebraucht. mit dem reinen Binär¬ code befassen. 29 2.2.2 Darstellung Digitalfiltern In von Darstellung positiven Zahl, positive und negative naheliegendste Weise, um das muss man stellen können. Die die 7 positiven und negativen Binärzahlen Zahlen dar¬ zu tun, ist durch Betrag und Vorzeichen. Es wird einer die den Absolutwert der Zahl darstellt, ein zusätzliches Vorzeichenbit angehängt. Die übliche Konvention ist, dass das Vorzeichenbit 0 für eine positive Zahl und 1 für eine negative gesetzt wird. Bei dieser Darstellungsart ist die Multiplikation am einfachsten: man muss nur beide Beträge miteinander multiplizieren. Das Vorzeichen des Pro¬ duktes ist die "Exklusiv-Oder"-Funktion der Vorzeichen der Faktoren. Die Addition_jLst dafür komplizierter: es muss erst anhand der Vorzeichen der Addenden entschieden ob man muss. die Beträge werden, der Addenden addieren oder subtrahieren Wenn die Vorzeichen verschieden aber zuerst zu¬ muss man sind, subtrahiert man, noch bestimmen, welcher der beiden ist. Beträge der grössere In Digitalfiltern werden Weise dargestellt. die Koeffizienten meistens in dieser Komplementdarstellungen günstiger. unabhängig von den Vorzeichen der Für die Addition sind die Damit wird die Addition durchgeführt. Die Subtraktion wird auf die Addition zurückgeführt und zwar mit Hilfe einer Komplementierung des Subtraktors. (Das Komplement einer Zahl ist jene Zahl mit dem gleichen Betrag, aber mit umgekehrtem Vorzeichen). Die einfachste Weise, einen solchen Komplementcode zu erhalten, ist, die (positiven und negativen Zahlen x in rein positive Zahlen x* abzubilden. Wenn der Zahlenbereich von -m/2 bis m/2 -q geht (q sei dabei das Gewicht des leichtesten Bit), Addenden 7 Als Literatur für diesen Abschnitt kann jedes Buch über Computer-Hardware oder Computer-Arithmetik, wie z.B. [27,93j angegeben werden. 30 kann dieser mit x* in das + x = positive m/2 Intervall [0, m-q] abgebildet werden. Der erhaltene Code heisst "offset binary" Code [28j. Man er¬ hält diesen Code, wenn man einen unipolaren Analog/Digital¬ so wandler oder Digital/Analogwandler polarer Spannungswerte für die Konversion bi¬ verwendet: Die Addition des Wertes Bereichsumfangs, also die Addition von m/2, er¬ folgt dabei auf der analogen Seite. Bei diesem Code entspricht des halben das Vorzeichenbit nicht der üblichen oben erwähnten Konvention, und der Wert Null wird hier durch die Bitfolge 10 0 0 gekennzeichnet. In der Arithmetik bedient man sich daher dem sehr verwandten Zweierkomplementcode. Man erhält ihn aus dem Offset Binary Code durch Invertierung des Vorzeichen¬ bits. Diese Inversion ist gleich der Addition modulo m des Wertes 10 0 Zahlenwert x* m/2. Somit ist die Abbildung von zugehörigen positiven Abbildungswert 0 ... zum x + = = (mod m) m = x - m einem (mod m) Bei den Zahlen in Zweierkomplement ist das Gewicht des Vor¬ zeichenbits negativ (= -m/2), während das Gewicht aller an¬ deren Bitstellen positiv geblieben ist. Komplementdarstellung ist die EinerkomplementDarstellung. Man erhält sie aus dem 2-er Komplement durch Eine andere die Subtraktion des Gewichtes q des leichtesten Bit wenn die Zahl negativ ist. Der Zahlenbereich ist hier symmetrisch (~2 0 + 0 q» ... j 0 - q)• Der Wert Null besitzt zwei (als +Q bezeichnet) und 1 1 1 Darstellungen: ... 1 (-0). Das Gewicht der Vorzeichenstelle ist hier keine Es beträgt --? + Zweierpotenz: q. jetzt einige wichtige Operationen mentdarstellungen Wir betrachten in den Komple¬ . 31 Komplementbildung, d.h. die Bildung der mit -1 multi¬ plizierten Zahl, ist besonders einfach beim 1-er Komplement: Die man muss nur alle Bits der Zahlendarstellung Komplement zu bilden, bildet Komplement und addiert eine "1" Um das 2-er man das 1-er an invertieren. meistens zuerst der leichtesten Stelle. Für eine serielle Verarbeitung ist der folgende, äqui¬ valente Algorithmus [27] günstiger: Man untersucht das Wort bitweise von der leichtesten Stelle an. Die ersten Nullen werden unverändert, wie auch die erste "1". Alle nach der ersten "1" folgenden Bits werden invertiert. Die Addition erfolgt ähnlich wie die Addition positiver Zahlen: Die Vorzeichenbit werden mitaddiert. Zweierkomplement wird der Uebertrag aus der Vorzeichen¬ stelle ignoriert. Beim Einerkomplement muss eine Korrektur eingeführt werden: der Uebertrag aus der Vorzeichenstelle Beim wird leichtesten Bit der Summe hinzuaddiert. Bei Parallel¬ addierern geschieht das, indem man den Uebertrag-Ausgang aus der Vorzeichenstelle mit dem Uebertrag-Eingang an der leich¬ zum testen Stelle verbindet? bei einer seriellen Addition ein zusätzlicher Die Additionszyklus eingeführt Multiplikation von Zahlen in muss werden. Komplementdarstellung ist komplizierter als die von Zahlen, die mit Betrag und Vorzeichen dargestellt sind. Bei Digitalfiltern werden daher in der Regel die Filterkoeffizienten mit Betrag und Vorzeichen dargestellt, die Signale aber mit Komplement wegen der nach¬ folgenden Additionen. Eine Möglichkeit ist, dass man die Signalgrössen vor der Multiplikation von der Komplernentdaretwas 8 Paralleladdierer mit geschlungenem Uebertrag (ripple carry) Einerkomplement ein wenig mehr Zeit (gleich der Verzögerung des Uebertrags durch zwei Volladdierer) als beim Zweierkomplement. Die Additionszeit wird in einem Paralleladdie¬ rer mit vorbestimmten Uebertrag (carry look-ahead) bei Verwendung des Einerkomplements praktisch verdoppelt [93]. Ein braucht beim 32 in die Betrag- und Vorzeichendarstellungumwandelt und sie nach der Multiplikation wieder in die Komplement¬ Stellung darstellung zurückwandelt. Die direkte Multiplikation mit der Signalgrössen in Komplernentdarstellung ist auch möglich: Die Methoden hängen von der Komplernentdarstellungund von der Art, wie die Multiplikation durchgeführt wird, ab. Es sei hier auf die Literatur verwiesen [27,29]. allgemeinen kann man sagen, dass die Einerkomplemntdar9 Stellung vorteilhafter ist für eine parallele Arithmetik wegen der einfacheren Komplementbildung und das ZweierkompleIm ment hingegen Arithmetik, 9 weil man dabei Additionszyklus braucht. Bei der Verwendung für eine serielle keinen zweiten Zweierkomplementes für eine Parallelarithmetik braucht man zur Bildung des Komplementes eine Kette von Halbaddierern, um den Wert l.q zu addieren. Falls man höchstens einen der Addenden vor einer Summierung komplementiert, kann man sich für die Bildung des Zweierkomplementes die Halbaddierer er¬ sparen: Man bildet das Einerkomplement und fügt den Wert l.q erst bei der nachträglichen Addition hinzu, indem man eine "1" an den Uebertrags-Eingang der leichtesten Stelle setzt. In diesem Fall kann das Zweierkomplement auch für eine Parallel¬ des arithmetik mit Vorteil eingesetzt werden. 2.2.3 Fest- und Gleitkommazahlen jetzt betrachteten Zahlen sind Festkommazahlen. Das Gewicht der einzelnen Bits bleibt konstant: Insbesondere ist Die bis es nicht Funktion der Zahlengrösse. (Fig. 7) 9 Bei der parallelen Arithmetik wird das ganze Wort gleichzeitig verarbeitet. Jedem Bit entspricht eine Leitung. Bei der seriel¬ len Arithmetik werden die Bits der Zahlen nacheinander ver¬ arbeitet, und zwar mit dem leichtesten Bit zuerst und dem Vor¬ zeichenbit zuletzt, wegen der Addition. 33 + 22 21 2° 2"1 2"2 2"3 2"4 2"5 q=2"6 Gewicht Fig. 7 Festkommazahl Festkommazahlen besitzen einen beschränkten Zahlenbereich. Bei nur positiven Zahlen befinden sich die Zahlen x im Intervall £ 0 x q. *- n. (2"b - 1) und bei Zahlen mit Vorzeichen heisst es |x| Das q.(2(nb-1)) Gleichheitszeichen gilt komplement. Bit und Die * nb In obigen für negative Zahlen im Zweier¬ Formeln sind q das Gewicht des leichtesten die gesamte nur Wortlänge. Auflösung der Zahlen ist konstant. Damit der Zahlenbereich gut ausgenützt ist, muss man die Zahlengrösse dem vorhandenen Bereich anpassen: diese Operation heisst Skalieren. Die Ska¬ lierung ist fest und wird im voraus bestimmt. Sie wird ausführ¬ lich im Kapitel 3.2 behandelt werden. Um die Nachteile der festen Skalierung zu vermeiden, hat man in der Computertechnik die Gleitkommazahlen (auch rithmisch dargestellte halbloga- Zahlen genannt) eingeführt. (Fig. 8) Dabei stellt ein Teil des Wortes eine (meist fraktionäre) Festkommazahl (Mantisse), der andere Teil einen (ganzzahligen) Exponenten einer Potenz der Basis b (d.h. bei binären Zahlen der Basis 2) dar, mit welcher die Mantisse multipliziert wird, um 34 den Zahlenwert zu erhalten. ± -!-..- + . -K V Exponent Fig. 8 Mantisse Gleitkommazahl Zahl = Mantisse Zahl = Mantisse Diese • • im b. p 2 Zahlendarstellung allgemeinen bei binären Zahlen ist redundant: Ein Zahlenwert kann mit mehreren verschiedenen Gleitkommazahlen werden. Variante ist dabei die normalisierte, bei wel¬ genaueste Die dargestellt grösstmöglichen cher die Mantisse ihren Wert annimmt. Wenn die Mantisse fraktionär ist, heisst das bei der Basis 2 0,5 In der Regel |Mantisse| ^ ist < 1 obige Bedingung genau dann erfüllt, wenn das schwerste Bit der Mantisse das Inverse des Vorzeichenbits ist. einzige Ausnahme zu dieser Regel beim Zweierkomple¬ ment: Der Wert -1, der noch zum Zahlenbereich gehört, wird nämlich vermieden, da sein Komplement nicht mehr zum Zahlen¬ Es gibt bereich eine gehört. Stattdessen wird bei einer normalisierten Mantisse der Wert Bit den Wert 1, -0,5 genommen: Hier hat nun gewichtigste genau wie das Vorzeichenbit. Bei normalisierten Gleitkommazahlen ist die fähr das proportional zur Zahlengrösse (siehe Auflösung unge¬ Abschnitt 2.4). 35 Nachteilig ist bei den Gleitkommazahlen der wand für die Arithmetik. Die wesentlich grössere Multiplikation ist Auf¬ zwar un¬ komplizierter als bei der Festkommaarithmetik: Die normalisierten Mantissen werden multipliziert und die Exponenten addiert. Die Addition ist aber erheblich Mantissen werden zusammen komplizierter [27]. addiert, aber Die beiden zuerst muss der kleinere Exponent durch eine Denormalisierung auf den Wert des grösseren gebracht werden. Das Resultat der Addition muss dann noch normalisiert werden. Wegen dem grossen Aufwand wird die Gleiticoramaarithmetik einer Filterhardware selten bei angewandt. Digitalfiltern folgt normalerweise einerAddition sofort eine Multiplikation. Deswegen ist die Block-Gleitkomma¬ arithmetik [30] dem Algorithmus besser angepasst. Dabei er¬ hält ein ganzer Zahlenblock, z.B. alle Signalgrössen in einem Teilfilter, einen gemeinsamen Exponenten. Die Arithmetik innerhalb des Blockes ist eine einfache Festkommaarithmetik, die Exponenten bestimmen die Skalierung zwischen den Blöcken, die bei der Block-Gleitkommaarithmetik signalabhängig wird. Bei 2.3 Der Abschnitt bei der Festkommaarithmetik Wenn man bei einer Zahl x die niedrigstwertigen besondere Bits bei Binärzahlen) der anderen Ziffern zu ändern), (roundoff) um vom 36 weglässt spricht man dieser Zahl. Man erhält den Abschnittfehler e = q richtigen x - Ziffern (ins¬ (ohne die Wertigkeit x q Wert unterscheidet. so von eine Zahl Abschnitt x , die sich abschneiden, indem Wir können eine Zahl wir einfach die oder wir können runden, indem wir jene abgeschnittene Zahl x nehmen, die am nächsten bei der letzten Bits richtigen weglassen, Zahl x q liegt. Einfacher Abschnitt (truncation) 2.3.1 gleich dem Wert der weggelassenen verwendeten Zahlendarstellung. Hier ist der Abschnittfehler Ziffern in der Wir betrachten zuerst den einfachen Abschnitt von positiven binären Zahlen 110 x - e = - q n.q„ q - SI 1 0 1 q : ursprüngliche Zahl abgeschnittene Zahl 1 1 0 1 -110 (n: ganze Zahl, q Der v Abschnittfehler Gewicht der letzten Stelle von Abschnittfehler ist gleich der x ) Zahl modulo q das Gewicht des richtigen wo q ^q , niedrigstwertigen Bit der abgeschnittenen Zahl x ist, Die Abschnittfunktion hat a die Form einer » • > • • •-¦» (Fig. 9a), Treppenkurve der Abschnitt¬ fehler die Form eines zahns • m •» Säge¬ (Fig. 9b). • 37 *e b 2q Fig. 9 Abschnitt positiver Zahlen a) Abschnittfunktion b) Abschnittfehler negativen Zahlen hängt Bei wendeten der Abschnittfehler von der ver¬ Komplementdarstellung ab. Wertabschnitt (value truncation) Wir nehmen für den negativen Wert des x obigen Beispiels in Zweierkomplementdarstellung x x = - q n.q SO 0 1 1 0 0 1 0 111 \0 0 0 0 5^ 0 0 0 Der s 1 J0 0 1 1 Zahl ursprüngliche -abgeschnittene Zahl Abschnittfehler Abschnittfehler ist immer positiv: Es ist * x - q x und folgender Betrachtung gesehen werden, x sei eine negative Zahl in Zweierkomplementdarstel¬ lung und x* deren Darstellung als positive Zahl (siehe Kapitel 2.2.2), der Zusammenhang zwischen x und x* ist gegeben durch. 0 38 - e < q . Das kann auch aus x x* = m - (mod m) m/2 das Gewicht der Vorzeichenstelle als positive Zahl ist. wo bei der Darstellung e* sei der Wert des abgeschnittenen Wortteils bei der Darq Stellung als positive Zahl, welcher, wie wir weiter oben gesehen haben, x = q x* — q immer x* m und daher positiv = e* q - x-x q = ist. Es - folgt: m e* ^ 0 q Der Abschnittfehler einer Zahl in Zweierkomplement ist immer positiv (siehe Fig. 10) 1 ix q Z" 0 /_^ /. X a) b) /_~~ Fig. 10 Wertabschnitt a) Abschnittfunktion b) Abschnittfehler 39 Betragsabschnitt (magnitude truncation) Beim gleichen Beispiel haben wir im p 0 1S 0 0 1 0 1. x = q n.q ^q - N 0. 1 1 0 CO 1. 1 1 1 00010 0 0 0 Einerkomplement ursprüngliche Zahl -abgeschnittene Zahl = - 110 1 Abschnittfehler Der Abschnittfehler einer negativen Zahl ist hier negativ: der abgeschnittene Wert ist grösser (absolut kleiner) als der richtige. Das kann man anhand einer ähnlichen Betrachtung, wie jener, die wir für das Zweierkomplement angestellt haben, allgemein einsehen: Einerkomplement ist die Darstellung einer negativen Zahl um den Quantisierungsschritt q kleiner als im Zweier¬ komplement (siehe Kapitel 2.2.2) Beim x = x* - m + q Bei der abgeschnittenen Quantisierungsschritt q jenige der Zahl r* x' - m + q muss man nehmen, ursprünglichen = x q* der den entsprechenden grösser ist als der- Zahl = X* _ o* - m + q* Daraus = e* q - (q* Mq - q*) M q* ist eine Zahl, gebildet aus allen 1 in den Stellen entsprechend den abgeschnittenen Stellen, e*q kann aber nicht grösser werden als eine solche Zahl und deswegen ist r* 40 - e* q*q - q so q* - dass der Abschnittfehler komplement Wenn alle immer negativ e q negativen Zahl im Einer- ausfällt. abgeschnittenen der Abschnittfehler einer e Bits =0, "1" sind, dann ist alle gleich "0" sind, dann gleich wenn wird der Abschnittfehler absolut maximal. Zusammenfassend kann sagen, dass das Vorzeichen des Ab¬ man Einerkomplementdarstellung schnittfehlers einer Zahl in gleich dem Vorzeichen der 0 - e q < und -q q < e - q q 0 q richtigen für x > 0 für x < 0 Zahl ist: es ist (Fig. 11) sehen, dass, wenn die Zahlen mit Vorzeichen und Betrag dargestellt werden, der Abschnittfehler sich Man kann leicht gleich wie bei der Einerkomplementdarstellung 1 genau ¦e verhält. q ////. v// q q 0 -q a Fig. 11 Betragsabschnitt: a) Abschnittfunktion x q b) b) Abschnittfehler 41 2.3.2 Rundung Um die Fehler etwas zu verringern, kann man eine Zahl runden statt sie einfach abzuschneiden. Runden heisst den nächsten gröber quantisierten Wert nehmen: Wenn der abgeschnittene Teil kleiner als ¦^•q ist, dann nimmt man den nächst-kleineren 2 q 1 Wert und wenn er grösser als -r-q ist den nächst-grösseren. z q Falls der abgeschnittene Teil gleich r-*q ist, dann ist es n gleichgültig, welchen der beiden nächsten Werte genommen wird: Die Wahl wird sich aus der verwendeten Zahlendarstellung er- geben. Um die Rundung praktisch zu realisieren, muss bei positiven Zahlen und bei negativen Zahlen im Zweierkomplement einfach die Zahl ~-*q (gleich einer "1" in der ersten abgeschnittenen z q Binärstelle) vor Wenn das erste geschnittene dem Abschneiden der Zahl hinzuaddiert werden. abgeschnittene Bit "0" war, dann wird die ab¬ Zahl durch diese Addition nicht verändert, aber gleich "1" war, dann entsteht ein Uebertrag zur letzten nicht abgeschnittenen Stelle. Man kann also runden, indem man das erste abgeschnittene Bit zur letzten Stelle der wenn es abgeschnittenen Bei Zahlen in von Zahl addiert. Einerkomplementdarstellung der Wert j-q z q der ungeschnittenen Zahl subtrahiert werden, wenn die Zahl negativ muss wird. Bei Zahlen im Zweierkomplement wird dabei der nächsthöhere Wert genommen (Wertrundung), bei Zahlen im Einerkomplement oder in Betrag-und Vorzeichen-Darstellung der nächste betragsmässig höhere Wert (Betragsrundung). Es sind auch Verfahren denk¬ bar, um die verbleibende Asymmetrie der Rundung zu verhindern, z.B. indem man bei geraden Zahlen den höheren Wert und bei unge¬ raden den niedrigeren Wert nimmt (oder umgekehrt), oder indem man die Grenzwerte zufälligerweise nach oben oder nach unten rundet. Der zusätzliche Aufwand lohnt sich meistens nicht. Die Unterschiede sind normalerweise belanglos,und wir werden daher im folgenden die Behandlung der Grenzwerte unbestimmt lassen. 42 Rundung wird die Charakteristik symmetrisch bezüglich der Nullinie: Durch die - —*q 2 Mq Das ist in •<; e Figur 12 Rundungsfehler K « q der dargestellt. x ? e. !a la 2 a) Fig. 12 Rundung a) Rundungsfunktion b) Rundungsfehler 2.4 Quantisierung bei Gleitkommazahlen Die Gleitkommazahlen bestehen in einem einzigen Wort Exponent (Fig. 13) zwei Festkommazahlen, zusammengefasst, meistens die Mantisse und der . * + aus b) 1 1. DB + \ "V Exponent Fig. 13 / /\ Mantisse Gleitkommazahl 43 Die Mantisse Wert liegt ist meistens eine fraktionäre Zahl: ihr m im Bereich i*|m|<l (wenn die Zahl normalisiert ist). Der Exponent exp ist eine ganze Zahl: Er ist der einer Potenz (normalerweise der Basis Mantisse multipliziert wird, x Die m = Beschränkung Konsequenz Der Quantisierungsschritt Wertes der Mantisse q wird von dessen m bestimmt: Im Falle der fraktionären Mantisse n er q ^m 2_nbm = Quantisierungsschritt q ^ q ^m = 2exP • q der Es ist aber 2exp so dass q Da meistens = •=¦ x ml = jlp qm -|x| -|m| x.qm 44 erhalten. der max. Der zu 2exP • des beträgt die Zahl mit welcher die Wortlänge einer Gleitkommazahl hat als Quantisierung der Mantisse und die Beschränkung des Exponenten bestimmt die Ueberlaufgrenze. eine Anzahl Bits um 2), Exponent < < q 1 folgt =¦ x.2q ^m vollständigen Zahl x ist dann Der Quantisierungsschritt Grösse der Zahl Zahl zur q wächst In erster x. treppenförmig Näherung kann er als mit der proportional selber betrachtet werden. x 3 z m /2 q.m oder besser q * x = Der Fehler ist dabei kleiner als ein Faktor 2, d.h. kleiner als ein halbes Bit. Wenn der Quantisierungsfehler der Mantisse Quantisierungsfehler e der ganzen Zahl der e Die q m =x + Der 2exp e e = • Zahl = - m x(l =¦ m e m /2 • beträgt, wird x ist dann x + e m /2) ist eine kleine Zahl le 1 m1I so • m quantisierte x e e = e - 2_nbm « dass der Faktor (1 1 + e Quantisierungsfehler Näherung einen m fl) sehr wenig von 1 abweicht. bei Gleitkommazahlen hat in erster multiplikativen Charakter, während er bei Festkommazahlen einen additiven Charakter besitzt. Festkommazahlen haben eine konstante absolute Genauigkeit, Gleitkommazahlen eine annähernd konstante relative Genauigkeit. 45 3. UEBERLAUF UND SKALIERUNG 3.1 Der Ueberlauf bei der Festkomma-Arithmetik Wir werden hier die Eigenschaften des Ueberlaufes bei der Festkommaarithmetik und deren Folgen bei Digitalfiltern be¬ handeln. Der Ueberlauf ist ein schwerer Fehler: Er kann zu einem in¬ stabilen Verhalten des Filters führen. Auch wenn letzteres durch geeignete Massnahmen vermieden wird, resultieren Ver¬ zerrungen des Signals. Ein Ueberlauf eine Zahl entsteht, wenn versucht wird, in ein Register einzuschreiben, der Wert sich ausserhalb des Inter¬ valls der im Register darstellbaren Zahlen befindet, d.h. wenn sie grösser ist als die grösste darstellbare positive Zahl oder kleiner als die kleinste darstellbare negative Zahl. Ueberlaufe können überall dort entstehen, wo die schwer¬ sten Bits eines Wortes abgeschnitten werden oder wo eine Zahl grösser werden kann, ohne dass die dazu sehen worden sind. Das kann - - nötigen Bits vorge¬ geschehen bei einer Addition bei einer Multiplikation mit einem Faktor grösser als 1, insbesondere - bei einer Linksschiebung (left shift). Der Ueberlauf kann durch eine geeignete Skalierung vermieden werden, die dafür sorgt, dass nirgends der zugelassene Werte¬ bereich überschritten wird. Die Skalierung ist Gegenstand von Kapitel 3.2. Wir werden sehen, dass unter bestimmten Vor¬ aussetzungen der Ueberlauf an gewissen Stellen (nämlich den Zwischenresultaten von Additionen) toleriert werden kann, so dass nur an gewissen Stellen (Eingängen von Multiplikatoren) 46 bei der Skalierung auf Ueberlauf geprüft werden muss. gewissen Fällen müssen selten auftretende Ueberläufe In toleriert werden. Eine Ueberlaufes in und zu einer jedem Skalierung, Fall die ein Auftreten eines verhindert, kann zu streng sein unnötigen Verschlechterung des Verhältnisses Signal-zu Quantisierungsrauschen führen. Man muss dabei sorgen, dass sich das Filter nach dem Auftreten eines Ueberlaufes wieder erholen kann und dass es nicht ins Schwingen gerät. Dazu muss man den Ueberlauf detektieren können, um entsprechende Korrekturmassnahmen ergreifen zu können [31]. 3.1.1 Eigenschaften des Ueberlaufs Wir werden in diesem Abschnitt die laufs untersuchen. Wir werden schen einer überlaufenen und Eigenschaften des Ueber¬ insbesondere zeigen, dass zwi¬ der entsprechenden richtigen kongruenzähnliche Beziehung existiert. Wir betrach¬ zuerst Zahlen mit der Vorzeichen/Betragsdarstellung und Zahl eine ten schauen, wie sich der Ueberlauf hier auswirkt. Das Vorzeichen sei hier separat vom des Ueberlaufs einer Betrag dargestellt, somit ist der Fall positiven Zahl zu betrachten. m q ' Fig. 14 Der Ueberlauf Es ist keine eigentliche Kongruenz, weil diese Aequivalenz- relation nicht immer für die Multiplikation gilt, wie wir im Kapitel 3.1.3 sehen werden. Wir werden trotzdem für diese Rela¬ tion das Symbol e (kongruent) verwenden. 47 Die überzähligen Bits werden einfach abgeschnitten. (Fig. 14) Man sieht sofort, dass sich als Resultat r nach dem Ueber¬ lauf ergibt: + 10 110 1 1 0 a 1 0 n.m 10 110 1 + die überlaufene Zahl durch Subtraktion eines ganzVielfachen des Gewichtes des ersten abgeschnittenen der richtigen Zahl. Es gilt daher Man erhält zähligen Bits von a = n.m + r = a r n ganze Zahl d.h. (mod m) Die überlaufene Zahl ist das Residuum der modulo des Gewichtes hier so gewählt, dass Der Modul m des ersten m richtigen Zahl a abgeschnittenen Bits, n wird den kleinsten positiven Wert annimmt. ist bei binären Zahlen eine Zweierpotenz. r Die Ueberlaufcharakteristik hat eine Fig. 15 dargestellt. darstellungen Bei negativen Sägezahnform, Zahlen in wie in Vorzeichen/Betrags¬ wird auch das Resultat eines Ueberlaufs m-q negativ. r -m+q Fig. 15 Ueberlaufcharakteristik bei stellung 48 Vorzeichen/Betragsdar¬ Zweierkomplement dargestellt sind, sehen die Verhältnisse auf den ersten Blick komplizierter aus. Wenn zu der grössten positiven Zahl (= 0.11...11 q) das Gewicht des leichtesten Bits (= q) addiert wird, ent¬ 00 steht die negative Zahl mit dem grössten Betrag (= 1.00 Anderseits, wenn von der negativen Zahl mit dem grössten Betrag das Gewicht des leichtesten Bits subtrahiert wird (d.h. die Zahl 1.11...11 addiert wird), wird die grösste positive Zahl erhalten. Ein Ueberlauf kann hier einen Vor¬ zeichenwechsel erzeugen. Wenn wir diese Ueberlegung weiter verfolgen, bekommen wir die in Fig. 16 dargestellte Ueber¬ Wenn die Zahlen hingegen im = — - — = - ^) . . r 1 i laufcharakteristik y y m y y / / / / X / / / 0 / / a m * ~~2 y y y y y Fig. Ueberlaufcharakteristik beim Zweierkomplement 16 Die Ueberlaufcharakteristik hat immer noch die Form eines dieser befindet sich Sägezahns, ^ m m jetzt aber zwischen den Wer- q. Die überlaufene Zahl der Rest der ursprünglichen Zahl a modulo ten nur - und j - a=n.m+r d.h. stellt sich hier n so aEr ein, dass r ist immer noch m (mod m), r den kleinsten Absolut- wert besitzt. 49 Einerkomplement verhält sich ähnlich wie das Zweierkomple¬ Das gleichen Gedankengang wie vorhin wiederholen: Wenn zu der grössten positiven Zahl (0.11...11 -y-q) das Gewicht des LSB addiert wird, entsteht auch hier die negative Zahl mit dem grössten Betrag (1.00...00 —j +q) Der Betrag der Differenz zwischen der richtigen und der überge¬ laufenen Zahl beträgt m-q. Das gleiche gilt für die Summe anderer Zahlenpaare, die eine überlaufende Summe ergeben. Wenn auch die Summe mehrerer Zahlen betrachtet wird, sieht man, ment. Wir können hier den = = übergelaufene dass eine stellung a die = richtige n.(m-q) Zahl Zahl a r • Einerkomplementdar¬ (m-q) ist: bei der modulo + r Dieses Resultat wird erhalten sowohl wenn die Ueberläufe in einem zu kurzen Addierwerk entstehen als auch wenn die ge¬ wichtigsten Beim Bits der Summe Einerkomplement Zahlenbereich, komplement ist Das wird wieder als —2 ten Komplemente aller Zahlen im Symmetrie desselben. Beim Zweier¬ der Zahlenbereich von werden. sind die wegen der Komplement abgeschnitten —r* gehört unsymmetrisch bezüglich nicht mehr zum Zahlenbereich und erscheinen. Aus diesem Grund wird —~ Null. man in vielen Fällen als ausserhalb des Zahlenbereichs betrach¬ müssen, 3.1.2 Die da es leicht einen Ueberlauf erzeugen kann. Eigenschaften Wir werden hier die der Restklassen Eigenschaften 12 der Restklassen kurz ohne 12 Hier wird eine verallgemeinerte Definition von Restklasse angewendet, indem die Zahlen (ausser n) rational und nicht nur ganz sein dürfen. 50 Beweis angeben und auf überlaufene Zahlen anwenden. Def. Alle Zahlen, die den gleichen Rest modulo m besitzen, gehören derselben Restklasse modulo zu ursprüngliche Eine überlaufene Zahl und die hören zur Summe Es Theorem gleichen m. Zahl davon ge¬ Restklasse. gilt folgende wichtige Eigenschaft: [33] Wenn a = b (mod m) und c e d (mod m) dann sind auch a ± c = b ± d (mod m) (Addenden oder Zwischensummen) einen Ueberlauf erlitten haben, ist ihre Summe immer in der Wenn eine oder mehrere Zahlen selben Restklasse wie die Summe der richtigen Zahlen. Das lässt sich auf mehrere Summen ausdehnen, falls das Zahlen¬ format konstant bleibt, so dass auch m überall gleich ist. folgt: Wenn das richtige Gesamtresultat mehrerer aufeinander¬ folgender Summen im gegebenen Register Platz hat, wird die Richtigkeit dieser Summe von eventuellen Ueberläufen in den Teilsummen nicht beeinträchtigt. Es Bei einer Aenderung Theorem Wenn des Moduls a e b (mod. m) a e b (mod gilt: dann ist auch / ), k ganze Zahl. Wenn 2 Zahlen in der sie auch in der gleichen Restklasse modulo m sind, sind gleichen Restklassen modulo eines Bruchteils von m. 51 Bew. a = n-m + b=k*n m/.k • + b QED Daraus folgt, Erhaltung dass die der Restklasse bei Ueber¬ laufen in fortlaufenden Summen auch summen gleiche nicht das tats muss nur gilt, die Teil¬ wenn Format haben: der Modul des Resul¬ dem kleinsten Modul der Teilsumme sein. gleich gilt für positive Zahlen und für die ZweierkomplementDarstellung, weil dort die Module verschiedener Wortformate immer um ganzzahlige Faktoren (nämlich 2er Potenzen) abweichen. Das Multiplikation Digitalfiltern kommen nur Multiplikationen grössen mit konstanten Koeffizienten vor. Bei In lässt sich ein Ueberlauf verhindern, betrachtet werden muss. Theorem: so Signal¬ den Koeffizienten dass dieser Fall nicht Wenn (mod. m) e b a.c = a n-m + a dann ist Bew. = a.c = (mod. m.c) b.c n • b (m.c) + b*c Der Ueber1aufmodul wird mit dem Faktor neue von Ueberlaufmodul wird nur QED c multipliziert. Der in den seltensten Fällen mit dem Modul übereinstimmen, der durch das Wortformat des Resul¬ tates gegeben ist (d.h. eine 2er Potenz ist). Nur wenn der Faktor c eine ganze Zahl diesem Fall sind a.c wegen des vorletzten 52 ist, wird das der Fall kongruent Theorems, kongruent und b.c modulo sein: in cm modulo c . und — = jiuch m. anderen Fällen geht die Kongruenzeigenschaft bei der Multiplikation verloren. Die Multiplikation einer über¬ laufenen Zahl mit einem nicht ganzzahligen Koeffizient liefert ein Resultat, aus welchem das richtige Resultat nicht mehr In allen rekonstruiert werden kann. Die Ueberlaufe in den Teilsummen können Schlussfolgerungen: ignoriert werden. Das Signal muss plikatoren bei der Skalierung auf d.h. es 3.1.3 müssen nur nur am Eingang der Multi¬ Ueberlauf kontrolliert, dort Korrekturmassnahmen getroffen werden. Die Ueberlaufdetektion wissen, ob bei der Ausführung einer Operation in Festkommaarithmetik Ueberläufe entstanden sind. Das erlaubt Es ist wichtig zu einerseits eine falsche Skalierung seits das Einführen von Massnahmen laufschwingungen in Digitalfiltern. zu zur korrigieren, Verhinderung Dafür kann zum anderer¬ von Ueber¬ Beispiel die überlaufene Zahl durch die Zahl ersetzt werden, die am wenigsten von der richtigen abweicht, d.h. durch die Zahl mit dem grössten Betrag und mit dem Vorzeichen des richtigen Resultates. Das entspricht Einführung einer Sättigungs¬ der charakteristik [31]. Es ist in gewissen Fällen sogar möglich, das richtige Resultat zu rekonstruieren. Das ist vor allem interessant im Zusammenhang mit einer Gleitkomma- oder einer Blockgleitkommaarithmetik, viel weniger bei einer reinen Festkommaarithmetik. gesehen, dass ein Ueberlauf sich ergibt, wenn bei einer Operation eine Zahl entsteht, die sich ausserhalb des im gegebenen Wort darstellbaren Zahlenbereichs befindet. Die Wir haben Detektion des Ueberlaufes ist am einfachsten beim Abschneiden 53 gewichtigeren Bits eines Wortes: es liegt kein Ueberlauf vor, wenn die abgeschnittenen Bits die Bedeutung von führen¬ den Nullen besitzen. Das heisst bei den Komplementdarstellungen, dass alle weggeworfenen Bits gleich dem resultierenden Vor¬ der zeichenbit sein müssen. Diese Methode lässt sich sehr leicht bei anderen Operationen anwenden: Das Wort bei der Ope¬ ration so weit erweitert werden, dass das Resultat sicher darin Platz findet. Am Schluss wird das Resultat durch Ab¬ muss einigen der gewichtigeren Bits wieder ins ge¬ gebene Wortformat zurückgeführt. Bei der Addition gibt es aber Methoden, die eine Verlängerung der Wortlänge nicht erfordern; wir werden sie anschliessend besprechen. Beim Linksschieben kann obige Detektionsmethode direkt angewendet werden, da der Test auf Gleichheit von zwei Bits sequentiell durchgeführt werden kann. schneiden von Die Ueberlaufdetektion bei der Addition Wir wir im Kap. 2.2.2 gesehen haben, werden fast ausschliesslich mit Zahlen in geführt. Wir werden im die Additionen Komplementdarstellung folgenden die Betrachtungen für durch¬ Zahlen im Zweierkomplement durchführen, sie lassen sich leicht, aber mit etwas Vorsicht, auf das Einerkomplement erweitern. Das Wortformat sei das in Fig. 13 dargestellte: q sei das Gewicht des leichtesten Bits (LSB), m das Gewicht der Vorzeichenstelle. Zur Vereinfachung führen wir noch das der Vorzeichenstelle ein. Wir nehmen auch an, dass die Wortlängen der Addenden und des Resultates gleich Gewicht v = — seien. Bei der Summe von zwei Zahlen - die - das ergibt sich ein Ueberlauf, wenn Vorzeichen der Addenden gleich sind und Vorzeichenbit des Resultates umgekehrt zu den Vor¬ zeichen der Addenden ist. 54 Wenn die Vorzeichen der Addenden verschieden sind, haben wir eine Subtraktion und der Absolutwert des Resultates ist kleiner als der grössere übsolutwert der beiden Addenden: es ist kein Ueberlauf möglich. Wenn wir die Ueberlaufscharakteristik von Fig. 15 betrachten, sehen wir, dass, wenn Resultat nur wenig grösser als die Ueberlaufgrenze ist, das Vorzeichen wechselt. Die richtige Summe von zwei Zahlen ist aber nie so gross, dass bei einem Ueberlauf das richtige Vorzeichen wieder er¬ das richtige gleich der grosst0.1111...) oder gleich der kleinstmögmöglichen Zahl (v-q lichen Zahl (-v 1.0000...) im Zweierkomplement sind, be¬ scheinen kann. Wenn nämlich beide Addenden = = kommen wir 1.00...00 0.11...11 + 0.11...11 + p_.oo. ..00 J..11...11 Der Uebertrag aus 1.00...00 der Vorzeichenstelle kann nicht alleine zur Ueberlaufdetektion bei der Komplementdarstellung gebraucht werden. Wenn man nämlich zwei Zahlen mit verschiedenen Vor¬ zeichen zusammenaddiert und die Summe positiv ist, entsteht auch ein solcher Uebertrag. Eine andere Regel zur Ueberlauf¬ detektion lautet [34]: Uebertrag in die Vorzeichenstelle verschieden vom Uebertrag aus der Vorzeichenstelle ist, liegt ein Ueberlauf vor. Das richtige Vorzeichen ist gleich dem Uebertrag aus der Wenn der Vorzeichenstelle. Bei der Summe - - - von drei Zahlen sind folgende drei Fälle möglich kein Ueberlauf ein Ueberlauf zwei Ueberläufe. 55 Zwei Ueberläufe in der selben Richtung (als Richtung ist gemeint), sind nicht möglich. nämlich alle drei Addenden gleich der grosstmöglieher 0.111... oder gleich der negativen Zahl mit dem gröss¬ das Vorzeichen der Addenden Wenn Zahl ten Betrag 1.000... sind, dann erhalten 0.111...11 + 1.00...000 0.111...11 1.00...000 + 1.111...10 + wir Ueberlauf 0.00...000 0.111...11 1.00...000 + 0.111..101 kein Ueberlauf 1.00...000 Es tritt nur ein Ueberlauf auf. Wenn die drei Addenden be- tragsmässig kleiner sind, gleichen Richtung zwei Ueberläufe in der zwei Ueberläufe tung und auftreten, haben kompensieren möglich, ist es ebenfalls nicht sich: man zu erhalten. Wenn entgegengesetzte Rich¬ erhält die richtige Summe. sie Wir behandeln beim jetzt die Ueberlaufdetektion und -Korrektur allgemeinen Fall von mehreren aufeinanderfolgenden Summen, wobei das Wortformat konstant bleibe. Bei der Summierung seien Ueberläufe in positiver und n_ in negativer Richtung auf¬ getreten. Bei jeder der n positiven Ueberläufe wird die n Summe um m = 2v gegenüber der richtigen jeder der n_ negativen Ueberläufe wird Es folgt, dass sich die richtige Summe Summe sie S Summe S mit Hilfe der Anzahl Ueberläufe in negativer Richtung rekonstruieren S = r Wenn n dann ist, 56 - n_ S + = (n,+ - 0, d.h. n - ) um m aus = bei 2v erhöht. der überlaufenen positiver und in lässt: •' m wenn wie wir schon erniedrigt, kompensieren, Summe richtig. sich die Ueberläufe gesehen haben, die Wenn n ^ 0, n - Vorzeichen von n stimmt das überein. n_ - richtige Vorzeichen ist das Gewicht des ersten m (n+ Bit links ausserhalb des Wortes. Zahl (n - angesetzt, n ) mit Beim Addieren von (n - - n_)«m ist daher die Summierung verwendeten links am bei der Vorzeichen, mit dem Wort Zweierkomplement dargestellt. im n_)*m S muss S mit seinem Vorzeichen zu positives Vorzeichen hat, gleich 00...00, wenn es nega¬ links erweitert werden. Wenn S ein Erweiterung des ist die tiv ist, ist sie aber günstiger, richtige die Wortes 11...11. Für die Realisierung ist es diese Addition vermieden werden kann und gleich wenn Summe lediglich durch das Anhängen eines Korrektur- gefunden werden kann. Man merkt, dass bei negativem S das gleiche Resultat erhalten wird, wenn S nicht mit einser erweitert wird, sondern der Wert -m zum Korrekturglied (n+ n_).m hinzuaddiert wird. Es folgt, dass die richtige Summe Sr er¬ terms - halten wird, indem der überlaufenen Summe S die Zahl n+ links angehängt wird, wenn S positiv ist und die Zahl n - -1 wenn S n_ negativ - n_ ist. obige Resultate auf die Fälle einer und zweier auf¬ einanderfolgender Summen an. Wie wir gesehen haben, können wir Wir wenden nur einen Ueberlauf haben. Beim Ueberlauf können folgende Fälle auftreten: Ueberlauf + - 1 01 0....® 00 1 1 11 0 10 1 @ Q bezeichneten Fälle bezeichneten Fälle können nur dann auf¬ möglich. Die mit treten, wenn der Ueberlauf in der ersten der beiden Summen ge¬ schehen ist und wenn das Resultat der zweiten Summe das umge¬ Bei nur einer Summe sind Q> nur die mit kehrte Vorzeichen wie das der ersten Summe hat. 57 Das erste Bit kann weggelassen werden, zweiten ist: darum müssen in den Fällen den Fällen angehängte Q) 2 Bits vorne Bit muss angehängt umgekehrt gleich wenn es ® dem 1 Bit und in werden. Das leichtere wie das Vorzeichenbit von S sein und das zweite allenfalls angehängte Bit muss gleich wie das Vorzeichenbit von S sein [35], 3.2 Die Skalierung bei der Festkommaarithmetik Bei der Festkommaarithmetikhaben wir es mit einem ziemlich begrenzten Zahlenbereich zu tun. In vielen Fällen werden die Zahlen auf den maximalen Wert 1 normiert, so dass der Zahlen¬ bereich vom (offenen) Intervall (-1, +1) gebildet wird (frak- Zahlen). Die Ueberschreitung dieses Zahlenbereichs ergibt einen Ueberlauf, der einen schweren Fehler darstellt. tionäre Das Auftreten von Ueberläufen muss daher vermieden oder min¬ destens auf ein Minimum reduziert werden. Anderseits ist man Signalamplituden interessiert, damit der Zahlen¬ bereich gut ausgenützt wird. Das Quantisierungsrauschen ist bei der Festkommaarithmetik im wesentlichen unabhängig von der Signalamplitude: Um ein gutes Signal-zu-Rauschverhältnis an grossen erhalten, muss das Signal möglichst gross sein. Zudem kann ein Signal verschwinden, wenn seine Amplitude kleiner als der Quantisierungsschritt wird (underflow) zu jT . Aus diesen Gründen muss man im Inneren der im allgemeinen kommaarithmetik in - Digitalfilter und jedem anderen numerischen System mit Fest¬ eine gewisse Menge von (festen) Skalierungs¬ faktoren einführen. Diese müssen so werden, dass die Signalamplituden angeordnet - und bemessen in den einzelnen Teilen des digitalen Filters dem bestehenden Zahlenbereich angepasst wer¬ den, ohne dass die anderen Eigenschaften des Systems insbe¬ sondere seine Uebertragungsfunktion geändert werden. Diese - - 58 brauchen nicht genau Skalierungsfaktoren zu sein: sie müssen Grössenordnungen anpassen. Aus Einfachkeitsgründen nimmt man dazu Zweierpotenzen: Somit reduzieren sich die dazu be¬ nötigten Multiplikationen zu einfachen Schiebeoperationen. nur Um die Skalierfaktoren maximalen zu bestimmen, Signalamplituden Stellen bestimmen, Der Ueberlauf kann wo - muss man zuerst die im unskalierten Filter an den der Ueberlauf einen Fehler darstellt. an bestimmten unter gewissen Bedingungen - Stellen erlaubt werden (siehe Kap. 3.1) und zwar: Ueberläufe an den Eingängen oder in den Zwischenresultaten einer fortlaufenden Summe sind belanglos, wenn das rich¬ - tige Resultat der Summe (ohne Ueberläufe) sich im Zahlen¬ bereich befindet. - Eine überlaufene Zahl darf mit einem ganzzahligen am Eingang eines Multiplikators Koeffizienten auftreten. Das be¬ trifft insbesondere die Skaliermultiplikatoren (siehe Kap. 3.2.3). - Natürlich können in reinen Verzögerungsketten keine Ueber¬ (wenn man nicht innerhalb der Verzögerungs¬ kette die Wortlänge auf der Seite der gewichtigsten Bits verkürzt). läufe entstehen folgt, dass zur Dimensierung der Skalierung die maximalen Signalamplituden an den Eingängen der Multiplikatoren mit nicht-ganzzahligen Koeffizienten bestimmt werden müssen. Natürlich, wenn mehrere Multiplikatoren direkt an der gleichen Verzögerungskette angehängt werden (wie z.B. bei den direkten Formen der Fall ist), kann man sich begnügen, das Signal am Eingang der ganzen Verzögerungskette zu überwachen. Es Wir werden maximalen den uns zuerst in diesem Kapitel Signalamplituden befassen, allgemeinen Fall, mit der Bestimmung der im Abschnitt 3.2.1 für im Abschnitt 3.2.2 für gewisse spezifi- 59 Eingangssignale. Nachher werden wir im Abschnitt 3.2.3 sehen, wie man die Skalierung praktisch durchführen kann und sehe im ikbschnitt 3.2.4 mit den dabei auftretenden Fehler auseinan¬ dersetzen. 3.2.1 Maximale Signalamplitude für beliebige Eingangssignale Die maximale Signalamplitude an den einzelnen Punkten im Inneren eines digitalen Filters hängt offenbar vom ange¬ legten Eingangssignal ab. Die Amplitude des Eingangssignals ist beschränkt, da auch der Zahlenbereich am Eingang be¬ schränkt ist. Man sieht sofort ein, dass die grössten Signal¬ amplituden im Inneren eines Filters bei der grössten Eingangs¬ amplitude erreicht wird. Amplitude der Antwort eines linearen Systems auf ein beliebiges Eingangssignal mit be¬ schränkter Amplitude. Bei einem linearen abgetasteten System ist das Ausgangssignal yk mit dem Eingangssignal x, durch die Faltungssumme verbunden: Es existiert ein Grenzwert für die XI Wi yk i=0 hi die Impulsantwort des Systems ist. Für die maximale Amplitude von y, findet man unter Anwendung der Dreiecksunglei¬ chung den Absolutwert: wobei k I*! lXlmax ist E>i-xk-i sE|hi! •¦xk-ii*ix*«xljhii 1=0 die maximal i=0 i=0 mögliche Amplitude des Eingangssignals Sie ist gleich der Grenze des Zahlenbereichs, d.h. bei den üblichen fraktionären Zahlen 1-q. 60 Es daher in diesem Fall: folgt k k |ykl < max i=Q i=0 beliebiges Für 7~ lh±l y~\h±\ d-q) * k hat man [ 36] 13 oo lyl 1 * ' max < y~|h.| / ' i ' 1=0 Gleichheitszeichen in obiger Formel gilt genau dann, Das wenn die Eingangssequenz x. i ist, die = I' xl' • max sign(h.k-i ) ^ . Eingangsfolge das gleiche Vorzeichen umgekehrte Impulsantwort besitzt (vgl. den Fall des d.h. wenn die "matched filter"). Wir wollen nun wie CO die Reihenentwicklung \ i=0 |hi| untersuchen. Zuerst stellt sich die Frage, ob diese Reihe überhaupt konvergiert. Wir werden sehen, dass sie es bei stabilen Fil¬ tern stets tut. Als zweites wollen wir die besprechen. Konvergenzfrage Berechnung dieser Reihe Zur kann man feststellen: konvergiert die Reihe j> | h. | 1=0 13 wenn Definitionsgemäss die Reihe 00 £ h.^ absolut 1=0 als Eingangssignal die Abschnittfehler, die an einer bestimmten Abschnittstelle entstehen, und als Impuls¬ antwort die des Teilfilters von der Abschnittsteile zum Filterausgang nimmt, bekommt man eine Schranke für die Abschnittfehler am Ausgang, insbesondere eine obere Schranke für die Amplitude der vom Abschnitt verursachten Schwingungen im ruhenden Filter [37,38,39,40,94]. Diese Schranke ist aber in den meisten Fällen zu weit von den tatsächlich erhaltenen Werten entfernt. Wenn man 61 konvergiert. Wenn jetzt die Reihe £ h. absolut konvergiert, i=0 sagt uns Theorem folgendes Theorem: Bei einem digitalen Filter, dessen Uebertragungs¬ funktion H(z) eine rationale Funktion in z ist, 00 konvergiert die Reihe l h(i) der Abtastwerte der i=0 absolut Impulsantwort h(i) (gegen den Endwert der Schrittantwort)dann und nur dann, wenn das Filter stabil ist, d.h. wenn seine Pole innerhalb des Ein¬ heitskreises in der z-Ebene Beweis a) liegen. Bedingung ist hinreichend. Durch eine Partialbruchzerlegung der Uebertragungsfunktion H(z) Die bekommt man n H(Z) = Q(Z) + m y~~ y~~ j=0 k=0 Der Term Q(z) ist ein Polynom Division des Zählers von A*v (z p.) in z: Es ist der Quotient der H(z) durch den entsprechende Impulsantwort - ist Nenner von zeitbegrenzt: H(z). Die Die Summe aller seiner Abtastwerte ist eine endliche Reihe. Die anderen Terme entstehen durch die Partialbruchzerlegung des Restes der Division, n ist dabei die Anzahl der Pole. P m. ist die Mehrfachkeit des Pols p.. Die Impulsantwort jedes einzelnen Terms lässt sich mit Hilfe des Umkehrintegrals berechnen: 62 jk (i) h., ^jk <> T = zi.=i A., z1"1 (z-pj) dz -k-l (k-1) '. dz , 3k (k-l)1 (Als -— ist der dx (z _ Die / z=P. zu k-l konvergieren ,k-l dp W=T i-l Pi verstehen.) konvergiert absolut,falls ^T 1=0 dP cj . z=p. i-1 Xl (k-l)1 Identitätsoperator a z J z=P. ) k-l ,k-l ii_£ d,k-li-l p. 3 Reihen V^ .k (z-p ) (z-Pj) i-1 (z-Pj) k-l, i-l> dz i-1 £ p.~ Die Reihe Jk Res JJL k-l d = z auch |p.| < 1 absolut, falls • |p.| < 1, da sie Ableitungen Potenzreihen sind. Es folgt, dass die Reihe von absolut konvergierenden 00 J h(i) absolut konvergiert, da i=0 sie sich als Summe absolut konvergierender Reihen darstellen lässt. 63 b) Die Bedingung ist notwendig. Definitionsgemäss ist ein lineares System stabil, wenn für jeden beschränkten Eingang der Ausgang immer beschränkt bleibt. Falls das System instabil ist, existieren beschränkte Eingangssignale x, , bei welchen die Amplitude des Ausganges y, mit der Zeit unbeschränkt wächst. In diesen Fällen muss auch die obere Schranke der Amplitude W * |x|max l i=0 lhJ mit der Zeit k auch unbeschränkt wachsen. instabilen Filtern die Reihe 00 nicht I |h.| X 1=0 Deswegen kann bei konvergieren. QED 00 Die Reihe der Absolutwerte der £ |h(i)| Impulsantwort i=0 konvergiert ist. Die daher immer wenn das Auswertung dieser Reihe Filtern sehr leicht eine endliche entsprechende Filter stabil ist bei den nichtrekursiven durchzuführen, da deren Impulsantwort Länge besitzt. Bei transversalen Filtern (nichtrekursive Filter direkter Form) ist die obere Schranke des Ausganges einfach die [42]. Summe der Absolutwerte der Koeffizienten Die rekursiven Filter haben dagegen lange Im¬ pulsantwort. Die Reihe der Absolutwerte der Impulsantwort kann langsam konvergieren, wenn die Impulsantwort langsam abklingt. Die Konvergenz dieser Reihe ist jedenfalls langsamer eine unendlich £ Es ist ferner bei den rekursiven Filtern im möglich, h. gegen ihren 1=0 Endwert. allgemeinen nicht 00 den Ausdruck £ |h.| i=0 64 00 als die Konvergenz der Schrittantwort geschlossen zu berechnen. Es ist obigen Ausdruck eine obere Schranke für möglich, aber immer finden. zu Wir werden einige einfache Beispiele untersuchen, nun 00 £ |h | zuerst auf Fälle führen, wo die Reihe uns die geschlos¬ summierbar ist, dann aber einen Fall, die Reihe nicht mehr geschlossen summierbar ist. sen wo Filter 1. Ordnung Ein Filter 1. H(z) Seine Ordnung = z + a z + Impulsantwort hj1 besitzt die b ist (a-b). = Uebertragungsfunktion ] -, (-b)1"1 für i > 0 für i = 0 _.. i und die Summe der Reihe der Absolutwerte der Abtastwerte der Impulsantwort l 1=0 lhil " 1 1+JiJTl7 |b| 1 - 00 Bei Filtern 1. geschlossen Filter 2. Ordnung lässt sich also die Reihe £ |h.] i=0 aufsummieren. Ordnung 00 Schon hier lässt sich die Reihe nicht immer geschlossen i=0 summieren. Wir betrachten zuerst den £ |h.| Fall, durch den einfachen Ausdruck wo die gegeben Uebertragungsfunktion ist 65 z H(z) = 2 -= + z b;.z b + Wenn die Pole p. und p_ verschieden hi u - 1 i+1 ^r-fq (Pi , + ^ sind, ist i+1,' beide Pole reell sind, dann hat der Filterantwort [39] |h | Falls ein h± so = IM l- doppelter (i+1) (b2) + b2 Pol vorhanden ist 2 (b. 4b_) dann gilt = V2 dass [39] = i=0 ihii = —h=rr /bj)2 (1 Wenn beide Pole Impulsantwort h.l . = r i - (konjugiert) komplex sind, die Form an: sin(i+l)y r — sin/ mit , r 66 als Maximalwert man ± = i=0 Impulsantwort p2 Wenn I die = +/bZ, *f= arcos 1 2 m ¦ dann nimmt die Von der Reihe °° l r1 • |sin(i+l)fj i=0 geschlossene Summe bekannt (siehe [41] ) Man kann aber durch Majorisierung obiger Reihe, z.B. durch die r. eine obere Schranke für die maximal mögliche Reihe T i ist keine . 00 i=0 . Antwort in der « angeben (siehe [39,94]). Solche obere Schranken führen Regel zu ungünstigen Skalierungsfaktoren und sind daher uninteressant. Filter höherer Ordnung Berechnungen werden im allgemeinen sehr kompliziert (es sind jeweils beim Zerlegen der Absolutwerte viele verschie¬ dene Fälle zu unterscheiden). Zudem hat man in der Regel konjugiert komplexe Pole, so dass keine geschlossenen Aus¬ Die gefunden werden können und nur gegeben werden können (siehe oben bei Es empfiehlt sich also zur Bestimmung drücke eine numerische Summierung obere Schranken an¬ den Filtern 2. der maximalen Ordnung). Amplituden der Reihen l |h±|. 1=0 3.2.2 Maximale Signalamplituden Die oben berechneten allgemeinen für spezifische Eingangssignale Grenzen für die maximale Signal¬ sind normalerweise allzu stark auf der sicheren Seite, für die Skalierung wirklich brauchbar zu sein. Es entsteht amplitude um 67 "pessimistische" Skalierung, die nur eine schlechte Ausnützung des Zahlenbereiches gestattet und damit ein schlechtes Signal-zu-Rauschverhältnis ergibt. Wenn nun die Art der auftretenden Eingangssignale bekannt ist, dann ist man deshalb eher geneigt, die Skalierung für die effektiv auftretenden Signale vorzunehmen. Diese wird um so günstiger, je einschränkender man die Klasse der möglichen Eingangssignale angeben kann. Wenn am Eingang nur reine Sinussignale mit einigen möglichen nämlich eine Frequenzen zu f auftreten können, dann ist offenbar die maximale Signalamplitude im stationären Zustand durch die grösste Amplitudenantwort gegeben |H(f) | max f.1 Frequenzen möglich sind, Wenn alle Maximum des Amplitudenganges max (wobei f fs die |h| dann ist sie durch das bestimmt [ 15] ||h|| = Abtastfrequenz ist). Berechnungen haben gezeigt, dass bei stark selektiven obiger Wert die gleiche Grössenordnung wie die im Ab¬ 3.2.1 beschriebene Grenze für beliebige Signale besitzt. Numerische Filtern schnitt Wir betrachten jetzt den Fall, wo wir am Eingang ein weisses Gauss'sches Rauschen haben. Ein solches Signal hat theoretisch eine unendlich grosse maximale Amplitude: Ueberläufe sind hier unvermeidbar. Man hat daher in der Praxis immer mit gauss'sehen Signalen begrenzten Wahrscheinlichkeit, dass ein mittelwertsfreies gauss'sches Signal der Streuung a überläuft, ist: 68 zu tun. Die P {IXI Xmax} > X = / 2 " max exP{- 2 %)dx gauss'sches Rauschsignal behält bekanntlich seine gauss'sche Amplitudenverteilung, wenn es durch ein lineares System hindurchgeht. Ein nicht-gauss'sches stochastisches Ein unabhängigen Abtastwerten hat die Tendenz eine gauss'sche Verteilung zu erhalten, wenn es durch ein lineares System hindurchgeht (wegen des zentralen Grenzwerttheorems). Der Spitzenwert wird gegenüber dem Effektivwert oder der Streuung sehr gross. Man wird daher Ueberläufe, die selten auftreten, dulden. 14 Signal mit haben will, dann auch ein konstantes Verhältnis zwischen Ueberlauf- Ueberlaufhäufigkeit Wenn man eine konstante wird man grenze und Effektivwert o fordern. Die x max dann nach den Effektivwerten des für die Maximalwerte nimmt X y Jmax = max o . X q = y J y Jmax o X man g x Signals ausgeführt, d.h. den Ausdruck [15] 1 . Skalierung wird /|H(fT)| 2 -,1 d(fT) 2 = IIH x max " Skalierung gebrauchte Ueberlaufgrenze ist somit das Produkt der Ueberlaufgrenze am Eingang (meistens gleich 1 genommen) und des quadratischen Mittelwertes des Amplituden¬ ganges. Für die Ableitung dieses Ausdruckes sei auf Kap. 5. Die für die verwiesen. 14 In dem unbedingt Fall, wo man seltene Ueberläufe duldet, muss man eine stabile Ueberlaufcharakteristik verwenden sonst ein Ueberlauf Schwin¬ die nicht mehr abklingen, auslösen könnte. gungen, (z.B. eine Sättigung [31]), da 69 farbiges gauss'sches Rauschen Einqan9 steht, dann hat man Wenn ein Sxx am mit der -r / y max J = x S xx (fT) |H(fT)|2 d(fT) Leistungsdichte 1 2 max /S (fT) d(fT) spezifischen Eingangssignalen empfiehlt maximalen Amplituden durch eine Simulation des In anderen Fällen von es sich, die unskalierten Filters mit Gleitkommaarithmetik auf einem Gross¬ oder Kleinrechner zu 3.2.3 Durchführung Praktische ermitteln. der Skalierung gesehen haben, wird mit der Skalierung eine möglichst gute Ausnützung des beschränkten Wertebereichs der Festkomma¬ zahlen angestrebt mit der Randbedingung, dass keine überlaufene Zahlen bei den Multiplikatoreingängen ankommen und dass die Filterantwort nicht verändert wird. Dazu wird man die Signal¬ grössen an den kritischen Stellen (Multiplikatoreingängen) Wie wir auf ihren maximalen Wert normieren, d.h. die unskalierten Grössen mit den Inversen ihres maximalen Wertes ren. Nach der grössen durch werden aber multiplizie¬ Prinzip die Signal¬ Multiplikation sollte man im den vorhergehenden Skalenfaktor sehen, dass wir in der Praxis anders vorgehen wer¬ digitalen Filter belie¬ bige Bereiche definieren, wo der Signalpegel verschieden von jenem seiner Umgebung ist. Man muss nur alle Signale an den Eingängen eines Bereiches mit einer Konstanten multiplizieren den. Im und alle allgemeinen dividieren. Wir Ausgänge digitales 70 kann man in einem durch dieselbe Konstante dividieren. Ein Filter ist ein lineares System und seine Teilsysteme sind auch linear: es Wenn der man gilt daher das Superpositionsprinzip. alle Eingänge x,.. eines solchen Teilsystems mit gleichen den Ausgang Wenn wir c y,k« (c'x(l)' y(k) nun multipliziert, Teilsystems Konstanten des ••'/ c C'x(i)' alle diese •••>* Ausgänge dividieren, dann erhält man dann gilt (x(l)' c*y(k) für *•" je¬ x(i)"--) gleiche Konstante Ausgangssignale wie durch die dieselben früher (d.h. wie ohne den Faktor c): Das System "merkt" nichts von der Skalierung. folgt insbesondere die Bedingung, dass das Produkt der Skalierfaktoren, die man auf einer geschlossenen Schleife (insbesondere auf einer Rückkopplungsschleife) einführt, Daraus gleich Die 1 sein muss. Multiplikatoren mit den Skalenfaktoren (d.h. mit der inversen des maximalen Wertes) können von den Multiplikator¬ eingängen entgegen der Signalflussrichtung und die mit den inversen Skalenfaktoren von den Multiplikatorausgängen in die Signalflussrichtung verschoben werden, bis sich die Ska¬ liermultiplikatoren benachbarter Gebiete treffen. Zwei auf¬ einanderfolgende Skaliermultiplikatoren werden dann zu einem einzigen verschmolzen. Es entstehen so Bereiche konstanter Skalenfaktor. An der Grenze zwischen zwei solchen Bereichen befinden sich die Skaliermultiplikatoren, dessen Koeffizient (Skalierfaktor) gleich dem Verhältnis der Skalenfaktoren (in¬ versen vor Amplituden) des Bereichs betrachteten Skaliermultiplikator maximalen dem faktor zwischen zwei Bereichen wenig nach und des Bereichs ist. Wenn der Skalier¬ abweicht, werden die zwei Bereiche zu einem einzigen verschmolzen, dessen Skalen¬ faktor gleich dem kleinsten Skalenfaktor ist (d.h. als maxi¬ male Amplitude wird die grösste maximale Amplitude genommen). von 1 71 Die Skalierfaktoren brauchen nicht genau zu sein: sie müssen lediglich Grössenordnungen am anpassen. Deswegen werden dazu vorteilhaftesten Zweierpotenzen gewählt: damit verein¬ Multiplikationen zu Schiebeoperationen. Die maximalen Amplituden werden zu der nächstgrösseren Zweier¬ potenz aufgerundet. Diese rechnerische Ermittlung geschieht am einfachsten mit fachen sich die normalisierten Gleitkommazahlen, indem man den binären Expo¬ nenten der maximalen Amplituden nimmt. In diesem Fall erfüllt ja die Mantisse m die Bedingung i-N-l-q. (q ist der Quantisierungsschritt der Mantisse) Skalierung werden die Signalgrössen um die Differenz der Exponenten der maximalen Amplituden in den Bereichen vor Bei der Skaliermultiplikator geschoben. Die für die Skalierung günstigste Anordnung ist die, bei welcher die Bereiche so klein sind, dass die grössten Expo¬ nenten an den Eingängen der Multiplikatoren gleich gross sind und wo die Skaliermultiplikatoren direkt an die Aus¬ gänge der Multiplikatoren geschaltet sind. Wenn nämlich eine Zahl am Eingang eines Multiplikators keinen Ueberlauf auf¬ weist, dann hat auch das (komplette) Resultat der Multipli¬ kation, das am Eingang des Skaliermultiplikators steht, keinen und nach dem Ueberlauf. In vielen Fällen werden aber (um die Hardware zu vereinfachen) die Skaliermultiplikatoren nicht direkt an die Ausgänge der einzelnen Multiplikatoren angeschlossen. Zum Beispiel genügt bei der Kaskadenform meistens je ein Skalier¬ multiplikator zwischen zwei aufeinanderfolgenden Teilfiltern mit zwei zusätzlichen Skaliermultiplikatoren am Eingang und am 72 Ausgang des gesamten Filter. Hier muss auch ein allfälliger Ueberlauf Skaliermultiplikators berücksichtigt am Eingang werden. Es gibt des zwei Fälle: a) Der Skalierfaktor ist = 1 und daher eine ganze Zahl (Zweierpotenz mit positivem Exponent). Hier muss man nicht auf Ueberlauf am Eingang des Skaliermultiplika¬ tors testen. b) Skalierfaktor ist kleiner als 1 (d.h. eine Zweier¬ potenz mit negativem Exponent). Hier muss man seinen Ein¬ Der gang auf Ueberlauf testen und allenfalls den Exponenten des ganzen Bereichs korrigieren. Dieser Fall tritt auf, falls der Exponent des nachfolgenden Bereichs grösser ist als derjenige des betrachteten. 73 3.2.4 Abschnittfehler und Unterlauf Wenn der Skalierfaktor nicht ganzzahlig ist, können Abschnitt¬ fehler bei der Bei der üblichen Wahl der ist das der Skalierung entstehen. Skalierfaktoren als Zweierpotenz der Faktor kleiner als 1 (d.h. sein Exponent so dass die Zahl nach rechts geschoben wird, die Wortlänge werde um mindestens den Fall, wenn negativ) ist, denn, Betrag des Exponenten es sei erweitert. Diese Abschnittfehler sind gleich wie die bei den anderen Multiplikationen und werden im Kap. 5 behandelt. Je kleiner der Skalierfaktor werden die Verzerrungen des gemacht wird, desto grösser Signals. Bei zu kleinen Skalier¬ faktoren kann das Signal vollständig verschwinden: Es tritt Unterlauf auf. Man spricht von Unterlauf, wenn der Zahlen¬ bereich, in dem die Werte des Signals sich befinden, so klein wird, dass keine Schwelle der Quantisierungscharakteristik enthält. Somit erscheint ein nichtkonstantes Eingangssignal nach der Abschnittoperation am Ausgang als konstant, meistens gleich Null. Bei Unterlauf geht die Information über das Signal verloren. Bei der er Skalierung entsteht ein Wert rechts aus dem verwendeten Unterlauf, wenn der maximale Wort herausgeschoben wird. Es folgt daraus, dass ein Skalierfaktor natürlich nie kleiner als 2 sein darf, wo n die totale Anzahl Bits des vorgesehenen Datenwortes ist. Wenn der ist als Skalierungsfaktor nur um wenige Zweierpotenzen grösser die Unterlaufgrenze, muss man mit grossen Verzerrungen des Signals rechnen. 74 4. DIE QUANTISIERUNG DER KOEFFIZIENTEN Da digitalen Filters durch Zahlen beschränkten Wortlänge dargestellt werden, können die Koeffizienten eines mit einer eine endliche Anzahl von Werten annehmen. Deswegen werden aich die Pole und die Nullstellen nur eine endliche Anzahl von Lagen in der z-Ebene haben können und es existiert sie nur deshalb nur eine endliche Anzahl funktiorien. Bei der Synthese von von Digitalfiltern möglichen Uebertragungs- wird meistens vorausge¬ setzt, dass die Filterkoeffizienten ein Kontinuum bilden: Die Synthese wird mit einer grossen Stellenzahl durchgeführt. Die synthetisierten Koeffizienten werden daher nur in den Quantisierungsraster der späteren seltensten Fällen auf dem Realisation fallen. Die Beschränkung der Koeffizienten in ihrer Wortlänge bewirkt eine Aenderung der Koeffizienten; die Uebertragungsfunktion wird daher von der synthetisierten abweichen. Diese Abweichung hängt von der Aenderung der Koef¬ der Wortlänge und der Rundungs¬ der Uebertragungsfunktion und der Realisie¬ fizienten (die seinerseits abhängt), von rungsform des Filters In ungünstigen Fällen art von ab. kann dabei ein Pol ausserhalb des Ein¬ heitskreises verschoben werden: Ein stabiles Filter wird dabei instabil. Ganzzahlige Koeffizienten erfahren keine Aenderung: Sie be¬ finden sich schon auf dem Quantisierungsraster. Diese Abweichung der Uebertragungsfunktion vom gewünschten Verlauf ist ein unerwünschter Effekt. Man wird daher danach streben, dass möglichst nur kleine relative Abweichungen auf¬ treten. 75 4.1 Empfindlichkeit Die der Uebertragungsfunktion gegenüber Variationen ihrer Parameter Wir werden hier die verschiedenen Empfindlichkeiten und ihre Eigenschaften Wenn die Uebertragungsfunktion G(z) definieren anhand der Literatur kurz beschreiben. Parametern von n d l,2,...,n) (z.B. Filterkoeffizienten oder Pole Nullstellen) abhängig ist Pi = G(z) die je = G(z; Px,...,pif...,pn) eine kleine Variation 6p. erfahren, dann wird die Ueber¬ tragungsfunktion G (z) = " zu G(z) + 6G(z) r(7\ G(Z) + 3G(z) dass 6G(z) = 1?7 ÖP1 Die Glieder höherer so . + Ordnung + '•• können 3G(z) ~i?7 6pn + . , ••' vernachlässigt werden, folgt * dG(z) ||3p1 = 6p. cl + ... + dp± ¦—- 6p. ri + ... + |^9pn Die Variation 6G(z) kann durch das totale Differential G(z) bezüglich seiner Parametern approximiert werden. Glied 3G j—pi Ueblicherweise pi. 76 _ 6p *n . von Das stellt die absolute Empfindlichkeit der Uebertra- gungsfunktion G(z) gegenüber G S und 3G G 3p± Pi [43, 44, 45] _ 3G 3p± . pi G den i-ten Parametern dar. werden die relative Empfindlichkeit Un G 3lnpi Empfindlichkeiten de¬ einerseits die Empfindlichkeit der Uebertragungs¬ gegenüber relativen Aenderungen eines Parameters Typen sowie zwei finiert: funktion G 9G = P± semi-relativen von 3G _ 9 In 3P± "Pi P± Empfindlichkeit der Uebertragungs¬ gegenüber absoluten Aenderungen eines Parameters und anderseits die relative funktion _3G G QP± G = 3 In G 9Pi _ *P± Wenn die Filterkoeffizienten mit Festkommazahlen sind, ist ihr Quantisierungsschritt unabhängig dargestellt von ihrer Grösse: in diesem Fall ist die Verwendung einer Empfindlich¬ keit gegenüber absoluten Aenderungen der Koeffizienten zu empfehlen. Darstellung mit Gleitkommazahlen sind Empfindlichkeiten gegenüber relativen Aenderungen Bei ihrer hingegen die der Koeffizienten am geeignetsten. jetzt kurz einige interessante Eigenschaften Empfindlichkeiten besprechen. [44, 45] Wir werden G(z) Wenn man G(z) = mit |G| • Betrag und Phase darstellt ej*G |G| = solcher eJJB dann erhält man, da 3G_ 3p± SlGp. *! = = eJB ÜGl 3p± 6 lGl S^p. *1 + j B + SBBp. *1 j,G|_3B D|t,|3p± = S lGl p. *1 + j . Q0Bp. *1 77 Uebertragungsmass Wenn man das r In G = = ]g| ln + 34.G = braucht A + jB dann gilt sG Pi 31n G 31n p. ri =* 9A 31n ' p± 3B 3 3in p. - oA Q Pi • + 1 ^ «B Q gp± und auch <- j 3B 3P, Der Realteil der relativen Empfindlichkeit der Uebertragungs¬ gleich der relativen Empfindlichkeit der Ampli¬ tude. Sie ist zugleich die semirelative Empfindlichkeit der Dämpfung, falls diese in Neper ausgedrückt wird. Wenn die Dämpfung in dB gegeben ist, müssen die beiden erst genannten Empfindlichkeiten mit dem Faktor 20/ln 10 multipliziert werden, Der Imaginärteil der relativen Empfindlichkeit der Uebertra¬ gungsfunktion ist gleich der semirelativen Empfindlichkeit funktion ist der Phase. Wenn die Parameter von Polen und P*i dann 3Pi Nullstellen): Jt^ii • aus _ <• 78 komplexe Grössen P *ri + TP.. = folgt 9G p± 1 [57]: 2 3G 3pri j 2 Pri z 2 3G 3Pii p . . sind (wie z.B. im Fall ln[G(z)] ist, abgesehen von den Polen und den Nullstellen von G(z), analytisch. Daher müssen die CauchyRiemann'sche Gleichungen erfüllt sein. Aus den CauchyRiemann'sehen Gleichungen für die Polardarstellung der Funktion [57] folgt Die Funktion 0.|G| P 3B_ = 3P• rn *ri • • 3B - Q.|G| p.. rn 3prri . Wenn man auch für den lung komplexen Parameter p. die Polardarstel¬ braucht p. ci r = . 1 'eJ dann erhält man aus SGp. _L . i [57] sG - *i r. r. ii ^1 11 j S?$. l 1 Anwendung der Cauchy-Riemann'sehen Gleichungen Polardarstellung von G und von p. [57] ergibt SIG| _ Die i $. l 3B 30.l r. q;|g| bei der - - qb r. i 79 4.2 Die Eine indirekte Betrachtung Uebertragungsfunktion der Empfindlichkeit eines Filters kann immer in Funktion ihrer Pole und ihrer Nullstellen ausgedrückt werden. Die Pole und die Nullstellen sind ihrerseits Funktionen der Filter¬ koeffizienten. Wegen der Kettenregel der ist die Differentialrechnung Empfindlichkeit gegenüber Aenderungen eines Koeffi¬ zienten gleich der Summe der Produkte der Empfindlichkeiten gegenüber Aenderungen der Pole und der Nullstellen mal der Empfindlichkeiten der Pole und Nullstellen gegenüber der Aenderungen des gegebenen Koeffizienten. Dieser Umweg ist nicht günstig für eine Berechnung der Empfindlichkeit. Beide Teilresultate sind aber recht übersichtlich und gestatten das Aufstellen einfacher Regeln. Wir werden im nacheinander folgenden die besprechen. beiden erwähnten Empfindlichkeiten 4.2.1 Empfindlichkeit der Uebertragungsfunktion auf Aenderungen der Pole und der Nullstellen Wir wollen hier die und der daraus Empfindlichkeit der Uebertragungsfunktion abgeleiteten Funktionen (Amplitudengang, Grup¬ penlauf zeitgang) untersuchen. Ein digitales Filter n-ter Ordnung, gegeben Nullstellen z = und seine z = zQi 80 = 1, i = 1, ... , n ... , n Pole n zpi besitzt die i Uebertragungsfunktion durch seine n n G(z) z - H aQ = z z 1=1 , . z - . Ol Empfindlichkeit Die absolute . pi von G(z) bezüglich der i-ten Nullstelle ist daher 3G —-=— = G(z)'— - wenn z — 3z. z Ol z - , f z f- z . Ol . Ol und bezüglich des i-ten Poles G(z) 3G 3z z . pi z - z = ¦ Ol 3G/G ' - 3z pi Empfindlichkeiten Die semi-relative „,G Q' wenn z . 1 = z . oi - z sind daher nlG Q' und , — . pi z . oi . pi z - z pi Empfindlichkeiten gegenüber Aenderungen oder eines Pols sind umgekehrt proportional Die semi-relativen einer Nullstelle dem Abstand von z zum betrachteten Pol oder Nullstelle. Betrag der semi-relativen Empfindlichkeit des Frequenzganges G(eJ ) beträgt Der maximale 3G/G 3z.l Er ist 1 max ~\zi umgekehrt proportional oder des Pols z. i vom zum Abstand der Nullstelle Einheitskreis. 81 4.2.1.1 Empfindlichkeit des Amplitudengangs auf der Pole und Nullstellen Wenn die Nullstellen Phase dargestellt z = . 01 dann ist der r . 01 G(ejq) mit <t> a = z zpi ; z ' mit Betraq3 und . px Pi rpi «P^n-i r = e Amplitudengang i i -±^* = 1 und die Pole -e^oi n , 01 werden n i<t z o |z-zoi1.I n a = n n Iz-Z I pi' i=l 1 - 1 " n o 1=1 , 2rQ1.cos(<)>-<J) .) Q1 + r 2rniC°S(^"*r,i) pi Tpi + r ' üjT = Durch Differenzieren erhält man die relativen keiten des Amplitudengangs [46]: %\r\ /r o I Gl /G 3r _ . . oi oi 0,|G| r 3r pi *«*t Ol 1 z r _ 3*$ °*pi z . bzw. i 1 z ^ z - z - z - r - ,2 Empfindlich¬ oi_ . oi' . rpi - ,2 pi> . |2 . Ol ) Ol ' . rpl sin(d>-^pi) _ • , z sin (<J>-<|> oi i 1 z 3|G|/G _ oi 82 pi 9* Ol . ± , . 3|G|/G _ < **>—4>^oi.. ) cos(^-^pi) _ • 0.|G| ? z 1 3|G|/G _ . Q ,|G| cos _ , \r\ qiI^I r wenn Aenderungen z ., z - z , pi' 2 . wobei hier z = eD* ist, 2 oi . ö~ pi Gleichungen graphisch interpretieren. Die einzelnen Glieder dieser Fig. 17 z=e r . sin lassen sich nach T (<j>-<|>i -r, co Pol oder Nullstelle eine Nullstelle: Q'• '= Falls z. ein Pol: q'I Fig. Graphische Darstellung Falls z. 1 1 17 tude auf Aenderungen -sina ; I= sina der Q'' '= sinß Q1I '= -sin$ der Empfindlichkeit Ampli¬ eines Pols oder einer Nullstelle Die semi-relativen der Pole und der Null¬ stellen durch ihr Vorzeichen. Sie Empfindlichkeiten unterscheiden sieh lediglich hängen punktes z nur von = e^ der Phasendifferenz (<j> - 4-^) des Frequenz¬ und des betrachteten Pols bzw. der Nullstelle ab. In Fig. 18 Betrage r.1 des Pols, bzw. der Nullstelle I I QI QI 'und 'in sind die semi-relativen Empfindlichkeiten und vom Funktion der normierten Betrag r. als Parameter Q^[ Frequenzdifferenz (<j> dargestellt. Q^j - *±) /tt mit dem 83 XJl mmm^a! 0.00 -.1 .1 .5 -.1 —=s=^ -.3 -.2 N0RMPLIZED FREOUENCY a) Fig. 18 0.00 -.] NflRMfiLIZED .1 .1 .3 ,H FREOUENCY b) Semirelative Empfindlichkeit der Amplitude Aenderungen des Betrags eines Pols Aenderungen der Phase eines Pols a) auf b) auf in Funktion der normalisierten (<J> *±) /tt ~ für r. = Frequenzdifferenz 0.4, 0.5, 0.6, 0.65, 0.7, 0.75, 0.8, 0.85, 0.9, 0.95 Empfindlichkeit auf Aenderung des Betrages eine gewisse Aehnlichkeit mit derjenigen Die Kurven für die in Fig. 18a) haben für den Anteil desselben Pols auf den Amplitudengang (siehe [46], Fig. 2.1). <))= <J>. gleich der Bei , d.h. wenn normierten Abtastfrequenz) wird, 84 das Argument des Pols oder der Nullstelle Kreisfrequenz <J> (normiert bezüglich dann ist der dl Gl / |G r 3r (1 Ol " 3G 1 . 01 1 roi} 3|G| 3G 1 3r r - 'Pi 3(J) Ol ^Pi /G 3ZOl Ol max /G Dl Imax 3z folgt, = 3G /IG 3z dass auch die 4>. sein proportional 0 . 17 sieht man, dass Figur 3 |G $ = 3 * Aus der bei Pi r 3|G| 3 IG Es 3z . - muss. zum gelten muss /G Empfindlichkeit der Der maximale Wert ist Amplitude maximal auch umgekehrt Abstand des Pols oder der Nullstelle vom Einheitskreis. In der r. l Fig. 18b) Amplitude sehen wir, dass das Maximum der auf Aenderungen Empfindlichkeit der Phase auch mit dem Betrag nächst. 85 4.2.1.2 Empfindlichkeit des Phasenganges gegenüber Aende¬ rungen der Pole und Nullstellen Die Phase der Uebertragungsfunktion der Abstände des Punktes z ist die Summe der den Polen und von von den Null¬ stellen n *G(z) n yL = .*(z z - .) - 01 1=1 *(z folgen Daraus i£G_ 3r z.) 1 - die 1 z-z r 34-G 3(1) oi in _ . oi , pi1 ri sin^i ) ri cos<j>i des Phasenganges t) 2 z . [r oi -cos (<f>-<J> r yoi ) ] . . ' z-z . r d&G <wr-_ _ 31»Ypl • pi I z-z • ^ z , T- . Ol tr pi."COS (<|>-(f> . 86 - Tpi , . pi z .) pi' sin(d>-d> .) _ wenn z . Ol 34-G 3'r ~ Empfindlichkeiten Iz-zOl1|z . - ) ergibt sich sinf 3 8in(«»-» = e3 = arctg ( cos<() = *(z ^v i=l Phasengang (z Für den yL bzw. z ^ VY.. . | z . P1 )] pi• z ., wobei hier z = e^* Argumente ist, Empfindlichkeit 4.2.1.3 Gruppenlaufzeit gegenüber der Aenderungen der Pole und der Nullstellen Die Gruppenlaufzeit Digitalfilters ist definiert durch [11] den Ausdruck ¦g eines = _d*G(ej*) dcj) Wenn das Filter durch seine Pole und Nullstellen definiert ist, gilt: n n Lg T Die totale = _ V L 1=1 A*(e^dcj> z .) oi' + yL -£-*(ej<)) d<J» i=l durch die einzelnen Pole und Nullstellen betragen Tgi _d_ arctg ,sinc(> d<|> (cos<J) * 1 1 3x - g 8ri 3t 8(|)i 1-2 ri cos (<f-<t>i) Empfindlichkeit (1 _ + (1 - r. - rjsin-jjj. ricoscfji ricos (4>-a>i) - . Die - der z .) pi ist die Summe der Anteile, die Gruppenlaufzeit Anteile - + (+ - gegeben sind. Diese wenn z. wenn ein Pol, eine Nullstelle ist) zL r±z Gruppenlaufzeit ist daher [46]: cos (et)-*. ) 2r, r.2) il l 2r. cos(<))-<)). )+ r. 2)2 + - (1-r. (1-2 2)sin(<|)-(f)i) r.cos(<|>-<j)i) + r±2)2 87 In Fig. 19 sind die absoluten Empfindlichkeiten der Gruppen¬ laufzeit 3T„ T-2 3r± ™d 3t —2 34>i dargestellt, in der gleichen der Amplitude in Fig. 17. Weise wie die _ Empfindlichkeiten s K 0.00 NORMALIZED FREOUENCY N0RMBLIZED FREOUENCY a) Fig. 19 b) Absolute Empfindlichkeiten der Gruppenlaufzeit a) auf Aenderungen des Betrags eines Pols b) auf Aenderungen der Phase eines Pols in Funktion der normalisierten (<j) - Fig. <j>.i ) /tt für 17. Die Frequenzdifferenz gleichen Werte von r.i Empfindlichkeiten gegenüber die stellen haben die umgekehrten wie in den Null¬ Vorzeichen. 4.2.1.4 Anwendung auf den Speziallfall selektiver Filter Bei den frequenzselektiven Durchlassbereiche, DB 88 G(ej<l>) wo Filter haben wir ein oder mehrere Sperrbereiche, und ein oder mehrere SB: |G(e^) | ^ wo «1 e Insbesondere wird die Amplitude dort exakt Null, Nullstelle auf dem Einheitskreis haben. wo wir eine Durchlassbereich |G(ej<(>)| Amplitude lichkeiten ungefähr gleich Da die - 1 ist, sind die absoluten Empfind¬ den relativen. Bei den selektiven Filtern befinden sich die Pole normalerweise im Sektor der zum z-Ebene unterhalb des Bogens auf dem Einheitskreis, der Durchlass- und zum Uebergangsbereich gehört. sich dem Einheitskreis, d.h. sie haben eine sie sich näher der Bandgrenzen befinden. Die Pole nähern grössere Wenn der Güte, wenn Uebergangs¬ bereich schmal ist, dann häufen sich die Pole bei den Band¬ grenzen. Da die maximale Empfindlichkeit des Frequenzganges gegenüber zum den Aenderungen Abstand dieses Pols eines Pols vom umgekehrt proportional Einheitskreis ist, werden die Fehler des Frequenzganges in der Nähe der Bandgrenze als in der Bandmitte. Sperrbereich: Wenn man grösser Nullstellen auf dem Einheitskreis Dämpfung Filter mit einer hohen im Sperrbereich wünscht, sollten alle oder fast alle Nullstellen auf dem Einheitskreis liegen, so dass sich Dämpfungspole (d.h. Punkte Dämpfung) ergeben. Die relative Empfindlich¬ Amplitude gegenüber der Frequenz des Dämpfungpols mit unendlicher keit der yoi wird d> 3 . Ig /|G| 34)oi sin(cj>-ct> = ) — 2[1 - cos(4>-<l>oi) ] = 1 <t>-4>oi ^ cotg ~2 89 Bei einer Nullstelle auf dem Einheitskreis wird die relative Empfindlichkeit 3G 3z /G wenn z z ->¦ . Ol Ol da G gegen Null strebt. Empfindlichkeit Die absolute n ü(z 2 k=l 3G 3z = z-z . Ol k^i a - n Zpk> ü(z Ol k=l strebt dagegen gegen einen endlichen Grenzwert n n = Ol z=z Bei der 9*oi 90 z .) ok Mi o n - z pk.) z ok1 z pk haben wir 0 n Ol n k=l = Ol - . = z=z . n (z oi k=l Amplitude z=z a Ol 3 ] G| 3r Ol - (z oi . k=l . 3G 3z , ) ok' ± a n n k=l z | z . oi oi - . Gruppenlaufzeit Für die Phase und die kann die man Empfindlich¬ keit nicht definieren, da beide Funktionen in diesem Punkt nicht stetig 4.2.2 Empfindlichkeit der Pole und Nullstellen gegenüber Aenderungen der Koeffizienten sind. Wir betrachten jetzt der Pole und der Null¬ Empfindlichkeit die digitalen Filters auf Aenderungen der Koeffizienten. einem Digitalfilter direkter Form sind die Koeffizienten Uebertragungsfunktion stellen eines Bei der A(z) B(z) az ° ,.. C(y) = zugleich = z n + a. z n-1 + +...+a^.z Sil l n^Kn_1^ + + bxz X + ... bn_lZ K a ü bn 4- K + *, die Koeffizienten des Filters. Die Wurzeln der Gleichung B(z) tragungsfunktion; =0 sind die Pole der Ueber¬ die Wurzel der Gleichung A(z) =0 sind deren Nullstellen. Wenn obiges G(z) die Uebertragungsfunktion eines Teilfilters (d.h. Kaskaden- oder Parallelform) ist, sind die Pole von G(z) zugleich Pole des gesamten Filters. Wenn G(z) ein Teilfilter eines Filters in Kaskadenform ist, dann sind die Nullstellen von G(z) zugleich eines Digitalfilters zerlegter Form Nullstellen des gesamten Filters. A(z) und B(z) sind Polynome mit reellen Koeffizienten Grades des Typs -_ P(z)=cz n o + c.z 1 -i + ... + c ,z n-1 + c n n-ten 4.2.2.1 Empfindlichkeit der Wurzeln eines Polynoms die Nullstellen und die Pole digitalen Filtern die Wurzeln des Zählerpolynoms, bzw. des Nennerpolynoms der Ueber¬ tragungsfunktion sind, untersuchen wir zuerst die Empfindlich¬ keit der Wurzeln eines Polynoms. Die rationale Gleichung n-ten Grades mit reellen Koeffizienten Da P n (z) c = besitzt +C.Z~ Z ol Wurzeln n giert komplex (i z± +...+C n-1nz = 1, ..., Zi(V cl = =¦ 1 Man kann n =0 n), welche reell oder 3z± -r—- ' 3c von P n (z) (j=0, 1, ...,n) erfahren, von + o ... + —i 6c. 3c. 3 P n (z) je werden die Wurzeln 3z. 6c ° j 3z.l 3c. Aenderung z + ... 6c 3cn —— n einer eines Koeffizienten l = n 3 c o II k=l ) (z.-z, l k k^i beträgt. Die totale Variation der Wurzel z. i — 6z.l 92 = (z 6c £o—i—- (zi-zl> +...+ • zT}~36c. i 2 +...+ l 3z. + zeigen [47,48,49], dass die Empfindlichkeit Wurzel auf die konju¬ cn} Wenn die Koeffizienten c. 3 eine kleine Variation 6c. 3 sich um 6z. verschieben. 6z + c sein können. Die Wurzeln sind kontinuierliche Funktionen der Koeffizienten Zi von beträgt 6c ) ü_ (zi-Zi-l)(zi-zi+l)-"(zi-Zn) dann Der Zähler dieses noms an gleich dem Wert eines Poly¬ Polynom besitzt als Koeffizienten Ausdrucks ist der Stelle z.. Dieses die relativen Variationen der Koeffizienten auf den Wert des ersten Koeffizienten c von Pn(z), bezogen . Der Nenner ist das Produkt der und den anderen Wurzeln von Abstände zwischen der Wurzel pn(z). Wenn die Variationen 6c. der Koeffizienten Festkomma-Rundung |6c.| 3 verursacht wurden, jetzt abschätzen, Wir möchten durch eine c. gilt q/2 ^ ' 1 von c. z± |6zi| wie gross Bedingung werden kann. Der Nenner ist keine Funktion der unter dieser Variationen 6c.. Für den Zähler haben wir |6C| Da |zJ-6co + ... + zj"j6c. + ... + 6cnl 6C eine lineare Funktion der 6c. ist und da der Absolutwert eine |6C| Funktion ist, die kein Maximum besitzt, kann maximal werden, wenn alle 6c. sich auf einem der stetige nur Ränder ihres 6c. 3 so = Gültigkeitsbereichs = ± befinden ^2 dass gilt 1 6C 'max = • a * 2 i' ± ,n zV ± i ... ... ± i *n-3 z l + Die Vorzeichen der einzelnen Terme müssen so dass I6CI gewählt werden, maximal wird. 93 Wegen 6C| Dreiecksungleichung der ? (iz"i +|Zr1i ^ max |n 2 (|Zj i / g Zi" s| Der + ¦ |z, l11"1 'i " ' (n+1) 6z, max +1) + ... i) zj* 1 z. 1 1 ' =. Variation einer Wurzel eines daher: Zll Co + 1 grösste Absolutwert der Polynoms beträgt +... n+1 ' z.i < = haben wir . \z ' i'|n+1 |z.| - - 1 1 n n k=i '> lzil^ 1 i lzil= 1 |z.-z, x k Mi ^< LI (n+1) co \ 1 n n k-i z.-z. x k Mi Der erste Faktor der Koef¬ fizienten im ist. gibt an, wie grob die Quantisierung Vergleich zum Wert dieser Koeffizienten Faktor wächst mit steigendem Betrag der Wurzel z., um so stärker, je höher der Grad des Polynoms ist. Der zweite und zwar dritte Faktor ist umgekehrt proportional zum Produkt der Beträge der Abstände zwischen der Wurzel z.l und den anderen Wurzeln. Der 94 Folgerungen 4.2.3. Wir werden hier Fehler, die bei Quantisierungsfehler für die einige qualitative Aussagen machen über die der Beschränkung der Wortlänge der Koeffizien¬ entstehen. Diese Aussagen gründen auf die vorher gefundenen Resultate über die Empfindlichkeit der Uebertragungsfunktion ten auf Aenderungen der Pole und Nullstellen und über die Empfind¬ auf Aenderung dessen der Pole eines gegebenen Filters lichkeit der Wurzeln eines Polynoms Koeffizienten. a) Ordnung der Teilfilter Die Quantisierungsfehler steigen Ordnung mit zunehmender der Teilfilter. Tat, bei einem Teilfilter 2-ter Ordnung sind die Fehler In der umgekehrt proportional 6z.1 zum Abstand vom konjugiert komplexen z. l Beim Einbeziehen eines zusätzlichen filter wird dessen 6z.1^ Z . Ordnung ¦7*1-7. Z* Z . um 7. Z Polpaars (z., 2 erhöht. Es wird \ \ 7. - Die zusätzlichen Faktoren im Nenner ins Teil¬ |z.-z.|und | z -z*j | sind Einer davon wird kleiner als 1 oder im besten < Fall 1 sein. Wenn die Pole nahe beieinander 2. z^) 7* sicher =¦ Pol liegen, kann einer dieser Faktoren viel kleiner als 1 sein: der Zuwachs des Fehlers wird dann erheblich. 95 empfiehlt Es filtern (in Kaskade oder in Ordnung zusammenzusetzen. Um Hilfe reeller Koeffizienten ordnung von Grund, digitale Filter aus Teil¬ Parallel) möglichst niedriger sich aus diesem 2 benötigt. konjugiert komplexe zu realisieren, Bei Filtern höherer Pole mit wird eine Mindest¬ Ordnung weist die direkte Form die grössten Quantisierungsfehler auf. Der Unterschied bezüglich Qunatisierungsfehler wird am grössten bei schmalbandigen Bandpässen mit der Mittelfrequenz bei 1/4 der Abtastfrequenz. b) Bandbreite Die Fehler werden umso sehr schmal oder sehr grösser, je extremer (d.h. entweder breit) die Bandbreite eines Filters wird. Filter, die alle durch Frequenztranformation einzigen normalisierten Tiefpass hergeleitet wurden. Wir betrachten aus einem Grenzfrequenz eines 1/4 der Abtastfrequenz. Die normalisierten Tiefpasses liegt bei Tiefpass. Tiefpässe können aus einem normalisierten Tiefpass durch folgende Frequenztransformation gewonnen werden [46]: z z = + n B-z n B + 1 wobei B = tg tt (1/4 ist die - f ) lich der Grenzfrequenz des Tiefpasses, halben Abtastfrequenz. Wenn die Grenzfrequenz f lim B-1 f -»-0 c 96 f normalisiert gegen Null strebt, dann ist bezüg¬ und daher auch lim f +0 z = 1 c Die digitalen Filters Fig. 20 dargestellt. der Pole eines Bewegung der Bandbreite ist in n V2 Fig. 20 Wenn Verkleinerung bei f /2 P Bewegung der Pole bei Verkleinerung der Bandbreite eines digitalen Tiefpasses. fc ist hier die Grenz¬ frequenz, f die Abtastfrequenz. hingegen die Grenzfrequenz gegen die halbe Abtast¬ frequenz strebt, gilt lim B f +1 = 1 c und daher auch lim f +1 z = c 97 beiden Fällen gehen die Pole und die Nullstellen gegen einen einzigen Punkt. Ab einer gewissen Grenzfrequenz müssen In sie daher sich einander nähern: dabei werden die Quantisierungs- fehler grösser [48]. Bandpass Bandpass Ein mit den (wiederum normalisiert kann durch folgende z = Transformation 1 + n Grenzfrequenzen f.. und f» bezüglich der halben Abtastfrequenz) Aü—TT + A * k cos (TTf A = 1 B 1 = - - = cos f ist die Wenn die k Grenzfrequenzen k -* 0 B ¦* 1 A 98 o Bz B + n n + 1 ) = tgir(l/4 cotgiT(f (irf o ) - f - (f2-f1)) ) COSTT (f +f ) COSTT (f-f) = Mittelfrequenz f. und f_ gegen f streben und daher z werden L 46 j: k 1 + k k 1 .bT-TTn n mit gefunden cos ( TTf o ) streben, dann z -»- (irf o ) cos e = Wenn der ± cos y (irf o ) - 1 = cos(iTf o )-± j. sin (irf o ) ±JTTfQ Bandpass selektiver wird, dann häufen sich die Pole und die Nullstellen welcher der um jenen Punkt auf dem Einheitskreis, Mittelfrequenz entspricht. Das ist in Fig. 21 dar¬ gestellt. f Fig. 21 Bewegung ? 2 der Pole bei der Verkleinerung f. 72 der Band¬ digitalen Bandpass. fQ ist Mittelfrequenz, f die Abtastfrequenz. breite in einem die Wenn der Bandpass sehr breitbandig wird, d.h. wenn dabei f1 gegen 0 und f_ gegen 1 gehen, dann strebt ein Teil der Pole und der Nullstellen gegen z = +1 und der andere Teil gegen z = -1. 99 Hochpass Bandsperre: Hochpässen liegen die Ver¬ hältnisse genau wie bei den Tiefpässen,und bei den Bandsperren liegen sie genau wie bei den Bandpässen, da die Transformatio¬ nen jeweils ähnlich sind. und Bei den Ausführungen ist ersichtlich, dass die Quantisie¬ rungsfehler des Frequenzganges wachsen, je breiter oder ex¬ Aus diesen trem schmaler die Bandbreite Pole näher am Einheitskreis ist, weil liegen einerseits dann die und somit die maximale Empfindlichkeit des Frequenzganges auf Aenderungen der Pol¬ lage grösser wird, und weil anderseits die Pole und die Null¬ stellen näher aneinander rücken und somit ihre Empfindlichkeit auf Aenderung der Koeffizienten höher wird. Die Situation ist etwas besser bei schmalbandigen Bandpässen und Bandsperren in Kaskadenform, da hier der jugiert komplexen Abstand eines Pols von seinem kon¬ Verkleinerung der Bandbreite nicht viel ändert, so dass die Empfindlichkeit der Pole und der Null¬ stellen auf Aenderungen der Koeffizienten ungefähr konstant bei einer bleibt. c) Mittelfrequenz schmalbandigen Bandpässen und Bandsperren werden die Fehler grösser, wenn die Mittelfrequenz gegen Null oder gegen die halbe Abtastfrequenz geht. Die günstigsten Verhältnisse werden hier erhalten, wenn die Mittelfrequenz bei einem Vier¬ tel der Abtastfrequenz (f V2) liegt. Bei = d) Verteilung der Die der Pole und der Nullstellen Quantisierung der Koeffizienten bewirkt, dass die Anzahl möglichen Koeffizientenwerte endlich ist. Deswegen ist auch die Anzahl der Orte, wo sich Pole oder Nullstellen befin- 100 den können, endlich. Die Dichte der realisierbaren Pole oder der realisierbaren Nullstellen hängt unter anderem von der Filterstruktur ab. Empfindlichkeit des Frequenz¬ ganges auf Aenderungen der Pollage umgekehrt proportional zum Abstand des Poles vom Einheitskreis ist. Es folgt, dass Strukturen mit gleichmässiger Verteilung der Pole und Null¬ stellen auf der z-Ebene nicht die günstigsten sind. Die günstig¬ sten Strukturen bezüglich der Rundungsfehler der Koeffizienten Wir haben gesehen, dass die die, bei welchen umgekehrt proportional wären 4.3 Die Empfindlichkeit Aenderungen Wir haben im funktion auf max. die Dichte der Pole und der Nullstellen zum Abstand vom Einheitskreis ist. Uebertragungsfunktion der der Koeffizienten Kapitel 4.2 Aenderungen der Uebertragungs¬ der Koeffizienten auf eine indirekte die Empfindlichkeit erlaubt, und einige allge¬ Weise, d.h. in zwei Stufen, betrachtet. Dies hat gewisse qualitative Folgerungen meine Richtlinien aufzustellen, In diesem Abschnitt soll nun Empfindlichkeit der Amplitudenganges durchgeführt nung der drücke für die maximale erhalten, welche auf kleine zu ziehen uns welche sehr anschaulich sind. quantitative Uebertragungsfunktion und eine direkte Berech¬ des werden. Wir werden damit Aus¬ Abweichung eine unmittelbare der Uebertragungsfunktion Berechnung gestatten, je¬ doch nicht so anschaulich wie die Richtlinien des vorhergehen¬ den Abschnittes sind. In einem ersten Abschnitt (4.3.1) wird die Berechnung der Empfindlichkeit bei verschiedenen Filter¬ strukturen durchgeführt. Anschliessend wir eine Schranke für die maximale gungsfunktion angeben. legungen Im Abschnitt über die maximale (Kap. 4.3.2) Abweichung werden der Uebertra¬ 4.3.3 werden einige Ueber¬ Abweichung des Amplitudenganges 101 angestellt. Im letzten Abschnitt (4.3.4) wird die Empfindlich¬ keit des Amplitudenganges für den wichtigen Fall der Kaskaden¬ form angegeben. Empfindlichkeit der Uebertragungs¬ funktion auf Aenderungen der Koeffizienten 4.3.1 Direkte Berechnung der Empfindlichkeit Wir werden hier die der Koeffizienten bei der direkten Parallel- Aenderungen auf Uebertragungsfunktion der und Kaskadenform untersuchen. Es wird auch darauf hingewiesen, wie die Empfindlichkeit beliebiger Filterstrukturen berechnet werden kann. Direkte Form Wenn digitalen G - / x = eines Filters in direkter Form az z) kleine Uebertragungsfunktion den Koeffizienten der man n n-1 +a.z , 1 o — zn + 6a.. , A(z) + ... + bn B(z) zufügt, bzw. 6b. < . , , b^11-1 1 Aenderungen n +...+a . dass diese Koeffi¬ so zienten a = . qi a. l + 6a. l b.=b.+6b. l l qi werden, wird eine neue G * (z) G(z) 102 0, 1, i = 1, 2 , ..., n . n . . , erhalten 6G(z) = +a.z z zn +...+a 31 -32- + b lZn_1 ql 32L + ... + b qn ergebende Variation 6G(z) der Uebertragungs¬ G(z) genügend klein ist, dann kann man sie durch das Wenn die sich dabei funktion + = Uebertragungsfunktion a = i totale Differential G(z) gegenüber den Koeffizienten von ersetzen: n 6G(z) = dG(z) ff- l = l Die Polynome in i=l 6aii z i=0 l 6a. + X i=0 B(z) n ff- A(z) " 1 R2fz1 B (z) 6b. X ^ Z i=l 5 i z n dA(z) l = Sa. z 6b.i z n-i i=0 n und dB(z) y = ^ n-i i=l welche selber die Variationen der Koeffizienten von G(z) als Koeffizienten haben, sind die totalen Differentiale von bzw. B(z) gegenüber ihren Koeffizienten. Die Variation der Uebertragungsfunktion 6G(Z) , Mizj. B(z) _ wird damit G(z) dBjzl v Man kann die Effekte der erster Näherung Filter 6G(z) als eine zum A(z), ' B(z) Quantisierung der Koeffizienten in Parallelschaltung idealen Filter eines G(z) darstellen, parasitären wie in Fig. 22 103 dargestellt ist. Dabei ist 6G(z) durch G(z) obige Gleichung gegeben. O 6G(z) Fig. Gq(z) 22 .J Parallelform Uebertragungsfunktion G(z) Uebertragungsfunktion der Teilfilter G.(z) Bei der Parallelform ist die die Summe der G(z) = l Gi(z) i Filter 6G(z) die Parallel¬ den Teilfiltern gehörenden Parasitärfiltern Daher ist auch das schaltung der zu parasitäre 6G±(z) 6G(z) l 6G±(z) i = Die resultierende Anordnung ist in Fig. 23 6G z) ^ GX(z) 6Gi(z) Gi(z) 6Gi(z) G„ 6Gn(z) z Gz 104 dargestellt. Fig. 23 +<D Kaskadenform Uebertragungsfunktion G(z) das Uebertragungsfunktionen der Teilfilter G^z) Bei der Kaskadenform ist die Produkt der G(z) aQnGi(z) i = Man bekommt daher für das 6G(z) l n i=l j=l =¦ G.(z) l n i=l j=l j^i G(z) = parasitäre G (z) • • 6G.(z) i Filter + 6aQ G(z) • aÄ Gi(z) ei(z) + G(z) — ( l £i(z) i=0 wobei e±(z) dA. (z) G(z) A±(z) 6a_ eo(z) parasitäre gestellt. Das dG±(z) dB. (z) B±(z) für i=l, Filter bei der Kaskadenform ist in Fig. . . . , m 24 dar¬ :r G(z) i 6G . G(z) frt Fig. 24 105 Allgemeine Filternetzwerke Wir haben vorhin die absoluten Empfindlichkeiten für einige wichtige Filterformen angegeben. Für einige andere Realisie¬ rungsformen lassen sich die Empfindlichkeiten analytisch an¬ geben. In [50] wurden die Empfindlichkeiten der in [14] ange¬ gebenen vierzehn kanonischen Formen berechnet. Im allgemeinen ist es zu kompliziert, die Empfindlichkeiten analytisch zu berechnen: es empfiehlt sich hier, numerische Methoden zu verwenden. Man kann beweisen tragsfunktion gegeben ist, [51, 52, 53], dass die Ableitung der Uebernach einem Filterkoeffizient c. durch den Ausdruck H.„(z) Uebertragungsfunktion vom Filter¬ eingang zum Eingang des betrachteten Multiplikators, der c. als Koeffizient besitzt, und H,.(z) die Uebertragungsfunktion vom Multiplikatorausgang bis zum Filterausgang ist. Die knordnung zur Berechnung der Empfindlichkeit nach dieser Methode ist in Fig. 25 dargestellt. wobei die Netzwerkgleichungen eines digitalen Filters für eine bestimmte Frequenz ((>= 10T aufgelöst werden (nachdem z durch coscj) + j sin<|> ersetzt wurde) erhält man ausser einem Punkt des Frequenzganges rec G(e i<J> ), je einen Punkt aller Frequenzgänge j-*. vom Filtereingang bis zu den Multiplikatoreingängen. H19(eJT) 1 .j* von den Multiplikatorausgängen zum Filterausgang Die H_.(eJT), Wenn die , gleichen Arbeits¬ gang gefunden werden [26] durch die Verwendung des Begriffes des transponierten Netzwerkes [54]. Das transponierte Netzwerk genommen, können mit wird 106 vom gegebenen geringem Mehraufwand im Netzwerk durch Umkehr der Signalfluss- richtung gefunden: Insbesondere werden und Summatoren umgewandelt. transponiert. Wenn Knoten zu Knoten zu Summatoren Die Knotenmatrix [A] die Netzwerkgleichungen wird dabei einfach des gegebenen Netzwerkes mit Hilfe der LR-Zerlegung (Gauss1 sehe Eliminationsmethode) gelöst wurden [55], [A] = LL][R] ergeben die gleichen Faktoren [L] und [R] auch die Lösung des transponierten Netzwerkes L56j, da gilt [A]T Ein Programm ganges eines [R]T[L]T ([L][R])T = Berechnung der Empfindlichkeit des Frequenz¬ beliebigen digitalen Filternetzwerkes ist in zur [26] angegeben. r^>4> o 1 H,„ 12 v H,. 34 z z g(z: g(z: 3G(z) 3c. l Fig. 25 Anordnung zur Berechnung der Empfindlichkeit Uebertragungsfunktion eines digitalen auf Aenderungen eines Koeffizienten der Filters c 107 4.3.2 Die maximale Abweichung der Uebertragungsfunktion Uebertragungsfunktion G (z) eines digitalen (beliebiger Form), dessen Koeffizienten c schon Wir betrachten die Filters . quantisiert worden sind. Dieses Filter ist das Resultat der Quantisierung der Koeffizienten einer ganzen Schar von Filtern, dessen Koeffizienten c. nach der Quantisierung alle c ergeben. Alle c.1 liegen dabei in einem bestimmten Inter. qi vall die Lage und die Grösse dieses Intervalls hängen von der Art der Quantisierung ab. Wenn die Koeffizienten c Festkommazahlen sind, die durch um c .: . qi von c. bestimmt worden die Rundung gleich valle c sind alle Inter¬ gross: ^ 2 q s ¦=¦ - qi . wobei q der sind, dann c. - c qi i . + M 2 q •=- Quantisierungsschritt (= Wert des LSB) ist. Die Variation der Koeffizienten 6c.i c. = l c - . qi befindet sich dabei im Intervall 0Ci 2 Alle sich 2 unquantisierten Uebertragungsfunktionen G(z) befinden in einem "Schlauch" um die quantisierte Uebertragungs¬ funktion G (z) . q Wir werden hier den maximalen "Durchmesser" dieses d.h. |6G|'max 1 6G ist - berechnen. in erster Näherung der Koeffizienten 6c. l 108 Schlauches, - eine lineare Funktion der Variation M 6G = dG l = 1=1 (M Der ist die totale Anzahl Betrag 3G *„ 3c. 6c.l %z Koeffizienten) davon M I dGl 6G i=l l Quadrat des Betrags von dG ist eine quadratische in 6c M I dGl i=l M Re(gf )6c I i-1 Diese Funktion hat die Form einer 6^. der stetige, positiv semidefinite Funktion ist eine Das 3c. Funktion 1 2 Im(3f)6ci elliptischen Paraboloid- fläche in einem mehrdimensionalen Raum. Sie besitzt kein (nur ein Minimum Maximum bei unbeschränkten Werten von wenn alle 6c Da die 6ci 0). = (positive) Quadratwurzel einer positiven len eine monoton zunehmende Funktion ist, wird 2 ein Maximum hat. mum haben, wo reellen Variab¬ |dG| ein Maxi- |dG| Die Werte der 6c befinden sich aber in ganz bestimmten Inter¬ wird daher ein Maximum dann und nur dann annehmen, die 6c sich an einem der beiden Ränder ihres Definitions¬ vallen: wenn |dG| intervalls befinden 6c + _ a 2 109 M Daher dG q _ 3G 3c.1 I max 1=1 (6) max Die Vorzeichen der einzelnen Terme sind dabei so zu wählen, dass der Betrag der Summe maximal wird. Wegen der Dreiecks¬ ungleichung haben wir M dG| Wir wollen Wert vom lA max 1=1 jetzt abschätzen, (6) 3G ac, I wie weit weg die Schranke (7) kann, d.h. sein (7) wie gross die grösste Abweichung des Verhältnisses n R _2G I i-1 I = 3C, M I 1=1 max 3G 3c l R, der abweicht, wollen wir mit Q bezeichnen. vom Im Wert 1 sein kann. Den Wert allgemeinen kann man von dieses Problem so am meisten von 1 formulieren: Gesucht wird M II Q = min max + x. l i-1 M I i=l wobei x. l beliebige 3 x I |x±| 1 um ein Problem der Menge kontinuierlicher Grössen des Satzes 110 x Vektoren auf einer Ebene sind, Es handelt sich also eine ± zweiwertiger Grössen. Minimalisierung über Maximums über eines Das Maximum (= 1) wird erreicht, R von alle wenn xi besitzen oder wenn ein bestimmtes gleiche Richtung die xi sehr viel grösser als alle anderen ist. Man kann daher wird, wenn wir befinden, d.h. alle - vermuten, am uns TT . x' = i R erreicht obiger Situation entfernt sind möglichst weit auseinander liegen, Richtungen gleichmässig aufgeteilt sind d.h. wenn die x. von von wenn die Richtung der - dass das Minimum weitesten gleich lang x. 15 eJ3— n x. . i Das Maximum der Summe M S I I = + i=l ist - x± | Symmetriegründen aus - die Summe der Richtung, wobei Vektoren x. auf eine mittlere x. Projektionen wählen sind, dass diese so zu Sinn haben. Für M ungerade haben wir max iy = 'L - i-1 1 c Diese | i'max + x. = fällen (M =2, 3, jedoch ' [1 + die Vorzeichen der gleichen alle den 2 YL i=l cos(-^ i)] M konnte bis jetzt nur in Spezial¬ ...) bewiesen werden. Die numerischen Resul¬ bisher nie einen Widerspruch geliefert. Arbeitshypothese tate haben |x| ' der 1 ~2~ M S Projektionen . 111 gilt [41, Da 104] S. m £ i=l erhält sin(6/2) 2 man . sin x max Für M sin[(m+l/2)9 1 1 2 i( cos f,M-l (—z— L 2 + ttI 1 —) 2' MJ\ — x 8ln(2M) gerade haben sm 2M wir 25-x 2 M x S = max X V 2 o x' ' i=0 Hier gilt [41, S. cos(n6+a) = /Tr COS(S • 1 + . TT 2M> -1 |x|[2cos(i,+ I coslii^,] . = 1=1 104] m l -cosa+cos (a+9)-cos[a+(m+l)6] 2(1 i=l so S dass = max man x ' ' cos(a+me) auch hier erhält 2cosi + ZM. Lfüi^üi - cos <T^> M 112 + cos8) - + cos (I-JL, cos^ 2 = x - cos£ cos^ cos^ cosf^ 2 2 Sin , = x + - . 2 + 2 sin ^ TT 2M TT Sin 2M dabei in beiden Fällen Man hat M I 7. l ±x.| i 1 Q mm max = - * Xi 1=1 ' M M I |x.| 1 i=l TT • Sin2M Wenn M wächst, strebt Q gegen Q lim M - co 1 lim = m- - —— M Sin(2M) = 12 -— M = - = 0,6366 2M feststellen, dass der tatsächliche Wert für die grösste Abweichung der Uebertragungsfunktion ganz allgemein stets zwischen einer unteren und einer oberen Schranke liegt. Dabei ist die obere Schranke nach Gl. (7) zu rechnen; die untere Schranke ist 0,6 366 mal die obere Schranke. Wir können also explizite Berechnung der oberen Schranke Fehlers der Uebertragungsfunktion für verschie¬ Wir wollen nun die des maximalen dene Filterformen vornehmen. 113 Direkte Form gesehen, dass dG dA dB G A B Wir haben SG „ ~ G d.h. für den 1 dG I gilt: = A i . n I 6a.l A 7» Tg| der zn_1 v ) 7. i=l — B 6b. ,, l z n-i . < q ¦^ s n-i 1=1 n (TÄT 2 n i l 6b. B 7. l - Ln-1 ' ' ., . y 7, i=0 n+1 = 1 - A Dreiecksungleichung ergibt 3 ( 1 ± z n-i Betrag Anwendung dG 7>6a.i i=0 — 1=0 Die n n In. . /n + 1 + (—-— —jr~) 6a dA. _-i . n V |zn_1' TIT 7I 'Z '"' i=l i - n 1 i , n z , z für . •,) j-.. |z| i i - -1 1 ) Izl f für 1 (Frequenzgang) =1 i ,„ % Kaskadenform gilt Es 6G G dG G _° + O l 6a - 1 o Bei Anwendung IdGl max 114 " J + l dB. - A. l 6a . oi z y —i B. l l + 6a.. li Li i . z + 6a_ i § f IWJ+ + < . l i Dreiecksungleichung der 2i ? T5 B. 1 6b,Ii z . + B. 6b„. 2i_ Im Normalfall sind die dG ' f max ? a - . oi 0 <7j -rir ?i * d.h. die 6a 1, = . oi * i ' ' ' i Bei selektiven Filter mit Nullstellen auf dem Einheitskreis sind auch die dG a_. 1 = ! 'max <-*+ i i T^r 2 + i' ' l i tct> i' ' Parallelform Dabei ist dG = dA. ^ I i i Wenn man dG|. 4.3.3 Gi " dB. -IT } + 6co wie vorhin verfährt, erhält = q y i +|Gj 1 IB. Die maximale Abweichung Wir haben im Abschnitt 4.1 Empfindlichkeit lichkeit der der des Amplitudenganges dass die semirelative die gleich der absoluten Empfind¬ gesehen, Amplitude, Dämpfung ist, Empfindlichkeit man der Realteil der semirelativen des Frequenzganges ist. 115 G 3c. c. 3c. c. 111 i Die totale relative Abweichung des Amplitudenganges und Abweichung der Dämpfung ist daher in erster Näherung die totale M i=i M x i=i i Beide sind eine lineare Funktion der Abweichungen 6c der Koeffizienten. Das Maximum der Abweichung wird erreicht, wenn alle 6c einen der beiden Extremwerte ihres Intervalles annehmen. Bei Festkomma-Koeffizienten heisst das äci ± - % wobei die Vorzeichen aller 6c so gewählt werden müssen, dass alle Terme der Summe entweder positiv oder negativ sind. folgt Daraus M 3_LGJ G| 'max n\ i =|6a.| i'max ' = a 2 yL 1=1 M 3A 3cl -?2 I |Re{Q'G} l—^c L 1=1 Die maximale Abweichung der Dämpfung ist proportional Quantisierungsschritt der Koeffizienten. Da | * 2~nb ist, wobei nb die Wortlänge bedeutet, verdoppelt 116 zum ein zusätzli- ches Koeffizientenbit die Genauigkeit der Amplitude. Der Faktor M |Re{Q;G} I ± i=l hängt der Filterform ab: Er kann als ein Gütemass für von die betreffende 4.3.4 Realisierungsform Empfindlichkeit genommen werden. Amplitudenganges des bei der Kaskaden¬ form Die Kaskade von Teilfiltern zweiter häufig gebrauchte Ordnung ist eine sehr Filterform. Wenn die Teilfilter direkter geschlossene Formeln für die Empfindlich¬ keit des Amplitudenganges, so dass sich die vorher besprochenen Approximationen erübrigen. Eine Kaskade von N Filtern 2. Ordnung, jedes realisiert mit einer direkten Form, besitzt die Uebertragungsfunktion Form sind, erhält man M N G(z) i 4- x = a„ TT n a . Ol i=l z 2 z + a,ll z + a_ 2l . + b,.z Ii + . b0. 2i Es ist vorteilhaft die a. Ol zu i=l,...,N =1 wählen. Man erspart damit einen Multiplikator pro Teil¬ filter, und die Hardware kann schneller arbeiten, weil in diesem Multiplikator die Verzögerung wegfällt. Zudem ergeben 117 Rundungsfehler. sich geringere Es wird dann N a =£ o a a n o • Ol i=l a,Ii =^ a,ll / a 2i 4 a0. 2i / a . . a_. . Ol In diesem Fall wird der N jA G(eD9) = a o |G(ej<())| = a • n )coscj> (1 = Die ao _, n i=l tt a, . '* + j(l-a_ ) sin<i> ~ j(l-h2i)sin<t) + somit j<|> Zpi " . pii ([(1+a£ ) cos* ([ (l+b2i)cos«|) + a ]2 + ~ Empfindlichkeiten . — b2i)cos<t> + b1± + i=l i N + — Amplitudengang wird N Frequenzgang (1+a n ±=1 Der . 01 des + b ] 2 2 sin J: Amplitudenganges gegenüber Aenderungen der Koeffizienten sind daher ,|G| äli Qu G| bli 118 = V2 <t>] 2 2 \ V2 d-b2i) sin cf>) (l-a„.) — + 2 (l+a2i)cos(t) + a1± [ (l+a2i)cos<|> + a1±]2 + (l-a2i)2sin2<}> d+b2i)coscf, + b1± [ (l+b2i)cos4) + b1;L]2 + (l-b2i)2sin2<j) u =1 [ (l+a_ -^ x )coscj) I cos(2<|)) + )cos(J> + [ (1+b ] xx 5 (1-a,.) + . a_ £x j—jsin <j> b^cos-j) + b2i ^ 2 2 b1±] + d-b2i) sin et = 2i + . + a . .. q I an cosü> + . a2i i (2<j)) cos Die relativen und semirelativen Empfindlichkeiten Ampli¬ denjenigen des tudenganges sind, ausser von der Frequenz, nur von Koeffizienten abhängig, die sich im gleichen Zähler gleichen Nenner der befinden, Empfindlichkeiten sind daher unabhängig von liegt. Die der Paarung der Reihenfolge der Teilfilter. Diese Eigenschaft allgemein aus der Kommutativität des Produktes der von kann auch ganz von des Teilfilters auch der betrachtete Koeffizient wo Terme und Uebertragungsfunktion oder im komplexen Zahlen hergeleitet werden. Filter mit Nullstellen auf dem Einheitskreis Wenn man selektive Filter mit einer hohen Dämpfung im Sperr¬ bereich wünscht, müssen alle oder fast alle Nullstellen der Uebertragungsfunktion auf dem Einheitskreis liegen. Damit bei einem Teilfilter einer Kaskadenform die Nullstellen liegen, auf dem Einheitskreis a„. 2i Insbesondere, a2i a = In diesem Fall gelten . oi wenn a = muss . = 1 (siehe vorhergehenden Abschnitt) L- bleiben die Nullstellen immer auf dem Einheits- 119 Quantisierung der Koeffizienten: die Dämpfungspole bleiben erhalten. Die Quantisierung der Koef¬ fizienten bewirkt lediglich eine Aenderung der Frequenz kreis trotz der Dämpfungspole. dieser wird sie überall dort wählen, gewünscht werden. der Kaskadenform: Sperrdämpfungen Die gen Das ist der entscheidende Vorteil man wo Empfindlichkeit des Amplitudenganges gegenüber dem quantisierten Koeffizienten des Zählers wird somit Q.lGl ali 2 cos<|> + a.. 1. 2 cosü) 2 Für diesen Ausdruck Sie ist in Fig. z 26 cos* gibt es eine dargestellt. - - (- hohe einzi¬ —5—) cos*Ol einfache Interpretation: Ol z=e 3* 1/Q cos* Fig. 26 Empfindlichkeit des Amplitudenganges des Zählerkoeffizienten a. Aenderungen bei Filter in Kaskadenform mit Nullstellen auf dem Einheitskreis 120 auf Die Empfindlichkeit a ist in diesem Fall . Amplitude gegenüber dem Koeffizienten umgekehrt proportional zur Differenz der zwischen dem Realteil von z = ej<)) und dem Realteil der Null¬ stelle. q:IGI ali wird = man l 4 sin V2(*+(j)oi) • sin V2 (4>- <J»oi) gleichbleibenden Abstand zwischen eD<t> und Dämpfungspol die Empfindlichkeit höher, wenn die Nullstelle sich Beim z - Durch eine weitere Umformung erhält + 1 nähert. 121 5. QUANTISIERUNG UND ABSCHNITT DER SIGNALGROESSEN Einleitung 5.1 Signalgrössen werden in einem Digitalfilter, das mit digitalen arithmetischen Elementen realisiert ist, auch durch Zahlen dargestellt, die in Registern mit beschränkter Wort¬ länge gespeichert werden. Dadurch entstehen zusätzliche Feh¬ Die ler: - Ueberlauffehler - Abschnittfehler - Quantisierungsfehler. Quantisierungsfehler entstehen am Eingang Analog-Digitalwandlung Digitalfilters. (Bei der Wandlung können auch bei Uebersteuerung des Wandlers entstehen.) eines Ueberlauffehler Die bei der Wortlänge der Summe der des Resultates einer Wortlängen mit ihrer vollen Multiplikation der Faktoren. Wenn man Genauigkeit behalten wollte, ist gleich die Zahlen dann würde die Wortlänge gehen: bei rekursiven Filtern mit der Zeit gegen Unendlich Das ist offenbar unmöglich. Im Gegenteil, man wird normalerweise mit höchstens zwei verschiedenen Wortlängen ar¬ beiten. Eine Beschränkung der Wortlänge ist unumgänglich. Wenn man den am wenigsten gewichtigen (least significant) Teil des Wortes den abschneidet, dann erhält man Abschnittfehler, gewichtigsten Teil abschneidet, kann man wenn man Ueberlauffehler haben. Die Ueberlauffehler werden hier nicht behandelt: Sie können durch eine 3.2.). 122 richtige Skalierung vermieden werden (siehe Es sei auf die Literatur verwiesen Kap. [31,58,59,60]. Die Abschnittfehler sind in ihrer Natur eng mit den Quanti¬ sierungsfehler verwandt: Der Hauptunterschied liegt darin, dass die Quantisierungsfehler eine kontinuierliche Grösse darstellen, Die die Abschnittfehler hingegen Quantisierungsfehler ergeben schnittfehler, wenn die Abschnittfehler in einen Grenzwert für die Ab¬ Länge des abgeschnittenen Teils des die Wortes gegen Unendlich eine diskrete Grösse. geht. Aus diesem Grund der gleichen Weise wie wird die man häufig Quantisie¬ rungsfehler behandeln. Insbesondere wird man das Modell des Quantisierungsrauschens anwenden: Jede Abschnitt- oder Quan¬ tisierungsstelle wird durch eine Rauschquelle ersetzt [61,62]. Die Quantisierung, nichtlineare bzw. der Abschnitt sind aber deterministische Operationen. Daher können typische nichtlineare Effekte erscheinen, wie Schwingungen bei Filtern, die ohne Quantisierung asymptotisch sollten, wenn der Ein¬ gehalten wird [63, 64, 65, 66J. stabil sein gang auf einem konstanten Wert des Rauschmodells auf den Abschnittfehler in digitalen Oszillatoren [73, 74] führt zu falschen Schlüssen, da diese eine stabile GrenzZyklusschwingung ausführen [75,64]. Die Anwendung Die deterministische Betrachtung der Abschnittfehler führt aber nur in den einfachsten Fällen von Filtern erster und zweiter Ordnung allgemeinen zu Behandlung brauchbaren Resultaten. Die Falls führt zu Grenzwerten, die allzu des pessimistisch sind [37, 39, 40]. Das Modell des Quantisierungsrauschens hingegen, den meisten Fällen eine recht gute Abschätzung wertes der Abschnittfehler und hat sich daher 1 C Es geht soweit, dass der Begriff den Abschnitt angewendet wird. liefert in des Effektiv¬ eingebürgert. Quantisierung auch für 123 Bei diesem Modell werden die Abschnittfehler durch additive unkorrelierte Rauschquellen ersetzt, die ein weisses gleich¬ verteiltes Rauschen erzeugen. Wir werden in den nächsten zwei Abschnitten (5.2 und 5.3) versuchen, die Annahmen des Rausch¬ modells zu verifizieren, um es dann im letzten Abschnitt (5.4) anzuwenden. 5.2 Die Quantisierung der Signale Begriff Quantisierung bezeichnet man im allgemeinen den Uebergang von einer kontinuierlichen zu einer diskreten (d.h. quantisierten) Grösse. Zur digitalen Signalverarbeitung werden zunächst durch den Abtastvorgang zeitkontinuierliche Funktionen in zeitdiskrete Mit dem überführt. Die dabei auftretenden Effekte interessieren hier nicht: Sie sind in der uns allgemeinen Literatur über Abtastsysteme hinreichend behandelt worden. Bei der anschliessenden Analog-Digitalwandlung wird sodann eine in der Amplitude kontinuierliche Grösse in eine ampli¬ tudendiskrete umgewandelt: Man hat hier eine Amplitudenquan¬ tisierung. x 4 Fig. 27 Die Quantisierung Es ist bekannt [67, 68, 61, 69], dass Fehler in erster 124 Näherung sich der dabei auftretende als ein weisses Rauschen (Quantisie- rungsrauschen) darstellen lässt, das gleichverteilt und dem Eingangssignal unkorreliert ist. Dieses Modell ist mit gültig, wenn: - - Ä/D-Wandlers die Charakteristik des alle Stufen hoch sind, das eine genügend Spektrum gleich Eingangssignal breites und verwischtes ideal ist, d.h. wenn grosse Amplitude und ein aufweist. knapp über der Unterlaufgrenze befindet, d.h. falls das Signal nicht sehr gross gegenüber dem Quantisierungs¬ schritt q ist, dann sind obige Eigenschaften nicht mehr gültig. Das ist leicht einzusehen für die Verteilung: Falls im Extrem¬ Falls man sich Signalamplitude fall die maximale Quantisie¬ Quantisierungs¬ kleiner als der rungsschritt ist, dann ist die Verteilung der fehler gleich der Verteilung der Signalamplituden. Wir wer¬ den hier solche Abweichungen untersuchen, insbesondere die Abhängigkeit der Quantisierungsfehler vom Eingangssignal. Als Mass für die Abhängigkeit werden wir den Korrelationskoef¬ fizient nehmen. 5.2.1 Quantisierungsfehler Korrelation zwischen Signal und Wir wollen hier den Korrelationskoeffizienten zwischen einem Signal x und dem Quantisierungsfehler berechnen. Der Kor¬ e relationskoeffizient ist definiert als E{(x-x)(e r 3 = o x wobei x, bzw. ungen 'o -e 3 )} eq e~~ q die Mittelwerte und (Effektivwerte) rungsfehler e des Signals x, o x , bzw. bzw. des o die Streu- e ^ Quantisie¬ sind. 125 Der Quantisierungsfehler e e = q q +» r .!f = Signals (x) Anhang) dass (siehe so ist eine Funktion des x»(e -e s q )-f(x) dx ax 'ae wobei f(x) die Wahrscheinlichkeitsdichtefunktion ist. dieses Ausdruckes ist die Kovarianz Der Zähler axeq von x E{(x-x)(eM -eM )} = und soll als erstes berechnet werden. a) Wertabschnitt Der Fehler e unquantisierten ist der Rest der Zahl x modulo dem Quantisierungsschritt q (siehe Abschnitt 2.3, sowie Fig. 24). e = x - i-q Der Mittelwert ist e q 1 — ^ ' q 2 X Fig. 126 28 ¦e = x - < (i+1)*q a 2 q S / / -q i«q wenn 0 q 2q Quantisierungskennlinie \ i.q (i+1)q beim Wertabschnitt x die Kovarianz Man erhält damit für oxe q (i + l)q l = j i.q i +°° / (x i.q - » x.f(x) dx |).f (x) a - a. - -oo ~2 x dx +°° Jx.f(x) dx £ - i _oo - q ^-x £ - - i (i+1)<3 / i.q i.q Sofern die Dichtefunktion f(x) wenigstens näherungsweise i.q (i+l)q / i.q x.f(x) x.f (x) dx im Intervall [i*q, (i+l)q) als konstant betrachtet werden kann (dies ist exakt erfüllt falls f(x) eine Gleichverteilung ist näherungsweise für die meisten praktischen Verteilungen falls der Quantisierungsschritt genügend klein gegenüber der maximalen Signalamplitude ist), gilt und (i+Dq / (i+Dq x-f(x) dx / f - i.q wobei f. 1 x dx = q2U-»-|) f i.q = (i+Dq f f(x) ± n q — der Mittelwert der Wahrschein- dx x.q • « lichkeitsdichte im Intervall [i.q, (i+l)q) ist. In diesem Fall wird 2 xe q qJ3 v.c/*2,ix \ f±(iZ +f) -q 2 oder 2^-2 =a+x o xe q x - 3 -^ 2 ~ • x - q M 3 }*¦ r f.i ,.2 d » Li —) + 2 -i 127 dx Betrachtet man als weitere entsprechend Fig. 29, Spezialisierung schreiben, kann man so eine GleichVerteilung zusätzlich wenn man annimmt, dass die Grenzen der GleichVerteilung ganzzahlige Viel¬ fache q sind von |f(x) e q /Ä/// 0 (m-n)q < n.g n.c i f.l x (m+n)q m-q = 0 = m-q x ax Fig. 2« n«q = für m-n<i<m+n sonst n 29 dass so a xe 2^-2 + x 2 ' x 2 n q m+n-1 m+n-1 I L i=m-n i=m-n Es ist ? 7 i=p i 1 2 2 (q P) (q + • 1) P + - 2 und m+n-1 l n i m+n-1 = I v i=m-n i-0 m+n-1 m+n-1 l i=m-n 128 .2 ^2 l i=0 .2 i m-n-1 .2 I v V - i falls Im I > In In| > |m| i-0 n-m 1 2 + I i=0 ! 2 falls 2 (7) gilt [41] Bekanntlich k. (k+1) • (2k+l) i=0 Beim Einsetzen dieser einiger Rechnung (sowohl nach |nl Beziehungen > |m|) für in Gl. |m| (7) |n| > bekommt man wie auch für für die Kovarianz 2 12 xe Der Kreuzkorrelationsfaktor ist für diesen Fall xe r xe G x .0 1 2n e b) Rundung Rundungsfehlers e ist symmetrischer Abschnittfehlers im 2er Komplement: Hier gilt Die Charakteristik des als die des (siehe Abschnitt 2.3, sowie Fig. 30): x = Fig. 30 - l q falls (i--|) -q < x < (i+|) -q Rundungskennlinie 129 Der Mittelwert e ist hier gleich Null, Die Kovarianz ist somit +00 x*(e axe - = e q q )*f(x) (i+f)q l j x*(x-i-q) dx f(x) dx (1-2) q i (i+ö-)q +o° = / x 2 f(x) dx - l j i*q x'f(x) dx (i~)q 1 Falls wir auch hier die Dichtefunktion f(x) im i-ten Inter¬ vall als konstant betrachten, gilt (i+^Oq 1 / (i+jjq x f(x) dx - f.x 1 / x dx = f.1 q2i und wir haben dann 3 ,2 q i Wir betrachten wiederum den gleichverteilt gemäss Fig. 130 Fall, 31 sei. wo der richtige Wert x n X 2 2 q e / ,/ /L ¦7^7 2«n«q i n. Fig. Die Grenzen der q 4f(x) Z. £. 7^7 ¦ m .q n.q 31 GleichVerteilung sind so gewählt - wie auch im Fall des Wertabschnitts -, dass sie auf einem ganzen Viel¬ fachen halb von q liegen. Daher sind die beiden Endintervalle nur gross wie die andern. so (m-n+l/2)q 2 2 rxe = q V"" / ~ m+n-1 Vx (m-n)q dx - / f± q2i i=m-n+l (m+n) q / f-. - x dx (m+n-l/2)q (m-n-t-^) q x f(x) dx = Wm-n i} x f(x) dx = h fi (m-n)q (m+n)q (m+n--) q Nach einiger Rechnung axe " + (m bekommt + n man - i} für die Kovarianz 24 q und für den Korrelationskoeffizient xe 1 4«n 131 c) Zwischenwerte der Amplitude jetzt gleichverteilte Eingangssignale betrach¬ tet, bei denen die Grenze der Verteilung ein ganzzahliges Vielfaches des Quantisierungsschritts ist. Wenn diese Gren¬ zen (in Fig. 32 als Amplitude bezeichnet) beliebig, aber symmetrisch zum Nullpunkt gesetzt werden, erhält man die Wir haben bis Verläufe des Korrelationskoeffizienten, die in Fig. 32 dar¬ gestellt sind. 1/2N /2N -s S Ä5 A A s A " 8 S^ö d RMPLITUDE AMPLITUDE /-IN /4N a) b) VflLUE R0UND Fig. TRUNC, 32 Korrelationskoeffizient zwischen Abschnittfehler und Signal in amplitude Funktion der Signal¬ bei verschiedenen Abschnittsarten: PMPLITUOE a) Rundung .C) Man sieht aus b) Wertabschnitt (2er-Komplement) c) Betragsabschnitt (ler-Komplement) MflGNo TRUNC. Fig. 32, dass bei der Rundung und beim Wertab¬ schnitt der Korrelationskoeffizient zwischen den beiden Grenzen 2-n und den Wert 132 4«n //ö' liegt. wenn Beim Betragsabschnitt die Aussteuerung strebt er gegen symmetrisch ist (gleich- positive wie negative Werte). Ist die Aussteuerung nicht mehr symmetrisch, wird dieser Grenzwert kleiner. Weist das Signal nur positive oder negative Werte auf, ist der Korrelationskoeffizient gleich wie beim Wertabschnitt. viele 5.3 Signale Abschnittfehler der Wir haben wir gezwungen sind, Orten in die gesehen, dass Digitalfiltern Wortlänge zu an bestimmten beschränken, so dass Abschnittfehler unvermeidlich sind. Wirkung der Abschnittfehler bei der Festkommaarithmetik zu berechnen, benützt man das Modell des Quantisierungsrau¬ schens. Man nimmt dabei an, dass die für die Quantisierung geltenden Voraussetzungen auch für den Abschnitt gelten. Wir werden in diesem Kapitel untersuchen, wie weit diese Annahme erfüllt ist. Eine der Abweichungen ist, dass die Um die Abschnittfehler eine diskrete Grösse darstellen: Ihre Ver¬ teilung ist eine diskrete Verteilung. Daraus folgt, dass der Mittelwert und die Varianz Bits Die abhängen. Verteilung von der Zahlen nach einer Lücken auf. Wenn sie sofort man abgeschnittenen der Anzahl der Multiplikation abschneidet, weist dann kann das Verhalten der Abschnittfehler wieder von den Annahmen für das Modell des Quantisierungsrauschens abweichen. Wenn man dagegen die Zahlen erst nach der Addition abschneidet, dann weniger auf¬ Quantisierungs¬ sind die Chancen gross, dass die Lücken mehr oder gefüllt sind und dass daher das Modell des rauschens besser stimmt. 5.3.1 Die Verteilung Wir wollen hier die der Abschnittfehler Verteilung der Abschnittfehler betrachten. unquantisierte Zahl x fallsvariable. Dann ist der Abschnittfehler e Dazu nehmen wir an, die dieser Zufallsvariablen sei eine Zu¬ q eine Funktion 133 eq = g(x) Wir wollen die Verteilung der Abschnittfehler P{e } in Funktion der Verteilung der Eingangswerte P{x} kennen. Wir haben gesehen, dass alle Zahlen, die sich um ein ganz¬ zahliges Vielfaches der Quantisierungseinheit der abge¬ schnittenen Zahlen q unterscheiden, den gleichen Wert des Abschnittfehlers ergeben. Deswegen ist P{eq] = l i (Es ist dabei P{xi|g(xi) eq} = = l n P{eg n-qq} + (8) bemerken, dass (8) beim Betragsabschnitt (Einerkomplement) separat für die positiven und für die negativen Werte von x (und e ) gilt.) zu q unabgeschnittene Zahl alle mögliche Werte annehmen kann und diese alle die gleiche Häufigkeit besitzen, dann ist leicht einzusehen, dass die Abschnittfehler auch gleich¬ Wenn die verteilt sind. Wenn die Zahlen nicht mehr Verteilung lung aufgefasst ihre als eine gleichverteilt sind, abgetastete aber immerhin kontinuierliche Vertei¬ werden kann (insbesondere sollen keine Lücken im Wertebereich auftreten), dann ist die Lage ungefähr gleich Quantisierung kontinuierlicher Grössen. Für die¬ sen Fall wurde gezeigt [61, 68], dass die Verteilung der Quantisierungsfehler gegen eine Gleichverteilung strebt und zwar recht schnell -, wenn die Signalamplitude gross gegenüber dem Quantisierungsschritt wird. Falls die Verteilung der Zahlen vor dem Abschnitt Lücken aufweist, kann die Verteilung der Abschnittfehler erheblich von der GleichVerteilung abweichen. Die genaue Form der Ver¬ teilung hängt davon ab, wie sich die Lücken der Eingangsver¬ teilung bei der Summenbildung nach Formel (8) überlagern, d.h. von der Lage der Lücken gegenüber dem durch den Quantiwie bei der - 134 sierungsschritt q abgeschnittenen der Zahlen gegebenen Wir werden solchen Fällen im Abschnitt 5.3.3.1 begegnen. Raster, Wir werden dort sehen, dass in den meisten Fällen immerhin die über einige benachbarten Werte gemittelte Verteilung der Abschnittfehler angenähert GleichVerteilung eine ist. der Abschnittfehler nähert sich also in den meisten Fällen einer diskreten Gleichverteilung. Ihre Gestalt hängt von der Darstellungsart der negativen Zahlen ab. Die Verteilung (n ist die Anzahl abgeschnittene Bits.) Wertabschnitt Die in 1 1 beim Wertabschnitt ist Verteilung der Abschnittfehler Fig. 33 dargestellt. P (e< -n__ q ,' 0 rr~ N =2 Fig. 33 <k *q Verteilung q der Abschnittfehler beim Wertabschnitt Betragsabschnitt Die Verteilung hängt vom positiven Anteil der und negativen Zahlen ab. Wenn die Wahrscheinlichkeit für das Auftreten von positiven treten die auf Zahlen p beträgt = pANIMM "^ 34 diejenige für das Auf¬ 1 negativen Zahlen p_ p ist, dann erhält man Fig. 34 dargestellte Verteilung der Abschnittfehler. von 2~nq P(eq) Fig. und daher Verteilung - ¦p 2"nq *I 6C der Abschnittfehler beim Betragsabschnitt 135 Rundung Rundung erhalten wir die Verteilung der Rundungsfehler. Bei der i () in Fig. 35 dargestellte P< ec o"na 2 q i i i i "V 2 Fig. V2 0 eq Verteilung der Rundungsfehler 35 Verteilung an den Grenzen hängt davon ab, wie die Rundung der Zahlen ausgeführt wird, die sich in der Mitte des resultierenden Quantisierungsinter¬ valls befinden (x (2n+l).q /2). Dies ist insbesondere von der Art der Darstellung negativer Zahlen abhängig Das genaue Verhalten der = (siehe Fussnote 10). 5.3.2 Die Varianz der Abschnittfehler Die Varianz der Abschnittfehler ist definiert als a wo e 2 e„ = = q E{(eq — - e q x e ist, haben l 136 2 } = 2 E{eqs} - —2 e q E{eq } der Mittelwert der Abschnittfehler der Abschnittfehler Variablen ) P(x) eine Funktion der unabgeschnittenen wir für den Mittelwert [70] -eq(x) ist. Da und für den e2q {e2} q E = quadratischen 7L = Mittelwert p(x) -e2(x) q X p(x) die Wahrscheinlichkeitsfunktion unabgeschnittenen Variablen x ist. wo der (diskreten) Mit der Annahme, dass die Abschnittfehler gleichverteilt sind, kann man die Varianz direkt berechnen. Wir haben ge¬ sehen, dass im Falle der Rundung und des Wertabschnitts gilt P(eq) wo n 2_nq = die Anzahl der q Wir wenden diese abgeschnittenen Beziehung Bits ist. für unsere drei Fälle an. Wertabschnitt Aus der gesehen der Abschnittfehler, die wir im Kap. 5.3.1 haben, erhalten wir für den Mittelwert Verteilung -¦£(-.- 2"»,) ^ und für den e2q quadratischen 2nq_1 — = 2"nq l L i=0 q .i.2_nq)2 (q^qq .i.2 Die Varianz wird damit er e = q 2 e^ q - —2 e q = 2a_M t^-(1 1Z = q2 qa ¦£6 (2 .. ~-n„ 3.2~nq . - + .-2n, 2 (vgl. [71, 72J) 2 2 Mittelwert - i~2'nr,\ 2 q) gross wird, dann konvergiert die Varianz gegen den Wert der Varianz der Fehler bei der Quantisierung einer kontinuierlichen Grösse Wenn die Anzahl abgeschnittene Bits n 137 BL'O 96T'0 SZ'9 9S'T 6e'o 83'0 890'0 Z.TO'0 OOT %00T OOT I/j£ - T366'0 0866'0 SZ.£6'0 fr*86'0 T966'0 3 £ fr T 'CR*! - Z896'0 ßunnsj^g jap pun £J zubt-iba aap uoa ßunnaj^s -isp pun C» o zueTjr-sA jap ßunqoTewqv - T u 9U9^;TUUPsaßqe Xqezuv S1TH b S/L'O z 998'0 o - = 0 ZX 0 e/3/& D - T\ 0 jraTHajsßunjSTST^irenö J9p t^Tuqosq^jraM uiTsq aaTqaj^-FuipsqY aap o Z'£ SZ'T %00T ßunqofawqv 9P SZ e/3/E> ei/zb n/jbV V'£X C/3/-Ö-D (b.uz-7 lim o q eo^ = 2 rk_ l2 C- j2 Die Konvergenz der Varianz der Abschnittfehler gegen den obigen Grenzwert ist sehr rasch: Nach einigen Bits wird die wie in Tab. 1 ersichtlich ist. Differenz vernachlässigbar, Betragsabschnitt hängen Mittelwert und Streuung Hier den Anteilen der positiven und der Abschnittfehler von Zahlen ab. Der negativen Mittelwert beträgt = q wo \.q-q 2 die p In diesem a2 = q - 2"nq)-(2-p+ Häufigkeit der Fall bekommt q2[P+d +2 (1 - p+> (1 na""°° Die auf von p + - p+ - 1)• für die Varianz: 2-2*nq) + ^(1 2-2>nq) - + - abgeschnittenen die Varianz gegen a2 Zahlen ist (0 (p2 l)-2"nq] Wenn die Anzahl lim 1) positiven man + - = q q2 [P+d p+) q —<L_ 2-/3 - + Bits erhöht wird, dann strebt 3^] bezogene Streuung ist in Fig. 36 in Funktion aufgezeichnet. 139 .2 .1 .6 ANTEIL P0S= ZRHLEN P+ Fig. 36 Relative Streuung der Abschnittfehler bei Betrags¬ abschnitt in Funktion des Anteils positiver Zahlen p Rundung Für die Varianz der Rundungsfehler wird der gleiche Ausdruck wie beim Wertabschnitt erhalten 2 q 7q -> ~* ae q " 12 (1 ii " -i~n 2 q) x Der Mittelwert ist im der Wertrundung (siehe allgemeinen Fussnote Null oder sehr klein. Bei 10) wird ein kleiner Mittel¬ wertanteil erhalten e^ 5.3.3 q = - o 2 q Der Abschnitt des Resultates einer Wir betrachten hier, geschieht, Multiplikation das Resultat der Multiplikation einer Variablen mit einer Konstanten abschnei¬ det. Die Betrachtungen werden für den Fall der Multiplikation zweier positiver Zahlen gemacht. Die Erweiterung auf die ande- 140 was wenn man ren Fälle ist unter Berücksichtigung dessen, was in den früheren Abschnitten gesagt wurde, leicht durchführbar. © Fig. 37 I Der Abschnitt nach einer filter Multiplikation in Digital¬ folgenden Ueberlegungen angenommen, dass das Resultat der Multiplikation auf das Format des variablen Faktors abgeschnitten wird. Das ist sicher der Fall, wenn die Multiplikation in einer Rückkopplungsschleife geschieht, was sehr häufig in rekursiven Filtern vorkommt (siehe Fig. 37). Dieser Spezialfall ist aber durch eine einfache Anpassung der Kommastelle des konstanten Faktors leicht auf den allgemeinen Es wird in den zu Es übertragen. ist bekannt, dass die Multiplikation zahlen (ohne Vorzeichen) ein Resultat zahl gleich zweier Festkomma¬ ergibt, dessen Stellen¬ der Summe der Stellenzahlen der Faktoren ist. dargestellte Situation. Vom Resultat y der Multiplikation werden die letzten n Bits abgeschnitten. (Für die Rundung gelten die gleichen Ueber¬ legungen; nur ist ihre Charakteristik verschoben.) Wir betrachten einfachheitshalber den Faktor x als ganzzahlig und verlangen, dass das abgeschnittene Resultat y auch ganzzahlig sei. Es folgt, dass der Koeffizient c gebrochen sein Wir haben die in muss, und (LSB) Bit qc = zwar Fig. 34 befindet sich das Binärkomma n q Bits vom letzten weg. Das LSB des Koeffizienten hat den Gewicht 2"n<3. 141 n X *¦ ¦ + 1 , n c + qc • n q nx+ nc qc + Y' y. |. 0*0 * \> Fig. 38 n q Wortformate in der Anordnung nach Fig. 37 ganzzahlig ist, dann geschnittene Teil gleich Null, und wir haben Wenn der Koeffizient bleibt der ab¬ c keine Abschnitt¬ fehler. Der Abschnittfehler hängt nur vom Teil des Koef¬ gebrochenen fizienten ab. Wir werden sehen, dass er unabhängig vom ganz¬ zahligen Teil ist. Je nach dem Wert des gebrochenen Teils des Koeffizienten ist ein bestimmter Zusammenhang zwischen Abschnittfehler und Signalwert vorhanden. Fig. 39 zeigt den Abschnittfehler e abgeschnittenen e Resultats der q in Funktion des nicht Multiplikation i jL y. c - c ¦ c -= y=c.x Fig. 142 39 Charakteristik des Abschnittfehlers e l.qc 2.qc 3.q Wir stellen fest, dass in fizienten c nicht Fig. jeder Punkt, 39 je nach dem Wert des Koef¬ sondern nur jeder (c/qc)-te c«x angenommen werden kann. vom Ausgang y Wir zeigen nun das grundsätzliche Verhalten anhand einiger des leichtverständlicher Beispiele mit kleiner Bitzahl = gebrochenen nq Teils. Nehmen wir zuerst an, dass der Koeffizient c Dies ist der Spezialfall, wo alle Punkte der abgeschnittenen Ausgang y angenommen ist in Fig. 40 dargestellt. gleich Fig. l-qc sei, 39 vom un- werden. Diese Situation ,e e / y l .q = Fig. 40 Abschnittfehler bei c = l«q. ist, dann wird jeder zweite Punkt in Funk¬ übersprungen, und wir haben in der Charkteristik von Wenn der Koeffizient tion von x die c doppelte 2-qc = Anzahl von eq Sägezahnperioden (Fig. 41). i,e i,e / y=2.q Fig. .x Abschnittfehler bei 41 c = 2"qc 3-q c ist, dann sieht die Kennlinie schon unregelmässiger aus (Fig. 42)• Wenn c = etwas 143 7 y=3*q Fig. Mit Abschnittfehler bei 42 c = *x 1 - q c hat man die in 3*q = Fig. 43 dargestellte Lage y=(l-q ).x Fig. 43 Abschnittfehler bei c 1 = - q leicht sehen, dass der Verlauf von e für positive q Koeffizienten gleich k«q und n k (n, k-q ganz) eine gewisse Symmetrie aufweisen: alle Punkte ^ 0 sind symmetrisch geg. Man kann - Sq = 1 2' Die Anzahl der möglichen Werte, die der Abschnittfehler 'e q annehmen kann, ist von der effektiven Länge des gebrochenen Teils des Koeffizienten c, d.h. von der Anzahl der Bits vom Binärpunkt letzten Bit, das gleich eins ist, abhängig. Da die Varianz der Abschnittfehler von der Anzahl der Werte bis zum abhängt, die der Abschnittfehler annehmen kann (siehe Abschnitt 5.3.2), so folgt, dass sie auch vom Koeffizienten abhängig ist. 144 Diese Abhängigkeit ist aber im allgemeinen klein (siehe auch Abschnitt 5.3.3.2). Mit sieht man, dass der Verlauf der durch den gebrochenen Teil des Koeffizienten obiger Betrachtungsweise Abschnittfehler nur bestimmt wird: Der ganze Teil des Koeffizienten bewirkt nur, dass eine ganze Zahl von Perioden der Abschnittfehlercharak¬ teristik in Fig. 39 Obige übersprungen werden. Resultate lassen sich leicht auf andere Abschnittfälle (negative Zahlen, Rundung) verallgemeinern. Man muss nur in Fig. 39 die entsprechende Abschnittcharakteristik einsetzen. In der nächsten Figur (Fig. 44) sind die Abschnittcharakteri¬ stiken für drei Abschnittsarten und für verschiedene Koeffi¬ zienten bei einer erhöhten Anzahl abgeschnittenen Bits (n = q 8) dargestellt. 44 sehen wir, dass bei Koeffizienten, die sich Aus Fig. von einer ganzen Zahl rer Zusammenhang zwischen unterscheiden, bereichsweise dem Signal vor der wenig ein linea¬ Multiplikation und dem Abschnittfehler existiert. Diese Bereiche werden mit wachsendemAbstand des Koeffizienten von einer ganzen Zahl im¬ mer kleiner. In der Mitte zwischen zwei ganzen Zahlen er¬ scheint meistens ein Abschnittfehler in Funktion des Eingangs¬ signals als ein regelmässiges Punktmuster. Es kann daher an¬ genommen so werden, dass in der Mitte genügend "Unordnung" herrscht, gut erfüllt werden, ganzzahliger Koeffizienten Abweichungen zu dass die Annahmen des Rauschmodells dort während in der Nähe erwarten sind. Wir werden das in den nächsten Abschnitten hand einiger 5.3.3.1 Beispiele Verteilung ansehen. der Abschnittfehler Wir werden hier anhand eines Verteilung an¬ Beispiels zeigen, wie sich die der Abschnittfehler bei verschiedenen Koeffizienten verhält. Zur Berechnung wurde Gl. (8) in Abschnitt 5.3.1 ver- 145 Rundung C0EFF» = o002B C0EFFD = o002B VflLUE TRUNCe C0EFF-, = o002B MflGNo TRUNC« R0UND Wertabschnitt Betragsabschnitt Fig. 44a) Charakteristik des Abschnittes nach plikation mit c l.q c bei n =8 = q 146 einer Multi¬ Rundung C0EFFc 004B R0UND Wertabschnitt C0EFFo = o004B VflLUE TRUNC. C0EFF. = «004B MflGNo TRUNC. Betragsabschnitt Fig. 4 4b) Charakteristik des Abschnittes nach einer Multiplikation mit c = 2.q 147 Rundung C0EFF« = 0OO6B C0EFF„ = .006B VRLUE TRUNC. C0EFFo = 0OO6B MflGN. TRUNC. R0UND Wertabschnitt Betragsabschnitt Fig. 44c) Charakteristik des Abschnittes nach einer Multiplikation 148 mit c = 3.q Rundung ^j- R0UND :0EFFo = o552B "0EFFa = „552B VflLUE TRUNCc o552B MflGNo TRUNCc Wertabschnitt Betrabsabschnitt :0EFFa Fig. 44d) = Charakteristik des Abschnittes nach einer Multiplikation mit c = 181.q 149 Rundung C0EFFD = „776B R0UND C0EFF„ = 0776B VRLUE TRUNC- „776B MflGNo TRUNCc Wertabschnitt Betragsabschnitt C0EFFo Fig. 44e) Charakteristik des Abschnittes nach einer Multiplikation 150 = mit c = 255.q = 1 - q wendet. In Fig. sind die 45 Verteilungen aufgezeichnet. Als Eingangsverteilung wurde hier eine Gaussverteilung mit der Streuung a 1/4 und dem Mittelwert 0 genommen. Die Wortlänge der Signale und der Koeffizienten beträgt dabei 7 Bits. Für die Rundung wurden die gleichen Resultate experimentell, d.h. = durch Messungen an Hardware, realisierter von Eckhardt [76] gefunden. Aus Fig. len kann - 45 und anderen, hier nicht abgebildeten Beispie¬ aus folgendes festgestellt werden: Koeffizienten, die sich sehr wenig von einer ganzen Zahl unterscheiden, kann die Verteilung der Abschnittfehler sehr Bei verschieden von GleichVerteilung einer sein. Insbesondere Verteilung der Abschnittfehler ähnlich aus wie Eingangsverteilung, wenn der fraktionäre Teil des Koef¬ sieht die die fizienten so klein ist, dass er allein einen Unterlauf er¬ zeugen würde. - Sobald aber der Koeffizient etwas mehr abweicht eine Rundung gute Näherung einer ganzen Zahl Unterlaufgrenze), Betragsabschnitt sehr schnell die oben erwähnte (einige Male wird bei der von und beim GleichVerteilung erhalten. der fizienten in der Nähe eines einfachen Teilers eines Vielfachen davon (d.h. 3/4, ...) grössere in der Nähe von von Bei Koef¬ 1 oder 1/2, 1/4, sichtbare Abweichung von der GleichVerteilung. Wenn aber die Verteilung über ein Paar benachbarten Werte gemittelt wird, ergibt sich wieder - hat man eine eine gute Näherung Beim Betragsabschnitt GleichVerteilung. der ist die teilung erheblich grösser. Abweichung Das ist durch die schen Abschnittfehler und Polarität des (siehe Abschnitt 2.3.1) zu von der Gleichver¬ Beziehung zwi¬ Eingangssignals erklären. 151 Rundung C0EFFo R0UND0FF ERR0R o004B = R0UND Wertabschnitt 0.00 C0EFFo R0UND0FF ERR0R = „004B VflLUE TRUNCo Betragsabschnitt 1.0 C0EFF„ Fig. 45a) Verteilung (Hier 152 ist -.5 0.00 R0UND0FF ERR0R = o004B MfiGNo TRUNCo der Abschnittfehler bei c n q = 7) = l.q Rundung 3.00 R0UND0FF ERR0R R0UND ,010B C0EFF, Wertabschnitt C0EFFo R0UND0FF ERR0R = VflLUE TRUNCo oOlOB Betragsabschnitt -5 0.00 C0EFFo Fig. 45b) Verteilung R0UND0FF ERR0R = oOlOB MflGNo TRUNCo der Abschnittfehler bei c = 2.q 153 Rundung JVOQ C0EFFo R0UND0FF ERR0R = o404B R0UND Wertabschnitt 0.00 C0EFFD R0UND0FF ERR0R = o404B VflLUE TRUNC- Betragsabschnitt Q.00 C0EFFD Fig. 45c) 154 Verteilung R0UND0FF ERR0R = a404B MflGNo TRUNCo der Abschnittfehler bei c = 65.q Streuung der Abschnittfehler 5.3.3.2 vorherigen Abschnitt haben wir gesehen, dass die Vertei¬ lung der Abschnittfehler bei gewissen Koeffizienten von einer Gleichverteilung abweichen kann. Die Verteilung an sich ist aber nicht wesentlich für das Rauschmodell; sie Im Berechnung der Streuung der Abschnittfehler. dient zur wollen wir daher den Einfluss des Koeffizienten der Hier Multipli¬ kation auf die Streuung der Abschnittfehler betrachten. In d.h. Fig. 46 wurde die relative Streuung der Abschnittfehler - die Streuung teilung q//T2 bezogen auf - den idealen Wert für die Gleichver¬ gleiche aufgetragen. in Funktion des Koeffizienten für das gaussverteilte Eingangssignal wie in Fig. 45 sieht, dass bei der Rundung und beim Wertabschnitt die relative Streuung praktisch überall 1 beträgt. Kleine Ab¬ weichungen hat man bei gewissen einfachen Teilern von 1 und Man ihren Vielfachen (also bei 1/2, 1/4, 3/4, 1/8, 3/8, 5/8, 7/8): Diese Abweichungen sind nicht durch Abweichungen von der Gleich¬ verteilung, sondern durch die verkürzte effektive Länge des Wortteils (siehe Abschnitt 5.3.2) zu erklä¬ ren. Auch in der Nähe von ganzzahligen Koeffizienten sind Ab¬ weichungen vorhanden: In der Unterlaufzone ist die Streuung abgeschnittenen der Abschnittfehler gleich dem Produkt der Eingangsstreuung mit dem Koeffizienten. Beim Betragsabschnitt Wert (der 5.3.3.3 Das hier 2q//l2 sind die Abweichungen vom theoretischen beträgt) bedeutend grösser. Korrelation Quantisierungsrauschen trum sollte ein weisses Leistungsspek¬ aufweisen,und die einzelnen Rauschquellen sollten sich und mit dem hier die unter unkorreliert sein. Wir wollen dieser Annahmen kurz untersuchen. Eingangssignal Gültigkeit 155 rl- 2.0 Rundung 5 "* > — ¦ o n m A / Vi 8 "-0.00 •> .1 .6 CBEFFICIENT 7 BITS .'« 1 1. R0UND Wertabschnitt 8 3 ""O-OO 7 BITS °- TS 3 CBEFFICIENT VflLUE TRUNCo ». Betragsabschnitt ""s s CBEFFICIENT 7 BITS Fig. 46 Relative Streuung (1 nach einer zienten. 156 = 3 MflGNo TRUNCo q Multiplikation //12) der Abschnittfehler in Funktion des Koeffi¬ In Fig. 47 und 48 ist der Korrelationskoeffizient zwischen Eingangssignal Abschnittfehler und in Funktion des Koeffizienten Multiplikation dargestellt, in Fig. 47 für ein gleichver¬ teiltes Eingangssignal, in Fig. 48 für ein gaussverteiltes 1/4. Der Korrelationskoef¬ Eingangssignal mit der Streuung o fizient wurde nach der im Anhang dargestellten Methode nume¬ risch berechnet. Die Wortlänge der Signale und des Koeffizienten beträgt hier 8 Bit. Es ist ersichtlich, dass bei Wertabschnitt und bei Wertrundung der = der Korrelationskoeffizient zwischen Abschnittfehler und Ein¬ fast überall sehr klein ist, ausgenommen in der ganzen Zahlen und von einfachen Teilern von 1 und gangssignal Nähe von (1/2, 1/3, 2/3). ihren Vielfachen In der Nähe der ganzen Zahlen fällt der Korrelationskoeffizient mit l/2n beim Wertabschnitt und l/4n bei Wertrundung, wobei n der Abstand von der ganzen Zahl ist, ausgedrückt, bestätigt. zienten Beim was Betragsabschnitt grösser Quantisierungsstufen q des die Ausführungen im Abschnitt in Einheiten der als aus 5.2.1 ist der Korrelationskoeffizient viel Ueberlegungen den Koeffi¬ von Abschnitt 2.3.1 zu er¬ warten ist. In der Tat hat der Korrelationskoeffizient unge¬ fähr den Wert 0,7. die meisten Werte Bei der liegen ebenfalls des Korrelationskoeffizienten um Null, doch sind hier bedeutende fachen Teilern Betragsrundung von 1 Abweichungen bei den Vielfachen von (1/2, 1/4, 3/4, 1/8, 3/8, 5/8, 7/8) bemerken. Dies lässt sich damit ein¬ zu erklären, dass die Rundung von Werten, die ungerade Vielfache des halben resultierenden Quan¬ tisierungsschrittes sind, vom Vorzeichen abhängt. Bei einer kleineren effektiven Wortlänge treten diese Werte häufiger auf. 157 ^¦» 4 >«i> U 4 , ° J ' 8 BITS CBEFFICIENT «,-* 'c^ Fig. J 2-C0MPLo R0UND Wertrundung 47 J* ¦ * l'»P<fc fl J— J 8 BITS MHGNo TRUNCo Betragsabschnitt CBEFFICIENT B7d t >¦ CBEFFICIENT VflLUE TRUNCo ¦t»'"t.i»-Js "'yi ^ 'y^ f* II S| Wertabschnitt ,-.«i.i>*i\<ih'*'*- f^«)¦¦J s £ j %*Y*f I % J^>T^T^W^l^l•l'py'^ ^^r Vr'^W'T' I tBEFF CIENTl ' fJ • 8 BITS l-C0MPLo R0UND Betragsrundung Korrelationskoeffizient zwischen Abschnittfehler Multiplikation und Eingangssignal des Multiplikators in Funktion des Koeffizienten. Eingangssignal gleichverteilt. nach einer 158 Das 5.4. Quantisierungsrauschen Wir werden in diesem Kapitel die in Digitalfiltern Abschnittfehler am Ausgang Filtern berechnen", unter Annahme der Gültigkeit des Modells des Quantisierungsrauschens, d.h. dass die Ab¬ schnittfehler durch digitalen von - additive ersetzt werden können, die Rauschquellen - ein weisses Rauschen erzeugen - mit der Varianz o - wobei die xi dass = q2 -f^ 12 , Rauschquellen untereinander Wir haben in den von 2 vorherigen unkorreliert sind. zwei Abschnitten die Abweichungen obigen Annahmen untersucht. Wir haben dabei gesehen, diese bei der Rundung und beim Wertabschnitt meistens den vernachlässigbar sind. die mittlere Amplitude Zudem gestattet dieses Modell leicht der Abschnittfehler zu bestimmen und damit bekommt, weisen meistens eine genügende bis gute Uebereinstimmung mit Simulations- und Messresultaten auf. Wir ersetzen also jede Abschnittsteile durch eine additive so dass am Schluss des abschnittbehafteten Fil¬ die Werte, die Rauschquelle, ters durch ein quellen man lineares Filternetzwerk mit zusätzlichen Rausch¬ Quantisierungsrauschens am Superposition der durch die einzelnen ersetzt wird. Der Wert des Filterausgang wird durch Quellen verursachten Rauschanteile berechnet. 4.5.1 Stationärer Wert des Quantisierungsrauschens Wir werden hier den Mittelwert und die Varianz des Rundungs¬ rauschens am Ausgang eines digitalen Filters im stationären Zustand berechnen. Diese Berechnung wurde in der Literatur für den Fall mit Mittelwert Null oft ausgeführt [15,16,36,48,62, 73,74,79]. Wir werden hier den etwas allgemeineren Fall behan¬ deln, dass ein Mittelwert ungleich Null vorhanden ist, der Wertrundung der Fall ist. was bei 159 Anteil einer Rauschquelle Wir berechnen zuerst den Anteil einer Rauschquelle Mittelwert und am rauschens. Er ist offenbar beliebigen, der i-ten der Varianz des Ausgangs¬ an der Uebertragungsfunktion H.(z) betrachteten Rauschquelle bis zum Fil¬ von Einspeisepunkt der terausgang abhängig. Das Leistungsspektrurader Rauschquelle ist die Ueberlagerung des Spektrums eines weissen Rauschens mit Mittelwert 0 und vom eines "Gleichstrom"anteils Sx.x.(fT) = +^x '*0) 6(0) die Dirac'sche Stossfunktion, wo n 4. 11 11 i der Mittelwert des a 2 xi die Varianz und Quantisierungsrauschens sind, Der Mittelwert wird durch ein lineares System tragungsfunktion übertragen [70]. r\ = y n x. . H. i bei der Frequenz Null (z) n = • x. H. z=l 1 mit der Ueber¬ (fT) f=0 des Ausgangssignales y und Leistungsspektrum S demjenigen des Eingangssignals x eines linearen Abtastsystems mit der Uebertragungsfunktion H(z) existiert bekanntlich [30,70] die Beziehung Zwischen dem S yy (z) = S xx (z) • H(z) • H(z-1) oder auf dem Einheitskreis der z-Ebene (S(ojT) = s(z) z SyyUT) 160 = Sxx(wT). |H(WT) |2 = eJjo)T LeistungsSpektrums Autokorrelationsfunktion (Wiener-Kintschin)[70] Die inverse z-Transformierte des R yy Da (kT) S -zk yy (z) x dz Iz|=l die Autokorrelationsfunktion der Erwar¬ definitionsgemäss Folge y(nT) verschobenen Folge ist, d.h. Produktes der tungswert des um i -£-21T3 y = kT R yy (kT) = Mittelwert der yy Der (0) = yy (0) = E{y2(nT)} Nullpunkt = a2y ^-r 2.T-3 <j> S v yy (z) *z~ Daraus a 2 folgt = R yy y = = = z eDÜ)T e3* = bekommt 0 yy UT) d(ü)T) S = 0 yy - n 2 y [60] (fT) d(fT) der Wert der Varianz des Rauschens (0) man 1 S tz 2 tt demzufolge dz 2tt (0) quadratische =1 Durch die Substitution yy der n2y + Mittelwert des Rauschens ist z R gleichen, Folge y(nT) quadratische R mit der E{y(nT)-y[(n+k)T]> ist der Wert der Autokorrelation am R ist die am Ausgang = / Svv(fT) |H(fT) |2 d(fT) - [n H(0)]2 161 1 a2|H(fT)|2 d(fT) J o X Systeme Da wir + nJ|H(0)|2 n2H2(0) - X X mit reellen Koeffizienten betrachten, ist die Frequenz Null reell. Deswegen Uebertragungsfunktion bei der beträgt die Varianz des Anteils am Quantisierungsrauschen am Filterausgang verursacht durch die i-te Rauschquelle 1 2 2 Gy* Gx. = 1 x , o |H.(fT)|2 d(fT) Die Varianz des Quantisierungsrauschens am Filterausgang wird durch den quadratischen Mittelwert des Amplitudenganges be¬ stimmt. Sie ist unabhängig vom Mittelwert des Rauschens. Quantisierungsrauschen Gesamtes Wir haben das abschnittbehaftete Filter durch ein lineares Rauschquellen ersetzt. Daher Superposition der durch die Abtastnetzwerk mit zusätzlichen kann das Gesamtrauschen durch einzelnen Rauschquellen verursachte Rauschanteile bestimmt werden. Der Mittelwert des gesamten Rauschens ist daher die Summe der Mittelwerte L y yl i Die Varianz des Gesamtrauschens ist allgemein die Summe der Varianzen der einzelnen Anteile und der Kovarianzen zwischen den Anteilen o 2 = Ya2+2V 1 162 i-1 So j=i+l 1 3 Wir haben aber angenommen, dass die einzelnen Quellen unter¬ einander unkorreliert sind. Somit werden die Kovarianzterme gleich Null,und die gesamte Varianz wird der Varianzen der Anteile o2 x = Y i 2 wo " q. der Beim 1 qi °Y l "12" werden. Das wurde in [77] für den der Rundung H.(fT)|2 d(fT) Quantisierungsschritt Betragsabschnitt und in der Summe o2 Y± Man bekommt beim Wertabschnitt oder bei 2 gleich bei der i-ten Rauschquelle berücksichtigt Betragsabschnitt sollten die Kovarianzterme [81] speziell allgemeinen für den Fall versucht. Das Problem ist dabei, die Werte der Kovarianzen zu finden. Deswegen wurde [77] mit "worst case"-Werten für die Kovarianzen operiert. 5.4.2 Im Transientes Verhalten des vorherigen ist. in Quantisierungsrauschens Abschnitt 5.4.1 haben wir das Quantisierungs¬ rauschen im stationären Zustand berechnet. Wenn sich das Filter im Ruhezustand befindet, dann sind auch die Abschnittfehler Null. Wenn wir zu einem bestimmten Zeit¬ den Eingang geben, dann wird sich das Quanti¬ sierungsrauschen bis zum stationären Wert aufbauen. Wir wollen hier diesen transienten Vorgang näher untersuchen. punkt ein Signal an Wir untersuchen zuerst den transienten Vorgang beim Einschalten eines stationären weissen Rauschens Systems. Eingang eines linearen folgenden Prozess: Wir abgetasteten Systemen (Fig. 48), Dafür betrachten wir den eine Schar von linearen am haben alle 163 mit der gleichen Impulsantwort h(n), Ruhe befinden. Bei der Zeit nT die sich 0 wird an = 2 X angelegt, wobei die einzelnen Anfang in jeden Eingang weisses stationäres Rauschen mit Mittelwert n o am x Rauschquellen ein und Varianz untereinander unkorreliert sind. Wir wollen den Schar-Mittelwert und die Varianz der einzelnen Filterausgänge in Funktion der Zeit berechnen. »- h(n) -••y^n) xi(n) •- h(n) yt(n) xx(n) Fig. 48 des Der Ermittlung des transienten Quantisierungsrauschens Prozess zur Ausgang Verhaltens eines der Filter ist n yi(n) l = k=0 Der Mittelwert der y(n) = lim N-*00 | Der Mittelwert der X;L(n-k)-h(k) Ausgänge N n £ £ funktion und 164 es [70] n x.(n-k)-h(k) i=l k=0 Ausgänge auf den Mittelwert der schalten stationär ist folgt £ h(k)-x(n-k) k=0 ist Eingänge. bleiben, = der Antwort des Systems Da die Eingänge nach dem Ein¬ gleich ist der Mittelwert eine Schritt¬ n y(n) l nx- = k=0 Wir berechnen der Methode h(k) von folgen hier im wesentlichen [73], [74], verallgemeinert auf die Varianz. Wir jetzt Rader Gold u. einen Mittelwert des Rauschens, welcher nicht Null ist. Der quadratische Mittelwert der Ausgangssignale beträgt n y2 (n) [ l Xi(n-k)-h(k)]2 l = k-0 n I i £[x.(n-k)-h(k)]2 2 + Eingangsrauschen ist, hat man j f für l x.(n-k)•xi(n-j) n n £ £ für x±(n-k)-h(k)-x±(n-j)-h(j) j=k+l k-0 k-0 Da das = positive Zeiten weiss und stationär k E{x(n-k)}-E{x(n-j)} = 2 =n^ und daher n y^(n) S2 \ - = 2 hMk) , 2n^ + k=0 beträgt Die Varianz 2/ ay(n) x = y 2,(n) x n = x^ l u k-0 n I I k=0 h(k)-h(j) j=k+l daher -2, y (n) . - n h2(k) :.- ::.; = n + ¦ 2n22 l „x k=0 n n I h(k)]' h(k)'h(j)-nx[I k=0 j=k+l 165 n = x2 l h2(k) 2n2 + X n I I n h2(k) l 2n2 - k=0 n a\ h(k)-h(j) j=k+l k-0 k=0 n2 n l n n l l h(k)-h(j) j=k+l k=0 h2(k) k-0 Wir haben hier ein lineares Rauschen am Eingang, folgt, so mit weissem amplitudenmoduliert ist. Eingangsprozesses einer Schritt¬ dessen Varianz Wenn hier die Varianz des funktion System betrachtet ist die Varianz des Ausganges durch die Schrittantwort eines Hilfssystems gegeben, das als Impulsant2 wort das Quadrat h (n) der Impulsantwort des betrachteten Systems besitzt. (Das ist die Spezialisierung des allgemei¬ neren Falls, wo am Eingang ein stationäres weisses Rauschen multipliziert mit einer beliebigen Zeitfunktion a(t) angelegt wird. Die Varianz des Ausganges ist dann die Antwort auf a(t) Hilfssystems, Impulsantwort des des welches als Impulsantwort das Quadrat der betrachteten Systems besitzt [70, Probl. 12.2].) Die Varianz der Ausgänge ist eine monoton ansteigende der Zeit. Wenn das Filter stabil ist, dann kann man Funktion leicht durch die Substitution oo l u k-0 h2(k) = 'AZT]"} zeigen, dass die <j> |z|=1 H(z) H(z_1) z"1 Varianz gegen den Wert dz strebt, der im Abschnitt für den stationären Fall berechnet wurde. 166 vorigen \7*J- ^=^* berechnet simuliert 0.00 Tiefpass 10. Ordnung [88] berechnet simuliert KM 0.00 Bandsperre Fig. 49 22. 200 150 Ordnung [89] der Streuung des Ausgangssignals zwei verscheidenen digitalen Filter beim Einschwingvorgang von Anbringen eines weissen Rauschens am Eingang. 167 Zur Illustration wurde in Fig. 49 der Einschwingvorgang Streuung dargestellt, der des Ausgangssignals von zwei digitalen Filtern wenn am Eingang ein weisses gleichverteiltes Rauschen mit der grössten möglichen Amplitude angelegt wurde. bemerken, dass die Varianz schneller Wert einschwingt als die Schrittantwort. Es ist dabei zu stationären Die Varianz des totalen eines Quantisierungsrauschens am zu ihrem Ausgang digitalen Filters ist durch die Summe der Varianzanteile gegeben, die durch die einzelnen Rauschquellen verursacht werden, da wir angenommen haben, dass die Rauschquellen mit¬ einander unkorreliert seien. Die einzelnen Varianzteile werden dabei, wie erwähnt, durch die zeitliche Summe der Quadrate der Werte der Impulsantwort des Teilfilters zwischen der Abschnittsteile und dem Ausgang, betrachteten Zeitpunkt bestimmt. 5.4.3 Einschaltpunkt vom bis zum Verteilung des Quantisierungsrauschens Es ist theoretisch zu erwarten, dass die Verteilung schnittfehler Filters sich einer am Ausgang eines digitalen Gaussverteilung nähert. Die einzelnen Rauschquellen sind die Verteilung der Rauschanteile ursacht durch die einzelnen der Ab¬ gleichverteilt. Schon Ausgang des Filters, ver¬ zwar am Quellen, haben eine gaussförmigere Gestalt. Qualitativ ist das mit einem Grenzwertsatz für lineare Filter [90] zu erklären, der besagt, dass die Verteilung der Ausgangswerte eines linearen Filters mit einem weissen, belie¬ big verteilten Eingangssignal gegen eine Gaussverteilung strebt, die Bandbreite des Filters klein wird. Die Abweichung von der Gaussverteilung kann mit Hilfe der Kumulanten [91] berech¬ net werden. Darauf wird hier verzichtet: Ansätze dazu können wenn in 168 [92] gefunden werden. Bei der zu Summierung bilden, nähert sich die verteilung. Das Anteile, um das Gesamtrauschen Verteilung noch mehr einer Gauss¬ der einzelnen hängt mit dem zentralen Grenzwertsatz [70, 266] zusammen. Obige Vermutung wurde mit Hilfe von Simulationen verifiziert. In Fig. 50 und 51 sind einige Simulationsresultate wiederge¬ geben. Es wurde ein Signal am Eingang eines digitalen Filters 10. Ordnung [88] angelegt, und zwar im Beispiel von Fig. 50 S. ein weisses gleichverteiltes Rauschen und in demjenigen von tieffrequenter Sinus mit einer Periode von ca. 1000 Abtastwerten, ein Signal also mit einer hohen Kor¬ relation zwischen aufeinanderfolgenden Werten. Die Amplitude der Signale ist in beiden Fällen gleich der Ueberlaufgrenze der Eingangszahlen. Es sind die Histogramme der Verteilung der über 5000 Abtast¬ werte im eingeschwungenen Zustand ermittelte Abschnittfehler dargestellt. Die kontinuierliche Kurve in Fig. 50 und 51 stellt die Gaussverteilung mit gleichem Mittelwert und Streuung wie die empirische Verteilung dar. Es ist aus den Figuren ersicht¬ Fig. 51 ein sehr lich, dass beim Wertabschnitt und bei der Rundung die Ueber¬ einstimmung der empirischen Verteilung mit der Gaussverteilung recht gut ist. Beim Betragsabschnitt und Sinuseingang erhält man eine typische doppelhögerige Verteilung. Beim Betragsab¬ schnitt und Rauscheingang ist die sehr hohe Streuung der Ab¬ schnittfehler zu beachten, die viel grösser als das doppelte der Streuung bei den andern Abschnittsarten ist. 5.4.4 Das Quantisierungsrauschen bei Berücksichtigung der Skalierung Kap. 3 gesehen, dass bei der Festkommaarithmetik Skalierung der Filter unumgänglich ist. Damit wird die Wir haben in eine Uebertragungsfunktion des gesamten Filters nicht geändert, 169 \ \ / 7 -*' 0.00 ERR0R Fig. 50a) Verteilung Rundungsfehler am Ausgang eines digitalen Filter 10. Ordnung [88] bei einem der weissen Rauschen am Eingang ~\ / \ T c. n . Fig. 51a) Ä ,l"l*1 Verteilung J S V ' 1—!— -•>£ -10 0.00 10 ERR0R Rundungsfehler am Ausgang eines digitalen Filter 10. Ordnung [88] bei einem sehr niederfrequenten sinusförmigen Signal am Eingang 170 i V der -W ^dl ERR0R Fig, 50b) Abschnittfehler am Ausgang eines Wert¬ digitalen Filters 10. Ordnung [88] mit abschnitt bei einem weissen Rauschen am Eingang Verteilung der /- / \\ \ V I f \ [7 ^fl q \ 30 40 PdK. ERR0R Fig. 51b) Abschnittfehler am Ausgang eines digitalen Filter 10. Ordnung [88] mit Wertab¬ schnitt bei einem sehr niederfrequenten sinus¬ förmigen Signal am Eingang Verteilung der 171 \ / V o.oo ERR0R Fig. 50c) Verteilung digitalen Ausgang eines Ordnung [88] mit Betrags¬ der Abschnittfehler Filters 10. am abschnitt bei einem weissen Rauschen ä£= am Eingang 0.00 ERR0R Fig. 51c) 172 Verteilung der Abschnittfehler am Ausgang eines digitalen Filters 10. Ordnung [88] mit Betrags¬ abschnitt bei einem sehr niederfrequenten sinus¬ förmigen Signal am Eingang wohl aber die Teilübertragungsfunktionen zwischen bestimmten des Filters oder dem Eingang Punkt im Innern oder zwischen fast jedem Punkt Paaren von Punkten im Innern jedem und fast im Innern und dem Ausgang. Wir betrachten einen Punkt im Innern eines sondere einen Punkt, ein Abschnitt wo Filters, erfolgt. insbe¬ Die unskalierte Teilübertragungsfunktion (vom Eingang bis zum betrachteten 17 divi¬ Punkt) muss durch die maximale Amplitude des Signals diert werden, die im Bereich auftritt, in dem sich der Punkt befindet (siehe Kap. 3.2.3). Damit die gesamte Uebertragungs¬ funktion nicht verändert wird, muss die unskalierte Teilüber¬ tragungsfunktion vom betrachteten Punkt bis zum Ausgang mit dem gleichen .Skalierungsfaktormultipliziert werden [15,16]. Da das Quantisierungsrauschen am Ausgang des Filters durch die Teilübertragungsfunktion zwischen Abschnittpunkt und Aus¬ gang gegeben ist, folgt, dass die Skalierung das Quantisie¬ rungsrauschen stark beeinflusst. Wenn die Wortlänge gleich gross (gleich n^) Zahlen gleich eins ist, dann im ganzen Filter ist und er maximale Betrag der hat man o 2 y 2 = 3_ n 12 vy £ i i J max 2 -2(nb-l) 12 H.(fT)|2 d(fT) A2 A* 0 1*1 2 _ l max liHiii2 Eigentlich ist der Skalierungsfaktor aus Realisierungsgründen nur dann gleich der maximalen Amplitude, wenn diese gerade eine Zweierpotenz ist. In allen anderen Fällen ist er gleich der nächsthöheren Zweierpotenz. Um eine einfache Darstellung zu er¬ halten, werden wir den Skalenfaktor im folgenden immer gleich der maximalen Amplitude setzen. Für eine Diskussion der verwiesen. Abweichungen wird auf Kap. 3.2 173 die maximale A. wo l Amplitude (nach dem gewählten Kriterium, max siehe Kap. 3.2) im Bereich der i-ten Rauschquelle ist. sieht daraus, dass die Erhöhung der Wortlänge nfa um ein Bit das Rundungsrauschen halbiert; d.h. das Signal-zu-Rauschen Man Verhältnis wird um 6 dB verbessert. Signalamplitude, die zur Bestimmung der Skalierung gebraucht wird, wird am Eingang der Multiplikatoren ermittelt. Die max. Wir wollen nun hier den Fall betrachten, bei dem keine Ska¬ lierung zwischen dem Multiplikator und der betrachteten Ab¬ schnittsstelle erfolgt (sondern z.B. erst nach der Abschnitt18 die max. Amplitude am Multi¬ stelle), so dass im wesentlichen plikator den Skalierfaktor Diese maximale Amplitude an der Abschnittsteile bestimmt. ist eine Funktion der Teilübertra¬ gungsfunktion H.. vom Eingang des ganzen Filters bis zum Multiplikatoreingang. Erfolgt der Abschnitt direkt nach der Multiplikation, erhalten wir die Anordnung nach Fig. 52 [15,16] _ i-te c. H12/ 2 1 3 Rauschquelle \*34 4 1 G(z) c_. H : 12 H_.: Fig. 174 i-ter Koeffizient Uebertragungsfunktion vom Filter eingang zum Eingang des i-ten Multiplikators Uebertragungsfunktion vom Ausgang des i-ten Multiplikators zum Filterausgang (identisch zu H.) 52 Rauschquelle unmittelbar in Digitalfilter nach einer Multiplikation Empfindlichkeit Uebertragungsfunktion In diesem Fall lässt sich leicht mit Hilfe der beweisen, Skalierung die H_. von der Abschnittsteile zum Filterausgang mit der maxi¬ malen Amplitude A. wird. In der Tat, wenn multipliziert c c imax durch die Skalierung die gesamte Uebertragungsfunktion des Filters G(z) nicht verändert wird, dann bleibt auch ihre Ab¬ leitung unverändert. Somit erhalten wir (siehe Kap. 4.3.1) ~- 3c.l = dass durch die H1012 Die maximale H_. 34 = 12 - (A.imax .H,J 34 • A. imax Amplitude * tragungsfunktion Hn0 A. imax vom ist ein Funktional der Teilüber- Filtereingang zum Multiplikatorein- 19 Somit wird der Anteil am gang. Quantisierungsrauschen Ausgang verursacht durch die i-te Rauschquelle ayi = f(H12) •HH34II (10) Er ist somit das Produkt eines Funktionais tragungsfunktion H1_ vom Filtereingang gang mit der L_-Norm (d.h. mit dem Teilübertragungsfunktion Filterausgang. der 475.5 Der Ausdruck (10) Ausdruck für die 19 von = von 19 der Teilüber¬ zum Multiplikatorein¬ quadratischen Mittelwert) der Abschnittstelle Ueber den Zusammenhang zwischen Rauschverhalten 3^7l am zum Empfindlichkeit und Digitalfiltern gewisse Aehnlichkeit mit dem Empfindlichkeit (siehe Kap. 4.3.1) auf weist eine H12*H34 Die Art dieses Funktionais ist durch das rium (siehe Kap. 3.2) gegeben. Skalierungskrite¬ 175 Grunde wurde schon behauptet [82,83], dass zwischen der Empfindlichkeit und dem Quantisierungsrauschen ein enger Zusammenhang existiere, und zwar unabhängig von der Filter¬ Aus diesem form. Tatsächlich ist dieser Zusammenhang nicht so eindeutig behauptet. Behauptet wird nämlich [82,83], dass zwischen dem Verhältnis Quantisierungsrauschen zum Signal a /y und dem relativen wie Empfindlichkeitskoeffizienten Multiplikator bezogen) i-ten 1 - • eine 3G i -f— (beide auf den gleichen Proportionalitätsbeziehung der Form ii ki.^G y = bestehe, wobei wollen uns (id 3ci k von der Filterform unabhängig sei. 20 Wir das etwas genauer ansehen. [82] und in [83] gemacht Sinussignale am Eingang haben. In diesem Wir nehmen an, wie dies auch in wurde, Fall dass wir nur gilt A. = max max| H.2 (oi )| = ||H12(W) und somit erhalten wir für den Effektivwert des Rauschens am das durch die betrachtete Abschnittsteile verursacht Ausgang, wird a 20 yi = 2/3 MH12(-)IIJIH34(-)I|2 <12> hätte (falls er stimmen würde) zu einem sehr bequemen Kriterium für die Evaluation von Filterformen führen können: Man müsste die Filtertypen nur noch bezüglich einer der beiden erwähnten Eigenschaften vergleichen. Leider kann dieses Prinzip zu Trugschlüssen führen (siehe [84]). 176 Der Zusammenhang Empfindlichkeit der Uebertragungsfunktion auf Aenderungen i-ten Multiplikatorkoeffizienten ist (siehe Kap. 4.3.1) Die des 9G(u-) H = 3c.l 12 H "34 . miteinander vergleichen Um zwei Zahlen zu können, anstatt eine Zahl mit einer Funktion, nehmen wir einen Mittelwert der z.B. den quadratischen Mittelwert, da des¬ Empfindlichkeit, (11) sen Form 1 ähnlichsten ist. 1 iifim|2 3c. d(fT) 1 6 am = x Man kann o H12|2 .|H34|2 d(fT) d3) leicht einsehen, dass das Verhältnis von (12) und abhängt, d.h. nicht unabhängig von |H | und |H34| (4) von der Filterrealisierung ist, ausgenommen bei dem H 2(w) konstant ist, z.B. wenn für den c± sich Spezialfall, am Filterein¬ gang befindet. postulierte Beziehung Die wenn erfüllt, ist auch dann nicht besser wir ein weisses Gauss'sches Rauschen als Eingangssignal Mittelwert des Amplituden¬ In ganges für die Skalierung brauchen können (Kap. 3.2.2). diesem Fall ist die Varianz des Quantisierungsrauschens am annehmen und daher den Ausgang 2 öyi = al 12 1 ' quadratischen |H12(fT)|2 d(fT) 0 |H34(fT)|2 d(fT) allgemeinen das Produkt Integral des Produktes,und Integrale nicht Leider ist im der gleich dem die gleiche wir treffen hier wieder Für andere zwischen Situation an wie beim Skalierungskriterien Empfindlichkeit sinusförmigen Eingang. ist eine und Rauschen im Proportionalität allgemeinen noch weniger erfüllt. 177 untersucht, Wir haben hier ob eine Proportionalität zwischen quadratischen Mittelwert der Empfindlichkeit und dem Quantisierungsrauschen besteht. In [84] wurde gezeigt, dass eine Proportionalitätsbeziehung der Form (11) im allge¬ dem meinen nicht existiert. folgende Zusammenhang zwischen einerseits fv-; dem Verhältnis von Rauschen zu Signal —£*¦ am Ausgang bei einem sinusförmigen Eingangssignal der Frequenz oo und Dort besteht der anderseits der = 3r (oj ) o 1 2^ 3c.l Y o ||H12II00 1 3G — . C, i -r— o C. der ii mmtm ^ X l|H12ll. H12(%)| —I..II— ¦ • ¦!-¦ —II Proportionalität kann (frequenzabhängigen) Grössen 'H12(V' - C. Eine (direkte) die = -— G(w) auf Aenderungen des Koeffizienten ln - I Dämpfung T(oj) 3 T" Empfindlichkeit A und c. I|H34I |H34(u,0)| nur - existieren, falls 'H34(%)1 llH34ll2 konstant bleiben. Wenn beide Grössen sich im gleichen Sinn wie Empfindlichkeit der Dämpfung ändern oder wenn mindestens die Aenderung der Empfindlichkeit grösser ist als eine gegen¬ läufige Aenderung des Produktes der beiden Grössen die H12IL IV dann ist die Rauschen ist 178 oft, zu und I 1H34* '2 lH34l Empfindlichkeit der Dämpfung und das Verhältnis Signal zumindestens zueinander gleichläufig. Das aber nicht immer der Fall, wie in [84] gezeigt wurde, 5.4.6 Ueberlegungen über die Abschnittsteilen bei Digital¬ filtern Es ist bekannt, Multiplikation zweier Festkomma¬ ergibt, dessen Stellenzahl (ohne Vorzei¬ dass die zahlen ein Resultat chen) gleich der Summe der Stellenzahlen (wiederum ohne Vor¬ zeichen) der Faktoren ist. Digitalfilter nicht, dass die Wortlänge bei jeder Multiplikation wächst. Man ist auch daran interes¬ siert, die Wortlänge der Signalspeicher möglichst klein zu halten, da bei einer multiplexierten Filterhardware der Auf¬ Man will aber in einem wand der Arithmetik auf mehrere Filter verteilt wird, der Speicheraufwand aber immer proportional zu der Anzahl Filter die AbSchnittstellen zwischen den Aus¬ gang eines Multiplikators und den Eingang des nächsten Multi¬ plikators oder Speichers legen. Zwischen einem Multiplikator¬ ausgang und dem Eingang des nächsten Multiplikators oder Spei¬ wächst. Daher wird man chers befinden sich meistens einer oder mehrere Addierer: daher in diesen Fällen die Abschnittstellen vor oder nach die Addierer oder auch an beide Orte legen. Im ersten Man kann spricht man von einem einfachgenauen Addierer, im zweiten von einem doppeltgenauen Addierer. Im dritten Fall wird die Addition mit einer Wortlänge ausgeführt, die zwischen derjeni¬ gen der beiden ersten Fällen liegt: Dieser Fall wird im näch¬ Fall sten Abschnitt (5.4.6.1) ausführlich behandelt. die Addition einfach genau ausführen will, wird man bei den meisten Multiplikatoren den Abschnitt am Resultat der Wenn man durchführen. Es gibt aber auch Multiplikatoren, bei denen der Abschnitt während der Durchführung der Multipli¬ kation selber erfolgt. Bei einem Typ, der erstmals von Multiplikation [35] beschrieben wurde, werden alle Bitprodukte ge¬ bildet und aufsummiert: die überzähligen Summenbits werden aber im Laufe der Summation fallen gelassen. Damit erreicht Jackson 179 man Zeitgewinn, einen die Abschnittfehler werden dabei nicht vergrössert. Bei anderen Typen von Multiplikatoren, nämlich beim Typ der erstmals von Köthmann [86] beschrieben wurde, oder bei Parallel-Parallel-Multiplikatoren rigstwertigen Bitprodukte man Hardware ein, plikatoren, vor gar nicht werden die nied¬ gebildet. Damit spart allem bei den Parallel-Parallel-Multi- erhält aber dafür grössere Abschnittfehler: Die Varianz des Quantisierungsrauschens wird mit der Anzahl "1" im Koeffizienten multipliziert. Auch hier kann die Verwendung einer "zwischengenauen" Wortlänge von Vorteil sein. 5.4.6.1 Die Wir haben Wortlänge "zwischengenaue" Addition in Digitalfiltern eingangs erwähnt, dass wir die Addition mit einer durchführen können, die zwischen jener der Multi¬ plikatorausgänge jener des Eingangs des nächsten Multi¬ plikators oder Speichers ist. Wir wollen hier die Verbesserung in Bezug auf Quantisierungsrauschen gegenüber dem einfachge¬ nauen Addierer bzw. die Verschlechterung gegenüber dem doppelt¬ und genauen Addierer berechnen. Wir betrachten eine Multiplikationen Anordnung werde zuerst der Addition wird die Summe dass im gesamten nach um um (n Fig. -n 53. Das Resultat der ) Bits gerundet. Nach den restlichen n, Bits gerundet, abgeschnitten werden. Die Quantisierungsschritte nach den Multiplikationen q während der Addition q2 und vor der Speicherung q_ sind gendermassen miteinander verknüpft: so qx q2 = = q3 Bits 2 ' Rundungsstellen rauschen mit der Varianz a± 180 fol¬ d Jede der ersten 2 , 2_nq • q3 n _ - q2 q2 fn _-2(n -n,) q d' -jj [1~2 erzeugen je ein Quantisierungs¬ o N E^ z Rundung o- — n^d n _l " q TqQ Gewicht Fig. a) Anordnung Zwischengenauer Addierer 53 b) Wortformate dabei berücksichtigt, dass Anzahl abgeschnittener Bits endlich ist (siehe Abschnitt 5.3.2). Der Schlussab¬ schnitt erzeugt ein Quantisierungsrauschen mit der Varianz Man hat ^3 2 °2 12 Weil man die hält man für 02 N.02 . (1 - 2"2nd) Rauschquellen als unabhängig annehmen kann, 21 das totale Quantisierungsrauschen er- v + g2 ?3_ l, _ wobei N die Anzahl der + ,„.„ Eingänge .2-2nd . „.2-2nq] des Addierers ist. Kürzlich ist in [87] eine gründlichere Analyse der zwischen¬ genauen Addition durchgeführt worden. Es wurden recht kompli¬ zierte Ausdrücke für den mittleren quadratischen Fehler gefun¬ den, die aber nach Subtraktion des Quadrates des Mittelwertes den gleichen Ausdruck für die Varianz wie hier ergeben. 181 Darin sind auch die beiden Extremfälle enthalten. Man er¬ hält nämlich für n (einfachgenaue Addition) 0 = 2 2 °s = _ und für 3 xi N' n, (1 ,, 12 = n ~-2n 2 q) . " (doppeltgenaue Addition) 2 2 ad q3 12 (1 = _ .. Verwendung _-2n 2 q) . " doppeltgenauen Addierers verbessert den Effektivwert des Rundungsrauschens um den Faktor /n gegenüber dem einfachgenauen Addierer, was einer Verbesserung des Ver¬ Die hältnisses eines von Signal zu Rauschen Diese ist die obere Grenze der von 10 lg Verbesserung N dB bei entspricht. Verwendung zwischengenauen Addierers. Wir betrachten jetzt die Verminderung des Rundungsrauschens, die mit Hilfe eines zwischengenauen Addierers in Bezug auf den einfachgenauen Fall erreicht werden kann. Wir werden hier eine Näherung vornehmen. eines Wenn man den Addierer n viel kleiner als so 2 q 2 « d < wenige Bits erweitert, d.h. ist, dass gilt nur um n wenn 1 erhält man 2 at 0 182 2 s % 5 + (i- *>• 2-2nd (14) t in Fig. 54 ist in doppellogarithmischem Massstab dargestellt. of° m- Q LU UJ > oj O £z Z LO jnrt=1 ig¬ en -' < LU O (/) O z CD rv.= 2 er er in-. n„=3 fjj=4 2 Fig. 54 s INPUTS N OF ADDER NUMBER I 5 I—I—I—I 50 Verbesserung des Quantisierungsrauschens zwischengenauen Addierer i—i—r—i r>d=r>q 100 mit einem Wenn n, gross wird, dann strebt der Wert von (14) gegen 1/N: d Wir haben gesehen, dass dieser Wert mit den genauen Aus¬ drücken bei n d = n erreicht wird. Für N ->¦ « geht der Wert ~g d: Der Rauschanteil der zweiten Rundung von (14) gegen 2 vernachlässigbar gegenüber wird dem Anteil der ersten. Fig. 54 sieht man, dass die ersten paar zusätzlichen eine deutliche Verbesserung bringen, dass aber diese mit Aus gendem n, sionierung N •*¦ °° recht gering wird. Als Anhaltspunkt können wir den Punkt nehmen, wo die (= 2~nd) die Dieser Punkt liegt Kurve für n= n Bits stei¬ für eine Dimen¬ Asymptote für schneidet (siehe Fig.54 ) bei 183 N 22nd = d.h, n, = 2 ldN d.h. numerisch nd 1 2 3 N 4 16 64 Bei diesem Punkt ist 2_2nd.(2 2_2nd) = - Rundungsrauschen d.h. das als der Grenzwert für N ->- vergleichen jetzt die ist ungefähr um den Faktor /2 grösser <». erzielte Verbesserung des Rundungs¬ rauschens mit derjenigen, die wir durch eine Verkleinerung von q, (d.h. durch eine entsprechende Vergrösserung der Wortlänge) Wir so einfachgenauen Addierer erzielen können. Es ist leicht einzusehen, dass wir, um die gleiche Verbesserung zu erreichen, beim einfachgenauen Addierer die Signalwortlänge bei einem ld at as — vergrössern Fig. 54 müssen. Dies ist auf der Skala "bit dargestellt. gross ist: Es sichts des 184 der sieht, dass der Gewinn nicht sehr kann sich aber in vielen Fällen lohnen, ange¬ Man geringen Aufwandes diese Lösung eine zusätzliche reichen. gain" Verminderung des zu verwenden, Rundungsrauschens um zu er¬ um Korrelationskoeffizient zwischen einer Zufallsvariablen und einer Funktion dieser Variablen Wir suchen den Korrelationskoeffizient = xy Ef (x-x)-(y-yn o.o y x zwischen einer stochastischen Variablen x dieser Zufallsvariablen y = g(x) Der Korrelationskoeffizient kann auch wie und einer Funktion folgt geschrieben werden [70,sec.7.3] r E{x.y> = xy - x-y o.o y x gilt definitionsgemäss Für die Korrelationsfunktion R E{x-y] = = E{x-g(x)} Erwartungswert einer Variablen x ist [70] Der E{g1(x)} Funktion g1(x) einer stochastischen +00 / g1(x)-f(x) = dx 00 — wo f(x) die Wahrscheinlichkeitsdichtefunktion von x ist. Wenn wir g1(x) x«g(x) = nehmen, dann erhalten wir für die Korrelationsfunktion +00 R f(x) xy x«g(x)«f(x) dx ist die Wahrscheinlichkeitsdichtefunktion von x. 185 Wir erhalten für den Korrelationskoeffizienten + 00 / x.g(x).f(x) xy 0 o . x dx folgt x.g(x) g (x) . wobei sich der Mittelwert wie - . g(x) und die Streuung berechnen lassen: 'g(x) +00 g(x) = E{g(x) t } g(x) f • (x) dx 1 2 + 00 r g g(x) Falls (x) f(x) • dx - g(x) eine diskrete Zufallsvariable ist, dann erhält durch ähnliche Ueberlegungen x l \"3(\) *Pk k _ xy o mit pk x.g(x) " g(x) . P{x=xk} = g(x) o x man = l gtj^) pk • k l g(x) k g (\) -pk - g(x) Der Zähler in den Ausdrücken für r Es gilt axv 186 = £{(x-x) (yy)} = xy ist die Kovarianz o E{(x-x)-y} = xy E{x-(y-y)}= E{xy}- x-y LITERATUR z-Transform", [1] Jury, "Theory and Application of Wiley, New York, 196 4 [2] H.E. Kallmann, "Transversal Filters", Proc. IRE, Vol. No. 7, pp. 302-310 (July 1940) [3] W. Kuntz, "Entwurf und E.I. Anwendung eines the 28, Abtast-Analog¬ rechners" , NTZ, Bd. 21, H. 2, S. 82-87 (Febr. 1968) W. Kuntz, "A New Sample-and-Hold Device and its Appli¬ cation to the Realization of Digital Filters", Proc. IEEE, Vol. 56, pp. 2092-2093 (Nov. 1968) W. Kuntz, "Analoge Realisierung digitaler Filter" in W. Kuntz, W. Schüssler, W. Winkelkempern, "Untersuchung über Eigenschaften, Entwurf und Realisierung digitaler Filter", Ausgewählte Arbeiten über Nachrichtentechnik Nr. 10, Erlangen, 1969, S. 47-74 [4] C.M. Puckette, W.J. Butler, D.A. Smith, "Bucket-Brigade Transversal Filters". IEEE Trans, on Communications, Vol. COM-22, No. 7, pp. 926-934 (July 1974) D.A. Smith, W.J. Butler, C.M. Puckette, Filter, and Tone Generator Using Bandpass Delay Lines", "Programmable Bucket-Brigade Communications, Vol. COM-22, No. 7, pp. 921-925 (July 1974) H. Wupper, "A Method for the Realization of Filters with the Aid of Charge-Transfer Devices", Conf. Record 7th Asilomar Conf. (Nov. 1973), pp. 354-358 IEEE Trans, on Szekely, "Method for Weighted Charge Summation in Bucket-Brigade Circuits", Electronic Letters, Vol. 10, V. No. 20 [5] D.D. [6] Y. (Oct. 1974) Buss, D.R. Collins, W.H. Baley, CR. Reeves, "Trans¬ versal Filtering Using Charge-Transfer Devices", IEEE J. of Solid State Circuits, Vol. SC-8, No. 2, pp. 138146 (April 1973) Takodoro, T. Higuchi, "Simple Magnetic Delay Unit with High Accuracy and Reliability for Digital Filters", IEEE Trans. Industr. Electronics and Control Instrum., Vol. IECI-20, No. 3, pp. 130-137 (August 1973) [7] A. Shah, "Theoretische und praktische Untersuchungen über dielektrische Anwendungen von Ferroelektr.ika", Diss. ETH Nr. 4059 und AFIF Publ. Nr. 20 (1968) 187 [8] Mathaei, "Acoustic Surface-Wave Transversal Fil¬ ters", IEEE Trans, on Circuit Theory, Vol. CT-20, No. 5, G.L. pp. 459-470 [9] (Sept. 1973) Leuthold, "Filternetzwerke mit digitalen Schiebe¬ registern", Diss. ETH Nr. 3934 und Philips Res. Repts. Suppl. 1967, No. 5 P.E. Leuthold, "Microelectronic Versions of Digital and Quasidigital Filters", Proc. of the Summer School on Circuit Theory 1971, Tale, Czechoslovakia, pp. 9-1 P. to 9-20 [10] [11] H. Schwarz, "Einführung Vieweg, Braunschweig, W. Schüssler, "Zur in die moderne 1969 Systemtheorie", allgemeinen netzwerke", AEU, Bd. 22, H. Theorie der Verzweigungs¬ 8, S. 361-367 (August 1968) [12] H.W. [13] L.R. Rabiner et al. "Terminology in Digital Signal Processing", IEEE Trans, on and Electroacoustics, Vol. AU-20, No. 5, pp. 322-337 (Dec. 1972) [14] S.Y. Hwang, "Realization of Canonical Digital Networks", IEEE Trans, on Acoustics, Speech and Signal Proc, Vol. ASSP-22, No. 1, pp. 27-39 (Jan. 1974) Schüssler, "Digitale Systeme tung", Springer, Berlin, 1973 zur Signalverarbei¬ Audio S.Y. Hwang, "On Element-Values and Realizability Conditions of Canonical Digital Networks", IEEE Trans, on Acoustics, Speech pp. 152-153 and Signal Proc, (April 1974) [15] L.B. [16] L.B. [17] H. Freeman, "Discrete Time [18] F. 188 Vol. ASSP-22, No. 4, Jackson, "An Analysis of Roundoff Noise in Digital Filters", Ph.D. Thesis, Stevens Inst, of Technology, Hoboken N.J., 1969 Jackson, "On the Interaction of Roundoff Noise and Dynamic Range in Digital Filters", BSTJ, Vol. 49, No. 2, pp. 159-184 (Febr. 1970) Systems", Wiley, New York, 1965 Hemmer, "Simplification des conditions de stabilite des systdmes echantillonnes lineaires de forme directe", Diss. ETH Nr. 4690 und AFIF Publ. Nr. 26 (1971) [19] S.K. Mitra, R.J. Sherwood, "Digital Ladder Networks", IEEE Trans, on Audio and Electroacoustics, Vol. AU-21, No. 1, pp. 30-36 (Febr. 1973) Huey, R.J. Sherwood, "New Methods of Digital Ladder Realization", IEEE Trans, on Audio and Electroacoustics, Vol. AU-21, No. 6, pp. 485-491 (Dec 1973) S.K. Mitra, A.D. Sagar, "Additional Canonic Realizations of Digital Filters Using the Continued-Fraction Ex¬ pansion", IEEE Trans, on Circuits and Systems, Vol. CAS-21, No. 1, pp. 135-136 (Jan. 1974) S.K. [20] Mitra, D.C. A.G. Constantinides, "Some New Digital Filter Struc¬ tures Based on Continued Fraction Expansion", Proc. NATO Adv. Studies Inst, on Network and Signal Theory, (Sept. 1972) pp. 358-365 [21] A.H. Gray, Filter J.D. Markel, "Digital Synthesis", Lattice and Ladder Audio and Electro¬ 6, pp. 491-500 (Dec. 1973) IEEE Trans, on acoustics, Vol. AU-21, No. [22] Saito, "Digital Filtering Techniques Speech Analysis", Proc. 7th Int'l. Congress on Acoustics, Budapest, 1971, pp. 261-264 [23] A. Fettweis, sical Filter F. for Itakura, (Febr. 1971) S. "Digital Filter Networks", AEU, Structures Related to ClasBd. 25, H. 2, S. 79-89 Sedlmeyer, A. Fettweis, "Digital Filters with True Configuration", Int. J. on Circuit Theory and Applications, Vol. 1, pp. 5-10 (Jan. 1973) A. Fettweis, H. Levin, A. Sedlmeyer, "Wave Digital Lat¬ tice Filters", Int. J. on Circuit Theory and Applica¬ A. Ladder tions, Vol. 2, [24] pp. 203-211 R.E. Kaiman, "Mathematical mical Systems", SIAM J. on (1963) (1974) Description of Linear Dynapp. 152-192 Control, Vol. 1, [25] M. Morf, "Fast Algorithms for Multivariable Systems", Ph.D. Thesis, Stanford University, August 1974 [26] A.S. Ludvig, "A Comparative Study of Sensitiv!ty in Recursive Digital Filters", M.E. Thesis, McGill Univer¬ sity, Montreal, Canada, March 1973 189 [27] I. Flores, "The Logic of Computer Arithmetic", Hall, Englewood Cliffs, N.J., 1963 [28] Steingold, "Analog-Digital Conversion Handbook", Analog Devices Inc., Norwood Mass., 1972, Part II, Ch. [29] Prentice- D.H. 1 Landauro, "Realisation des filtres numeriques programmables", These, Facultg Polytechnique de Mons, A. Belgique, 1973 [30] A.V. [31] P.M. [32] H. [33] H. Griffin, "Elementary Theory of New York, 1954, pp. 53-57 [34] H.W. Gschwind, "Design of New York, 1967, p. 190 [35] R.O. [36] R. Edwards, J. Bradley, J.B. Knowles, "Comparison of Noise Performances of Programming Methods in the Rea¬ lization of Digital Filters", Proc. Symp. on Computer Processing in Communications, New York, pp. 295-311 Oppenheim, "Realization of Digital Filters Using Block-Floating-Point Arithmetic", IEEE Trans, on Audio and Electroacoustics, Vol. AU-18, No. 2, pp. 130-136 (June 1970) Ebert, J.E. Mazo, M.G. tions in Digital 3020 (Nov. 1969) Filters", Taylor, "Overflow Oscilla¬ Vol. BSTJ, 48, No. 9, pp. 2999- Meschkowski, "Einführung in die Bibliographisches Inst., Mannheim, moderne 1966 Numbers", Mathematik", McGraw Hill, Digital Computers", Springer, Berg, L.L. Kinney, "Serial Adders with Overflow Correction", IEEE Trans, on Computers, Vol. CT-20, No. 6, pp. 668-671 (June 1971) (April 1969) [37] J.E. Bertram, "The Effect of Quantization in SampledFeedback Systems", Trans. AIEE, Part 2 (Appl. & Ind.), Vol. 77, pp. 177-182 (Sept. 1958) [38] T.A. Brubaker, Filters", IEEE No. [39] pp. 675-677 (July 1972) J.L. Long, T.N. Trick, "An Absolute Bound on Limit Cycles Due to Roundoff Errors in Digital Filters", IEEE Trans, on Audio and Electroacoustics, Vol. AU-21, No.l, pp. 27- 30 190 5, J.W. Gowdy, "Limit Cycles in Digital Trans, on Automatic Control, Vol. AC-17, (Febr. 1973) Parker, "Computation of Bounds for Digital Filter Quantization Errors", IEEE Trans, on Circuit Theory, Vol. CT-20, No. 4, pp. 391-396 (July 1973) [40] S. Yakowitz, [41] V. Mangoulis, [42] D.S.K. Chan, L.R. Rabiner, "Theory of Roundoff Noise in Cascade Realizations of Finite Impulse Response Digital Filters", BSTJ, Vol. 52, No. 3, pp. 329-345 Engineers", S.R. "Handbook of Series for Scientists and Academic Press, New York, 1965 (March 1973) [43] H.W. Bode, "Network Analysis and Feedback Amplifier Van Norstrand, New York, 1945 Design", Sensitivity Collection Theory, Vol. CT- [44] J. of [45] S. [46] A.G. Deczky, "Computer Aided Design of Digital Filters in the Frequency Domain", Diss. ETH Nr. 4890 und AFIF Publ. Nr. 29 (1973) [47] CE. Maley, "The Effects of Parameters on the Roots of an Equation System", Computer J., Vol. 4, No. 2, pp. 62-63 (1962) [48] F. [49] Gorski-Popiel, "Classical Formulas", IEEE Trans, on Circuit 10, No. 2, pp. 300-302 (June 1963) - A Stefanescu, "Filtres electriques", Masson, Paris, 1972, chap. 11: SensitivitSs Pellandini, "Problemes de realisation digitaux", AGEN-Mitteilungen Nr. 9 (Juli 1969) Bonzanigo, des filtres F. S.K. Mitra, R.J. Displacement Sherwood, " Estimation of Pole-Zero Due to Coefficient Quantization", IEEE CAS-21, No. 1, Trans, on Circuits and Systems, Vol. pp. 116-124 (Jan. 1974) Rothenbühler, "Untersuchung der Empfindlichkeit [50] H. [51] M. Sablatash, "A Tellegen's Theorem for Digital Filters", IEEE Trans, on Circuit Theory, Vol. CT-18, No. 1, pp. 201-203 (Jan. [52] ver¬ schiedener Strukturen digitaler Filter", Diplomarbeit am Inst, für Technische Physik an der ETHZ, WS 1974 1971) A General Theorem for Signal-Flow Networks" Fettweis, AEU, Bd. 25, H. 12, S. 557-561 (Dez. 1971) A. " 191 [53] S. Colonna, U. de Julio, M. Salerno, "Determination of Sensitivity Functions of Digital Filters", IEEE Trans, on Circuit Theory, Vol. CT-19, No. 5, pp. 538-539 (Sept. 1972) [54] S.W. Director, R.A. Rohrer, "The Generalized Adjoint Network and Network Sensitivities", IEEE Trans, on Circuit Theory, Vol. CT-16, No. 3, pp. 318-323 (Aug. 1969) [55] £. Björck, [56] S.W. G. Dahlquist, bourg, München, 1972 "Numerische Methoden", Olden- in Network Sensitivity IEEE Trans, on Circuit Theory, Vol. CT-18 Director, "LU Factorization Computation", 1, pp. 184-185 (Jan. 1971) No. [57] H. Benke, F. Sommer, "Theorie der analytischen Funktionen einer komplexen Veränderlichen", Springer, Berlin, 1955, S. 54 [58] A.N. [59] A.N. [60] L. Kristiansson, Willson, "Some Effects of Quantization and Adder Overflow on the Forced Response of Digital Filters", BSTJ, Vol. 51, No. 4, pp. 863-887 (April 1972) Willson, "Limit Cycles due to Adder Overflow in Digital Filters", IEEE Trans, on Circuit Theory, Vol. CT-19, No. 4, pp. 342-346 (July 1972) "Jump 1974) [61] Phenomenon in Electronic Letters, Vol. B. 10, No. Digital Filters", 2, pp. 14-15 (Jan. of Amplitude-Quantized Trans. AIEE, Part 2 (Appl. & Ind.), Widrow, "Statistical Analysis Sampled-Data Systems", Vol. 79, pp. 555-568 (Jan. 1961) Knowles, R.E. Edwards, "Effect of a Finite Word Length Computer in a Sampled-Data Feedback System", Proc. IEE, Vol. 112, No. 6, pp. 1197-1206 (June 1965) [62] J.B. [63] Limit Cycles due to Multiplication Rounding in Recursive Digital Filters", Proc. 7th Allerton Conf., pp. 69-78 (Oct. 1969) [64] F. 192 L.B. Jackson, "An Analysis of Bonzanigo, "Constant-Input Behaviour of Recursive Digital Filters", IEEE Arden House Workshop on Digital Filtering, Harriman, N.Y., Jan. 1970 and Proc. 1970 Symposium on Digital Filtering, London, July 1970 [65] S. Hess, "A Deterministic Analysis of Limit Cycle Oscillations in Recursive Digital Filters due to Quantization", Ph.D. Thesis, US Naval Postgraduate School, Monterey (Dec. 1970) S.R. Parker, S.F. Hess, "Limit Cycle Oscillations Digital Filters", CT-18, No. 6, IEEE Trans, on pp. 687-697 Circuit (Nov. 1971) Theory, in Vol. [66] T.A.C.M. Claasen, W.F.G. Mecklenbräuker, J.B.H. Peek, "Some Remarks on the Classification of Limit Cycles in Digital Filters", Philips Res. Repts., Vol. 28, No. 4, pp. 297-305 (Aug. 1973) [67] W.R. [68] [69] Bennett, "Spectra Vol. 27, pp. 446-472 Widrow, "A Study of Quantized (July 1948) Signals", BSTJ, cuit Rough Amplitude Quantization by Nyquist Sampling Theorem", IRE Trans, on Cir¬ Theory, Vol. CT-3, No. 4, pp. 268-276 (Dec. 1956) A.A. Kosyakin, B. Means of of "The Statistical Theory of Amplitude Quantization", Avtomatika i Telemekhanika, Vol. 22, 6, pp. 722-729 (June 1961) No. [70] A. Papoulis, "Probability, Random Variables and Stochastic Processes", McGraw Hill, New York, 1965 [71] J.S. Thomson, "An Errors in Digital Electroacoustics, 1973) [72] Improved Model for Quantization Filters", IEEE Trans, on Audio and Vol. AU-21, No. 2, pp. 125-127 (April T.W. Sjoding, "Noise Variance for Rounded Two's Complement Product Quantization", IEEE Trans, on Audio and Electroacoustics, Vol. AU-21, No. 4, pp. 378-380 (Aug. 1973) [73] Gold, C.M. Rader, "Effects of Quantization Noise in Digital Filters", Proc. AFIPS 1966 Spring Joint Computer Conf., pp. 213-219 C.M. Rader, B. Gold, "Digital Filter Design in the Frequency Domain", Proc. IEEE, Vol. 55, No. 2, pp. 149-171 (Febr. 1967) [74] C.M. Rader, B. Gold, "Digital McGraw Hill, New York, 1969 B. Processing of Signals", 193 [75] J. Tödtli, J. Pfund, "Digitaler Oszillator", AGENMitt. Nr. 11, S. 32-39 (Juli 1970) [76] B. [77] P.E. Girard, "Correlated Noise Effects of Strueture in Digital Filters", Ph.D. Thesis, Naval Postgraduate Eckhardt, "On the Roundoff Error of a Multiplier", AEU, Bd. 29, H. 4, S. 162-164 (April 1975) School, Monterey, Calif., (June 1974) S.R. Parker, P.E. Girard, "Correlated Noise in Fixed Point Digital Filters", Paper submitted to the IEEE Trans, on Circuits and Systems (April 1975) [78] J.B. Knowles, R. Edwards, "Autocorrelation Function of the Quantisation-Error Process for a Sinusoid", Electronic Letters, Vol. 4, No. 9, pp. 180-182 (May 1968) [79] E. Avenhaus, "Zum Speicherwortlänge Diss., Universität Entwurf digitaler Filter mit minimaler für Koeffizienten und Zustandsgrössen", Erlangen-Nürnberg (Mai 1971) [80] J.R. [81] Liu, M.E. Van Valkenburg, "On Roundoff Error in Fixed-Point Digital Filters Using Sign-Magnitude Truncation", IEEE Trans, on Circuit Theory, Vol. CT-19, No. 5, pp. 536-537 (Sept. 1972) [82] A. Ragazzini, Systems", B. Fettweis, "On the Connection between Multiplier Word Length Limitation and Roundoff Noise in Digital Filters", IEEE Trans, on Circuit Theory, Vol. CT-19, No. 5, pp. 486-491 [83] G.F. Franklin, "Sampled-Data Control McGraw Hill, New York, 1958 (Sept. 1972) Fettweis, "Roundoff Noise and Attenuation Sensitivity in Digital Filters with Fixed-Point Arithmetic", IEEE Trans, on Circuit Theory, Vol. CT-20, No. 2, pp. 174A. 175 (March 1973) [84] F. [85] L.B. Jackson, J.F. Kaiser, H.S. McDonald, "An Approach to the Implementation of Digital Filters", IEEE Trans, on Audio and Electroacoustics, Vol. AU-16, No. 3, pp. 413- Bonzanigo, "Comment on 'Roundoff Noise and Attenua¬ Sensitivity in Digital Filters with Fixed-Point Arithmetic'", IEEE Trans, on Circuit and Systems, Vol. CAS-21, No. 6, pp. 809-810 (Nov. 1974) tion 421 194 (Sept. 1968) Köthmann, "Vereinfachte seriell arbeitende Multipli¬ zierwerke für Digitalfilter", NTZ, Bd. 25, H. 11, S. 492-496 (Nov. 1972) [86] W. [87] B. Eckhardt, H.W. Schüssler, "On the Quantization Error of a Rounded Sum of Rounded Products", AEU, Bd. 29, H. 7/8, S. 308-311 (July-August 1975) [88] R.B. Kieburtz, "An Experimental Study of Roundoff Effects in a Tenth Order Recursive Digital Filter", Proc. IEEE 1972 Int. Conf. on Communications [89] R.M. Data Golden, J.F. Kaiser, "Design of Wideband SampledFilters", BSTJ, Vol. 43, No. 4, pp. 1533-1546 (July 1964) [90] H. Davis, "A Central Limit Theorem for the Response of Filters with Vanishing Bandwidths", J. Math. Anal, and Appl., Vol. 3, No. 3, pp. 605-618 (Dec. 1961) [91] M.G. [92] F. [93] A. in [94] U. Kendall, A. Stuart, "Advanced Theory of Statistics", Vol. 1, Griffin, London, 1958 mit Anwendung auf Okt. 1974 PCM", unabhängigen Werten Nr. 4 der AFIF, Aktenvermerk Braun, "Diskrete Filterung von Weber, "Integrierte Schaltungen Band 2, Kap. IX: Binäre Arithmetik, Birkhäuser-Verlag, Basel, in Druck Shah, M. Saglini, C. digitalen Systemen", Appel, "Bounds on Second-Order Digital Filter Limit Cycles", IEEE Trans, on Circuits and Systems, Vol. CAS-22, No. 7, pp. 630-632 (July 1975) Z. Uenver, A. Khaldoun, "A Tighter Practical Bound on Quantization Errors in Second-Order Digital Filters with Complex Conjugate Poles", IEEE Trans, on Circuits and Systems, Vol. CAS-22, No. 7, pp. 632-633 (July 1975) 195 Die vorliegende der ETH Zürich Arbeit wurde am Institut für Technische Physik ausgeführt. Institutes, Prof.Dr.E.Baumann, hat diese Arbeit durch grosszügige Unterstützung und durch wertvolle An¬ regungen und Ratschläge gelenkt. Es ist mir gleichzeitig eine Freude und eine angenehme Pflicht, ihm dafür meinen Dank auszu¬ Der Vorsteher des sprechen. Auch Herrn Prof.Dr.G.S.Moschytz gebührt mein bester Dank für seine sehr wertvolle und konstruktive Kritik dieser Arbeit und für seine sehr nützlichen Hinweise. Stiftung, Bern, sei bestens gedankt für zügige finanzielle Unterstützung durch die AGEN. Der Hasler ihre gross¬ Kollegen Prof.Dr.F.Pellandini (vormals Leiter Digitalfilter) und Dr.A.G.Deczky möchte ich für Den früheren der Gruppe die für ständige Anregung, sowie für die interessanten Diskussionen, zu dieser Arbeit geführt haben,meinen Dank aussprechen. die Den Herren Dr.A.Shah und Dr.F.Braun möchte ich schliesslich für die sprachliche danken. 196 Korrektur und Verbesserung des Textes bestens Lebenslauf 1. Juli 1941 in Sorengo TI geboren. Nach Besuch der Primarschule (1947-52) und des "Ginnasio Cantonale" (1952Ich wurde 56) am in Bellinzona TI, trat ich im Jahr 1956 ins "Liceo Canto¬ nale" in Lugano ein, wo ich 1960 das Maturitätszeugnis Typus C erhielt. Im Herbst des gleichen Jahres begann ich das Studium an der Abteilung Hochschule, ingenieur Eidgenössischen Techn. dem Diplom als Elektro¬ für Elektrotechnik der das ich im Jahre 1964 mit abschloss. Anschliessend trat ich in den Dienst des Institutes für Tech¬ nische Physik an der ETH Zürich als Assistent und wissenschaft¬ Projekte hochgenauen licher Mitarbeiter. Zuerst bearbeitete ich verschiedene auf dem Gebiet der Messung magnetischer Felder, der geregelten Antriebe, der Fernsehtechnik und des Schaltver¬ halten von "digitale Transistorschaltungen. Bei der Gründung der Filter" im Jahre 1967 trat ich dieser bei, wo Gruppe ich Realisierung digitaler Filter und die Quantisierungsprobleme behandle. Seit April seitdem die Probleme der damit verwandten 1973 leite ich die oben genannte Gruppe. 197 Seite Leer / Blank leaf