Skript zur Vorlesung Mathematik 3

Werbung
Hochschule für Technik und Wirtschaft Dresden
Fakultät Informatik/Mathematik
Prof. Dr. B. Jung
Skript zur Vorlesung Mathematik 3
für den Studiengang
Elektrotechnik/Informationstechnik
Stoffgebiete:
9. Gewöhnliche Differentialgleichungen
10. Fourier-Transformation und Anwendungen
11. Partielle Differentialgleichungen (Einblick)
12. Grundlagen der Wahrscheinlichkeitsrechnung
13. Wahrscheinlichkeitsverteilungen
14. Mathematische Statistik
2
Inhaltsverzeichnis
9
Gewöhnliche Differentialgleichungen
9.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1.2 Anwendungsbeispiele für gewöhnliche Differentialgleichungen . . . . . . . . . . . . .
9.1.3 Anfangswertprobleme (AWP) und Randwertprobleme (RWP) . . . . . . . . . . . . . .
9.2 Differentialgleichungen 1. Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.2.1 Grafische Lösung expliziter Differentialgleichungen 1. Ordnung . . . . . . . . . . . . .
9.2.2 Differentialgleichungen mit trennbaren Variablen (separable Differentialgleichungen) . .
9.2.3 Lösung von Ähnlichkeits-Differentialgleichungen . . . . . . . . . . . . . . . . . . . . .
9.2.4 Lineare Differentialgleichungen 1. Ordnung . . . . . . . . . . . . . . . . . . . . . . . .
9.2.5 Lineare Differentialgleichungen 1. Ordnung mit konstanten Koeffizienten . . . . . . . .
9.2.6 Exakte Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.3 Lineare Differentialgleichungen 2. und höherer Ordnung mit konstanten Koeffizienten . . . . .
9.3.1 Lineare Differentialgleichungen 2. Ordnung mit konstanten Koeffizienten . . . . . . . .
9.3.2 Lineare Differentialgleichungen n-ter Ordnung (n ≥ 3) mit konstanten Koeffizienten .
9.3.3 Lösung der Eulerschen Differentialgleichung durch Rückführung auf eine lineare Differentialgleichung mit konstanten Koeffizienten . . . . . . . . . . . . . . . . . . . . . .
9.4 Die Laplace-Transformation und ihre Anwendungen . . . . . . . . . . . . . . . . . . . . . . .
9.4.1 Spezielle Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.4.2 Die Laplace-Transformation: Definition und Rechenregeln . . . . . . . . . . . . . . . .
9.4.3 Anwendung der Laplace-Transformation zur Lösung von AWP für gewöhnliche Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.4.4 Anwendung der Laplace-Transformation in der Regelungstechnik (lineare Übertragungssysteme) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.5 Systeme linearer Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.5.1 Definition und Anwendungsbeispiele . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.5.2 Methoden zur Lösung von linearen DGLS (Fallbeispiele) . . . . . . . . . . . . . . . . .
5
5
5
5
7
8
8
9
10
11
14
15
16
16
22
25
27
27
28
32
34
36
36
37
10 Fourier-Transformation und Anwendungen
10.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.2 Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.3 Fourier-Kosinus-Transformation und Fourier-Sinus-Transformation
10.4 Anwendungen in der Regelungstechnik . . . . . . . . . . . . . . .
10.5 Diskrete und schnelle Fourier-Transformation (Einblick) . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
40
40
42
43
43
44
11 Partielle Differentialgleichungen (Einblick)
11.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.2 Partielle Differentialgleichungen in der Praxis . . . . . . . . . . .
11.3 Partielle Differentialgleichungen mit Nebenbedingungen . . . . .
11.4 Methoden zur Lösung partieller Differentialgleichungen (Einblick)
11.4.1 Lösung durch Separationsansatz . . . . . . . . . . . . . .
11.4.2 Lösung nach der Methode von d’Alembert . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
46
46
47
49
50
50
52
.
.
.
.
.
.
.
.
.
54
54
55
55
56
58
58
58
60
62
.
.
.
.
.
.
12 Grundlagen der Wahrscheinlichkeitsrechnung
12.1 Hilfsmittel aus der Kombinatorik . . . . . . . . . . . . . . . . . . . . . . .
12.2 Grundbegriffe der Wahrscheinlichkeitsrechnung . . . . . . . . . . . . . . .
12.2.1 Das Zufallsexperiment und weitere Grundbegriffe . . . . . . . . .
12.2.2 Verknüpfungen von Ereignissen . . . . . . . . . . . . . . . . . . .
12.3 Der Begriff der Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . .
12.3.1 Laplace-Experimente, absolute und relative Häufigkeit . . . . . . .
12.3.2 Wahrscheinlichkeitsaxiome und Schlussfolgerungen . . . . . . . .
12.3.3 Additionssatz, bedingte Wahrscheinlichkeit und Multiplikationssatz
12.3.4 Baumdiagramme, totale Wahrscheinlichkeit von Ereignissen . . . .
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13 Wahrscheinlichkeitsverteilungen
13.1 Stetige und diskrete Zufallsvariable (ZV) . . . . . . . . . . . . . . .
13.2 Verteilungsfunktion einer ZV . . . . . . . . . . . . . . . . . . . . . .
13.2.1 Verteilungsfunktion einer diskreten ZV (diskrete Verteilung) .
13.2.2 Verteilungsfunktion einer stetigen ZV (stetige Verteilung) . .
13.3 Kennwerte einer Wahrscheinlichkeitsverteilung . . . . . . . . . . . .
13.4 Spezielle Wahrscheinlichkeitsverteilungen . . . . . . . . . . . . . . .
13.4.1 Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . .
13.4.2 Poisson-Verteilung . . . . . . . . . . . . . . . . . . . . . . .
13.4.3 Stetige Gleichverteilung (Rechteckverteilung) . . . . . . . . .
13.4.4 Exponentialverteilung . . . . . . . . . . . . . . . . . . . . .
13.4.5 Weibull-Verteilung . . . . . . . . . . . . . . . . . . . . . . .
13.4.6 Gaußsche Normalverteilung . . . . . . . . . . . . . . . . . .
13.5 Aussagen über Summen und Produkte von Zufallsvariablen . . . . . .
13.5.1 Kennwerte von Summen und Produkten von Zufallsvariablen
13.5.2 Zentraler Grenzwertsatz . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
65
65
65
66
67
68
70
70
71
72
73
74
76
79
79
81
14 Mathematische Statistik
82
14.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
14.1.1 Einige Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
14.1.2 Verteilungsfunktion einer Stichprobe . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
14.1.3 Gruppierung der Stichprobenwerte bei umfangreichen Stichproben . . . . . . . . . . . . 84
14.2 Kennwerte (Maßzahlen) einer Stichprobe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
14.3 Korrelationsrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
14.4 Statistische Schätzmethoden für die unbekannten Parameter einer Wahrscheinlichkeitsverteilung
( Parameterschätzungen“) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
”
14.4.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
14.4.2 Punktschätzungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
14.4.3 Bestimmung von Konfidenzintervallen (Vertrauensintervallen) . . . . . . . . . . . . . . 92
14.5 Statistische Prüfverfahren für die unbekannten Parameter einer Wahrscheinlichkeitsverteilung
( Parametertests“) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
”
14.5.1 Statistische Hypothesen und Parametertests . . . . . . . . . . . . . . . . . . . . . . . . 95
14.5.2 Tests für den unbekannten Erwartungswert µ einer Normalverteilung . . . . . . . . . . 96
14.5.3 Tests für die unbekannte Varianz σ 2 einer Normalverteilung . . . . . . . . . . . . . . . 98
14.5.4 Tests für die unbek. Erwartungswerte µ1 und µ2 zweier Normalverteilungen (Differenzentests) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
14.6 Statistische Prüfverfahren für die unbekannte Verteilungsfunktion einer Wahrscheinlichkeitsverteilung ( Anpassungs- oder Verteilungstests“) . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
”
4
9
Gewöhnliche Differentialgleichungen
9.1
9.1.1
Einführung
Grundbegriffe
Definition 9.1: Eine Gleichung, in der Ableitungen einer unbekannten Funktion y = y(x) bis zur n-ten
Ordnung auftreten, heißt gewöhnliche Differentialgleichung n-ter Ordnung. Man unterscheidet dabei noch:
implizite Form: F (x, y, y 0 , . . . , y (n) ) = 0
explizite Form: y (n) = f (x, y, y 0 , . . . , y (n−1) ).
Beispiel 9.1:
Definition 9.2: Eine Funktion y = y(x) heißt Lösung der Differentialgleichung, wenn sie mit ihren
Ableitungen die Differentialgleichung identisch erfüllt.
Bezüglich der Lösungen einer Differentialgleichung wird noch die folgende Unterscheidung getroffen:
(1) allgemeine Lösung einer Differentialgleichung n-ter Ordnung:
Diese enthält noch n voneinander unabhängige, frei wählbare Parameter (Konstante).
Es handelt sich hier nicht um eine einzelne Funktion, welche die Differentialgleichung löst, sondern um eine
Schar von Lösungen (bei der grafischen Darstellung der Lösungsmenge: eine Schar von Lösungskurven).
(2) partikuläre (spezielle) Lösung einer Differentialgleichung n-ter Ordnung:
Eine solche Lösung wird durch eine spezielle Wahl der Parameter aus der allgemeinen Lösung gewonnen.
Die Werte dieser Parameter ergeben sich dadurch, dass die Lösungsfunktion zusätzliche Bedingungen erfüllen soll, siehe dazu Abschnitt 9.1.3.
(3) singuläre Lösung einer Differentialgleichung n-ter Ordnung:
Das ist eine Lösung der Differentialgleichung , die nicht aus der allgemeinen Lösung gewonnen werden
kann.
Beispiel 9.2:
Bemerkung:
Neben gewöhnlichen Differentialgleichungen gibt es noch partielle Differentialgleichungen. Diese enthalten
partielle Ableitungen (siehe Kapitel 7) einer unbekannten Funktion von mehreren Variablen.
9.1.2
Anwendungsbeispiele für gewöhnliche Differentialgleichungen
Zahlreiche Problemstellungen in Physik und Technik lassen sich mit Hilfe gewöhnlicher Differentialgleichungen
modellieren und lösen. Im weiteren werden einige Beispiele dazu betrachtet.
5
Beispiel 9.3: Harmonische Schwingung eines Feder-Masse-Schwingers (Federpendels)1
Dieses einfache Modell eines schwingungsfähigen
Systems läßt sich durch eine Differentialgleichung
beschreiben.
elast. Feder
m
Bei der Modellierung werden die folgenden Kräfte berücksichtigt:
- Rückstellkraft der Feder: F1 = −cx (c: Federkonstante, x: Auslenkung der Feder zur Zeit t)
- Reibungskraft:
F2 = −kv (k: Reibungskoeffizient, v: Geschwindigkeit)
Nach dem zweiten Newtonschen Gesetz gilt:
ma = F = F1 + F2 = −cx − kv ,
wobei a die Beschleunigung bezeichnet. Auf Grund der Beziehungen v = ẋ und a = ẍ (vgl. dazu auch: Abschnitt 5.4.1 im Skript zur Vorlesung Mathematik 1) entsteht daraus die folgende Differentialgleichung 2. Ordnung (Schwingungsgleichung):
mẍ = −cx − k ẋ
bzw.
mẍ + k ẋ + cx = 0 .
Wichtiger Spezialfall: k = 0 (d.h. es treten keine Reibungskräfte auf)
mẍ + cx = 0
oder
ẍ + ω02 x = 0 (mit ω02 =
c
)
m
Beispiel 9.4: Beschreibung des Zeitverhaltens eines Stromes2
Ein Stromkreis mit einer Gleichurspannung U ,
einer Induktivität L und einem Gesamtwiderstand R
wird zur Zeit t = 0 geschlossen.
U
Die Summe der Spannungsabfälle ist gleich der vorhandenen Urspannung:
uR + uL = U .
R
L
dI
erhält man eine Differentialgleichung 1. Ordnung zur
Mit Hilfe der Beziehungen uR = I · R und uL = L ·
dt
Beschreibung des Zeitverhaltens des Stromes:
dI
dI
R
U
IR + L
= U bzw.
+ I= .
dt
dt
L
L
Die allgemeine Lösung dieser Differentialgleichung lautet:
R
U
+ Ce− L t mit C ∈ R (Konstante) ,
R
R
R
dI
= −C e− L t , und dies eingesetzt in die linke Seite der obigen Differentialgleichung ergibt:
denn es gilt:
dt
L
U
U
R
R
dI
R
R
R
+ I = −C e− L t + ·
+ Ce− L t = .
dt
L
L
L
R
L
I=
Beispiel 9.5:
Die Differentialgleichung der Bewegung eines Fadenpendels lautet:
g
m l2 α̈ + m g l sin α = 0 bzw. α̈ + sin α = 0 ,
l
wobei die folgenden Bezeichnungen gelten: m: Masse, l: Länge des Fadens, α = α(t): Auslenkwinkel.
Beispiel 9.6:
Die Differentialgleichung des elektrischen Reihenschwingkreises (unter der Voraussetzung, dass die von außen
angelegte Spannung konstant ist) lautet:
d2 i R di
1
+ ·
+
· i = 0,
dt2
L dt LC
wobei i = i(t) die Stromstärke, R den ohmschen Widerstand, L die Induktivität und C die Kapazität bezeichnet.
1
Quelle: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 2, 12. Auflage (2009), S. 348-349
Quelle: W. L EUPOLD (Hrsg.). Mathematik - ein Studienbuch für Ingenieure (Band 2: Reihen - Differentialgleichungen - Analysis
für mehrere Variable - Stochastik), 2. Auflage (2006), S. 84
2
6
9.1.3
Anfangswertprobleme (AWP) und Randwertprobleme (RWP)
Bei einem Anfangswertproblem (AWP) werden der Lösungsfunktion y = y(x) insgesamt n Werte
vorgeschrieben, und zwar der Funktionswert und die Werte der ersten (n − 1) Ableitungen an einer
bestimmten Stelle x0 . Diese Werte
y(x0 ), y 0 (x0 ), . . . , y (n−1) (x0 )
werden als Anfangswerte (AW) oder Anfangsbedingungen (AB) bezeichnet.
Sie liefern n Bestimmungsgleichungen für die noch unbekannten Parameter in der allgemeinen Lösung
der Differentialgleichung (siehe dazu Abschnitt 9.1.1). Die partikuläre Lösung ist durch die AB stets
eindeutig bestimmt.
Beispiel 9.7:
Beispiel 9.8:
Das AWP3
ẍ + ω02 x = 0,
x(0) = x0 ,
ẋ(0) = 0
(x0 > 0)
beschreibt die harmonische Schwingung eines elastischen Federpendels (vgl. auch Beispiel 9.3) unter den folgenden Versuchsbedingungen (Anfangsbedingungen):
- Das Federpendel besitzt zu Beginn der Bewegung, d.h. zum Zeitpunkt t = 0, eine Auslenkung x0 in der
positiven Richtung.
- Die Bewegung erfolgt aus der Ruhe heraus (Anfangsgeschwindigkeit v0 = ẋ(0) = 0).
Die allgemeine Lösung dieser Schwingungsgleichung lautet:
x(t) = A · sin(ω0 t + ϕ)
mit den Parametern A > 0 und 0 ≤ ϕ < 2π .
Diese beiden Parameter können aus den Anfangswerten bestimmt werden:
1) x(0) = x0 ⇒ A · sin ϕ = x0
2) ẋ(t) = ω0 A · cos(ω0 t + ϕ), ẋ(0) = 0 ⇒ ω0 A · cos ϕ = 0 ⇒ cos ϕ = 0
Wegen A > 0 und x0 > 0 muss sin ϕ > 0 gelten (siehe 1)), so dass nur die Lösung ϕ =
Aus 1) folgt dann: A = x0 .
π
2
möglich ist.
Die Schwingung des Federpendels unter den genannten Anfangsbedingungen wird daher durch die folgende
Funktion beschrieben:
π
x(t) = x0 · sin ω0 t +
= x0 · cos(ω0 t) .
2
Bei einem Randwertproblem (RWP) werden der Lösungsfunktion y = y(x) an mindestens zwei verschiedenen Stellen x1 und x2 zusätzliche Bedingungen (in Form von Funktions- oder Ableitungswerten) vorgeschrieben. Diese werden als Randwerte (RW) oder Randbedingungen (RB) bezeichnet.
Häufig sucht man die Lösung einer Differentialgleichung in einem Intervall [x1 , x2 ] und stellt die zusätzlichen Bedingungen in den Randpunkten dieses Intervalls.
Aus den Randbedingungen ergeben sich n Bestimmungsgleichungen für die noch unbekannten Parameter
in der allgemeinen Lösung der Differentialgleichung. Im Gegensatz zum AWP muss die Lösung eines RWP
nicht eindeutig sein. Auch der Fall, dass keine Lösung existiert, kann bei RWP eintreten.
3
Quelle: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 2, 12. Auflage (2009), S. 352
7
Beispiel 9.9: RWP zur Berechnung der Biegelinie eines Balkens4
Es wird ein Balken der Länge l betrachtet, der auf zwei Stützen ruht und durch eine konstante Streckenlast q
gleichmäßig belastet ist.
q = const.
x
?
?
?
?
?
?
?
?
-
x
y
?
l
AA
A Biegelinie y = y(x)
Die Biegelinie y = y(x) genügt für kleine Durchbiegungen näherungsweise der Differentialgleichung 2. Ordnung (Biegegleichung): y 00 = −
Mb
, wobei die folgenden Bezeichnungen gelten:
EI
E - Elastizitätsmodul (Materialkonstante), I - Flächenmoment des Balkenquerschnitts, Mb - Biegemoment.
q
Das ortsabhängige Biegemoment Mb beträgt in diesem Fall: Mb = (lx − x2 ) , so dass die Biegegleichung die
2
folgende Gestalt annimmt:
y 00 = −
q
(lx − x2 )
2EI
für 0 ≤ x ≤ l.
In den beiden Randpunkten x = 0 und x = l ist keine Durchbiegung möglich.
Somit ist das folgende Randwertproblem zu lösen:
y 00 = −
9.2
q
(lx − x2 ) ,
2EI
y(0) = y(l) = 0
(0 ≤ x ≤ l) .
Differentialgleichungen 1. Ordnung
9.2.1
Grafische Lösung expliziter Differentialgleichungen 1. Ordnung
Eine explizite Differentialgleichung 1. Ordnung hat allgemein die Form (siehe dazu auch Abschnitt 9.1.1):
y 0 = f (x, y).
(161)
Auf Grund der geometrischen Deutung der ersten Ableitung einer Funktion (Anstieg der Kurventangente; siehe
dazu auch: Abschnitt 5.3.1 im Skript zur Vorlesung Mathematik 1) kann eine geometrische Interpretation der
Gleichung (161) angegeben und daraus eine Methode zur grafischen Lösung hergeleitet werden. Diese wird im
folgenden erläutert.
Es wird vorausgesetzt, dass die Funktion f (x, y) auf einer Teilmenge D der (x, y)-Ebene definiert sei. Dann wird
jedem Punkt (x0 , y0 ) ∈ D durch die Gleichung (161) eine eindeutig bestimmte Richtung y 0 (x0 ) = f (x0 , y0 )
zugeordnet. In dem Punkt (x0 , y0 ) wird ein Geradenstück mit dem Anstieg f (x0 , y0 ) eingezeichnet. Der Punkt
mit dem zugehörigen Geradenstück wird Richtungselement (oder Linienelement) genannt.
Richtungsfeld und Isoklinen
Das Richtungsfeld der Differentialgleichung (161) wird aus sämtlichen Richtungselementen gebildet
(siehe Bild 9.1a)).
Verbindet man jeweils alle Punkte, deren zugehörige Richtungselemente die gleiche Richtung besitzen,
so erhält man die Isoklinen. Die Isoklinen werden durch die Gleichung f (x, y) = const. charakterisiert.
Eine Kurve y(x) ist genau dann Lösungskurve der gegebenen Differentialgleichung, wenn sie in das Richtungsfeld passt“, d.h. wenn in jedem Punkt der Kurve die Tangente mit dem eingezeichneten Geradenstück (Rich”
tungselement) zusammenfällt. Die Methode zur (näherungsweisen) grafischen Lösung der Differentialgleichung
(161) lässt sich nun folgendermaßen beschreiben. Mit Hilfe der Gleichung f (x, y) = const. können (jeweils
durch spezielle Wahl der Konstanten) Isoklinen der Differentialgleichung gezeichnet werden. Auf den Isoklinen
werden dann die Richtungselemente eingetragen. Dabei genügt es, auf jeder Isokline nur ein Richtungselement
einzuzeichnen, da die anderen durch Parallelverschiebung entstehen. Die Näherungen für die Lösungskurven
sind so zu konstruieren, dass sie in den Schnittpunkten mit den Isoklinen parallel zu den zugehörigen Richtungselementen verlaufen.
4
Quelle: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 2, 12. Auflage (2009), S. 353-354
8
Ist zusätzlich zu der Differentialgleichung (161) eine Anfangsbedingung y(xa ) = ya vorgegeben, so ist die
(Näherungs-)Lösung dieses AWP durch diejenige Kurve aus der Kurvenschar gegeben, die durch den Punkt mit
den Koordinaten (x, y) = (xa , ya ) verläuft (vgl. Bild 9.1b)).
Bild 9.1a)
Bild 9.1b)
Beispiel 9.10:
y
Es wird die Differentialgleichung y 0 = (mit x 6= 0) betrachtet.
Gemäß (161) gilt: f (x, y) =
y
y
x
x
, d.h. die Isoklinen werden durch
die Gleichung = const. = m charakterisiert. Es handelt sich
x
um eine Schar von Halbgeraden, welche durch Gleichungen der
Form y = mx mit x, y 6= 0 beschrieben werdena . Das Richtungsfeld der Differentialgleichung ist in der nebenstehenden Abbildung dargestellt. Für die betrachtete Differentialgleichung fallen die Lösungskurven mit den Isoklinen zusammen.
5
−5
5
−5
a
Die Gleichungen y = mx sind zwar Gleichungen von Geraden. Aber auf
Grund der Bedingung x, y 6= 0 zerfallen“ diese Geraden jeweils in zwei Halb”
geraden.
9.2.2
Differentialgleichungen mit trennbaren Variablen (separable Differentialgleichungen)
Unter einer separablen Differentialgleichung 1. Ordnung versteht man eine Differentialgl. vom folgenden Typ:
dy
= f (x) · g(y) ,
(162)
dx
d.h. auf einer Seite der Gleichung steht die erste Ableitung der gesuchten Funktion y = y(x), der Ausdruck auf
der anderen Seite der Gleichung lässt sich als Produkt einer nur von x abhängigen Funktion f (x) und einer nur
von y abhängigen Funktion g(y) darstellen.
Derartige Differentialgleichungen können mit der Methode der Trennung der Variablen gelöst werden.
y 0 = f (x) · g(y)
oder
Lösung einer separablen Differentialgleichung mittels Trennung der Variablen
1) Die vorliegende Differentialgleichung
dy
dy
= f (x) · g(y) wird wie folgt umgestellt:
= f (x) dx ,
dx
g(y)
d.h. es entsteht eine Gleichung, bei der eine Seite nur noch von der Variablen x,
die andere Seite nur noch von der Variablen y abhängt. Dabei wird vorausgesetzt, dass g(y) 6= 0 gilt.
2) Auf beiden Seiten der Gleichung aus Schritt 1) wird eine unbestimmte Integration durchgeführt:
Z
dy
=
g(y)
Z
f (x) dx .
3) Die allgemeine Lösung der Differentialgleichung liegt nun in der impliziten Form: F1 (y) = F2 (x) vor.
Die Auflösung nach y - falls überhaupt möglich - ergibt die allgemeine Lösung der Differentialgleichung
in der expliziten Form y = y(x).
Hinweis: Bei dem soeben beschriebenen Lösungsweg wurde zunächst g(y) 6= 0 vorausgesetzt. In dem Fall
g(y) = 0 hat die betrachtete Differentialgleichung die Form y 0 = f (x) · 0 = 0, d.h. ihre Lösungen sind vom
Typ y = const. = a (a ∈ R).
Beispiel 9.11:
9
Beispiel 9.12: Das AWP5 für die Differentialgleichung des freien Falles mit Luftwiderstand:
mg
m dv
+ v2 =
,
c dt
c
v(0) = 0
ist zu lösen (c: Proportionalitätsfaktor).
Zunächst wird die Differentialgleichung ohne Berücksichtigung der AB mittels Trennung der Variablen gelöst:
r
dv
c 2
dv
mg
dv
= dt
.
(163)
=g− v ⇒
falls v 6=
c 2 = dt ⇒
c
dt
m
g−m
c
v
g 1 − mg
v2
r
Die Integration der linken Seite der Gleichung (163) erfolgt durch die Substitution u =
Z
des Grundintegrals
c
v und mit Hilfe
mg
du
= artanhu + C.
1 − u2
Insgesamt ergibt die Integration der Gleichung (163):
r
r
m
c
artanh
v = t + C.
cg
mg
Nach Berücksichtigung der AB erhält man: C = 0, d.h. die Lösung des AWP (partikuläre Lösung der Dgl.)
lautet:
r
r
r
r
mg
cg
mg ekt − e−kt
cg
v=
tanh
t bzw. v =
mit k :=
.
kt
−kt
c
m
c e +e
m
9.2.3
Lösung von Ähnlichkeits-Differentialgleichungen
Eine Differentialgleichung der Form
y
y0 = f
x
wird als Ähnlichkeits-Differentialgleichung bezeichnet. Auf der einen Seite der Differentialgleichung befindet
sich die erste Ableitung der gesuchten Funktion, auf der anderen Seite ein Ausdruck, der als Funktion des
y
Quotienten geschrieben werden kann. Die Lösung derartiger Differentialgleichungen wird mit Hilfe der
x
Substitution u =
y
x
auf die Lösung von Differentialgleichungen mit trennbaren Variablen zurückgeführt.
Vorgehensweise bei der Lösung von Dgln. der Form y 0 = f
y
x
(Ähnlichkeits-Dgln.)
1) Aufstellen und Lösen der folgenden Differentialgleichung mit getrennten Variablen:
du
dx
=
f (u) − u
x
(164)
Der Ausdruck für f (u) entsteht aus f
y
x
, indem
y
x
durch u ersetzt wird.
Das Lösen der Gleichg. (164) erfolgt wie im Abschn. 9.2.2 beschrieben, die allgemeine Lösung lautet u.
Hinweis: Wenn der Fall f (u) − u = 0 eintreten kann, ist dieser gesondert zu behandeln.
2) Die allgemeine Lösung der gegebenen Ähnlichkeits-Differentialgleichung erhält man als: y = u · x,
mit u aus 1).
Begründung dieser Vorgehensweise:
y
Zunächst wird die Funktion u = eingeführt. Dann gilt: y = u · x. Diese Gleichung wird nun nach x
x
differenziert, wobei die Produktregel anzuwenden ist (denn u ist eine von der Variablen x abhängige Funktion).
Das führt zunächst auf die Gleichung
y 0 = u0 · x + u · 1 .
(165)
5
Quelle: W. L EUPOLD (Hrsg.). Mathematik - ein Studienbuch für Ingenieure (Band 2: Reihen - Differentialgleichungen - Analysis
für mehrere Variable - Stochastik), 2. Auflage (2006), S. 98-99
10
y
Wenn in der zu lösenden Differentialgleichung der Quotient durch u ersetzt wird, dann entsteht die Gleichung:
x
y 0 = f (u). Dies ergibt zusammen mit (165):
du
du
f (u) − u
x
+ u ⇒ f (u) − u = x ·
⇒
=
dx
dx
du
dx
Diese Gleichung ist äquivalent zu der folgenden Differentialgleichung mit getrennten Variablen:
f (u) = u0 · x + u = x ·
du
dx
=
.
f (u) − u
x
Nachdem diese Differentialgleichung gemäß der im Abschnitt 9.2.2 beschriebenen Vorgehensweise gelöst wurde, entsteht die Lösung y der Ausgangsgleichung als: y = u · x.
Beispiel 9.13:
9.2.4
Lineare Differentialgleichungen 1. Ordnung
Definition 9.3:
Eine Differentialgleichung 1. Ordnung heißt linear, wenn sie in der folgenden Form darstellbar ist:
y 0 + f (x) · y = g(x) .
(166)
Die Funktion g(x) wird Störfunktion oder Störglied genannt.
Falls g(x) ≡ 0 gilt, wird die Differentialgleichung als homogene lineare Differentialgleichung bezeichnet.
Anderenfalls handelt es sich um eine inhomogene lineare Differentialgleichung.
Beispiel 9.14:
Bei der Erläuterung der Methoden zur Lösung linearer Differentialgleichungen wird zunächst der Fall einer
homogenen Gleichung betrachtet (d.h. Gleichung (166) mit g(x) ≡ 0).
Lösung einer homogenen linearen Differentialgleichung 1. Ordnung
Die Differentialgleichung y 0 + f (x) · y = 0 hat die allgemeine Lösung:
y = C · e−
R
f (x) dx
(C ∈ R) .
(167)
Begründung für Formel (167):
Bei der Differentialgleichung y 0 + f (x) · y = 0 kann eine Trennung der Variablen vorgenommen werden:
dy
dy
dy
+ f (x) · y = 0 ⇒
= −f (x) · y ⇒
= −f (x) dx (falls y 6= 0).
(168)
dx
dx
y
Die Integration beider Seiten dieser Gleichung ergibt:
Z
Z
Z
dy
= − f (x)dx ⇒ ln |y| = − f (x)dx + C
y
(C ∈ R) .
Die letztgenannte Gleichung wird nach |y| aufgelöst:
|y| = e−
R
f (x)dx+C
= eC · e−
R
f (x)dx
.
Somit lautet die allgemeine Lösung6 der gegebenen Differentialgleichung
y = C · e−
R
f (x)dx
mit C ∈ R
(siehe Formel (167)).
6
Bei der Auflösung nach y entsteht zunächst eine Konstante ungleich 0. Da die Funktion y = 0 ebenfalls Lösung der Differentialgleichung ist, lässt sich die Lösungsmenge in der genannten Form darstellen.
11
Nun wird eine Formel zur Berechnung der allgemeinen Lösung einer inhomogenen Gleichung (d.h. Gleichung (166)
mit g(x) 6≡ 0) angegeben.
Lösung einer inhomogenen linearen Differentialgleichung 1. Ordnung mit der Methode
der Variation der Konstanten
Die Differentialgleichung y 0 + f (x) · y = g(x) (mit g(x) 6≡ 0 ) hat die allgemeine Lösung:
hZ
i
R
R
g(x) · e f (x)dx dx + C · e− f (x)dx , C ∈ R.
y=
(169)
Begründung für Formel (169):
Die zu der Ausgangsgleichung
y 0 + f (x) · y = g(x)
(170)
y0
gehörige homogene lineare Differentialgleichung 1. Ordnung
+ f (x) · y = 0 hat die allgemeine Lösung
R
−
f
(x)dx
yh = C · e
(siehe (167)).
Der Ansatz für die Lösung y der inhomogenen Differentialgleichung (170) nach der Methode der Variation der
Konstanten wird wie folgt aufgestellt:
y = K(x) · yh = K(x) · e−
R
f (x)dx
,
(171)
d.h. y wird dargestellt als Produkt einer (bisher unbekannten, von x abhängigen) Konstanten K(x) und der bereits berechneten allgemeinen Lösung der homogenen Differentialgleichung . Die erste Ableitung des Lösungsansatzes lautet (nach Produkt- und Kettenregel):
y 0 = K 0 (x) · e−
R
f (x)dx
− K(x) · f (x) · e−
R
f (x)dx
,
(172)
Z
da die Ableitung des Integrals
f (x) dx den Integranden f (x) ergibt. Einsetzen von (171) und (172) in (170)
liefert:
⇒
K 0 (x) · e−
R
K 0 (x) · e−
R
f (x)dx
f (x)dx
− K(x) · f (x) · e−
R
f (x)dx
+ f (x) · K(x) · e−
= g(x) bzw. K 0 (x) = g(x) · e
R
R
f (x)dx
= g(x)
f (x)dx
Z
Durch Integration der letztgenannten Gleichung erhält man: K(x) =
g(x) · e
R
f (x)dx dx
+ C (C ∈ R)
und nach Einsetzen in (171) ergibt sich die Formel (169) für die allgemeine Lösung der Differentialgleichung
(170).
Beispiel 9.15:
12
Beispiel 9.16:
Der zeitliche Verlauf der Stromstärke i = i(t) in einem Stromkreis mit zeitabhängigem ohmschen Widerstand
werde durch die lineare inhomogene Differentialgleichung 1. Ordnung
di
+ cos t · i = 2 · cos t
(t ≥ 0)
dt
beschrieben. Man berechne die allgemeine Lösung dieser Differentialgleichung .
Wie lautet die Lösung der Differentialgleichung, wenn die Anfangsbedingung i(0) = 0 gestellt wird?
Bezüglich der Lösungsmenge von linearen inhomogenen Differentialgleichungen 1. Ordnung gilt allgemein die
folgende Aussage.
Darstellung der Lösung einer inhomogenen linearen Differentialgleichung 1. Ordnung
Die allgemeine Lösung y = y(x) der Differentialgleichung y 0 + f (x) · y = g(x) (mit g(x) 6≡ 0 )
ist stets in der Form
y(x) = yh (x) + yp (x)
(173)
darstellbar, wobei die folgenden Bezeichnungen gelten
yh (x): allgemeine Lösung der zugehörigen homogenen Differentialgleichung y 0 + f (x) · y = 0,
yp (x): (beliebige) partikuläre Lösung der inhomogenen Differentialgleichung.
Begründung für Formel (173):
Sei yh die allgemeine Lösung der zugehörigen homogenen Differentialgleichung, dann gilt:
yh0 + f (x) · yh = 0 .
Jede partikuläre Lösung yp der inhomogenen Differentialgleichung besitzt die Eigenschaft:
yp0 + f (x) · yp = g(x) .
Die Addition dieser beiden Gleichungen ergibt:
yh0 + f (x) · yh + yp0 + f (x) · yp = g(x)
⇒
(yh + yp )0 + f (x)(yh + yp ) = g(x) ,
d.h. die Funktion y(x) = yh (x) + yp (x) erfüllt die Ausgangsgleichung y 0 + f (x) · y = g(x) und ist zugleich
allgemeine Lösung dieser Differentialgleichung (da ein freier Parameter in y enthalten ist).
Schlussfolgerung aus (173):
Zur Ermittlung der allgemeinen Lösung einer inhomogenen Differentialgleichung y 0 + f (x) · y = g(x)
genügt es, eine partikuläre Lösung yp dieser Gleichung zu bestimmen. Dies ist oft durch einen speziellen
Ansatz möglich (siehe dazu den nachfolgenden Abschnitt 9.2.5).
Bemerkung:
Auch bei linearen Differentialgleichungen 2. und höherer Ordnung besitzt die allgemeine Lösung die Darstellung (173).
13
9.2.5
Lineare Differentialgleichungen 1. Ordnung mit konstanten Koeffizienten
Eine lineare Differentialgleichung 1. Ordnung mit konstanten Koeffizienten hat die Gestalt:
y 0 + a · y = g(x)
mit a ∈ R.
(174)
Es handelt sich um einen Spezialfall der bisher betrachteten Differentialgleichungen vom Typ (166), und zwar
gilt hier: f (x) = a, a ∈ R.
Gemäß den Ausführungen im vorangegangenen Abschnitt ist die Methode der Variation der Konstanten zur
Lösung derartiger Differentialgleichungen geeignet. Wenn jedoch die Störfunktion von einem speziellen Funktionstyp (z.B. Exponentialfunktion, Polynom oder trigonometrische Funktion) ist, bietet sich als Alternative die
Lösung mit Hilfe eines speziellen Ansatzes an7 . Letztere ist meistens einfacher. Zunächst wird die Vorgehensweise bei einem solchen Lösungsweg beschrieben und anschließend werden mögliche Ansätze vorgestellt.
Lösung linearer Differentialgleichungen 1. Ordnung mit konstanten Koeffizienten bei Vorliegen
spezieller Störfunktionen
1) Die allgemeine Lösung der zugehörigen homogenen Differentialgleichung y 0 + a · y = 0 wird berechnet.
Diese Lösung lautet gemäß (167): yh = C · e−
R
a dx
= C · e−ax (C ∈ R).
2) Um eine partikuläre Lösung yp der inhomogenen Differentialgleichung (174) zu finden, wird ein Ansatz
in Form einer Funktion, die im Wesentlichen dem Typ der Störfunktion entspricht, verwendet
(häufig verwendete Ansätze: siehe unten).
3) Die allgemeine Lösung y von (174) ergibt sich gemäß (173) als: y = yh + yp .
Übersicht über Ansätze für die partikuläre Lösung yp der inhomogenen Differentialgleichung
y 0 + a · y = g(x) (a 6= 0)
Störfunktion g(x)
Lösungsansatz für yp (x)
konstante Funktion
konstante Funktion yp = a0 , Parameter: a0
lineare Funktion
(Polynom 1. Grades)
lineare Funktion yp = a1 x + a0
Parameter: a0 , a1
quadratische Funktion
(Polynom 2. Grades)
quadratische Funktion yp = a2 x2 + a1 x + a0
Parameter: a0 , a1 , a2
Polynom n-ten Grades
Polynom n-ten Grades yp = an xn + . . . + a1 x + a0
Parameter: a0 , a1 , . . . , an
g(x) = c · sin(ωx)
g(x) = c · cos(ωx)
g(x) = c1 · sin(ωx) + c2 · cos(ωx)
yp = A · sin(ωx) + B · cos(ωx) oder
yp = C · sin(ωx + ϕ)
Parameter: A, B bzw. C, ϕ
g(x) = b · ecx
yp = A · ecx
für c 6= −a
yp = A · x · ecx für c = −a
Parameter: A
Hinweise zur Tabelle:
- Die in der Tabelle (rechte Spalte) genannten Parameter sind zunächst unbekannt. Nach Einsetzen des gewählten Ansatzes für yp sowie dessen Ableitung yp0 in die zu lösende Differentialgleichung kann ein Koeffizientenvergleich durchgeführt werden. Dieser liefert Bedingungen (in Form linearer Gleichungen) für die gesuchten
Parameter, aus denen diese Parameter berechnet werden können. Die Beispiele 9.17 und 9.18 verdeutlichen
diese Vorgehensweise.
- Besteht die Störfunktion g(x) aus mehreren additiven Störgliedern, so erhält man den Lösungsansatz für yp
als Summe der Lösungsansätze für die Einzelglieder.
7
Dafür wird häufig auch die Bezeichnung Störgliedansatz“ verwendet.
”
14
Beispiel 9.17:
Beispiel 9.18:
Beispiel 9.19:8
Ein Stromkreis mit einem Ohmschen Widerstand R, der Induktivität L und der Wechselspannungsquelle
u(t) = u0 sin(ωt) wird zur Zeit t = 0 geschlossen. Das Zeitverhalten des Stromes i = i(t) wird durch
die lineare inhomogene Differentialgleichung 1. Ordnung
u0
di R
+ i=
sin(ωt)
dt L
L
beschrieben.
Offensichtlich handelt es sich um eine Differentialgleichung mit konstanten Koeffizienten.
Die zu (175) gehörige homogene Differentialgleichung
(175)
R
di R
+ i = 0 hat die allgemeine Lösung ih = C · e− L t
dt
L
mit C ∈ R (vgl. dazu Relation (167)). Die Störfunktion in der inhomogenen Gleichung (175) hat die Form
g(t) =
u0
sin(ωt) , d.h. sie ist vom Typ c · sin(ωt). Daher eignet sich der Ansatz ip = A · sin(ωt) + B · cos(ωt)
L
zur Berechnung einer partikulären Lösung von (175).
Es gilt dann:
dip
= A · ω · cos(ωt) − B · ω · sin(ωt) . Einsetzen in die Differentialgleichung (175) ergibt:
dt
dip R
R
u0
+ ip = A · ω · cos(ωt) − B · ω · sin(ωt) + [A · sin(ωt) + B · cos(ωt)] =
· sin(ωt)
dt
L
L
L
R
R
u0
⇒ A · ω + · B cos(ωt) + −B · ω + · A · sin(ωt) =
· sin(ωt) .
L
L
L
R
u
·A−B·ω = 0
L
L
R
A · ω + · B = 0.
L
−u0 · ω · L
u0 · R
, B= 2
.
Die Lösung dieses linearen Gleichungssystems ist: A = 2
R + ω 2 L2
R + ω 2 L2
Durch Vergleich der Koeffizienten bei sin(ωt) sowie bei cos(ωt) erhält man:
Damit erhält man als partikuläre Lösung der Gleichung (175):
ip =
u0
[R sin(ωt) − ωL cos(ωt)] .
R2 + ω 2 L2
Folglich lautet die allgemeine Lösung der Differentialgleichung (175):
R
i = ih + ip = C · e− L t +
9.2.6
R2
u0
[R sin(ωt) − ωL cos(ωt)]
+ ω 2 L2
(C ∈ R).
Exakte Differentialgleichungen
Definition 9.4: Eine Differentialgleichung der Gestalt
y0 =
dy
g(x, y)
=−
dx
h(x, y)
oder
g(x, y) dx + h(x, y) dy = 0
(176)
heißt exakte Differentialgleichung, wenn der Ausdruck auf der linken Seite der letztgenannten Gleichung
das totale Differential einer Funktion f (x, y) (vgl. dazu Abschnitt 7.3 im Skript zur Vorlesung Mathematik 2) ist. Dies bedeutet, dass eine Funktion f (x, y) mit dem totalen Differential
df (x, y) = fx (x, y) dx + fy (x, y) dy = g(x, y) dx + h(x, y) dy
(177)
existieren muss.
Die Funktion f (x, y) ist zunächst nicht bekannt, aber mit Hilfe der folgenden
Integrabilitätsbedingung : gy (x, y) = hx (x, y)
8
(178)
Quelle: W. L EUPOLD (Hrsg.). Mathematik - ein Studienbuch für Ingenieure (Band 2: Reihen - Differentialgleichungen - Analysis
für mehrere Variable - Stochastik), 2. Auflage (2006), S. 109-110
15
kann geprüft werden, ob es sich bei der Gleichung (176) tatsächlich um eine exakte Differentialgleichung handelt. Wenn die Integrabilitätsbedingung erfüllt ist, hat die Differentialgleichung (176) die (in impliziter Form
vorliegende) Lösung f (x, y) = C mit C ∈ R, wobei fx (x, y) = g(x, y) und fy (x, y) = h(x, y) gilt, siehe (177). Diese beiden Beziehungen werden zur Berechnung der Lösung f (x, y) verwendet. Zunächst wird die
erste dieser Gleichungen unbestimmt nach x integriert (wobei zu beachten ist, dass dabei eine von y abhängige
Integrationskonstante entsteht). Dann ist f (x, y) bis auf diese additive Konstante bereits bestimmt. Die Berechnung dieser Konstanten erfolgt, indem noch die Bedingung fy (x, y) = h(x, y) berücksichtigt wird. Somit lässt
sich die Vorgehensweise bei der Lösung exakter Differentialgleichungen folgendermaßen beschreiben.9
Lösung der exakten Differentialgleichung g(x, y) dx + h(x, y) dy = 0
1) Berechnung des unbestimmten Integrals
Z
g(x, y) dx = G(x, y) + C0 (y)
⇒ Die Lösung der gegebenen Differentialgleichung hat die Form f (x, y) = G(x, y) + C0 (y).
2) Berechnung von: fy (x, y) =
∂G(x, y)
∂
(G(x, y) + C0 (y)) =
+ C00 (y)
∂y
∂y
3) Gleichsetzung von fy (x, y) mit h(x, y) ergibt eine Gleichung für C00 (y)
4) Berechnung von C0 (y) durch unbestimmte Integration (nach y) des Ausdrucks für C00 (y)
5) Die allgemeine Lösung der gegebenen Differentialgleichung ergibt sich (in impliziter Form) als:
f (x, y) = G(x, y) + C0 (y) = C, mit G(x, y) aus 1), C0 (y) aus 4) und C ∈ R.
Beispiel 9.20:
Bemerkungen:
- Wenn zusätzlich zu der exakten Differentialgleichung eine Anfangsbedingung gegeben ist, kann die Lösung
dieses AWP als Summe zweier bestimmter Integrale dargestellt werden, siehe dazu z.B.:
G. M ERZIGER , G. M ÜHLBACH , D. W ILLE , T H . W IRTH. Formeln + Hilfen zur höheren Mathematik,
7. Auflage (2014), S. 165.
- Wenn bei einer Differentialgleichung der Form (176) die Integrabilitätsbedingung nicht erfüllt ist, kann das
aufgeführte Lösungsverfahren nicht unmittelbar angewendet werden. Gegebenenfalls ist es jedoch möglich,
die Gleichung durch Erweitern mit einer speziellen Funktion (integrierender Faktor) in eine exakte Differentialgleichung zu verwandeln. Weitere Ausführungen und Beispiele dazu findet man z.B. in:
H.-J. BARTSCH . Taschenbuch mathematischer Formeln für Ingenieure und Naturwissenschaftler,
23. Auflage (2014), S. 549f. oder:
W. P REUSS , G. W ENISCH (Hrsg.). Lehr- und Übungsbuch Mathematik, Band 2, 3. Auflage (2003), S. 283f.
9.3
Lineare Differentialgleichungen 2. und höherer Ordnung mit konstanten Koeffizienten
Derartige Differentialgleichungen sind in der Praxis häufig anzutreffen. Beispielsweise können mechanische und
elektromagnetische Schwingungen durch lineare Differentialgleichungen mit konstanten Koeffizienten beschrieben werden (siehe auch Abschnitt 9.1.2).
9.3.1
Lineare Differentialgleichungen 2. Ordnung mit konstanten Koeffizienten
Definition 9.5:
Eine Differentialgleichung der Form
y 00 + ay 0 + by = g(x)
(a, b ∈ R)
(179)
heißt lineare Differentialgleichung 2. Ordnung mit konstanten Koeffizienten.
Beispiel 9.21:
9
Vor Ausführung dieser Lösungschritte ist mittels (178) zu überprüfen, ob tatsächlich eine exakte Differentialgleichung vorliegt.
16
9.3.1.1 Lösung der homogenen Differentialgleichung
Ähnlich wie im Abschnitt 9.2.5 wird zunächst die zu der inhomogenen Differentialgleichung (179) gehörige
homogene Differentialgleichung gelöst. Für die allgemeine Lösung dieser homogenen Differentialgleichung gilt
die folgende Aussage.
Die allgemeine Lösung einer homogenen linearen Differentialgleichung 2. Ordnung mit konstanten Koeffizienten (siehe (179), speziell mit g(x) ≡ 0) ist als Linearkombination zweier linear unabhängiger Lösungen
(Basislösungen) y1 (x) und y2 (x) darstellbar:
y(x) = C1 y1 (x) + C2 y2 (x)
(C1 , C2 ∈ R).
(180)
Die Lösungen y1 (x) und y2 (x) sind linear unabhängig, wenn gilt:
y1 (x) y2 (x) 6= 0
W (y1 , y2 ) = 0
(W (y1 , y2 ) heißt Wronski-Determinante).
y1 (x) y20 (x) Diese Lösungen bilden dann ein Fundamentalsystem der Differentialgleichung (179).
Zum Auffinden eines solchen Fundamentalsystems wird ein Lösungsansatz der Form y = Ceλx mit dem
zunächst unbekannten Parameter λ verwendet (C sei konstant). Nach Einsetzen dieser Funktion y und ihrer
Ableitungen y 0 = Cλeλx , y 00 = Cλ2 eλx in die zu lösende Differentialgleichung y 00 + ay 0 + by = 0 entsteht
die Gleichung
Cλ2 eλx + a Cλeλx + b Ceλx = 0 .
Nach Division durch Ceλx (unter der Voraussetzung C 6= 0 ist dieser Ausdruck von Null verschieden) ergibt sich
eine bezüglich λ quadratische Gleichung, mit deren Hilfe linear unabhängige Lösungen der Differentialgleichung
ermittelt werden können.
Die Gleichung
λ2 + aλ + b = 0
(181)
heißt charakteristische Gleichung der Differentialgleichung y 00 + ay 0 + by = 0.
Bezüglich der Lösungsmenge der Gleichung (181) sind die folgenden Fälle zu unterscheiden:
1. Fall: zwei verschiedene reelle Lösungen λ1 , λ2 der charakteristischen Gleichung
⇒ y1 = eλ1 x und y2 = eλ2 x bilden ein Fundamentalsystem der Differentialgleichung.
2. Fall: zwei gleiche reelle Lösungen λ1 = λ2 = −
a
der charakteristischen Gleichung
2
⇒ y1 = eλ1 x und y2 = x · eλ1 x erfüllen die Differentialgleichung und bilden ein Fundamentalsystem der Differentialgleichung.
3. Fall: zwei konjugiert-komplexe Lösungen λ1 = α + jβ , λ2 = α − jβ der charakteristischen Gleichung
(α, β ∈ R, β 6= 0):
Zunächst können die (komplexwertigen) Lösungen: e(α+jβ)x und e(α−jβ)x gebildet werden.
Mit e(α+jβ)x = eαx · e jβx = eαx · [cos(βx) + j sin(βx)] (und analog für e(α−jβ)x ) erhält man die
reellen Lösungen y1 = eαx sin(βx) und y2 = eαx cos(βx). Diese bilden ein Fundamentalsystem der
Differentialgleichung.
Die Aussage, dass die Lösungen y1 und y2 in den genannten Fällen jeweils linear unabhängig sind (d.h. ein
Fundamentalsystem bilden), lässt sich mit Hilfe der Wronski-Determinante rechnerisch leicht begründen.
Beispielsweise gilt im 1. Fall:
y1 y2 eλ1 x
eλ2 x W (y1 , y2 ) = 0
=
= (λ2 − λ1 )eλ1 x eλ2 x 6= 0 , da λ1 6= λ2 .
y1 y20 λ1 eλ1 x λ2 eλ2 x Zur Ermittlung der allgemeinen Lösung einer homogenen linearen Differentialgleichung mit konstanten Koeffizienten sind somit die folgenden Arbeitsschritte erforderlich.
17
Berechnung der allgemeinen Lösung der Differentialgleichung y 00 + ay 0 + by = 0
1) Aufstellen der charakteristischen Gleichung λ2 + aλ + b = 0
2) Lösen der charakteristischen Gleichung und Aufstellen des Fundamentalsystems {y1 (x), y2 (x)}
der Differentialgleichung entsprechend der Fallunterscheidung (siehe vorige Seite)
3) Bilden einer Linearkombination der Lösungen y1 (x) und y2 (x) gemäß (180)
Beispiel 9.22:
9.3.1.2 Lösung der inhomogenen Differentialgleichung
Die allgemeine Lösung der Differentialgleichung (179) ist darstellbar in der Form
y(x) = yh (x) + yp (x)
(vgl. auch (173) im Fall einer linearen Differentialgleichung 1. Ordnung).
Ähnlich wie bei linearen Differentialgleichungen 1. Ordnung mit konstanten Koeffizienten kann zur Ermittlung
einer partikulären Lösung der inhomogenen Differentialgleichung auf spezielle Ansätze zurückgegriffen werden,
wenn die Störfunktion z.B. eine Exponentialfunktion, ein Polynom oder eine trigonometrische Funktion ist.
Zuerst wird die Vorgehensweise bei einem solchen Lösungsweg beschrieben und anschließend werden mögliche
Ansätze aufgezählt.
Lösung linearer Differentialgleichungen 2. Ordnung mit konstanten Koeffizienten bei Vorliegen
spezieller Störfunktionen
1) Die allgemeine Lösung yh der zugehörigen homogenen Differentialgleichung y 00 + ay 0 + by = 0
wird berechnet (gemäß der im Abschnitt 9.3.1.1 beschriebenen Vorgehensweise, siehe oben).
2) Um eine partikuläre Lösung yp der inhomogenen Differentialgleichung (179) zu finden, wird ein Ansatz
in Form einer Funktion, die im Wesentlichen dem Typ der Störfunktion entspricht, verwendet
(häufig verwendete Ansätze: siehe nächste Seite).
3) Die allgemeine Lösung y der Gleichung (179) ergibt sich als: y = yh + yp .
18
Übersicht über Ansätze für die partikuläre Lösung yp der inhomogenen Differentialgleichung
y 00 + ay 0 + by = g(x)
Störfunktion g(x)
Lösungsansatz für yp (x)
Polynom vom Grad n
g(x) = Pn (x)
falls b 6= 0, d.h.: 0 ist keine Lösung der charakteristischen
Gleichung
yp = x · Qn (x) falls a 6= 0, b = 0, d.h.: 0 ist eine einfache Lösung
der charakteristischen Gleichung
2
yp = x · Qn (x) falls a = b = 0, d.h.: 0 ist eine doppelte Lösung
der charakteristischen Gleichung
Qn (x): Polynom vom Grad n
Parameter: Koeffizienten des Polynoms Qn (x)
Exponentialfunktion
g(x) = decx (c, d ∈ R)
yp = A · ecx
falls c keine Lösung der charakteristischen Gleichung
cx
yp = Ax · e
falls c eine einfache Lösung der charakteristischen Gleichung
2
cx
yp = Ax · e falls c eine doppelte Lösung der charakteristischen Gleichung
Parameter: jeweils A
Sinusfunktion
g(x) = d1 sin(βx) (d1 , β ∈ R)
oder
Falls jβ keine Lösung der charakteristischen Gleichung:
yp = A · sin(βx) + B · cos(βx)
oder yp = C · sin(βx + ϕ)
Kosinusfunktion
g(x) = d2 cos(βx) (d2 , β ∈ R)
oder Linearkombination
aus beiden Funktionen
Falls jβ eine Lösung der charakteristischen Gleichung:
yp = x [A · sin(βx) + B · cos(βx)]
oder yp = Cx · sin(βx + ϕ)
Parameter: jeweils A, B bzw. C, ϕ
g(x) = ecx · Pn (x)
(Pn (x): Polyn. vom Grad n,
c ∈ R)
yp = ecx · Qn (x)
falls c keine Lösung der charakteristischen Gleichung
cx
yp = x · e · Qn (x) falls c eine einfache Lösung der charakterist. Gleichung
yp = x2 · ecx · Qn (x) falls c eine doppelte Lösung der charakterist. Gleichung
yp = Qn (x)
Qn (x): Polynom vom Grad n
Parameter: Koeffizienten dieses Polynoms
g(x) = ecx · sin(βx)
oder
Falls c + jβ keine Lösung der charakteristischen Gleichung:
yp = ecx · [A sin(βx) + B cos(βx)]
g(x) = ecx · cos(βx)
(c, β ∈ R)
Falls c + jβ eine Lösung der charakteristischen Gleichung:
yp = x · ecx · [A sin(βx) + B cos(βx)]
oder Linearkombination
Parameter: jeweils A, B
g(x) = Pn (x) · sin(βx)
oder
Falls jβ keine Lösung der charakteristischen Gleichung:
yp = Qn (x) · sin(βx) + Rn (x) · cos(βx)
g(x) = Pn (x) · cos(βx)
(Pn (x): Polyn. vom Grad n,
Falls jβ eine Lösung der charakteristischen Gleichung:
yp = x · [Qn (x) · sin(βx) + Rn (x) · cos(βx)]
β ∈ R)
Qn (x), Rn (x): Polynome vom Grad n
Parameter: Koeffizienten dieser Polynome
Hinweise zur obigen Tabelle:
- Besteht die Störfunktion g(x) aus mehreren additiven Störgliedern, so erhält man den Lösungsansatz für yp
als Summe der Lösungsansätze für die Einzelglieder.
- Die Fälle, in denen c (bzw. jβ oder c + jβ) eine Lösung der charakteristischen Gleichung ist, entsprechen der
Situation, dass die Störfunktion in der allgemeinen Lösung der homogenen Differentialgleichung vorkommt.
Man spricht in derartigen Fällen auch von Resonanz.
Beispiel 9.23:
19
Bemerkungen:
- Sind zu der Differentialgleichung (179) zusätzlich Anfangsbedingungen (AB) vorgegeben, so bleiben diese
zunächst unberücksichtigt. Erst nach Berechnung der allgemeinen Lösung der Differentialgleichung werden
diese eingearbeitet, d.h. aus diesen AB werden Bedingungsgleichungen für die Konstanten C1 und C2 (siehe
(180)) in der allgemeinen Lösung aufgestellt und anschließend gelöst.
- Wenn eine inhomogene lineare Differentialgleichung 2. Ordnung mit konstanten Koeffizienten zu lösen ist,
bei der die Störfunktion nicht die in der obigen Tabelle aufgeführte Form hat, kann zum Auffinden einer partikulären Lösung yp die Methode der Variation der Konstanten angewendet werden. Dabei wird nach Ermittlung
des Fundamentalsystems {y1 (x), y2 (x)} für die zugehörige homogene Differentialgleichung ein Ansatz in der
Form yp = c1 (x)y1 + c2 (x)y2 aufgestellt (für weitere Details siehe z.B.: G. M ERZIGER , G. M ÜHLBACH ,
D. W ILLE , T H . W IRTH. Formeln + Hilfen zur höheren Mathematik, 7. Auflage, S. 169).
9.3.1.3 Anwendungsbeispiele für lineare Differentialgleichungen 2. Ordng. mit konstanten Koeffizienten
Beispiel 9.24: Differentialgleichung einer mechanischen Schwingung (Schwingungsgleichung)10
Das betrachtete System besteht aus einer Masse m, einer dem
Hookeschen Gesetz genügenden elastischen Feder und einer
Dämpfungsvorrichtung (wesentlicher Unterschied zu der im
Beispiel 9.3 betrachteten Situation).
Annahme:
Feder und Dämpfungskolben seien masselos.
Mit x = x(t) wird die Auslenkung der Feder aus der Gleichgewichtslage (Ruhelage) zur Zeit t (t ≥ 0) bezeichnet.
elast. Feder
mX
XX
Dämpfungsvorrichtg.
Auf die Masse m wirken die folgenden Kräfte ein:
- Rückstellkraft der Feder: F1 = −cx (c: Federkonstante; c > 0)
- Dämpfungskraft, proportional zur Geschwindigkeit v = ẋ: F2 = −bv = −bẋ (b: Dämpferkonstante)
- eine von außen einwirkende, meist zeitabhängige Kraft: F3 = F (t)
Nach dem Newtonschen Grundgesetz der Mechanik gilt:
ma = F1 + F2 + F3 ⇒ mẍ = −cx − bẋ + F (t)
Das schwingungsfähige System wird somit durch die folgende lineare Differentialgleichung 2. Ordnung mit
konstanten Koeffizienten beschrieben:
mẍ + bẋ + cx = F (t) .
Diese Gleichung wird auch als Schwingungsgleichung der Mechanik bezeichnet.
Bei mechanischen Schwingungen werden die folgenden speziellen Schwingungstypen unterschieden:
1. freie Schwingungen
Das System unterliegt keiner äußeren Kraft, d.h. es gilt: F (t) = 0. Dabei wird noch die folgende Unterscheidung getroffen:
a) freie ungedämpfte Schwingung
In der Schwingungsgleichung ist b = 0 zu setzen, d.h. man erhält die Gleichung
mẍ + cx = 0
zur Beschreibung dieses Schwingungstyps.
Die allgemeine Lösung dieser Differentialgleichung lautet (siehe dazu Abschnitt 9.3.1.1):
x(t) = C1 sin(ω0 t) + C2 cos(ω0 t) mit ω02 =
10
c
m
und C1 , C2 ∈ R.
Quelle: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 2, 12. Auflage (2009), S. 417-418
20
b) freie gedämpfte Schwingung
Dieser Schwingungstyp wird durch die Gleichung
mẍ + bẋ + cx = 0 (b 6= 0) bzw.
ẍ + 2δ ẋ +
ω02 x
=0
b
c
2
2δ = , ω0 =
m
m
beschrieben. Die Größe δ wird als Dämpfungsfaktor oder Abklingkonstante und die Größe ω0 als Eigenoder Kennkreisfrequenz bezeichnet.
Bei freien gedämpften Schwingungen wird noch unterschieden:
δ < ω0 (schwache Dämpfung):
Es handelt sich um eine Schwingung mit abnehmender Amplitude, siehe dazu Bild 9.2a). Die allgemeine
Lösung der zugehörigen Schwingungsgleichung lautet (siehe dazu auch Abschnitt 9.3.1.1):
q
x(t) = e−δt · [C1 sin(βt) + C2 cos(βt)] mit β = ω02 − δ 2 und C1 , C2 ∈ R
(wegen δ < ω0 gilt: β ∈ R, β > 0).
δ = ω0 (aperiodischer Grenzfall):
Es findet keine Schwingung im eigentlichen Sinne statt. Das System bewegt sich aperiodisch auf die
Gleichgewichtslage zu, siehe dazu Bild 9.2b). In diesem Fall hat die Schwingungsgleichung die allgemeine Lösung
x(t) = e−δt · (C1 + C2 t)
mit C1 , C2 ∈ R.
δ > ω0 (starke Dämpfung, Kriechfall):
Auch hier liegt ein aperiodisches Verhalten vor, das System bewegt sich im Laufe der Zeit asymptotisch
auf die Gleichgewichtslage zu. Dies geschieht jedoch langsamer als im aperiodischen Grenzfall, siehe
dazu Bild 9.2c). Die allgemeine Lösung der Schwingungsgleichung lautet in diesem Fall:
q
x(t) = C1 eα1 t + C2 eα2 t mit α1,2 = −δ ± δ 2 − ω02 und C1 , C2 ∈ R
(wegen δ > ω0 gilt: α1,2 ∈ R und α1,2 < 0).
x(t)
6
x(t)
6
-
-
t
x(t)
t
δ = 0.25, ω0 = 3.5
δ = ω0 = 1.5
Bild 9.2a)
Bild 9.2b)
6
-
t
δ = 1.5, ω0 = 0.9
Bild 9.2c)
Hinweise:
- Wenn zusätzlich zu der Schwingungsgleichung noch Anfangsbedingungen (Auslenkung und Geschwindigkeit zum Zeitpunkt t = 0) vorgegeben sind, können die Werte der Konstanten C1 und C2 in der
allgemeinen Lösung bestimmt werden, d.h. man gelangt dann zu einer speziellen Lösung der Schwingungsgleichung.
21
- In den Bildern 9.2b) und 9.2c) ist jeweils die Situation dargestellt, dass die Funktion x(t) genau eine
Nullstelle besitzt. In Abhängigkeit von den Anfangsbedingungen kann auch der Fall eintreten, dass x(t)
keine Nullstelle hat. Für eine ausführliche Diskussion dieser Problematik sei auf die folgende Literaturstelle verwiesen: A. F ETZER , H. F R ÄNKEL. Mathematik 2: Lehrbuch für ingenieurwissenschaftliche
Studiengänge. Springer, 6. Auflage, 2009, S. 436-439.
2. erzwungene Schwingungen
Das System unterliegt einer von außen einwirkenden zeitabhängigen periodischen Kraft F (t) = F0 · sin(ωt)
mit der Erregerkreisfrequenz ω:
mẍ + bẋ + cx = F0 · sin(ωt).
In diesem Fall liegt also eine inhomogene Differentialgleichung vor. Auch bei erzwungenen Schwingungen
wird zusätzlich unterschieden, ob es sich um eine ungedämpfte Schwingung handelt oder ob eine Dämpfung
vorliegt.
a) erzwungene ungedämpfte Schwingung
In der o.g. Schwingungsgleichung ist b = 0 zu setzen. Wenn die Erregerkreisfequenz ω mit der Eigenq
c
kreisfrequenz ω0 =
des Systems übereinstimmt, dann tritt Resonanz ein.
m
b) erzwungene gedämpfte Schwingung
In diesem Fall gilt b 6= 0. Detaillierte Informationen bezüglich erzwungener Schwingungen bei schwacher Dämpfung (d.h. δ < ω0 ) findet man z.B. in: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 2, 12. Auflage, 2009, S. 435-443.
Beispiel 9.25: siehe Übung
Beispiel 9.26: Schwingungsgleichung eines elektrischen Reihenschwingkreises
Die Differentialgleichung des elektrischen Reihenschwingkreises lautet:
L
d2 i
di
1
dua
+R + i=
,
2
dt
dt C
dt
oder
d2 i
di
1 dua
+ 2δ
+ ω02 i =
2
dt
dt
L dt
mit δ =
R
1
, ω0 = √
,
2L
LC
wobei i = i(t) die Stromstärke, R den ohmschen Widerstand, L die Induktivität, C die Kapazität und ua = ua (t)
die von außen angelegte Spannung bezeichnet.
Der elektrische Reihenschwingkreis ist das elektrische Analogon“ zum Feder-Masse-Schwinger.
”
9.3.2
Lineare Differentialgleichungen n-ter Ordnung (n ≥ 3) mit konstanten Koeffizienten
Definition 9.6:
Eine Differentialgleichung n-ter Ordnung vom Typ
y (n) + an−1 y (n−1) + . . . + a1 y 0 + a0 y = g(x)
(a0 , a1 , . . . , an−1 ∈ R)
heißt lineare Differentialgleichung n-ter Ordnung mit konstanten Koeffizienten.
Beispiel 9.27:
22
(182)
Die Vorgehensweise beim Lösen solcher Differentialgleichungen ist weitestgehend analog zu den bereits betrachteten linearen Differentialgleichungen 2. Ordnung mit konstanten Koeffizienten (siehe Abschnitte 9.3.1.19.3.1.3). Auch jetzt wird zunächst wieder die zu (182) gehörige homogene Differentialgleichung betrachtet.
Die allgemeine Lösung der homogenen Differentialgleichung y (n) + an−1 y (n−1) + . . . + a1 y 0 + a0 y = 0
ist in der Form
y(x) = C1 y1 (x) + C2 y2 (x) + . . . + Cn yn (x)
(C1 , C2 , . . . , Cn ∈ R)
(183)
darstellbar, wobei die Funktionen y1 (x), y2 (x), . . . , yn (x) ein Fundamentalsystem (d.h. ein System linear
unabhängiger Lösungen) bilden.
Das Auffinden eines Fundamentalsystems erfolgt wiederum durch Lösung der charakteristischen Gleichung.
Diese lautet:
λn + an−1 λn−1 + . . . + a1 λ + a0 = 0 .
(184)
Da es sich bei (184) um eine Gleichung n-ter Ordnung (n ≥ 3) in λ handelt, ist die Ermittlung der Lösungen
dieser Gleichung meist schwieriger als bei der charakteristischen Gleichung für Differentialgleichungen 2. Ordnung (dort liegt stets eine quadratische Gleichung in λ vor).
Bezüglich der Lösungsmenge der Gleichung (184) sind die folgenden Fälle zu unterscheiden:
1. Fall: Alle Lösungen sind reell und paarweise verschieden.
Fundamentalsystem der Differentialgleichung : y1 = eλ1 x , y2 = eλ2 x , . . . , yn = eλn x
allgemeine Lösung der Differentialgleichung : y = C1 eλ1 x + C2 eλ2 x + . . . + Cn eλn x
2. Fall: Es treten mehrfache reelle Lösungen auf.
Sei λ = α eine m-fache reelle Lösung der charakteristischen Gleichung,
d.h. λ1 = λ2 = . . . = λm = α, so gehören zu hierzu die m linear unabhängigen Lösungen:
y1 = eαx , y2 = x · eαx , y3 = x2 · eαx , . . . , ym = xm−1 · eαx .
Die allgemeine Lösung der Differentialgleichung enthält daher die folgenden Summanden:
C1 eαx + C2 x · eαx + C3 x2 · eαx + . . . + Cm xm−1 · eαx .
3. Fall Es treten konjugiert-komplexe Lösungen auf.
Sei λ1,2 = α ± jβ eine (einfache) konjugiert-komplexe Lösung der charakteristischen Gleichung, dann
sind die (reellwertigen) Funktionen y1 = eαx · sin(βx) und y2 = eαx · cos(βx) linear unabhängige
Lösungen der Differentialgleichung. In der allgemeinen Lösung der Differentialgleichung liefern sie
den Beitrag: C1 · eαx · sin(βx) + C2 · eαx · cos(βx) = eαx [C1 sin(βx) + C2 cos(βx)] .
Die Lösung der inhomogenen Differentialgleichung (182) besitzt die Darstellung y = yh + yp . Eine partikuläre
Lösung yp der Differentialgleichung kann wiederum mittels eines geeigneten Ansatzes gefunden werden, wenn
die Störfunktion g(x) z.B. eine Exponentialfunktion, ein Polynom oder eine trigonometrische Funktion ist11 .
Mögliche Lösungsansätze ist auf der nächsten Seite dargestellt.
11
Wenn dies nicht zutrifft, kommt die Methode der Variation der Konstanten zur Anwendung, vgl. dazu die Bemerkung am Ende des
Abschnitts 9.3.1.2.
23
Ansätze für die partikuläre Lösung yp der inhomogenen Differentialgleichung
y (n) + an−1 y (n−1) + . . . + a1 y 0 + a0 y = g(x), n ≥ 3
Störfunktion g(x)
Polynom vom Grad k
g(x) = Pk (x)
Lösungsansatz für yp (x)
yp = Qk (x)
falls a0 6= 0, d.h.: 0 ist keine Lösung der charakt. Gleichg.
`
yp = x · Qk (x) falls a0 = a1 = . . . = a`−1 = 0 (` ≥ 1),
d.h.: 0 ist eine `-fache Lösung der charakt. Gleichung
Qk (x): Polynom vom Grad k
Parameter: Koeffizienten des Polynoms Qk (x)
Exponentialfunktion
g(x) = decx (c, d ∈ R)
yp = A · ecx
falls c keine Lösung der charakteristischen Gleichung
yp = A · xm · ecx falls c eine m-fache Lösung der charakt. Gleichung
Parameter: jeweils A
Sinusfunktion
g(x) = d1 sin(βx) (d1 , β ∈ R)
oder
Kosinusfunktion
g(x) = d2 cos(βx) (d2 , β ∈ R)
oder Linearkombination
Falls jβ keine Lösung der charakteristischen Gleichung:
yp = A · sin(βx) + B · cos(βx)
Falls jβ eine m-fache Lösung der charakteristischen Gleichung:
yp = xm [A · sin(βx) + B · cos(βx)]
Parameter: jeweils A, B
g(x) = ecx · Pk (x)
(Pk (x): Polyn. vom Grad k,
c ∈ R)
yp = ecx · Qk (x)
falls c keine Lösung der charakteristischen Gleichg.
m
cx
yp = x · e · Qk (x) falls c eine m-fache Lösung der charakt. Gleichg.
Qk (x): Polynom vom Grad k
Parameter: Koeffizienten dieses Polynoms
g(x) = ecx · sin(βx)
oder
Falls c + jβ keine Lösung der charakteristischen Gleichung:
yp = ecx · [A sin(βx) + B cos(βx)]
g(x) = ecx · cos(βx)
(c, β ∈ R)
Falls c + jβ eine m-fache Lösung der charakteristischen Gleichung:
yp = xm · ecx · [A sin(βx) + B cos(βx)]
oder Linearkombination
Parameter: jeweils A, B
g(x) = Pk (x) · sin(βx)
oder
Falls jβ keine Lösung der charakteristischen Gleichung:
yp = Qk (x) · sin(βx) + Rk (x) · cos(βx)
g(x) = Pk (x) · cos(βx)
(Pk (x): Polyn. vom Grad k,
Falls jβ eine m-fache Lösung der charakteristischen Gleichung:
yp = xm · [Qk (x) · sin(βx) + Rk (x) · cos(βx)]
β ∈ R)
Qk (x), Rk (x): Polynome vom Grad k
Parameter: Koeffizienten dieser Polynome
Hinweis zur obigen Tabelle:
Besteht die Störfunktion g(x) aus mehreren additiven Störgliedern, so erhält man den Lösungsansatz für yp als
Summe der Lösungsansätze für die Einzelglieder.
Beispiel 9.28:
Beispiel 9.29:
24
Abschließend wird eine Anwendungssituation für lineare Differentialgleichungen 4. Ordnung mit konstanten
Koeffizienten vorgestellt.
Beispiel 9.30: Eulersche Knicklast für einen Stab12
Ein elastischer Stab der Länge l verlaufe in Richtung der x-Achse und sei an einem Ende eingespannt, an dem
anderen Ende gelenkig gelagert. Die konstante Biegesteifigkeit des Stabes sei α. In Richtung der Stabachse wirkt
eine Einzelkraft F . Dann genügt die Durchbiegung y(x) des Stabes für 0 < x < l der Differentialgleichung
r
F
(4)
2 00
y +µ y =0
mit µ =
.
α
Die Lösung dieser Differentialgleichung muss zudem die folgenden Randbedingungen erfüllen:
y(0) = 0 ,
y(l) = 0
(da an den Stabenden keine Durchbiegung vorliegt)
0
(da an dem eingespannten Ende die Tangente an die Biegelinie horizontal verläuft)
00
(da das Biegemoment Mb (x) = −αy 00 (x) an dem gelenkig gelagerten Stabende verschwindet).
y (0) = 0
y (l) = 0
Zur Berechnung der Durchbiegung des Stabes ist somit ein Randwertproblem (vgl. dazu auch Abschnitt 9.1.3)
zu lösen. Dazu sei bemerkt, dass dieses Randwertproblem stets (d.h. für jeden beliebigen Wert von µ) die triviale
Lösung y ≡ 0 hat, die jedoch aus praktischer Sicht nicht von Interesse ist. Dagegen existieren nichttriviale
Lösungen des Randwertproblems nur für bestimmte Werte von µ. Die zu dem kleinsten µ-Wert gehörige Kraft
wird als Eulersche Knicklast bezeichnet.
9.3.3
Lösung der Eulerschen Differentialgleichung durch Rückführung auf eine lineare Differentialgleichung mit konstanten Koeffizienten
Definition 9.7:
Eine Differentialgleichung der Form
an xn y (n) + an−1 xn−1 y (n−1) + . . . + a1 xy 0 + a0 y = g(x)
(a0 , a1 , . . . , an ∈ R, an 6= 0) (185)
wird als Eulersche Differentialgleichung bezeichnet.
Beispiel 9.31:
Offensichtlich handelt es sich bei der Eulerschen Differentialgleichung nicht um eine Differentialgleichung mit
konstanten Koeffizienten, da vor der i-ten Ableitung (0 ≤ i ≤ n) der gesuchten Funktion y(x) jeweils der
von x abhängige Koeffizient ai xi steht. Auf Grund der speziellen Struktur dieser Koeffizienten ist jedoch eine
Rückführung auf eine lineare Differentialgleichung mit konstanten Koeffizienten möglich.
Bei den weiteren Betrachtungen wird die Einschränkung x > 0 vorgenommen.
12
Quelle:W. L EUPOLD (Hrsg.). Mathematik - ein Studienbuch für Ingenieure (Band 2: Reihen - Differentialgleichungen - Analysis für
mehrere Variable - Stochastik), 2. Auflage (2006), S. 157-159
25
Vorgehensweise bei der Lösung Eulerscher Differentialgleichungen
Eine Eulersche Differentialgleichung kann für x > 0 durch die Substitution
y(x) = u(t)
mit
x = et
(186)
auf eine lineare Differentialgleichung n-ter Ordnung mit konstanten Koeffizienten zurückgeführt werden.
Dazu müssen noch die Terme x · y 0 , x2 · y 00 , . . . aus der Differentialgleichung (185) mit Hilfe der Funktion
u und ihrer Ableitungen (nach t) ausgedrückt werden. Es gilt:
x · y0 =
du
,
dt
x2 · y 00 =
d2 u du
−
,
dt2
dt
x3 · y 000 =
d3 u
d2 u
du
−
3
+2
3
2
dt
dt
dt
(187)
(Erläuterung zu diesen Beziehungen: siehe unten). Bei Bedarf sind weitere Produkte der Form xi · y (i) ,
4 ≤ i ≤ n, zu berechnen. Mit Hilfe der Beziehungen (187) werden die Terme x · y 0 , x2 · y 00 , . . . in der
Differentialgleichung (185) durch Ableitungen der Funktion u(t) ersetzt und die rechte Seite g(x) wird in
der Form g(et ) geschrieben. Dann entsteht eine lineare Differentialgleichung n-ter Ordnung mit konstanten
Koeffizienten a0 , a1 , . . . , an , deren Lösung die Funktion u(t) ist. Zur Lösung dieser Gleichung können
(bei passender Struktur der Störfunktion) die in den Abschnitten 9.3.1 bzw. 9.3.2 vorgestellten Methoden angewendet werden. Nach Berechnung von u(t) ist eine Rücksubstitution durchzuführen, um die Lösung y(x)
der Ausgangsgleichung zu erhalten (siehe dazu (186)).
Erläuterung zu (187):
Die Differentiation der Funktion u(t) = y(x(t)) nach der Kettenregel (siehe Abschnitt 5.3.1 im Skript zur
Vorlesung Mathematik 1) ergibt unter Beachtung von (186):
du
dy(x(t))
dy dx
=
=
·
= y 0 · et = y 0 · x .
dt
dt
dx dt
Nochmaliges Differenzieren bei zusätzlicher Anwendung der Produktregel liefert:
d2 u
d
du
= (y 0 · et ) = y 00 · (et )2 + y 0 · et = y 00 · x2 +
2
dt
dt
dt
⇒ x2 · y 00 =
d2 u du
−
.
dt2
dt
Beispiel 9.32:
Bemerkung:
Als Spezialfall wird nun die Eulersche Differentialgleichung (185) mit n = 1 betrachtet: a1 xy 0 + a0 y = g(x).
Unter der Voraussetzung x > 0 geht diese Gleichung nach Division durch (a1 x) über in: y 0 +
a0
a1 x
y=
g(x)
a1 x
.
Dabei handelt es sich um eine lineare Differentialgleichung 1. Ordnung (vgl. Formel (166)) für die gesuchte
Funktion y(x). Zur Lösung dieser Differentialgleichung kann die Methode der Variation der Konstanten (Formel (169)) angewendet werden, d.h. in dem vorliegenden Spezialfall ist es nicht erforderlich, die Substitution (186) durchzuführen.
26
9.4
Die Laplace-Transformation und ihre Anwendungen
9.4.1
Spezielle Funktionen
(I) Die Einheitssprungfunktion (Heaviside-Funktion)
Diese ist wie folgt definiert:
0 für t < 0
ε(t) =
1 für t ≥ 0 ,
ε 6
1 r
(188)
d.h. es handelt sich um eine stückweise konstante
Funktion, siehe Bild 9.3.
t
0
Bild 9.3
Diese Funktion findet Anwendung bei der Beschreibung von Einschaltvorgängen in technischen Sachverhalten (siehe nachfolgendes Beispiel).
Beispiel 9.33:
Die Funktion ε(t) besitzt die sog. Ausblendeigenschaft, d.h. mit Hilfe von ε(t) kann eine Funktion f (t) für
alle t aus einem gewissen Teilbereich des Definitionsbereiches gleich 0 gesetzt ( ausgeblendet“) werden.
”
Diese Eigenschaft wird im folgenden genauer erläutert.
Sei ε(t) die durch (188) gegebene Funktion und f (t) eine (beliebige) Funktion der Variablen t ∈ R.
Dann gilt:
[ε(t − a) − ε(t − b)] · f (t) = 0
für t < a und t ≥ b (a, b ∈ R und a < b) ,
(189)
[ε(t − a) − ε(t − b)] · f (t) = f (t) für a ≤ t < b ,
d.h. es entsteht eine Funktion, die im Intervall [a, b) gleich der ursprünglichen Funktion f (t) ist und sonst
verschwindet. Die unter (189) genannten Eigenschaften können folgendermaßen begründet werden. Es gilt:
0 für t − a < 0 , d.h. für t < a
(siehe Bild 9.4a)) sowie
ε(t − a) =
1 für t − a ≥ 0 , d.h. für t ≥ a
0 für t − b < 0 , d.h. für t < b
ε(t − b) =
(siehe Bild 9.4b)).
1 für t − b ≥ 0 , d.h. für t ≥ b
Damit ist ε(t − a) − ε(t − b) = 0 − 0 = 0 für t < a sowie ε(t − a) − ε(t − b) = 1 − 1 = 0 für t ≥ b ,
woraus sofort (189) (die erste Eigenschaft) folgt.
Weiterhin ist ε(t − a) − ε(t − b) = 1 − 0 = 1 für a ≤ t < b (siehe Bild 9.4c)), d.h. dort gilt:
[ε(t − a) − ε(t − b)] · f (t) = 1 · f (t) = f (t) , womit auch die zweite Eigenschaft aus (189) bestätigt ist.
6
6
6
ε(t − a)
1
r
0
a
Bild 9.4a)
t
ε(t − b)
1
r
0
b
Bild 9.4b)
27
t
ε(t − a) − ε(t − b)
1
r 0
a
r
b
Bild 9.4c)
t
(II) Die Diracsche δ-Funktion (Dirac-Stoß, Impulsfunktion)
Ein sehr kurzzeitig wirkender Impuls (z.B. Hammerschlag oder Stromstoß) kann durch einen Rechteckimpuls (vgl. dazu Bild 9.4c)), welcher zeitlich stark begrenzt ist und eine sehr große Amplitude besitzt,
beschrieben werden. Dies führt zu der folgenden Definition der δ-Funktion:
δ(t − t0 ) =
0 für t 6= t0
∞ für t = t0 ,
(190)
d.h. hier wird der Gesamtimpuls auf einen Zeitpunkt t = t0 konzentriert“.
”
Es sei bemerkt, dass es sich bei der δ-Funktion um eine verallgemeinerte Funktion handelt, denn für eine
Funktion im eigentlichen Sinne ist ja der Funktionswert ∞“ nicht möglich.
”
Es gelten die folgenden symbolischen Beziehungen:
Z∞
δ(t − t0 ) dt = 1 ,
−∞
Zb
δ(t − t0 )f (t) dt =
f (t0 ) für a ≤ t0 ≤ b
0
sonst
für eine auf (−∞, ∞) stetige Funktion f (t),
a
d.h. δ(t − t0 ) ordnet dieser Funktion ihren Wert bei t = t0 zu.
Für weitere Informationen über die δ-Funktion (z.B. die Darstellung dieser Funktion als eine Folge stetiger
Funktionen) sei auf die folgende Literaturstelle verwiesen:
W. P REUSS , G. W ENISCH (Hrsg.): Lehr- und Übungsbuch Mathematik für Elektro- und Automatisierungstechniker, 1998, S. 79-80.
9.4.2
Die Laplace-Transformation: Definition und Rechenregeln
Definition 9.8:
Sei f (t) eine reellwertige Funktion der reellen Variablen t, wobei f (t) = 0 für t < 0 gelte.
Die Laplace-Transformation von f (t) ist definiert durch:
Z∞
F (s) = L{f (t)} = e−st · f (t) dt mit s ∈ C .
(191)
0
Bezeichnungen: f (t) - Originalfunktion, F (s) - Bildfunktion (Laplace-Transformierte)
Die Menge der Originalfunktionen wird als Originalbereich, die Menge der Bildfunktionen als Bildbereich bezeichnet. Die Laplace-Transformation ist eine Funktionaltransformation, die einer Funktion der reellen Variablen t eine Funktion der komplexen Variablen s zuordnet13 . Der Zusammenhang zwischen der Originalfunktion f (t) und der Bildfunktion F (s) wird auch als Korrespondenz bezeichnet und durch f (t) ◦−−• F (s) symbolisiert.
Da es sich bei dem Integral in (191) um ein uneigentliches Integral (siehe Abschnitt 6.5 im Skript zur Vorlesung
Mathematik 2) handelt, muss noch geklärt werden, unter welchen Bedingungen dieses Integral konvergiert (und
damit die Laplace-Transformierte von f (t) überhaupt existiert).
Hinreichende Bedingungen für die Existenz der Laplace-Transformierten:
(I) Die Funktion f (t) ist stückweise stetig (d.h. sie kann aus endlich vielen stetigen Teilfunktionen“ zusam”
mengesetzt werden).
(II) Es existieren reelle Konstante α und M > 0 so, dass |f (t)| ≤ M · eαt gilt.
Die Laplace-Transformierte existiert dann für alle s mit Re(s) > α.
13
Manchmal wird bei der Definition der Laplace-Transformation auch die Variablenbezeichnung p anstelle von s verwendet.
28
Beispiel 9.34:
Die Laplace-Transformierte der Einheitssprungfunktion ε(t) (siehe (188)) ist zu berechnen.
Sei s ∈ C mit s = s1 + js2 . Mit f (t) = ε(t) erhält man nach Formel (191) und unter Berücksichtigung
der Gesetzmäßigkeiten für die Berechnung uneigentlicher Integrale (siehe dazu Abschnitt 6.5 im Lehrmaterial
Mathematik 2):
Z∞
F (s) = L{f (t)} = L{ε(t)} =
e
−st
Zc
· 1 dt = lim
0
1
= lim − · e−(s1 +js2 )t
c→∞
s
e
c→∞
−st
1
dt = lim − · e−st
c→∞
s
0
c
0
c
0
1 −s1 t −js2 t c
1
1
= lim − · e
·e
= − · lim (e−s1 c · e−js2 c ) + · 1 · 1
c→∞
s
s c→∞
s
0
1
1
1
= − · lim e−s1 c · lim e−js2 c + = , falls s1 = Re(s) > 0,
c→∞
s c→∞
s
s
denn dann gilt: limc→∞ e−s1 c = 0 (der Faktor limc→∞ e−js2 c ist stets beschränkt).
Beispiel 9.35:
0 für t < 0
Sei f (t) =
wobei a ∈ C mit a = α + jβ.
eat für t ≥ 0 ,
Dann wird die Laplace-Transformierte von f (t) wie folgt berechnet (es sei wiederum s = s1 + js2 ):
Z∞
−st
e
F (s) =
Z∞
· f (t) dt =
0
Z∞
at
· e dt =
0
= lim
c→∞
=
e
−st
−1 −(s−a)t
e
s−a
e
0
c
= lim
c→∞
0
−(s−a)t
Zc
dt = lim
c→∞
e−(s−a)t dt
0
−1 −(s1 −α)t −j(s2 −β)t
e
·e
s−a
c
0
−1
1
1
· lim (e−(s1 −α)c · e−j(s2 −β)c ) +
=
, falls s1 = Re (s) > α,
s − a c→∞
s−a
s−a
denn dann gilt: limc→∞ e−(s1 −α)c = 0 (der Faktor limc→∞ e−j(s2 −β)c ist stets beschränkt).
Unter der inversen Laplace-Transformation (Rücktransformation) versteht man die Berechnung der Originalfunktion f (t) aus einer gegebenen Bildfunktion F (s).
Formel für die inverse Laplace-Transformation (Rücktransformation)
−1
f (t) = L
1
{F (s)} =
2πj
c+j∞
Z
est · F (s) dt
c−j∞
Da die Berechnung der Laplace-Transformierten bzw. ihrer Inversen mit Hilfe der genannten Formeln nicht unbedingt einfach ist, greift man häufig auf die Korrespondenztabellen für die Laplace-Transformation zurück.
Dort kann für bestimmte Funktionstypen f (t) sofort die Bildfunktion F (s) abgelesen werden und umgekehrt
kann für bestimmte Bildfunktionen F (s) sofort die Originalfunktion f (t) gefunden werden. Derartige Tabellen
sind in Formelsammlungen zu finden, siehe z.B.:
G. M ERZIGER , G. M ÜHLBACH , D. W ILLE , T H . W IRTH. Formeln + Hilfen zur höheren Mathematik,
7. Auflage, S. 125
oder: H.-J. BARTSCH . Taschenbuch mathematischer Formeln für Ingenieure und Naturwissenschaftler,
23. Auflage (2014), S. 639ff.
Die nachfolgende Tabelle (siehe nächste Seite) enthält spezielle Korrespondenzen der Laplace-Transformation.
Einige dieser Korrespondenzen resultieren unmittelbar aus den zuvor genannten Rechenregeln (z.B. dem Verschiebungssatz) bzw. den zugehörigen Umkehrtransformationen.
29
Einige spezielle Korrespondenzen der Laplace-Transformation
Mit ε(t) ist die Einheitssprungfunktion bezeichnet, mit δ(t) der Dirac-Stoß (Impulsfunktion).
Es gilt a, b ∈ R und a > 0 , Re(s) sei hinreichend groß.
f (t)
F (s) = L{f (t)}
1
s
ε(t)
ε(t − a)
δ(t)
e−as
s+b
ε(t − a) · e b(a−t)
e−as
s
1
δ(t − a)
F (s) = L{f (t)}
f (t)
1
· ε(t − a) · (1 − e b(a−t) ) (b 6= 0)
b
e−as
s(s + b)
ε(t − a) · (t − a) · e b(a−t)
e−as
(s + b)2
1
· ε(t − a) · sin[b(a − t)] (b 6= 0)
b
e−as
Hinweis: In einigen Formelsammlungen ist die Korrespondenz 1 ◦−−•
1
s
e−as
+ b2
s2
zu finden. Da bei der Originalfunkti-
on f (t) stets f (t) = 0 für t < 0 vorausgesetzt wird, entspricht dies genau der Korrespondenz ε(t) ◦−−•
1
s
in der
obigen Tabelle (vgl. auch Formel (188)).
Wenn eine gegebene, echt gebrochenrationale Bildfunktion jedoch nicht in der Korrespondenztabelle zu finden
ist, sollte diese Funktion in reelle Partialbrüche (siehe dazu : Skript Mathematik 2, Abschnitt 6.2.3) zerlegt werden. Anschließend kann für jeden Summanden der Partialbruchzerlegung die Rücktransformation vorgenommen
werden und die gesuchte Originalfunktion entsteht als Summe dieser Teilresultate.
Eine Alternative zu dieser Vorgehensweise bietet (unter gewissen Voraussetzungen) die Anwendung der Heaviside’schen Formel.
Heaviside’sche (Umkehr-)Formel (oder: Heaviside’scher Entwicklungssatz)
Gegeben sei eine echt gebrochenrationale Bildfunktion:
F (s) =
P (s)
Q(s)
(P (s) : Zählerpolynom, Q(s) : Nennerpolynom).
Unter der Voraussetzung, dass das Nennerpolynom Q(s) nur einfache Nullstellen besitzt, kann die zu F (s)
gehörige Originalfunktion f (t) für t ≥ 0 nach der folgenden folgenden Formel berechnet werden:
n
X
P (sk ) sk t
f (t) =
·e
Q0 (sk )
(sk : Nullstellen des Polynoms Q(s); k = 1, 2, . . . , n).
k=1
Die Anwendung dieser Formel erfordert also nur die Ermittlung der Nullstellen sk des Nennerpolynoms Q(s)
sowie die Berechnung der Werte der Polynome P (s) und Q0 (s) an den Stellen sk , k = 1, 2, . . . , n.
Im weiteren werden Rechenregeln für die Laplace-Transformation angegeben. Einige dieser Regeln finden unmittelbar Anwendung bei der Lösung von AWP für Differentialgleichungen (siehe Abschnitt 9.4.3).
30
Rechenregeln für die Laplace-Transformation
1) Linearität der Laplace-Transformation
L{af1 (t) + bf2 (t)} = aL{f1 (t)} + bL{f2 (t)} = aF1 (s) + bF2 (s)
(a, b ∈ C)
2) Verschiebungssatz
L{f (t − t0 )} = e−st0 F (s)
(t0 ≥ 0)
3) Dämpfungssatz
L{e−at f (t)} = F (s + a)
(a ∈ C)
4) Faltungssatz
Sei f (t) das Faltungsprodukt zweier Originalfunktionen, d.h.
Zt
f (t) = (f1 ∗ f2 )(t) =
f1 (t − τ ) · f2 (τ ) dτ .
0
Dann gilt :
bzw.
L{f (t)} = L{f1 (t)} · L{f2 (t)} = F1 (s) · F2 (s)
L−1 {F1 (s) · F2 (s)} = (f1 ∗ f2 )(t)
5) Integrationssatz für die Originalfunktion
Z t
1
f (τ ) dτ = F (s)
L
s
0
6) Differentiationssatz für die Originalfunktion
L{f 0 (t)} = s · F (s) − f (+0) mit f (+0) = lim f (t) (Anfangswert der Originalfunktion)
t→0+0
L{f 00 (t)} = s2 · F (s) − s · f (+0) − f 0 (+0)
L{f (n) (t)} = sn · F (s) − sn−1 · f (+0) − sn−2 · f 0 (+0) − . . . − s · f (n−2) (+0) − f (n−1) (+0)
Beispiel 9.36:
31
9.4.3
Anwendung der Laplace-Transformation zur Lösung von AWP für gewöhnliche Differentialgleichungen
Es wird vorausgesetzt, dass eine lineare Differentialgleichung mit konstanten Koeffizienten (vgl. Abschnitt 9.3)
gelöst werden soll. Dazu seien entsprechende Anfangsbedingungen (AB) vorgegeben. Die gesuchte Lösung y
des AWP sei eine Funktion der Variablen t ( Zeitfunktion“).
”
Vorgehensweise bei der Lösung von AWP für gewöhnliche Differentialgleichungen
mittels Laplace-Transformation
1) Anwendung der Laplace-Transformation auf die Differentialgleichung
(Linearität und Differentiationssatz nutzen)
2) Auflösung der entstandenen Gleichung nach Y (s) (Laplace-Transformierte der gesuchten Lösung y(t))
3) Rücktransformation (inverse Laplace-Transformation): y(t) = L−1 {Y (s)},
ggf. nach Partialbruchzerlegung des Ausdrucks für Y (s)
Die soeben beschriebene Vorgehensweise lässt sich wie folgt schematisch darstellen:
Differentialgleichung
+ Anfangswerte
⇓
gesuchte Zeitfunktion
y(t)
Laplace-Transf.
lineare Gleichung
für Y (s)
inverse Laplace-Transf.
⇒
⇑
Bildfunktion
Y (s)
Bei der Lösung eines AWP mittels Laplace-Transformation werden die Anfangswerte sofort berücksichtigt, wohingegen sie bei den im Abschnitt 9.3 beschriebenen Lösungsverfahren zunächst unberücksichtigt bleiben und
erst nach Ermittlung der allgemeinen Lösung eingearbeitet werden.
Beispiel 9.37:
32
Beispiel 9.38: Ausschaltvorgang in einem RL-Schaltkreis
An eine Spule mit dem Ohmschen Widerstand R und der Induktivität L wird eine konstante Spannung U angelegt
(d.h. ein Gleichstrom der Stärke I = U/R fließt). Zum Zeitpunkt t = 0 wird die Spule durch Umlegen eines
Schalters von der Spannungsquelle getrennt und mit dem Ohmschen Widerstand R0 verbunden.
Gesucht ist der zeitliche Verlauf der Stromstärke im Zeitintervall t ≥ 0.
Das zugehörige AWP lautet:
di (R + R0 )
+
i = 0,
dt
L
i(0) =
U
R
di 1
+ i = 0,
dt τ
i(0) =
U
R
bzw. mit τ := L/(R + R0 ) :
Mit L
di
dt
= s·I(s)−i(0) = s·I(s)−
U
und L{0} = 0 ergibt die Anwendung der Laplace-Transformation
R
auf die Differentialgleichung :
s · I(s) −
U
1
+ I(s) = 0 .
R τ
Die Auflösung dieser Gleichung nach I(s) ergibt:
1
U
U
1
= 0 ⇒ I(s) =
·
I(s) · s +
−
.
τ
R
R s + τ1
n 1 o
1
= eat , und mit a := − ist dann die Lösung des AWP:
Laut Korrespondenztabelle gilt: L−1
s−a
i(t) =
U
R
−
τ
t
·e τ
(t ≥ 0) .
Beispiel 9.39:
Bemerkung:
Bisher wurden nur AWP für Differentialgleichungen 1. oder 2. Ordnung mit Hilfe der Laplace-Transformation
gelöst. Allgemein erfolgt die Lösung von AWP für lineare Differentialgleichungen n-ter Ordnung mit konstanten
Koeffizienten unter Anwendung des Differentiationssatzes für sämtliche Ableitungen y (n) , y (n−1) , . . . , y 0 .
33
9.4.4
Anwendung der Laplace-Transformation in der Regelungstechnik (lineare Übertragungssysteme)
Da sich Übertragungssysteme in der Regelungstechnik durch Differentialgleichungen beschreiben lassen, wird
die Laplace-Transformation für derartige Problemstellungen häufig angewendet. Zunächst werden einige Grundbegriffe14 zusammengestellt.
Lineare Übertragungssysteme: einige Grundbegriffe
- zeitkontinuierliches Übertragungssystem:
wandelt ein zeitlich kontinuierliches Eingangssignal x(t), t ∈ R, in ein Ausgangssignal y(t) um;
symbolisch: y(t) = S{x(t)}
(z.B.: Verstärkerschaltung zur Vergrößerung der Signalamplitude)
- lineares Übertragungssystem:
Für alle Eingangssignale x1 (t), x2 (t) und alle a1 , a2 ∈ C gilt:
S{a1 x1 (t) + a2 x2 (t)} = a1 S{x1 (t)} + a2 S{x2 (t)}
- zeitinvariantes Übertragungssystem:
Für alle Eingangssignale x(t) und beliebiges t0 ∈ R folgt aus y(t) = S{x(t)}: y(t − t0 ) = S{x(t − t0 )}
(d.h. bei einer Verschiebung des Eingangssignals um eine Zeitspanne t0 verschiebt sich das Ausgangssignal entsprechend)
- LTI-System:
lineares und zeitinvariantes Übertragungssystem (linear time invariant)
- Impulsantwort eines Systems:
das Ausgangssignal, welches durch das Eingangssignal x(t) = δ(t) (δ-Impuls) erzeugt wurde;
symbolisch: g(t) = S{δ(t)}
- Sprungantwort eines Systems:
das Ausgangssignal, welches durch das Eingangssignal x(t) = ε(t) (Einheitssprungfunktion)
erzeugt wurde; symbolisch: h(t) = S{ε(t)}
Zeitkontinuierliche LTI-Systeme können durch lineare Differentialgleichungen mit konstanten Koeffizienten beschrieben werden:
an y (n) (t)+an−1 y (n−1) (t)+. . .+a1 y 0 (t)+a0 y(t) = bm x(m) (t)+bm−1 x(m−1) (t)+. . .+b1 x0 (t)+b0 x(t)(192)
(mit a0 , . . . , an , b0 , . . . , bm ∈ R), d.h. es wird das Ausgangssignal y(t) gesucht, wobei das Eingangssignal x(t)
und dessen Ableitungen bis zur Ordnung m gegeben sind.
Falls y(0) = y 0 (0) = . . . = y (n−1) (0) = x(0) = x0 (0) = . . . = x(m−1) (0) = 0 gilt, dann entsteht nach
Laplace-Transformation der Gleichung (192) (bei Anwendung der Linearität und des Differentiationssatzes):
(an sn + an−1 sn−1 + . . . + a1 s + a0 )Y (s) = (bm sm + bm−1 sm−1 + . . . + b1 s + b0 )X(s) .
Dies wird nun nach Y (s) (Bildfunktion des gesuchten Ausgangssignals) umgestellt:
Y (s) = G(s)X(s) ,
mit G(s) =
bm sm + bm−1 sm−1 + . . . + b1 s + b0
.
an sn + an−1 sn−1 + . . . + a1 s + a0
(193)
Die gebrochenrationale Funktion G(s) wird als Übertragungsfunktion des LTI-Systems bezeichnet. Sie lässt
sich aus den Koeffizienten der Differentialgleichung (192) berechnen. Andererseits lassen sich die Eigenschaften
eines LTI-Systems aus seiner Übertragungsfunktion vollständig ablesen.
14
Quelle: W. P REUSS , G. W ENISCH (Hrsg.). Lehr- und Übungsbuch Mathematik für Elektro- und Automatisierungstechniker, 1998,
S. 85f.
34
Beispiel 9.40: Übertragungsfunktion eines speziellen LTI-Systems15
L
R
b
b x(t) = ue (t)
Eingangssignal: x(t) = ue (t)
(Eingangsspannung)
y(t) = ua (t)
Ausgangssignal: y(t) = ua (t)
(Ausgangsspannung)
C
i(t)
Dieses System wird beschrieben durch die Differentialgleichung
CL · y 00 + CR · y 0 + y = x .
(194)
Somit gilt: m = 0, n = 2 und die Koeffizienten in der beschreibenden Differentialgleichung (vgl. (192)) lauten:
b0 = 1, a2 = CL, a1 = CR, a0 = 1.
Wenn das System zur Zeit t = 0 energielos ist, dann gilt: y(0) = ua (0) = 0, y 0 (0) = u0a (0) = 0 , d.h. die
Voraussetzungen für die Anwendung der Formel (193) sind erfüllt und man erhält für die Übertragungsfunktion:
G(s) =
a2
s2
b0
1
=
.
2
+ a1 s + a0
CLs + CRs + 1
Wird nun als Eingangssignal für ein zeitkontinuierliches LTI-System speziell die Diracsche δ-Funktion (siehe
Abschnitt 9.4.1) gewählt, d.h. x(t) = δ(t), so ist das Ausgangssignal y(t) die Impulsantwort g(t). Somit ist:
Y (s) = L{y(t)} = L{g(t)}. Außerdem gilt (wegen X(s) = L{x(t)} = L{δ(t)} = 1 und nach (193)):
Y (s) = G(s) · 1 = G(s). Dies führt zu der folgenden wichtigen Aussage:
Die Laplace-Transformierte der Impulsantwort ist die Übertragungsfunktion:
G(s) = L{g(t)} .
Beispiel 9.41:
Aus der Beziehung (193) und dem Faltungssatz (siehe Abschnitt 9.4.2) ergibt sich weiterhin:
y(t) =
L−1 {Y
(s)} =
L−1 {G(s)
· X(s)} = (g ∗ x)(t) =
Zt
g(t − τ ) · x(τ ) dτ .
0
Daraus kann die folgende Schlussfolgerung gezogen werden:
Wenn die Impulsantwort eines zeitkontinuierlichen LTI-Systems bekannt ist, kann das zu dem
Eingangssignal x(t) gehörige Ausgangssignal y(t) mit Hilfe der Formel
Zt
g(t − τ ) · x(τ ) dτ
y(t) =
0
berechnet werden.
15
Quelle: P. S TINGL . Mathematik für Fachhochschulen, 8. Auflage (2009), S. 571
35
9.5
Systeme linearer Differentialgleichungen
9.5.1
Definition und Anwendungsbeispiele
Definition 9.9:
Ein System von m Gleichungen, das die unbekannten Funktionen y1 (x), y2 (x), . . . , ym (x)
(n )
0 (x), y 00 (x), . . . , y (nm ) (x) enthält, heißt
sowie deren Ableitungen y10 (x), y100 (x), . . . , y1 1 (x), . . . , ym
m
m
Differentialgleichungssystem (DGLS).
Die Ordnung des DGLS ergibt sich als Summe der Ordnungen der einzelnen Differentialgleichungen
des Systems.
Das DGLS heißt homogen, wenn die Störfunktionen in allen zum System gehörigen Differentialgleichungen
gleich 0 sind, anderenfalls heißt es inhomogen. Solche Begriffe wie: allgemeine Lösung, partikuläre Lösung,
AWP, RWP (siehe Abschnitt 9.1) lassen sich auf DGLS übertragen.
Im folgenden werden zwei Anwendungsbeispiele für DGLS angegeben.
Beispiel 9.42:
Berechnung der Maschenströme in einem Kettenleiter16
L
Der dargestellte Stromkreis (Kettenleiter) wird durch die
(zeitabhängige) Spannung u = u(t) gespeist. In den Maschen I
und II fließen die (ebenfalls zeitabhängigen) Ströme i1 = i1 (t)
und i2 = i2 (t).
u = u(t)
I
L
R
I
i1
II
R
I
?i1 − i2
i2
Durch Anwendung der Maschenregel erhält man die beiden Beziehungen
L
di1
+ R(i1 − i2 ) − u = 0
dt
di2
− R(i1 − i2 ) + Ri2 = 0 .
dt
Diese beiden Gleichungen können auch in der Form
L
di1
R
R
u
= − i1 + i2 +
dt
L
L
L
di2
R
2R
=
i1 −
i2
dt
L
L
geschrieben werden. Sie bilden ein System linearer Differentialgleichungen 1. Ordnung mit konstanten Koeffizienten zur Berechnung der Maschenströme i1 (t) und i2 (t) (d.h. die Ordnung des DGLS beträgt 2).
Beispiel 9.43:
Bewegungsgleichungen für gekoppelte mechanische Systeme17
Die dargestellten schwingungsfähigen Systeme seien
über eine Kopplungsfeder (Federkonstante: c12 ) miteinander verbunden.
c12
@@
c2
c1
@@
m1
m2
@@
@@ B B BB } B B B } B B BB
@@ B B B
B B B
B B B
@
@
@
x1
@@
@@
@@
@@
@@
@
@
@
x2
Mit Hilfe des Hookeschen Gesetzes und des Newtonschen Grundgesetzes der Mechanik erhält man für die
Auslenkungen x1 = x1 (t) und x2 = x2 (t) der beiden Massen (bei Vernachlässigung der Reibungskräfte):
m1 x¨1 = −c1 x1 − c12 (x1 − x2 )
m2 x¨2 = −c2 x2 − c12 (x2 − x1 ) .
16
17
Quelle: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 2, 12. Auflage (2009), S. 487
Quelle: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 2, 12. Auflage (2009), S. 513-514
36
Die Bewegungsgleichungen für die beiden gekoppelten mechanischen Systeme können auch in der Form
m1 x¨1 + c1 x1 + c12 (x1 − x2 ) = 0
m2 x¨2 + c2 x2 + c12 (x2 − x1 ) = 0
geschrieben werden.
Sie bilden ein System homogener linearer Differentialgleichungen 2. Ordnung mit konstanten Koeffizienten zur
Berechnung der Auslenkungen x1 und x2 (d.h. die Ordnung des DGLS beträgt 4).
9.5.2
Methoden zur Lösung von linearen DGLS (Fallbeispiele)
In diesem Abschnitt werden verschiedene Lösungsmethoden jeweils anhand eines Beispiels vorgestellt. Dabei
werden ausschließlich solche DGLS betrachtet, in denen nur Differentialgleichungen mit konstanten Koeffizienten vorkommen.
9.5.2.1 Eliminationsmethode
Die Eliminationsmethode zielt darauf, aus den gegebenen m Gleichungen des DGLS eine einzelne Differentialgleichung herzuleiten, in der nur noch eine der m gesuchten Funktionen vorkommt. Diese Differentialgleichung
besitzt höchstens die Ordnung m.
Beispiel 9.44:
Zu lösen sei das DGLS:
y10 = −y1 + 3y2 + x
y20
= 2y1 − 2y2 + e
(I)
−x
(II)
(lineares inhomogenes DGLS 2. Ordnung mit konstanten Koeffizienten).
Bei der Lösung dieses DGLS mittels Eliminationsmethode wird zunächst die Gleichung (I) nach y2 aufgelöst
und anschließend nach x differenziert:
1
1
y2 = (y10 + y1 − x) (I0 )
⇒ y20 = (y100 + y10 − 1).
3
3
Durch Einsetzen dieses Ausdrucks für y20 sowie der Beziehung (I0 ) in die Gleichung (II) wird y2 aus der Gleichung (II) eliminiert:
⇒
1 00
2
(y1 + y10 − 1) = 2y1 − (y10 + y1 − x) + e−x
3
3
00
0
y1 + 3y1 − 4y1 = 2x + 1 + 3e−x ,
d.h. es ist eine lineare Differentialgleichung 2. Ordnung mit konstanten Koeffizienten entstanden. Diese Gleichung kann mit den Methoden aus Abschnitt 9.3 gelöst werden (wobei beachtet werden muss, dass der Ansatz
für die partikuläre Lösung y1,p in der Form y1,p = a1 x + a0 + be−x aufzustellen ist). Man erhält die allgemeine
Lösung:
y1 = C1 e−4x + C2 ex −
1
5 1
x − − e−x
2
8 2
(C1 , C2 ∈ R).
Somit gilt:
y10 = −4C1 e−4x + C2 ex −
1 1 −x
+ e .
2 2
Wird dies zusammen mit dem soeben erhaltenen Ausdruck für y1 in die Gleichung (I0 ) eingesetzt, dann ergibt
sich:
1
1 1 −x
1
5 1 −x
−4x
x
−4x
x
y2 =
−4C1 e
+ C2 e − + e + C1 e
+ C2 e − x − − e − x
3
2 2
2
8 2
2
1
3
= −C1 e−4x + C2 ex − x −
(C1 , C2 ∈ R) .
3
2
8
Die Funktionen y1 und y2 bilden zusammen die allgemeine Lösung des DGLS (I), (II).
Fortsetzung zu Beispiel 9.42:
37
Bemerkung:
Die Eliminationsmethode ist nur dann effektiv anwendbar, wenn das DGLS wenige Gleichungen enthät und
seine Ordnung sehr klein ist.
9.5.2.2 Lösung mittels Exponentialansatz
Beispiel 9.45:
Zu lösen sei das DGLS:
y10 = −y1 + 3y2
y20
= 2y1 − 2y2
(I)
(II)
(lineares homogenes DGLS 2. Ordnung mit konstanten Koeffizienten).
Für die weiteren Überlegungen ist es von Vorteil, das DGLS in Matrixschreibweise zu notieren, d.h.:
0 y1
−1
3
y1
0
y =
=
= Ay
(III) .
y20
2 −2
y2
Für den Lösungsvektor y wird nun ein Exponentialansatz aufgestellt:
y1 = k1 eλx ,
y2 = k2 eλx
(λ : unbekannter Parameter; k1 , k2 : Konstante).
Die Ableitungen dieser Funktionen lauten: y10 = k1 λ eλx , y20 = k2 λ eλx . Diese werden zusammen mit dem
Ansatz für y1 und y2 in die Gleichungen (I) und (II) eingesetzt:
λ k1 eλx = −k1 eλx + 3 k2 eλx
λk2 eλx = 2 k1 eλx − 2 k2 eλx .
Nach Division beider Gleichungen durch eλx und Umstellen ergibt sich das folgende homogene lineare Gleichungssystem mit den Unbekannten k1 und k2 :
(−1 − λ)k1 +
3k2 = 0
2k1 + (−2 − λ)k2 = 0 ,
welches in Matrixschreibweise folgendermaßen lautet:
k1
−1 − λ
3
0
.
=
2
−2 − λ
k2
0
Bei diesem linearen Gleichungssystem interessieren nur die nichttrivialen Lösungen, da anderenfalls (d.h. für
k1 = k2 = 0) nach dem obigen Ansatz nur die triviale Lösung y1 = y2 = 0 des DGLS entstehen würde. Gemäß
der Theorie der Eigenwerte und Eigenvektoren von Matrizen (siehe dazu Abschnitt 4.8 im Skript zur Vorlesung
Mathematik 1) sind die zu berechnenden Werte für λ genau die Eigenwerte der Matrix A aus der Gleichung (III).
Man erhält für die Matrix A die beiden (reellen) Eigenwerte: λ1 = −4, λ2 = 1, so dass die Komponente y1
des Lösungsvektors des DGLS folgendermaßen lautet:
y1 = C1 eλ1 x + C2 eλ2 x = C1 e−4x + C2 ex
(C1 , C2 ∈ R) .
Aus der Gleichung (I) (umgestellt nach y2 ) des DGLS folgt schließlich:
1
2
1
−4C1 e−4x + C2 ex + C1 e−4x + C2 ex = −C1 e−4x + C2 ex .
y2 = (y10 + y1 ) =
3
3
3
Die Funktionen y1 und y2 bilden zusammen die allgemeine Lösung des DGLS (I), (II).
Bemerkungen:
- Falls für die Eigenwerte der Matrix A gilt: λ1 = λ2 = α (d.h. es liegt ein doppelter reeller Eigenwert vor),
lautet die Darstellung für y1 : y1 = C1 eαx + C2 x eαx (C1 , C2 ∈ R).
Im Fall eines Paares konjugiert-komplexer Eigenwerte: λ1 = α + jβ, λ2 = α − jβ erhält man für y1 :
y1 = eαx (C1 sin(βx) + C2 cos(βx)) (C1 , C2 ∈ R).
- Falls die beschriebene Methode zur Lösung eines inhomogenen linearen DGLS angewendet werden soll,
ist zunächst das zugehörige homogene System zu lösen (analog zu Beispiel 9.44). Zum Auffinden einer
partikulären Lösung y1,p , y2,p des inhomogenen Systems kann ein Ansatz je nach Typ der Störfunktionen
(vgl. auch Abschnitte 9.2.5 und 9.3) verwendet werden.
38
- Bei einer größeren Anzahl von Gleichungen im DGLS vergrößert sich die Dimension der Matrix A entsprechend, wodurch die Berechnung der Eigenwerte schwieriger wird.
9.5.2.3 Laplace-Transformation
Nachdem im Abschnitt 9.4 die Laplace-Transformation als eine Methode zur Lösung von AWP für Differentialgleichungen vorgestellt wurde, soll die Anwendung dieser Methode jetzt auf Systeme linearer Differentialgleichungen erweitert werden.
Beispiel 9.46:
Es wird das folgende AWP für ein DGLS betrachtet:
y10 (t) = −3y1 (t) − y2 (t)
(I)
y20 (t) =
(II)
y1 (t) − y2 (t)
mit y1 (0) = 2, y2 (0) = 3.
Die Anwendung der Laplace-Transformation auf die beiden Differentialgleichungen ergibt unter Berücksichtigung der AB:
s Y1 (s) − y1 (+0) = s Y1 (s) − 2 = −3Y1 (s) − Y2 (s)
(s + 3) Y1 (s) +
Y2 (s) = 2
(I0 )
⇒
s Y2 (s) − y2 (+0) = s Y2 (s) − 3 =
Y1 (s) − Y2 (s)
− Y1 (s) + (s + 1) Y2 (s) = 3 .
(II0 )
Nun wird die Gleichung (I0 ) nach Y2 (s) umgestellt und der erhaltene Ausdruck in die Gleichung (II0 ) eingesetzt:
Y2 (s) = 2 − (s + 3)Y1 (s)
⇒
−Y1 (s) + (s + 1)(2 − (s + 3)Y1 (s)) = 3
Nach geeigneter Zusammenfassung der Ausdrücke auf der linken Seite dieser Gleichung ergibt sich:
Y1 (s)(−s2 − 4s − 4) + 2s + 2 = 3
⇒
Y1 (s) =
−1 + 2s
−1
2s
=
+
s2 + 4s + 4
(s + 2)2 (s + 2)2 .
Jeder der beiden Summanden auf der rechten Seite dieser Gleichung kann auf einfache Weise (z.B. mittels
Korrespondenztabelle) rücktransformiert werden:
−1
2s
−1
−1
y1 (t) = L {Y1 (s)} = L
+
= −te−2t + 2e−2t (1 − 2t) = e−2t (2 − 5t) .
(s + 2)2 (s + 2)2
Zur Berechnung von y2 (t) kann die aus der Gleichung (I) abgeleitete Beziehung y2 (t) = −3y1 (t) − y10 (t)
genutzt werden; dazu wird noch die erste Ableitung der soeben berechneten Funktion y1 (t) benötigt. Man erhält
schließlich:
y2 (t) = 3e−2t + 5te−2t = e−2t (3 + 5t) .
Die Funktionen y1 (t) und y2 (t) bilden zusammen die Lösung des gegebenen AWP.
Bemerkung:
Zu der Thematik Gewöhnliche Differentialgleichungen“ sei abschließend bemerkt, dass bei weitem nicht alle
”
in der Praxis vorkommenden Differentialgleichungen bzw. AWP mit den besprochenen Methoden gelöst werden können. Zum Teil sind die gestellten Voraussetzungen nicht erfüllt (d.h. die Differentialgleichungen sind
komplizierter als in den von uns betrachteten Fällen) oder es existiert keine geschlossene Lösungsdarstellung.
In solchen Fällen muss dann auf numerische Lösungsverfahren zurückgegriffen werden, d.h. es werden Näherungslösungen für die gestellten Probleme ermittelt. Einige numerische Lösungsverfahren für AWP bei gewöhnlichen Differentialgleichungen werden beschrieben in: A. F ETZER , H. F R ÄNKEL. Mathematik 2: Lehrbuch für
ingenieurwissenschaftliche Studiengänge, Springer, 6. Auflage (2009), S. 480-498.
39
10
10.1
Fourier-Transformation und Anwendungen
Einführung
Im Abschnitt 6.3 (siehe Skript zur Vorlesung Mathematik 2) wurden Fourier-Reihen betrachtet. Dabei wurde
eine periodische Funktion f (t) (mit Periode T ) als Überlagerung harmonischer Schwingungen mit den diskreten
Frequenzen kω = k 2π
T dargestellt.
Jetzt soll eine nichtperiodische Funktion f (t) als Überlagerung harmonischer Schwingungen dargestellt werden,
wobei sämtliche Frequenzen ω ∈ (−∞, ∞) beteiligt sind, d.h. das Frequenzspektrum ist kontinuierlich.
Definition 10.1:
Sei f (t) eine Funktion der reellen Variablen t. Die Fourier-Transformation von f (t) ist definiert durch:
Z∞
F (ω) = F{f (t)} =
e−jωt · f (t) dt
für ω ∈ R .
(195)
−∞
Bezeichnungen: f (t) - Originalfunktion,
F (ω) - Bildfunktion (Fourier-Transformierte oder Spektralfunktion)
Die Menge der Originalfunktionen wird Original- oder Zeitbereich genannt, die Menge der Bildfunktionen heißt
Bild- oder Frequenzbereich. Der Zusammenhang zwischen der Originalfunktion f (t) und der Bildfunktion F (ω)
wird wie folgt symbolisch dargestellt: f (t) ◦−−• F (ω) .
Da es sich bei dem Integral in (195) um ein uneigentliches Integral handelt, ist noch zu klären, unter welchen
Bedingungen dieses Integral konvergiert (und damit die Fourier-Transformierte von f (t) überhaupt existiert).
Hinreichende Bedingungen für die Existenz der Fourier-Transformierten:
(I) Die Funktion f (t) ist stückweise stetig (d.h. sie kann aus endlich vielen stetigen Teilfunktionen“ zusam”
mengesetzt werden).
Z∞
(II) Es gilt:
|f (t)| dt < ∞.
−∞
Definition 10.2:
Das Amplitudenspektrum A(ω) und das Phasenspektrum ϕ(ω) der nichtperiodischen Funktion f (t)
sind gegeben durch:
A(ω) = |F (ω)| ,
ϕ(ω) = arg F (ω) .
(196)
Beispiel 10.1:
Beispiel 10.2:
f (t)
Gesucht ist die Fourier-Transformierte des Rechteckimpulses
1 für |t| ≤ 1
f (t) =
0 für |t| > 1.
1
6
0
−1
Für ω 6= 0 gilt gemäß Formel (195):
"
#1
Z∞
Z1
−1 −jωt
1
−jωt
−jωt
F (ω) =
e
f (t)dt = e
dt =
e
= − (e−jω − e jω )
ωj
ωj
−∞
= −
1
t
−1
−1
1
1
sin ω
[ cos(−ω) + j sin(−ω) − (cos ω + j sin ω)] = − · (−2j sin ω) = 2
.
ωj
ωj
ω
(Hinweis: Für die Berechnung wurden die Eulersche Formel, siehe Abschnitt 1.4.1 im Skript zur Vorlesung Mathematik 1, sowie die trigonometrischen Beziehungen cos(−ω) = cos ω und sin(−ω) = − sin ω genutzt.)
40
Für ω = 0 erhält man:
Z∞
Z1
h i1
−jωt
= 2.
F (ω) =
e
f (t)dt = 1dt = t
−1
−∞
−1
Somit gilt:

 sin ω für ω 6= 0
ω
F{f (t)} = F (ω) = 2 sinc(ω), mit sinc(ω) :=
 1
für ω = 0.
Die Funktion sinc ( Sinus cardinalis“ oder Kardinalsinus“) wird auch häufig Spaltfunktion genannt. Sie spielt
”
”
eine wichtige Rolle in der digitalen Signalverarbeitung (z.B. bei der Rekonstruktion zeitkontinuierlicher Signale
aus Abtastwerten) und bei der Beugung von Lichtwellen.
Unter der inversen Fourier-Transformation (Rücktransformation) versteht man die Berechnung der Originalfunktion f (t) aus einer gegebenen Bildfunktion F (ω).
Formel für die inverse Fourier-Transformation (Rücktransformation)
f (t) = F
−1
1
{F (ω)} =
2π
Z∞
e jωt · F (ω) dω
(197)
−∞
Beispiel 10.3:
Die Ermittlung der Fourier-Transformierten bzw. ihrer inversen erfolgt häufig mit Hilfe von Korrespondenztabellen (nicht über die Berechnung der Integrale). Im folgenden sind die Fourier-Transformierten einiger Funktionen
aufgelistet.
Fourier-Transformierte ausgewählter Funktionen18
Mit ε(t) ist die Einheitssprungfunktion bezeichnet, mit δ(t) der Dirac-Stoß (Impulsfunktion).
Es gilt a, b ∈ R und a > 0 , b > 0.
f (t)
F (ω) = F{f (t)}
f (t)
F (ω) = F{f (t)}
1
a + jω
r
π − ω2
e 4a
a
δ(t)
1
ε(t) · e−at
δ(t ± a)
e±jaω
e−at
e±jat
2πδ(ω ∓ a)
ε(t) · e−at · sin(bt)
b
(a + jω)2 + b2
cos(at)
π[δ(ω − a) + δ(ω + a)]
ε(t) · e−at · cos(bt)
jω
(a + jω)2 + b2
sin(at)
−jπ[δ(ω − a) − δ(ω + a)]
1
a 2 + t2
π −a|ω|
e
a
2
jπe−a|ω| für ω < 0
e−a|t|
2a
a2 + ω 2
t
a 2 + t2
0
für ω = 0
−a|ω|
−jπe
Beispiel 10.4:
18
Quelle: W. P REUSS. Funktionaltransformationen, 2. Auflage (2009), S. 50
41
für ω > 0
Bemerkungen:
- Die Fourier-Transformierte und ihre Inverse wurden so eingeführt, dass das Integral in (195) keinen Vorfaktor
1
und das Integral in (197) den Vorfaktor 2π
besitzt. Es besteht aber auch die Möglichkeit, diesen Faktor vor
das Integral in (195) zu schreiben oder vor beide Integrale den Faktor √12π zu schreiben.
- Mittels Grenzwertbetrachtungen kann gezeigt werden, dass die Fourier-Transformation eine Art FourierReihe für nichtperiodische Funktionen darstellt (siehe dazu: J. KOCH , M. S T ÄMPFLE. Mathematik für das
Ingenieurstudium, S. 590-593) .
- Die Begriffe Amplitudenspektrum und Phasenspektrum wurden für periodische Funktionen bereits im Abschnitt 6.3.3 (siehe Skript zur Vorlesung Mathematik 2) erläutert.
- Für Funktionen f (t) mit f (t) = 0 für t < 0 ist die Fourier-Transformation ein Spezialfall der LaplaceTransformation. Die Fourier-Transformierte einer solchen Funktion entsteht, indem in der Laplace-Transformierten dieser Funktion die Variable s durch jω ersetzt wird. (Voraussetzung ist dabei die Existenz der
Laplace-Transformierten für s ∈ C mit Re(s) = 0.)
10.2
Rechenregeln
Rechenregeln für die Fourier-Transformation
1) Linearität der Fourier-Transformation
F{af1 (t) + bf2 (t)} = aF{f1 (t)} + bF{f2 (t)} = aF1 (ω) + bF2 (ω)
(a, b ∈ C)
2) Verschiebungssatz (Zeitverschiebungssatz)
F{f (t − t0 )} = e−jωt0 · F (ω)
(t0 ∈ R)
3) Dämpfungssatz (Frequenzverschiebungssatz)
F{e jω0 t · f (t)} = F (ω − ω0 )
4) Faltungssatz
Sei f (t) = (f1 ∗ f2 )(t) , dann gilt : F{f (t)} = F{f1 (t)} · F {f2 (t)} = F1 (ω) · F2 (ω)
bzw.
F −1 {F1 (ω) · F2 (ω)} = (f1 ∗ f2 )(t)
5) Integrationssatz für die Originalfunktion
 t

Z

1
· F (ω)
F
f (u) du =

 jω
−∞
6) Differentiationssatz für die Originalfunktion
F{f 0 (t)} = jω · F {f (t)} = jω · F (ω) ,
F{f 00 (t)} = −ω 2 F{f (t)} = −ω 2 · F (ω)
allgemein: F{f (n) (t)} = (jω)n · F (ω)
Beispiel 10.5:
42
10.3
Fourier-Kosinus-Transformation und Fourier-Sinus-Transformation
Definition 10.3:
Die Fourier-Kosinus-Transformation der Funktion f (t) ist definiert durch:
Z∞
FC (ω) = FC {f (t)} =
cos(ωt) · f (t) dt
(198)
0
und die zugehörige inverse Transformation ist gegeben durch:
f (t) =
2
=
π
FC−1 {FC (ω)}
Z∞
cos(ωt) · FC (ω) dω .
(199)
0
Analog werden die Fourier-Sinus-Transformation und die dazu inverse Transformation berechnet:
Z∞
FS (ω) = FS {f (t)} =
sin(ωt) · f (t) dt
(200)
0
f (t) =
FS−1 {FS (ω)}
2
=
π
Z∞
sin(ωt) · FS (ω) dω .
(201)
0
Zu der durch (195) definierten Fourier-Transformation F (ω) besteht der folgende Zusammenhang.
Für eine gerade Originalfunktion (d.h. f (−t) = f (t) für alle t ∈ D(f )) gilt:
F (ω) = 2FC (ω)
und für eine ungerade Originalfunktion (d.h. f (−t) = −f (t) für alle t ∈ D(f )): F (ω) = −2j FS (ω).
Somit kann die Berechnung der Fourier-Transformierten einer geraden (bzw. ungeraden) Funktion mit Hilfe von
Formel (198) (bzw. (200)) erfolgen, wodurch die Rechnung meist einfacher wird im Vergleich zur Anwendung
der Formel (195). In diesem Zusammenhang sei daran erinnert, dass die Fourier-Reihe einer geraden Funktion
a
nur den Summanden 0 und Kosinusglieder enthält, wohingegen die Fourier-Reihe einer ungeraden Funktion
2
nur aus Sinusgliedern besteht (siehe dazu Abschnitt 6.3.2 im Skript zur Vorlesung Mathematik 2) .
Beispiel 10.6:
10.4
Anwendungen in der Regelungstechnik
In diesem Abschnitt werden wieder lineare und zeitinvariante Übertragungssysteme (LTI-Systeme) betrachtet
(siehe dazu Abschnitt 9.4.4). Derartige Systeme reagieren auf harmonische Eingangssignale beliebiger Frequenz
mit harmonischen Ausgangssignalen der gleichen Frequenz. Die Amplituden und Phasen der Ausgangssignale
sind i.allg. nicht gleich den Amplituden und Phasen der Eingangssignale. Die Beschreibung der Amplitudenbzw. Phasenänderungen kann mit Hilfe des Amplituden- bzw. Phasengangs erfolgen.
Frequenzgang, Amplitudengang und Phasengang eines Übertragungssystems
Frequenzgang:
Amplitudengang:
Phasengang:
G(ω) = F{g(t)}
A(ω) = |G(ω)|
Φ(ω) = arg G(ω)
(Fourier-Transformierte der Impulsantwort)
(Betrag des Frequenzgangs)
(Argument des Frequenzgangs)
Die Amplitude des Ausgangssignals entsteht durch Multiplikation der Amplitude des Eingangssignals mit dem
Betrag des Frequenzgangs (Amplitudengang). Die Phase des Ausgangssignals entsteht durch Addition der Phase
des Eingangssignals und dem Argument des Frequenzgangs (Phasengang).
Beispiel 10.7:
43
Beispiel 10.8: Gegeben ist das folgende LTI-System (RC-Glied):
R
b
b x(t) = ue (t)
Eingangssignal: x(t) = ue (t)
(Eingangsspannung)
y(t) = ua (t)
Ausgangssignal: y(t) = ua (t)
(Ausgangsspannung)
C
Dieses System wird beschrieben durch die Differentialgleichung
RC · ẏ + y = x .
1 −t/RC
e
für t > 0
RC
1
g(t) =
ε(t)e−t/RC für t ∈ R).
RC
Die Impulsantwort dieses Systems lautet (siehe Übung): g(t) =
(bzw.
Somit beträgt der Frequenzgang dieses Systems:
n
o
1
1
F ε(t) e−t/RC =
·
G(ω) = F{g(t)} =
RC
RC
1
RC
1
1
=
.
1 + jωRC
+ jω
Unter Verwendung von Rechenregeln für komplexe Zahlen erhält man weiterhin:
Amplitudengang: A(ω) = |G(ω)| = √
1
1 + ω 2 R2 C 2
Φ(ω) = arg G(ω) = − arccos
Phasengang:
1
√
1 + ω 2 R2 C 2
= − arctan(ωRC) .
Bemerkung:
Da die Fourier-Transformation ein Spezialfall der Laplace-Transformation ist (siehe dazu: letzte Bemerkung am
Ende von Abschnitt 10.1), kann der Frequenzgang eines LTI-Systems aus dessen Übertragungsfunktion (siehe
Abschnitt 9.4.4) ermittelt werden, indem dort s = jω gesetzt wird.
10.5
Diskrete und schnelle Fourier-Transformation (Einblick)
Bisher wurde vorausgesetzt, dass die Werte der zu transformierenden Funktion f (t) für alle Zeitpunkte t bekannt sind. In der Praxis trifft man jedoch häufig die Situation an, dass nur endlich viele einzelne (d.h. diskrete)
Funktionswerte vorliegen, z.B. Messwerte einer physikalischen Größe zu äquidistanten Zeitpunkten. In solchen
Fällen erfolgt der Übergang zu einer zeitlich diskreten Folge von Funktionswerten fd (n), z.B. in der Form:
fd (n) = f (nτ ), n = 0, 1, . . . , N − 1, wobei τ den (äquidistanten) Abstand zwischen zwei Messzeitpunkten
bezeichnet.
In solchen Fällen wird anstelle der bisher betrachteten Fourier-Transformation die diskrete Fourier-Transformation (kurz: DFT) angewendet.
Definition 10.4:
Die DFT einer Folge {f (n)}, n = 0, 1, . . . , N , von Funktionswerten wird berechnet nach der Formel:
F (m) =
N
−1
X
f (n) e−j2πmn/N ,
m = 0, 1, . . . , N − 1 .
(202)
n=0
Die inverse diskrete Fourier-Transformation (IDFT) ist gegeben durch:
f (n) =
N −1
1 X
F (m) e j2πmn/N ,
N
n = 0, 1, . . . , N − 1 .
m=0
44
(203)
Beispiel 10.9: Diskrete Fourier-Transformation (DFT) für eine spezielle Folge
Gegeben ist die Folge von Funktionswerten f (n): {1, 1, 1, 1, 0, 0, 0, 0}. Die DFT dieser Folge wird mit Hilfe der
Formel (202) berechnet, wobei N = 8 gilt. Wegen f (4) = f (5) = f (6) = f (7) = 0 können die Summationsgrenzen jedoch auf n = 0 bis n = 3 gesetzt werden. Man erhält:
für m = 0 : F (0) =
3
X
f (n) e−j2π·0·n/8 =
n=0
für m = 1 : F (1) =
3
X
n=0
3
X
1 · e0 = 4 · 1 = 4
n=0
f (n) e−j2π·1·n/8 =
3
X
1 · e−jπn/4 = e0 + e−jπ/4 + e−jπ/2 + e−jπ3/4
n=0
√
= 1 − ( 2 + 1)j ≈ 1 − 2.4142j,
die Komponenten F (m) für m = 2, . . . , 7 werden analog berechnet. Die Ergebnisse lauten:
√
F (2) = 0, F (3) = 1 − ( 2 − 1)j ≈ 1 − 0.4142j,
√
F (4) = 0, F (5) = 1 + ( 2 − 1)j ≈ 1 + 0.4142j,
√
F (6) = 0, F (7) = 1 + ( 2 + 1)j ≈ 1 + 2.4142j .
Wichtige Anwendungsgebiete für die DFT/IDFT sind z.B. die Rekonstruktion abgetasteter Signale und die Implementierung digitaler Filter. Die numerisch effiziente Umsetzung der DFT ist durch den Algorithmus der
schnellen Fourier-Transformation FFT (fast Fourier transform) gegeben. Dieser Algorithmus wurde erstmals
im Jahre 1965 von J. C OOLEY und J.W. T UKEY veröffentlicht. Die Grundidee des Algorithmus besteht in der
Ausnutzung von Symmetrien in den zu berechnenden Summen, falls die Zahl N eine Zweierpotenz ist.
DFT-Algorithmen stehen in modernen Software-Paketen zur Verfügung.
45
11
Partielle Differentialgleichungen (Einblick)
11.1
Grundbegriffe
Zahlreiche physikalische oder technische Prozesse können durch partielle Differentialgleichungen beschrieben
werden. Das Anliegen dieses Kapitels besteht darin, einige Grundlagen zu dieser an sich sehr umfangreichen
Problematik zu vermitteln und einige Anwendungsgebiete derartiger Gleichungen vorzustellen.
Zunächst sei die grundlegende Eigenschaft partieller Differentialgleichungen genannt (dadurch wird auch der
Unterschied zu den gewöhnlichen Differentialgleichungen, die im Kapitel 9 behandelt wurden, deutlich).
Bei einer partiellen Differentialgleichung hängt die gesuchte Funktion von mehreren Variablen ab
und in der Gleichung treten partielle Ableitungen dieser Funktion auf.
Beispiel 11.1:
Bei den folgenden Differentialgleichungen handelt es sich um partielle Differentialgleichungen:
a) Laplace-Gleichung (siehe auch (144)):
∆U =
∂2U
∂2U
∂2U
+ 2 + 2 =0
2
∂x
∂y
∂z
für U = U (x, y, z)
b)
∂U
∂U
+2
− U = sin x
∂t
∂x
für U = U (x, t)
c)
∂2u
∂u
∂2u
=α 2 +β
+ γu
2
∂x
∂t
∂t
für u = u(x, t) (α, β, γ seien Konstante)
Die Ordnung einer partiellen Differentialgleichung ist gleich der Ordnung der höchsten vorkommenden
partiellen Ableitung der gesuchten Funktion.
Fortsetzung zu Beispiel 11.1:
Die unter a) und c) genannten Differentialgleichungen sind partielle Differentialgleichungen 2. Ordnung, denn
die höchste vorkommende Ableitung hat jeweils die Ordnung 2.
Dagegen ist die Differentialgleichung aus b) eine partielle Differentialgleichung 1. Ordnung, denn sie enthält nur
partielle Ableitungen 1. Ordnung.
Insbesondere für die Auswahl geeigneter Lösungsmethoden ist es wichtig, eine Unterscheidung zwischen linearen und nichtlinearen partiellen Differentialgleichungen zu treffen.
Bei einer linearen partiellen Differentialgleichung treten die gesuchte Funktion und deren partielle
Ableitungen nur in einem linearen Zusammenhang auf.
Anderenfalls heißt die partielle Differentialgleichung nichtlinear.
Beispiel 11.2:
Alle im Beispiel 11.1 betrachteten partiellen Differentialgleichungen sind linear.
2 2
∂ u
∂u
∂2u
Die partielle Differentialgleichung
+
=
sin(x
+
y)
ist
nichtlinear,
denn
die
Ableitung
tritt in
2
2
∂x
∂y
∂x
einem nichtlinearen Zusammenhang auf (die Differentialgleichung enthält das Quadrat dieser Ableitung).
Ein System partieller Differentialgleichungen besteht aus m Gleichungen (m ≥ 2), die m unbekannte
Funktionen mehrerer reeller Variabler und partielle Ableitungen dieser Funktionen enthalten.
Ein Beispiel für ein System partieller Differentialgleichungen wird im Abschnitt 11.2 angegeben.
46
Schließlich ist noch zu klären, was man unter einer Lösung einer partiellen Differentialgleichung versteht.
Jede Funktion, die eine partielle Differentialgleichung identisch erfüllt, ist eine Lösung dieser Gleichung.
Beispiel 11.3:
Das skalare Feldfunktion19 U (~r) = ln |~r | = ln r im R3 (mit r > 0) ist eine Lösung der partiellen Differentialgleichung ∆U =
1
.
r2
Begründung:
p
Es sind die partiellen Ableitungen (bis zur 2. Ordnung) der Funktion U = ln |~r | = ln r = ln x2 + y 2 + z 2 zu
berechnen und in die linke Seite der Differentialgleichung
∆U =
∂2U
∂2U
∂2U
1
1
+ 2 + 2 = 2 = 2
2
∂x
∂y
∂z
r
x + y2 + z2
(204)
einzusetzen. Wenn dadurch eine wahre Aussage entsteht, ist die Differentialgleichung erfüllt. Vor der Berechnung der Berechnung der Ableitungen
werden. Mittels eines
pkann der Ausdruckfür U noch etwas vereinfacht
Logarithmengesetzes erhält man: ln x2 + y 2 + z 2 = ln (x2 + y 2 + z 2 )1/2 = 21 ln(x2 + y 2 + z 2 ).
Bei der Berechnung der Ableitungen sind die Kettenregel und die Quotientenregel zu berücksichtigen:
x
∂ 1
1
1
∂U
2
2
2
· 2x = 2
=
ln(x + y + z ) = · 2
2
2
∂x
∂x 2
2 x +y +z
x + y2 + z2
∂2U
∂
x
1 · (x2 + y 2 + z 2 ) − 2x · x
−x2 + y 2 + z 2
=
=
=
.
∂x2
∂x x2 + y 2 + z 2
(x2 + y 2 + z 2 )2
(x2 + y 2 + z 2 )2
Völlig analog dazu erhält man:
∂2U
x2 − y 2 + z 2
=
∂y 2
(x2 + y 2 + z 2 )2
sowie
∂2U
x2 + y 2 − z 2
=
.
∂z 2
(x2 + y 2 + z 2 )2
Einsetzen dieser Ableitungen in die linke Seite der Differentialgleichung (204) und Vereinfachen liefert:
∆U =
x2 + y 2 + z 2
1
∂2U
∂2U
∂2U
+
+
=
= 2
,
2
2
2
2
2
2
2
∂x
∂y
∂z
(x + y + z )
(x + y 2 + z 2 )
d.h. es ist die rechte Seite der Differentialgleichung (204) entstanden.
Die Funktion U (~r) = ln |~r | = ln r erfüllt somit die partielle Differentialgleichung ∆U =
11.2
1
.
r2
Partielle Differentialgleichungen in der Praxis
Bei den Beispielen 11.4 bis 11.7 bezeichnet u eine gesuchte Funktion (d.h. die Lösung der entsprechenden
Differentialgleichung), f ist eine gegebene Funktion. Außerdem sind a und b vorgegebene Konstante.
Beispiel 11.4:
Laplace-Gleichung: ∆u = 0 (siehe auch Formel (144) aus Abschnitt 8.3)
Poisson-Gleichung: ∆u = f oder −∆u = f
Die Funktionen u und f sind ortsabhängig, aber zeitunabhängig.
Physikalische Bedeutung dieser Gleichungen:20
- Wenn f = f (x, y, z) eine Massendichte im Raum ist, so stellt die Lösung u = u(x, y, z) das Gravitationspotential des zugehörigen Gravitationsfeldes dar.
- Analog dazu ist u das elektrische Potential, falls f = f (x, y, z) eine Ladungsdichte im Raum bezeichnet.
- In der Theorie der Wärmeleitung ist u die stationäre, d.h. zeitunabhängige Temperatur, die sich nach einer
längeren Zeit einstellt, wenn innere Wärmequellen der Intensität f vorhanden sind. Der Fall f = 0 (LaplaceGleichung) entspricht der Situation, dass keine inneren Wärmequellen existieren.
19
Bei der Darstellung von U beachte man den Unterschied zwischen ~r und r: mit ~r ist der Ortsvektor eines Raumpunktes mit den
Koordinaten (x, y, z) bezeichnet, dagegen ist r der Abstand dieses Punktes zum Koordinatenursprung (siehe dazu auch die Gleichungen (132) zur Transformation in Kugelkoordinaten).
20
Quelle: W. P REUSS , H. K IRCHNER . Mathematik in Beispielen (Band 8: Partielle Differentialgleichungen), 1. Auflage, S. 127
47
Beispiel 11.5:
Wärmeleitungsgleichung:
Diffusionsgleichung:
∂u
− a2 ∆u = f (siehe auch Beispiel 8.21 aus Abschnitt 8.7.2)
∂t
∂u
− a2 ∆u + bu = f
∂t
(u und f sind Funktionen der Zeit t und des Ortes)
Physikalische Bedeutung dieser Gleichungen:21
- Wärmeleitungsgleichung:
Wenn f = f (x, y, z, t) die Intensität der in einem (homogenen, isotropen) Medium befindlichen Wärmequelle
zur Zeit t an der Stelle (x, y, z) bezeichnet, so ist u = u(x, y, z, t) die Temperatur zur Zeit t an dieser Stelle.
- Diffusionsgleichung:
f bezeichnet die Intensität der inneren Stoffquellen und u ist die Teilchendichte zum Zeitpunkt t an der Stelle (x, y, z) .
Beispiel 11.6:22
Saitenschwingungsgleichung:
2
∂2u
2∂ u = f
−
a
∂t2
∂x2
(u und f sind Funktionen der Zeit t und des Ortes)
Physikalische Bedeutung dieser Gleichung:
Die Gleichung beschreibt kleine Querschwingungen einer eingespannten, biegsamen Saite. Dabei bezeichnet f = f (x, t) die
äußere Anregung (äußere Krafteinwirkung) an der Stelle x zur
Zeit t und u(x, t) ist die Auslenkung eines beliebigen Punktes x
der Saite zur Zeit t (siehe auch Bild 11.1).
Bild 11.1: Auslenkungen der Punkte der Saite
zu einem festen Zeitpunkt t
Beispiel 11.7:
Wellengleichung:
∂2u
− a2 ∆u = f
∂t2
(u und f sind Funktionen der Zeit t und des Ortes; Betrachtung im R2 oder im R3 )
Physikalische Bedeutung dieser Gleichung:
Durch diese Gleichung werden Schwingungen von räumlichen oder flächenhaften Körpern (Membranen) bzw.
die Ausbreitung von Wellen in flüssigen oder gasförmigen Medien beschrieben. Die Bedeutung der Funktionen f und u ist analog zu Beispiel 11.6. (Man beachte, dass der Unterschied zwischen den in Beispiel 11.6 und
Beispiel 11.7 betrachteten Differentialgleichungen darin besteht, dass in 11.6 nur die Ortsvariable x, in 11.7
dagegen die Ortsvariablen x und y bzw. x, y und z vorhanden sind. Die Saitenschwingungsgleichung wird daher
auch als eindimensionale Wellengleichung bezeichnet.)
Nachfolgend werden zwei Beispiele23 für Systeme partieller Differentialgleichungen angegeben.
Beispiel 11.8:
Leitungsgleichungen (oder Telegrafengleichungen):
∂i
∂u
+ LL
+ RL i = 0
∂x
∂t
∂i
∂u
+ CL
+ GL u = 0
∂x
∂t
Gesucht sind die Spannung u = u(x, t) sowie die Stromstärke i = i(x, t).
Gegeben sind die (konstanten) Koeffizienten der Differentialgleichungen: CL - Leitungskapazität, GL - Ohmsche Ableitung, LL - Leitungsinduktivität, RL - Ohmscher Widerstand der Leitung.
Diese Differentialgleichungen sind gekoppelt, d.h. die gesuchten Funktionen (bzw. ihre Ableitungen) treten in
beiden Gleichungen auf, so dass es nicht möglich ist, diese Gleichungen einzeln zu lösen.
21
Quelle: W. P REUSS , H. K IRCHNER . Mathematik in Beispielen (Band 8: Partielle Differentialgleichungen), 1. Auflage, S. 128
Quelle: M. R. S PIEGEL . Höhere Mathematik f. Ingenieure u. Naturwissenschaftler - Theorie u. Anwendung, Nachdruck 1991, S. 259
23
Quelle: W. P REUSS , H. K IRCHNER . Mathematik in Beispielen (Band 8: Partielle Differentialgleichungen), 1. Auflage, S. 52-53
22
48
Beispiel 11.9:
Modell einer chemischen Reaktion in einem Röhrenreaktor:
∂u
∂2u
− D1 2 − u2 v + (b + 1)u − a = 0
∂t
∂x
∂v
∂2v
− D2 2 + u2 v
∂t
∂x
− bu
= 0
Gesucht sind die Konzentrationen u = u(x, t) und v = v(x, t) der Stoffe U und V , die im Reaktor diffundieren.
Gegeben sind die Diffusionskoeffizienten D1 und D2 sowie die (näherungsweise konstanten) Konzentrationen a
und b von Ausgangsstoffen A und B.
11.3
Partielle Differentialgleichungen mit Nebenbedingungen
Bei der Modellierung technisch-physikalischer Systeme oder Prozesse mit Hilfe von (gewöhnlichen oder partiellen) Differentialgleichungen sind meistens zusätzliche Bedingungen wie z.B. der gegebene Anfangszustand
eines Systems zu berücksichtigen. Während im vorangegangenen Abschnitt nur die Gleichungen selbst im Mittelpunkt standen, ist dieser Abschnitt den partiellen Differentialgleichungen mit Rand- oder Anfangsbedingungen (zusammengefasst unter dem Begriff Nebenbedingungen“) gewidmet. Bei den Beispielen wird jeweils auch
”
eine physikalische Interpretation dieser Nebenbedingungen angegeben.
Im weiteren wird davon ausgegangen, dass die Lösung u einer partiellen Differentialgleichung in einem Bereich B ⊂ Rn (n = 1, 2 oder 3) gesucht ist. Der Rand dieses Bereiches wird mit ∂B bezeichnet.
Arten von Nebenbedingungen bei partiellen Differentialgleichungen
Randbedingung:
Anfangsbedingung:
Auf ∂B soll die Fkt. u oder eine Ableitung von u vorgegebene Werte annehmen.
Zum Zeitpunkt t = 0 werden der Funktion u oder einer Ableitung von u (nach t)
Werte vorgeschrieben.
Beispiel 11.10:24
Gesucht ist eine Funktion u = u(x, y, z), die für (x, y, z) ∈ B (d.h. im Bereich B) die Differentialgleichung
−∆u = f
mit einer vorgegebenen Funktion f = f (x, y, z) sowie für (x, y, z) ∈ ∂B die Randbedingung
oder
∂u ∂~n ∂B
u|∂B = ϕ (Randbedingung 1. Art)
∂u
∂u
∂u =
n1 +
n2 +
n3 = ϕ (Randbedingung 2. Art)
∂x
∂y
∂z
∂B
∂u
+ αu
oder
∂~n
∂B
= ϕ (Randbedingung 3. Art)
erfüllt. Dabei sind ϕ = ϕ(x, y, z) und α = α(x, y, z) gegebene Funktionen, ~n = (n1 , n2 , n3 )T ist der äußere
∂u
die Richtungsableitung in Richtung des Einheitsnormalenvektors (NorEinheitsnormalenvektor an B und
∂~n
malenableitung).
In diesem Beispiel wird die Lösung einer partiellen Differentialgleichung gesucht, wobei zusätzlich eine Randbedingung gestellt wird. Es handelt sich hier um ein reines Randwertproblem.
Physikalische Interpretation:
Es liegt ein stationäres Wärmeleitproblem vor (siehe dazu Beispiel 11.4 aus dem Abschnitt 11.2). Die Funktion
f bezeichnet die (gegebene) Intensität der Wärmequelle, u die (gesuchte) Temperatur im Inneren eines Körpers.
Die Randbedingungen besitzen die folgende Bedeutung:
Randbedingung 1. Art: entspricht einer vorgegebenen Temperatur am Rand
Randbedingung 2. Art: vorgegebener Wärmefluss am Rand
Randbedingung 3. Art: freier Wärmeaustausch mit der Umgebung
24
Quelle: W. P REUSS , H. K IRCHNER . Mathematik in Beispielen (Band 8: Partielle Differentialgleichungen), 1. Auflage, S. 127-128
49
Beispiel 11.11:25
Gesucht ist eine Funktion u = u(x, t), die für x ∈ B := (0, l) und t > 0 die Differentialgleichung
∂u
∂2u
= a2 2 + f
∂t
∂x
mit einer vorgegebenen Funktion f = f (x, t) und einer Konstanten a > 0 löst.
Außerdem soll die Funktion u folgende Bedingungen erfüllen (ϕ(x), ψ1 (t) und ψ2 (t) sind vorgegeben):
Anfangsbedingung:
u(x, 0) = ϕ(x) für 0 ≤ x ≤ l
sowie
Randbedingung 1. Art: u(0, t) = ψ1 (t) und u(l, t) = ψ2 (t) für t > 0
Hier liegt ein Anfangs-Randwertproblem vor.
Physikalische Interpretation:
Die vorliegende Differentialgleichung beschreibt die instationäre Wärmeleitung26 in einem Stab der Länge l.
Die Anfangsbedingung sagt aus, dass die Anfangstemperatur des Stabes zur Zeit t = 0 festgelegt ist (nämlich
durch die gegebene Funktion ϕ(x)). Durch die Randbedingung 1. Art ist der Temperaturverlauf an den Enden
des Stabes (d.h. für x = 0 und x = l) zu jedem beliebigen Zeitpunkt t > 0 vorgegeben.
Bemerkung:
Wird bei der instationären Wärmeleitung anstelle eines Stabes der Länge l ein unendlich langer“ Stab betrachtet,
”
so entfällt die im Beispiel 11.11 gestellte Randbedingung. Es wird nur die
Anfangsbedingung: u(x, 0) = ϕ(x) für alle x ∈ R
gestellt. Dann handelt es sich um ein reines Anfangswertproblem. Jedoch muss aus physikalischer Sicht die zu
berechnende Temperatur u(x, t) beschränkt sein (insbesondere für x → ±∞). Auf diese Weise unterliegt die
Lösung des Problems einer weiteren Nebenbedingung.
11.4
Methoden zur Lösung partieller Differentialgleichungen (Einblick)
So vielfältig wie sich die partiellen Differentialgleichungen gestalten (Abschnitt 11.2 vermittelt nur einen kleinen
Einblick!), so verschieden sind auch die Lösungsmethoden für diese Gleichungen. Im Abschnitt 11.4.1 soll ein
recht häufig verwendetes Lösungsverfahren vorgestellt werden. Es handelt sich dabei um den Separationsansatz
(oder: Produktansatz bzw. Trennung der Variablen). Der Abschnitt 11.4.2 ist der Lösung der Saitenschwingungsgleichung nach der Methode von d’Alembert gewidmet.
11.4.1
Lösung durch Separationsansatz
Der Separationsansatz ist anwendbar beispielsweise für lineare homogene partielle Differentialgleichungen,
wenn die Koeffizienten konstant sind und keine gemischten Ableitungen auftreten. Wie der Name schon vermuten lässt, wird angenommen, dass die Lösung ein Produkt unbekannter Funktionen ist, die jeweils nur von
einer Variablen abhängen. Dadurch kann die Lösung der partiellen Differentialgleichung auf die Lösung von
gewöhnlichen Differentialgleichungen zurückgeführt werden. Die Vorgehensweise bei Anwendung des Separationsansatzes wird anhand des nachfolgenden Beispiels erläutert.
Beispiel 11.12:
Zu lösen ist die (eindimensionale) Wärmeleitungsgleichung:
∂u
∂2u
− a2 2 = 0
∂t
∂x
mit u = u(x, t), a = const., a > 0
(205)
(vgl. auch Beispiel 11.5 aus dem Abschnitt 11.2; jetzt wurde speziell die Störfunktion f = 0 gewählt, wodurch
eine homogene Differentialgleichung entsteht).
Für die Lösung der Differentialgleichung wird der Ansatz u(x, t) = v(t) · w(x) gewählt, d.h. die gesuchte
Funktion wird dargestellt als Produkt einer nur von der Variablen t und einer nur von der Variablen x abhängigen
25
Quelle: K. M EYBERG , P. VACHENAUER. Höhere Mathematik 2 (Differentialgleichungen, Funktionentheorie, Fourier-Analysis,
Variationsrechnung), 2. Auflage, S. 383
26
Es wird eine zu Beispiel 11.5 analoge Gleichung betrachtet, jetzt jedoch nur mit einer Ortsvariablen.
50
Funktion. Zielstellung ist nun die Berechnung der Funktionen v(t) und w(x). Da u eine Lösung der Differentialgleichung (205) ist, werden die in dieser Gleichung vorkommenden Ableitungen der Funktion u jetzt mit Hilfe
von v und w ausgedrückt:
∂u
∂
= (v(t) · w(x)) = v 0 (t) · w(x) ,
∂t
∂t
∂2u
∂2
=
(v(t) · w(x)) = v(t) · w00 (x)
∂x2
∂x2
(man beachte, dass die Ableitungen von v und w keine partiellen, sondern gewöhnliche Ableitungen sind, da
diese Funktionen jeweils nur von einer Variablen abhängen). Einsetzen dieser Ableitungen in die Gleichung (205)
liefert:
v 0 (t) · w(x) − a2 · v(t) · w00 (x) = 0 ⇒ v 0 (t) · w(x) = a2 · v(t) · w00 (x)
und nach Division beider Seiten dieser Gleichung durch den Term a2 · v(t) · w(x) entsteht:
v 0 (t)
w00 (x)
=
,
a2 · v(t)
w(x)
d.h. eine Gleichung mit getrennten Variablen. Da die linke Seite dieser Gleichung nur von t, die rechte Seite
nur von x abhängt, ist die Gleichheit sicher dann gewährleistet, wenn beide Seiten der Gleichung gleich einer
Konstanten sind. Um dies zum Ausdruck zu bringen, führt man einen Separationsparameter, hier −β genannt,
ein, d.h. es soll gelten:
w00 (x)
v 0 (t)
=
= −β
a2 · v(t)
w(x)
mit dem Separationsparameter β ∈ R.
Wird in dieser Gleichung der von t abhängige Ausdruck zeitweilig weggelassen, so erhält man:
w00 (x)
= −β
w(x)
⇒
w00 (x) + β · w(x) = 0.
(206)
Analog ergibt sich, wenn der von x abhängige Ausdruck zeitweilig weggelassen wird:
v 0 (t)
= −β
a2 · v(t)
⇒
v 0 (t) + β · a2 · v(t) = 0.
(207)
Damit wurde ein sehr wichtiger Schritt zur Lösung des gestellten Problems vollzogen: die Lösung der partiellen
Differentialgleichung (205) kann auf die Lösung der beiden gewöhnlichen Differentialgleichungen (206) und
(207) zurückgeführt werden. Dadurch können die Lösungsmethoden aus Kapitel 9 angewendet werden.
Die Gleichung (207) ist eine lineare homogene Differentialgleichung 1. Ordnung.
Gemäß der Formel (167) aus Abschnitt 9.2.4 hat diese die allgemeine Lösung:
2
v(t) = C · e−βa t , C ∈ R.
Die Gleichung (206) ist eine lineare homogene Differentialgleichung 2. Ordnung mit konstanten Koeffizienten.
Gemäß den Ausführungen im Abschnitt 9.3.1 erfolgt die Lösung derartiger Gleichungen mit Hilfe der charakteristischen Gleichung (siehe Formel (181)) und die Struktur der allgemeinen Lösung hängt davon ab, ob die
charakteristische Gleichung zwei verschiedene reelle Lösungen, eine reelle Doppellösung oder zwei konjugiertkomplexe Lösungen besitzt. Im Fall der Differentialgleichung (206) lautet die charakteristische Gleichung:
λ2 +β = 0 . Da der Separationsparameter β beliebig reell sein kann, treten bei der Lösung der charakteristischen
Gleichung (und somit bei der Lösung von (206)) insgesamt drei verschiedene Fälle auf.
Die allgemeine Lösung der Differentialgleichung (206) lautet (K1 und K2 sind reelle Konstante):
√ √ w(x) = K1 cos β x + K2 sin β x , falls β > 0,
w(x) = K1 x + K2
√
√
w(x) = K1 e |β| x + K2 e− |β| x
falls β = 0,
falls β < 0.
Auf Grund des Ansatzes u(x, t) = v(t) · w(x) können jetzt die Lösungen der partiellen Differentialgleichung (205) (Wärmeleitungsgleichung) durch Multiplikation der Lösungen der Gleichungen (206) und (207)
gebildet werden. Die entstehenden Resultate sind auf der nächsten Seite zusammengefasst.
51
Zusammenfassung: Lösungen der Wärmeleitungsgleichung (205)
Für die Gleichung (205) wurden mittels Separationsansatz die folgenden Lösungen berechnet
(Fallunterscheidung nach dem Separationsparameter β):
√ √ 2
β > 0 : u(x, t) = e−a βt C1 cos β x + C2 sin β x
β=0:
β<0:
u(x, t) = u(x) = C1 x + C2
√
√
2
u(x, t) = ea |β|t C1 e |β| x + C2 e− |β| x
Dabei sind C1 und C2 reelle Konstante (es gilt: C1 = C · K1 , C2 = C · K2 ).
Hinweis:
In dem Fall β = 0 vereinfacht sich die Lösung der Differentialgleichung (207):
2
2
v(t) = C · e−βa t = C · e−0·a ·t = C · 1 = C (C ∈ R), dadurch ist die Lösung der Wärmeleitungsgleichung in
diesem Fall nur von x abhängig.
Bemerkung:
Bisher wurde nur die partielle Differentialgleichung ohne Berücksichtigung von Nebenbedingungen gelöst. Wenn
zusätzlich zur Differentialgleichung noch Anfangs- und Randbedingungen (vgl. dazu auch Abschnitt 11.3) erfüllt
sein sollen, muss die berechnete Lösung im Nachhinein noch an diese Bedingungen angepasst werden. Die
Anpassung der Lösung an die Anfangsbedingung kann unter Verwendung einer Fourier-Reihenentwicklung der
Funktion aus der Anfangsbedingung erfolgen.
11.4.2
Lösung nach der Methode von d’Alembert
Zunächst wird der Fall einer unendlich langen“ schwingenden Saite betrachtet.
”
Zu lösen ist dann die Differentialgleichung
2
∂2u
2 ∂ u
−
a
=0
∂t2
∂x2
mit u = u(x, t), a = const., a > 0
(208)
(siehe Beispiel 11.6, jetzt speziell mit f = 0)
unter den Anfangsbedingungen27
u(x, 0) = ϕ1 (x),
∂
u(x, 0) = ϕ2 (x)
∂t
mit x ∈ R und gegebenen Funktionen ϕ1 (x), ϕ2 (x).
(209)
Die Funktionen ϕ1 (x) und ϕ2 (x) beschreiben die Anfangsauslenkung und die Anfangsgeschwindigkeit, bezogen
auf die Punkte der Saite.
Die d’Alembertsche Lösung28 des Anfangswertproblems (208), (209) lautet dann:
1
1
u(x, t) = [ϕ1 (x + at) + ϕ1 (x − at)] +
2
2c
x+at
Z
ϕ2 (ξ) dξ .
(210)
x−at
Diese Formel sagt aus, dass die Lösungsfunktion des Anfangswertproblems (208), (209) durch Superposition
einer in positiver und einer in negativer x-Richtung (jeweils mit Geschwindigkeit a) fortschreitenden Teilwelle
entsteht.
In dem speziellen Fall, dass ϕ2 (x) = 0 gilt, vereinfacht sich die Gleichung (210) zu:
u(x, t) =
1
[ϕ1 (x + at) + ϕ1 (x − at)] .
2
Als nächstes wird eine Saite der Länge l betrachtet, welche an beiden Enden fest eingespannt ist. Anstelle des
bisher betrachteten Anfangswertproblems ist jetzt ein Anfangs-Randwertproblem zu lösen.
27
Es wird vorausgesetzt, dass die Funktion ϕ1 (x) zweimal und die Funktion ϕ2 (x) einmal stetig differenzierbar ist.
Eine Herleitung dieser Formel ist z.B. zu finden in: H. DALLMANN , K.-H. E LSTER. Einführung in die höhere Mathematik für
Naturwissenschaftler und Ingenieure (Band III), 1. Auflage, S. 284-285.
28
52
Im Vergleich zu der Problemstellung (208), (209) ergeben sich dann die folgenden Änderungen:
- Die Funktionen ϕ1 (x) und ϕ2 (x) sind nur für x ∈ [0, l] vorgegeben.
- Es sind zusätzlich die Randbedingungen u(0, t) = 0, u(l, t) = 0 zu berücksichtigen. Dabei muss aus Stetigkeitsgründen gelten: ϕ1 (0) = ϕ1 (l) = 0 sowie ϕ2 (0) = ϕ2 (l) = 0.
Die Lösung des Anfangs-Randwertproblems ist ebenfalls durch die Formel (210) gegeben, wenn die Funktionen ϕ1 (x) und ϕ2 (x) von dem Intervall [0, l] als ungerade Funktionen in das Intervall [−l, 0] und anschließend
über das Intervall [−l, l] hinaus nach beiden Seiten 2l-periodisch fortgesetzt werden.
Bemerkung:
Der Vorteil der Lösungsdarstellung (210) besteht darin, dass die Nebenbedingungen bereits eingearbeitet sind.
Alternativ zur Methode von d’Alembert ist auch die folgende Vorgehensweise zur Lösung des Anfangswertproblems (208), (209) (bzw. des entsprechenden Anfangs-Randwertproblems) möglich:
Zunächst wird die Differentialgleichung (208) ohne Berücksichtigung von Nebenbedingungen mittels Separationsansatz (vgl. Abschnitt 11.4.1) gelöst. Anschließend wird die erhaltene Lösung an die Randbedingungen
(falls vorhanden) sowie an die Anfangsbedingungen angepasst, wobei wiederum die Fourier-Reihenentwicklung
der Funktionen aus den Anfangsbedingungen verwendet werden kann.
Bemerkung (abschließend zu Abschnitt 11.4):
Da nur ein kleiner Einblick in die Methoden zur Lösung partieller Differentialgleichungen gegeben werden
konnte, seien hier einige weitere Lösungsverfahren zumindest genannt:
- Integration nach einer Variablen (wenn nur partielle Ableitungen nach einer Variablen in der Gleichung auftreten)
- Erzeugung von Lösungen durch Superposition (anwendbar bei linearen Differentialgleichungen)
- Fourier- oder Laplace-Transformation (nach einer Variablen)
- numerische Lösung (d.h. Berechnung von Näherungslösungen), z.B. durch: Finite-Elemente-Methode, Differenzenverfahren oder Randelementmethode.
53
12
12.1
Grundlagen der Wahrscheinlichkeitsrechnung
Hilfsmittel aus der Kombinatorik
Definition 12.1:
Als Permutationen von n Elementen ohne Wiederholung bezeichnet man Anordnungen dieser n verschiedenen Elemente, die sich nur durch die Reihenfolge dieser Elemente unterscheiden.
Eine Permutation von n Elementen mit Wiederholung liegt vor, wenn nicht alle n Elemente voneinander
verschieden sind.
Für die Berechnung der Permutationen (d.h. die Anzahl der möglichen Anordnungen) gelten die folgenden
Formeln.
Permutationen von n Elementen ohne Wiederholung:
P (n) = n · (n − 1) · (n − 2) · . . . · 1 = n!
Permutationen von n Elementen, unter denen
sich jeweils n1 , n2 , . . . , nk einander gleiche befinden:
P (n; n1 , n2 , . . . , nk ) =
n!
n1 ! · n2 ! · . . . · nk !
mit n1 + n2 + . . . + nk = n
Beispiel 12.1:
Definition 12.2:
Unter Variationen von n Elementen zur k-ten Klasse ohne Wiederholung versteht man Teilmengen von
je k Elementen, die unter Berücksichtigung der Anordnung aus n gegebenen Elementen ausgewählt werden
(1 ≤ k ≤ n).
Eine Variation von n Elementen zur k-ten Klasse mit Wiederholung liegt vor, wenn die ausgewählten
Elemente mehrfach auftreten dürfen.
Variationen von n Elementen zur k-ten Klasse
ohne Wiederholung:
V (n; k) = n · (n − 1) · . . . · (n − (k − 1)) =
mit Wiederholung:
VW (n; k) = nk
Beispiel 12.2:
54
n!
(n − k)!
(mit 1 ≤ k ≤ n)
Definition 12.3:
Als Kombinationen von n Elementen zur k-ten Klasse ohne Wiederholung bezeichnet man Teilmengen von
je k Elementen, die ohne Berücksichtigung der Anordnung aus n gegebenen Elementen ausgewählt werden
(1 ≤ k ≤ n).
Eine Kombination von n Elementen zur k-ten Klasse mit Wiederholung liegt vor, wenn die ausgewählten
Elemente mehrfach auftreten dürfen.
Kombinationen von n Elementen zur k-ten Klasse
n
n!
=
(Binomialkoeffizient)
ohne Wiederholung: C(n; k) =
k
k! · (n − k)!
n+k−1
mit Wiederholung: CW (n; k) =
k
Bei den Kombinationen ohne Wiederholung muss gelten: 1 ≤ k ≤ n.
Beispiel 12.3:
12.2
Grundbegriffe der Wahrscheinlichkeitsrechnung
12.2.1
Das Zufallsexperiment und weitere Grundbegriffe
Definition 12.4:
Das Zufallsexperiment ist ein Versuch, bei dem die folgenden Bedingungen (Voraussetzungen) erfüllt sind:
1) Der Versuch lässt sich unter den gleichen äußeren Bedingungen beliebig oft wiederholen.
2) Bei der Durchführung des Versuchs sind mehrere sich gegenseitig ausschließende Ergebnisse möglich.
3) Das Ergebnis einer konkreten Durchführung des Versuchs lässt sich dabei nicht mit Sicherheit voraussagen, sondern ist zufallsbedingt.
Beispiel 12.4:
Definition 12.5:
Die möglichen, sich gegenseitig ausschließenden Ergebnisse eines Zufallsexperiments heißen
Elementarereignisse.
Schreibweise: ω1 , ω2 , ω3 , . . . .
Die Menge aller Elementarereignisse heißt Ergebnismenge Ω.
55
Beispiel 12.5:
Die Teilmengen der Ergebnismenge Ω beschreiben Versuchsausgänge, die bei der Durchführung des Versuchs
eintreten können, aber nicht unbedingt eintreten müssen. Dies gibt Anlass zur Definition des Begriffes Ereignis.
Definition 12.6:
Eine Teilmenge A der Ergebnismenge Ω eines Zufallsexperiments wird Ereignis genannt.
Die Menge aller Ereignisse, die aus der Ergebnismenge eines Zufallsexperiments gebildet werden können,
heißt Ereignisraum oder Ereignisfeld.
Nach den Gesetzmäßigkeiten der Mengenlehre sind sowohl die leere Menge ∅ als auch die Ergebnismenge Ω
selbst Teilmengen von Ω. Sie stellen Ereignisse mit folgender Bedeutung dar:
∅:
unmögliches Ereignis (ein Ereignis, das nie eintreten kann)
Ω:
sicheres Ereignis
(ein Ereignis, das immer eintritt).
Ein Ereignis A ist somit entweder
- das unmögliche Ereignis ∅ (siehe oben; A enthält dann kein Element von Ω)
oder
- ein Elementarereignis (siehe Definition 12.5; A enthält genau ein Element von Ω)
- eine Menge mehrerer Elementarereignisse (A enthält mehrere Elemente von Ω)
oder
oder
- das sichere Ereignis Ω (siehe oben; A enthält alle Elemente von Ω, d.h. A = Ω).
Beispiel 12.6:
12.2.2
Verknüpfungen von Ereignissen
Gemäß Definition 12.6 sind Ereignisse als Teilmengen der Ergebnismenge Ω anzusehen, d.h. es handelt sich
um Mengen. Somit kann man bei Ereignissen - ebenso wie bei Mengen - Verknüpfungen betrachten. Auf der
nachfolgenden Seite wird eine Übersicht über Verknüpfungen von Ereignissen gegeben. Die Veranschaulichung
erfolgt jeweils mit Hilfe von Mengendiagrammen.
56
Mit A und B sind Ereignisse im Sinne der Definition 12.6 bezeichnet.
Verknüpfung
Bedeutung
Teilereignis: A ⊆ B
A zieht B nach sich
Vereinigung (Summe): A ∪ B
mindestens eines der Ereignisse A, B
tritt ein (d.h.: A oder B)
A
B
sowohl A als auch B tritt ein
(d.h.: A und B)
A
B
A
B
Durchschnitt (Produkt): A ∩ B
Differenz: A \ B
Darstellung im Diagramm
A tritt ein, jedoch nicht gleichzeitig B
A B
Für die Verknüpfungen von Ereignissen gelten - wie auch für die Verknüpfungen von Mengen - Gesetzmäßigkeiten wie Kommutativgesetze, Assoziativgesetze, Distributivgesetze sowie die D E M ORGANschen Gesetze:
A ∪ B = A ∩ B, A ∩ B = A ∪ B
(A und B sind wiederum Ereignisse im Sinne der Definition 12.6).
Das zu A komplementäre Ereignis tritt genau dann ein, wenn A nicht eintritt.
Bezeichnung: Ā; es gilt: Ω \ A = Ā
Die Ereignisse A und B heißen disjunkt (oder unvereinbar), wenn gilt: A ∩ B = ∅.
Beispiel 12.7:
Definition 12.7:
Die Ereignisse Ai (i = 1, 2, . . . , n) heißen Zerlegung des Ereignisses A, wenn gilt:
n
[
Ai = A
und Ai ∩ Aj = ∅ für alle i, j mit i 6= j .
i=1
Sie bilden ein vollständiges System zufälliger Ereignisse, wenn gilt:
n
[
Ai = Ω
und Ai ∩ Aj = ∅ für alle i, j mit i 6= j
(Zerlegung des sicheren Ereignisses).
i=1
Ein vollständiges System zufälliger Ereignisse A1 , A2 , . . . , An besitzt die folgende Eigenschaft: als Ergebnis
eines zufälligen Versuches muss genau eines von ihnen eintreten.
Beispiel 12.8:
57
12.3
12.3.1
Der Begriff der Wahrscheinlichkeit
Laplace-Experimente, absolute und relative Häufigkeit
Definition 12.8:
Ein Zufallsexperiment mit der endlichen Ergebnismenge Ω = {ω1 , ω2 , . . . , ωm } heißt
Laplace-Experiment, wenn alle Elementarereignisse ωi die gleiche Wahrscheinlichkeit besitzen:
P ({ωi }) = p(ωi ) =
1
m
(i = 1, 2, . . . , m).
Die Wahrscheinlichkeit eines Ereignisses A ist dann gegeben durch:
P (A) =
g(A)
m
,
wobei g(A) : Anzahl der für das Ereignis A günstigen Fälle (d.h. der Fälle, in denen das Ereignis A eintritt)
m : Anzahl der insges. möglichen Fälle (Anzahl der gleichwahrscheinlichen Elementarereignisse)
Hinweis: Dies wird auch als klassische Definition der Wahrscheinlichkeit bezeichnet (nur anwendbar für LaplaceExperimente !).
Beispiel 12.9:
Bei dem Zufallsexperiment Wurf eines homogenen Würfels“ treten alle 6 möglichen Augenzahlen (Elementar”
ereignisse) mit der gleichen Wahrscheinlichkeit auf:
p(i) =
g(i)
m
=
1
6
für i = 1, 2, . . . , 6.
Beispiel 12.10:
Für die Festlegung unbekannter Wahrscheinlichkeiten in der Praxis (siehe Abschnitt 12.3.2) werden noch die
Begriffe der absoluten und relativen Häufigkeit benötigt.
Definition 12.9:
Wird ein Zufallsexperiment n-mal durchgeführt und tritt dabei das Ereignis A genau n(A)-mal ein, so wird
n(A)
hn (A) =
als absolute Häufigkeit des Ereignisses A
n(A)
n
und
als relative Häufigkeit des Ereignisses A
bezeichnet.
Die absolute Häufigkeit eines Ereignisses kann somit durch einfaches Abzählen“ ermittelt werden.
”
12.3.2
Wahrscheinlichkeitsaxiome und Schlussfolgerungen
Wie im vorigen Abschnitt bereits ausgeführt wurde, ist der klassische Wahrscheinlichkeitsbegriff ausschließlich auf Laplace-Experimente anwendbar. In der modernen Wahrscheinlichkeitsrechnung wird der Begriff der
Wahrscheinlichkeit eines zufälligen Ereignisses“ mit Hilfe gewisser Axiome29 eingeführt. Diese heißen (nach
”
ihrem Begründer) Wahrscheinlichkeitsaxiome von Kolmogoroff und werden im folgenden aufgeführt.30
29
Ein Axiom ist ein nicht aus anderen Aussagen abgeleiteter Grundsatz, welcher nicht bewiesen wird. Aus Axiomen werden weitere
Sätze eines Wissensgebietes hergeleitet.
30
Quelle: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 282-283
58
Wahrscheinlichkeitsaxiome von Kolmogoroff
Jedem Ereignis A eines Zufallsexperiments mit der Ergebnismenge Ω wird eine reelle Zahl P (A),
genannt: Wahrscheinlichkeit des Ereignisses A, so zugeordnet, dass die folgenden Axiome erfüllt sind:
Axiom 1:
P (A) ist eine nichtnegative Zahl, die höchstens gleich 1 ist: 0 ≤ P (A) ≤ 1 .
Axiom 2:
Für das sichere Ereignis (Ergebnismenge) Ω gilt: P (Ω) = 1.
Axiom 3:
Für paarweise sich gegenseitig ausschließende Ereignisse A1 , A2 , A3 , . . . gilt:
P (A1 ∪ A2 ∪ A3 ∪ . . .) = P (A1 ) + P (A2 ) + P (A3 ) + . . . .
Man beachte: Die Wahrscheinlichkeitsaxiome beinhalten keinerlei Aussagen darüber, wie man bei einem konkreten Zufallsexperiment die Wahrscheinlichkeiten der auftretenden Ereignisse ermitteln kann. Sie stellen aber
in gewisser Hinsicht Rechenregeln für Wahrscheinlichkeiten dar.
Folgerungen aus den Wahrscheinlichkeitsaxiomen von Kolmogoroff
1) Für das unmögliche Ereignis gilt: P (∅) = 0 .
2) Für das zum Ereignis A komplementäre Ereignis gilt: P (Ā) = 1 − P (A) .
3) Für zwei sich gegenseitig ausschließende Ereignisse A und B folgt aus Axiom 3:
P (A ∪ B) = P (A) + P (B) .
In gewissen Fällen ist es möglich, Versuchsergebnisse als Punkte eines Intervalls bzw. einer ebenen oder räumlichen Punktmenge zu interpretieren. Dies führt zur geometrischen Wahrscheinlichkeitsformel, welche im folgenden angegeben wird31 .
Geometrische Wahrscheinlichkeitsformel
Wenn dem zufälligen Ereignis A ein Teilbereich des Grundbereiches G zugeordnet wird, dann kann
die Wahrscheinlichkeit P (A) des Ereignisses A mit Hilfe der Formel
P (A) =
I(A)
I(G)
(211)
berechnet werden. Dabei gelten die Bezeichungen:
I(A) − geometrischer Inhalt des für A günstigen Teilbereiches
I(G) − geometrischer Inhalt des Grundbereiches.
Voraussetzung für die Anwendbarkeit dieser Formel ist, dass alle Punkte des Grundbereiches G
gleichberechtigt sind.
Der geometrische Inhalt ist - in Abhängigkeit von der Dimension der betrachteten Punktmenge - entweder eine
Länge, ein Flächeninhalt oder ein Volumen.
Beispiel 12.11:
31
Quelle: W. L EUPOLD (Hrsg.). Mathematik - ein Studienbuch für Ingenieure (Band 2: Reihen - Differentialgleichungen - Analysis
für mehrere Variable - Stochastik), 2. Auflage, S. 351
59
Bei praktischen Sachverhalten ist es häufig so, dass die Zufallsexperimente nicht als Laplace-Experimente angesehen werden können und die Wahrscheinlichkeiten von Elementarereignissen nicht von vornherein bekannt oder
berechenbar sind. In solchen Fällen bedient man sich statistischer (oder empirischer) Wahrscheinlichkeitswerte.
Dazu sei n die (hinreichend große!) Anzahl der Einzelversuche einer Versuchsreihe und A ein zufälliges Ereignis, welches als Versuchsergebnis auftreten kann. Dann wird die relative Häufigkeit hn (A) (vgl. Definition 12.9)
des Ereignisses A festgestellt und
P (A) ≈ hn (A)
für die unbekannte Wahrscheinlichkeit P (A) angenommen (d.h. die ermittelte relative Häufigkeit von A dient
als Schätzwert für die unbekannte Wahrscheinlichkeit P (A)).
Beispiel 12.12:
Statistische Wahrscheinlichkeitswerte können z.B. angewendet werden für
- die Wahrscheinlichkeit für eine Jungen- oder Mädchengeburt
- die Wahrscheinlichkeit des Ausfalls eines Maschinenelementes während einer vorgegebenen Laufzeit.
12.3.3
Additionssatz, bedingte Wahrscheinlichkeit und Multiplikationssatz
Wenn A und B disjunkte Ereignisse sind (d.h.: A ∩ B = ∅), dann gilt nach dem Wahrscheinlichkeitsaxiom 3
(siehe Abschnitt 12.3.2): P (A ∪ B) = P (A) + P (B). Falls die Voraussetzung, dass die Ereignisse disjunkt sind,
nicht erfüllt ist, ist der folgende Satz anzuwenden:
Additionssatz für zwei beliebige Ereignisse
Seien A und B zwei beliebige Ereignisse eines Ereignisraumes, dann gilt:
P (A ∪ B) = P (A) + P (B) − P (A ∩ B) .
(212)
Beispiel 12.13:
Wenn A und B Ereignisse ein und desselben Ereignisraumes sind, kann man bedingte Wahrscheinlichkeiten
betrachten, und zwar:
- die bedingte Wahrscheinlichkeit von A unter der Bedingung B
(d.h. es wird vorausgesetzt, dass das Ereignis B bereits eingetreten ist)
oder
- die bedingte Wahrscheinlichkeit von B unter der Bedingung A
(es wird vorausgesetzt, dass A bereits eingetreten ist).
Die Schreibweise für die genannten Wahrscheinlichkeiten ist: P (A | B) bzw. P (B | A) .
Die Berechnung bedingter Wahrscheinlichkeiten wird mit Hilfe der nachfolgenden Formeln durchgeführt.
Berechnung bedingter Wahrscheinlichkeiten
Bedingte Wahrscheinlichkeit von A unter der Bedingung B:
P (A | B) =
P (A ∩ B)
P (B)
(wobei P (B) 6= 0 gelten muss)
(213)
Bedingte Wahrscheinlichkeit von B unter der Bedingung A:
P (B | A) =
P (A ∩ B)
P (A)
(wobei P (A) 6= 0 gelten muss)
Beispiel 12.14:
60
(214)
Als unmittelbare Schlussfolgerung aus den Formeln für die bedingte Wahrscheinlichkeit erhält man die folgende
Aussage.
Multiplikationssatz (für beliebige Ereignisse)
Die Wahrscheinlichkeit für das gleichzeitige Eintreten der beiden Ereignisse A und B wird berechnet
nach der Formel:
P (A ∩ B) = P (A) · P (B | A).
(215)
Hinweis: In (215) bedeutet P (A) die Wahrscheinlichkeit für das Eintreten von A (ohne jede Bedingung!) und
P (B | A) die Wahrscheinlichkeit für das Eintreten von B unter der Bedingung, dass A bereits eingetreten ist.
Beispiel 12.15:
Ausgehend von den bedingten Wahrscheinlichkeiten können aber auch die Fälle:
P (A | B) = P (A)
bzw.
P (B | A) = P (B)
in Betracht gezogen werden.
In dem ersten Fall gilt: Die Wahrscheinlichkeit des Eintretens von A unter der Bedingung B ist gleich der Wahrscheinlichkeit des Eintretens von A (ohne Bedingung). Dies kann so interpretiert werden, dass das Eintreten des
Ereignisses B keinen Einfluss auf das Eintreten des Ereignisses A hat. Oder, anders ausgedrückt: Das Ereignis A
ist (stochastisch) unabhängig von dem Ereignis B.
Analog dazu bedeutet der zweite der o.g. Fälle, dass das Ereignis B (stochastisch) unabhängig von dem Ereignis A ist.
In dem speziellen Fall stochastisch unabhängiger Ereignisse kann der o.g. Multiplikationssatz wie folgt formuliert werden.
Multiplikationssatz für stochastisch unabhängige Ereignisse
Wenn die Ereignisse A und B stochastisch unabhängig sind, dann gilt:
P (A ∩ B) = P (A) · P (B).
(216)
Die Formel (216) entsteht aus (215), indem dort P (B | A) = P (B) gesetzt wird. Diese Beziehung ist auf Grund
der vorausgesetzten Unabhängigkeit der Ereignisse A und B stets gültig.
61
Die Formel (216) kann auch auf den Fall von n Ereignissen verallgemeinert werden. Wenn die Ereignisse
A1 , A2 , . . . , An ein vollständiges System stochastisch unabhängiger Ereignisse bilden, dann gilt:
!
n
n
\
Y
P
Ai = P (A1 ) · P (A2 ) · . . . · P (An ) =
P (Ai ).
(217)
i=1
i=1
Mit dieser Formel lässt sich die Wahrscheinlichkeit für das gleichzeitige Eintreten von n stochastisch unabhängigen Ereignissen berechnen, falls die Wahrscheinl. für das Eintreten jedes einzelnen Ereignisses bekannt sind.
Beispiel 12.16:
Bemerkungen:
- Wenn die Ereignisse A und B stochastisch unabhängig sind, dann sind auch die Ereignisse A und B stochastisch unabhängig, ebenso die Ereignisse A und B sowie die Ereignisse A und B.
- Für drei beliebige Ereignisse A, B, C lautet der Additionssatz:
P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B) − P (A ∩ C) − P (B ∩ C) + P (A ∩ B ∩ C).
Für eine Verallgemeinerung des Additionssatzes auf n beliebige Ereignisse sei auf die folgende Literaturstelle
verwiesen: W. VOSS (Hrsg.): Taschenbuch der Statistik, 1. Auflage (2000), S. 305.
12.3.4
Baumdiagramme, totale Wahrscheinlichkeit von Ereignissen
Wenn mehrere gleichartige Zufallsexperimente nacheinander durchgeführt werden, spricht man auch von einem
mehrstufigen Zufallsexperiment.
Ergänzung zu Beispiel 12.15:
Die Ziehung zweier Kugeln aus einer Urne ohne Zurücklegen kann als 2-stufiges Zufallsexperiment aufgefasst
werden, wenn man die Ziehung einer Kugel als einfaches“ Zufallsexperiment ansieht.
”
Zur Veranschaulichung mehrstufiger Zufallsexperimente werden häufig Baumdiagramme (Ereignisbäume) verwendet. Zunächst wird ein Beispiel angegeben und anschließend werden einige allgemeine Aussagen32 zu
Baumdiagrammen getroffen.
Beispiel 12.17:
Aus einer Urne mit 4 roten und 2 gelben Kugeln werden 2 Kugeln nacheinander ohne Zurücklegen entnommen
(siehe auch Beispiel 12.15). Das vorliegende Baumdiagramm (siehe Bild 12.1) veranschaulicht die möglichen
Ergebnisse dieses Experiments zusammen mit den Wahrscheinlichkeiten der Zwischenergebnisse“.
”
3
5
Erläuterung:
2
3
2
5
0 x
4
5
1
3
1
5
Bild 12.1
32
Quelle: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 301-302
62
Aufbau eines Baumdiagramms
Das Baumdiagramm setzt sich zusammen aus einer Wurzel (Ausgangspunkt) sowie Verzweigungspunkten
und Zweigen.
Die Verzweigungspunkte charakterisieren die möglichen Zwischenergebnisse nach einer bestimmten Stufe
des Zufallsexperiments.
Die Zweige führen zu den jeweils möglichen Ergebnissen der nachfolgenden Stufe.
Ein mögliches Endergebnis des Zufallsexperiments erreicht man (ausgehend von der Wurzel)
längs eines bestimmten Pfades.
Wenn die Berechnung der Wahrscheinlichkeit eines Ereignisses (das als Ergebnis eines mehrstufigen Zufallsexperiments auftreten kann) mit Hilfe eines Baumdiagramms erfolgen soll, können die folgenden Pfadregeln
angewendet werden.
Regeln bei der Berechnung von Wahrscheinlichkeiten mit Hilfe eines Baumdiagramms
Es gelten die folgenden Pfadregeln:
1) Die Wahrscheinlichkeiten längs eines Pfades werden miteinander multipliziert.
2) Wenn mehrere Pfade zum gleichen Endergebnis führen, dann addieren sich ihre Wahrscheinlichkeiten.
Fortsetzung zu Beispiel 12.17:
Um den Begriff der totalen Wahrscheinlichkeit einführen zu können, werden folgende Ereignisse betrachtet:
Ai (i = 1, 2, . . . , n): disjunkte Ereignisse mit P (Ai ) 6= 0 für alle i,
B : ein Ereignis, das stets zusammen mit einem der Ereignisse Ai eintritt.
Das Diagramm in Bild 12.2 veranschaulicht eine solche Situation
für den Fall n = 4.
A2
A1
A3
B
A4
Bild 12.2
Formel für die totale Wahrscheinlichkeit eines Ereignisses
Unter den o.g. Voraussetzungen gilt für die Wahrscheinlichkeit des Ereignisses B:
n
n
X
X
P (B) =
P (B ∩ Ai ) =
P (Ai ) · P (B | Ai ) .
i=1
(218)
i=1
Hinweis: Der Summand P (Ai ) · P (B | Ai ) in (218) ist die Wahrscheinlichkeit dafür, dass das Ereignis B über
die Zwischenstation“ Ai (für das jeweilige i) erreicht wurde.
”
Begründung für die Formel (218):
Es gilt (siehe dazu auch Bild 12.2): B = (B ∩ A1 ) ∪ (B ∩ A2 ) ∪ . . . ∪ (B ∩ An ).
Da die Ereignisse Ai (i = 1, 2, . . . , n) als disjunkt vorausgesetzt wurden, sind auch die Ereignisse (B ∩ Ai ) für
i = 1, 2, . . . , n disjunkt. Durch Anwendung des Wahrscheinlichkeitsaxioms 3 (siehe Abschnitt 12.3.2) und der
Formel (215) ergibt sich dann:
P (B) =
n
X
i=1
P (B ∩ Ai ) =
n
X
i=1
P (Ai ∩ B) =
n
X
P (Ai ) · P (B | Ai ) .
i=1
Beispiel 12.18:
63
Bayessche Formel:
P (Aj ) · P (B | Aj )
P (Aj | B) = P
n
.
(219)
P (Ai ) · P (B | Ai )
i=1
Bedeutung dieser Formel:
Jetzt wird vorausgesetzt, dass das Ereignis B bereits eingetreten ist. Dann ermöglicht die Bayessche Formel die
Berechnung der Wahrscheinlichkeit dafür, dass das Ereignis B über die Zwischenstation“ Aj erreicht wurde.
”
Fortsetzung zu Beispiel 12.18:
64
13
13.1
Wahrscheinlichkeitsverteilungen
Stetige und diskrete Zufallsvariable (ZV)
Dem Begriff der Zufallsvariablen kommt in diesem Kapitel eine zentrale Rolle zu. Im folgenden wird für den
Begriff Zufallsvariable“ meistens die Abkürzung ZV verwendet. Man unterscheidet zwischen stetigen und dis”
kreten Zufallsvariablen.
Definition 13.1:
Unter einer Zufallsvariablen (oder Zufallsgröße) X versteht man eine Abbildung, die jedem Elementarereignis ω aus der Ergebnismenge Ω eines Zufallsexperiments genau eine reelle Zahl X(ω) zuordnet.
Eine ZV heißt dabei diskret, wenn sie nur endlich viele oder abzählbar unendlich viele reelle Werte annehmen kann.
Eine ZV heißt stetig, wenn sie jeden beliebigen Wert aus einem (reellen) endlichen oder unendlichen
Intervall annehmen kann.
Die Werte, die eine Zufallsvariable annehmen kann, heißen Realisierungen. Sie werden üblicherweise mit kleinen Buchstaben bezeichnet.
Beispiel 13.1:
13.2
Verteilungsfunktion einer ZV
Bei praktischen Anwendungen der Wahrscheinlichkeitsrechnung wird häufig die Frage gestellt, mit welcher
Wahrscheinlichkeit eine ZV einen bestimmten Wert annimmt bzw. der Wert der ZV kleiner (oder größer) als eine
bestimmte Zahl ist. Dies führt auf den Begriff der Verteilungsfunktion.
Definition 13.2:
Die Verteilungsfunktion einer ZV X ist gegeben durch:
F (x) = P (X ≤ x) ,
(220)
d.h. sie gibt an, mit welcher Wahrscheinlichkeit die ZV X einen Wert annimmt, der kleiner oder gleich
einer vorgegebenen reellen Zahl x ist.
Eine ZV X wird durch ihre zugehörige Verteilungsfunktion vollständig beschrieben.
Nachfolgend sind wichtige Eigenschaften von Verteilungsfunktionen zusammengestellt. Diese gelten allgemein,
d.h. unabhängig von der konkreten ZV.
65
Eigenschaften von Verteilungsfunktionen
Sei X eine beliebige (diskrete oder stetige) Zufallsvariable und F (x) die zugehörige Verteilungsfunktion.
Diese Funktion besitzt die folgenden Eigenschaften:
1) F (x) ist eine monoton wachsende Funktion und es gilt: 0 ≤ F (x) ≤ 1 für alle x ∈ R.
2) limx→−∞ F (x) = 0
3) limx→∞ F (x) = 1
4) Die Wahrscheinlichkeit, dass a < X ≤ b gilt, lässt sich mit Hilfe der Verteilungsfunktion
wie folgt berechnen: P (a < X ≤ b) = F (b) − F (a).
Die Eigenschaften 2) und 3) sind unmittelbare Schlussfolgerungen aus der Definition 13.2 und der Tatsache,
dass die Wahrscheinlichkeit des unmöglichen Ereignisses gleich 0, die des sicheren Ereignisses gleich 1 ist
(siehe dazu auch Abschnitt 12.3.2).
Die Fragestellung, zu einem gegebenen Wert der Verteilungsfunktion das zugehörige Argument zu finden, führt
auf den Begriff des Quantils.
Definition 13.3:
Sei X eine ZV mit der zugehörigen Verteilungsfunktion F (x) und p0 (mit p0 ∈ [0, 1]) eine vorgegebene
reelle Zahl.
Dann wird jede Zahl x0 mit der Eigenschaft: F (x0 ) = P (X ≤ x0 ) = p0 als p0 -Quantil der Zufallsvariablen X bezeichnet.
Ein Quantil kann genau dann eindeutig bestimmt werden, wenn die entsprechende Verteilungsfunktion streng
monoton wachsend ist.
13.2.1
Verteilungsfunktion einer diskreten ZV (diskrete Verteilung)
Bei einer diskreten ZV X (vgl. Definition 13.1) gehört zu jeder Realisierung xi eine bestimmte Wahrscheinlichkeit: P (X = xi ) = pi (Einzelwahrscheinlichkeit). Die Realisierungen der ZV können zusammen mit den
zugehörigen Einzelwahrscheinlichkeiten in einer Verteilungstabelle dargestellt werden:
xi
x1
x2
x3
...
xm
...
P (X = xi )
p1
p2
p3
...
pm
...
Mit Hilfe dieser Tabelle kann die Verteilungsfunktion der diskreten ZV ermittelt werden.
Verteilungsfunktion F (x) einer diskreten ZV X:
X
F (x) = P (X ≤ x) =
pi
für x ∈ R und mit pi = P (X = xi )
(221)
xi ≤x
Es wurden bereits einige Eigenschaften von Verteilungsfunktionen genannt (siehe oben). In dem hier vorliegenden
Fall einer diskreten ZV kommt noch die folgende Eigenschaft hinzu:
Die grafische Darstellung der Verteilungsfunktion einer
diskreten ZV ergibt eine stückweise konstante Funktion
(auch Treppenfunktion genannt), siehe dazu Bild 13.1.
F (x)
6
s
1
s
p1 + p2 + p3
p1 + p2
p1
s
0
x1
s
x2
x3 . . . xn
Bild 13.1
66
..
.
x
Beispiel 13.2:
13.2.2
Verteilungsfunktion einer stetigen ZV (stetige Verteilung)
Verteilungsfunktion F (x) einer stetigen ZV X:
Zx
F (x) = P (X ≤ x) =
f (t) dt
(222)
−∞
für x ∈ R, wobei die Funktion f als Wahrscheinlichkeitsdichte oder Dichtefunktion bezeichnet wird
Die Dichtefunktion f (x) besitzt die folgenden Eigenschaften33
1) f (x) ≥ 0 für alle x ∈ R
2) f (x) = F 0 (x), d.h. die Dichtefunktion ist gleich der ersten Ableitung der Verteilungsfunktion
Z∞
f (x) dx = 1
3)
−∞
Diese Eigenschaft wird auch als Normiertheit der Dichtefunktion bezeichnet.
4) Die Wahrscheinlichkeit, dass X einen Wert zwischen a und b annimmt, kann mit Hilfe der Dichtefunktion
wie folgt berechnet werden:
Zb
P (a ≤ X ≤ b) = F (b) − F (a) =
Za
f (x) dx −
−∞
Zb
f (x) dx =
−∞
f (x) dx
a
(vgl. dazu auch Formel (222)).
Z∞
f (x) dx = P (−∞ < X < ∞) = 1 (Wahrscheinl. des sicheren Ereignisses).
Die Eigenschaft 3) folgt aus:
−∞
Die Eigenschaft 4) kann wie folgt veranschaulicht werden: die im Bild 13.2 grau unterlegte Fläche entspricht
der Wahrscheinlichkeit, dass die ZV X einen Wert zwischen a und b annimmt.
f (x)
6
a
b
-
x
Bild 13.2
33
An dieser Stelle wird f als eine von der Variablen x abhängige Funktion betrachtet, während in der Formel (222) auf Grund der
Bezeichnung der oberen Integrationsgrenze die Schreibweise f (t) verwendet wurde.
67
Beispiel 13.3:
13.3
Kennwerte einer Wahrscheinlichkeitsverteilung
Bei der Beschreibung von ZV ist (außer den bereits eingeführten Funktionen) auch die Angabe von Kennwerten hilfreich. In diesem Abschnitt werden die folgenden Kennwerte34 eingeführt: Erwartungswert, Varianz und
Standardabweichung einer ZV. Bei der Berechnung dieser Kennwerte wird nach diskreten und stetigen ZV unterschieden.
Definition 13.4:
Sei X eine diskrete ZV mit den Realisierungen x1 , x2 , . . . , xn und den Einzelwahrscheinlichkeiten
p1 , p2 , . . . , pn (mit pi = P (X = xi ), siehe Abschnitt 13.2.1).
Dann werden die Kennwerte von X wie folgt berechnet:
Erwartungswert:
µ = E(X) =
n
X
xi · pi
(223)
i=1
Varianz (Streuung):
σ 2 = D2 (X) = Var(X) =
n
X
(xi − µ)2 · pi
(224)
i=1
Standardabweichung: σ = D(X) =
p
Var(X)
(225)
Wenn die ZV X abzählbar unendlich viele Realisierungen besitzt, ist in (223) und (224) die obere Summationsgrenze gleich ∞“ zu setzen.
”
Die Varianz ist ein Maß für die Variabilität der Verteilung. Gemäß (223) ist die Varianz gleich dem Erwartungswert der Zufallsvariablen Z = (X − µ)2 .
Die Standardabweichung wird auch mittlere quadratische Abweichung genannt. Der Vorteil der Standardabweichung (im Vergleich zur Varianz) besteht darin, dass sie die gleiche Dimension und Maßeinheit wie die ZV X
besitzt. Für praktische Berechnungen ist die folgende Formel für die Varianz:
σ 2 = E(X 2 ) − µ2
(226)
meistens leichter zu handhaben als die Formel (224). Der in (226) vorkommende Erwartungswert der Zufallsvariablen X 2 kann ermittelt werden, indem in (223) anstelle von xi jeweils x2i eingesetzt wird.
Beispiel 13.4:
34
Weitere Kennwerte sind Variationskoeffizient, Schiefe und Exzess. Darauf wird hier nicht näher eingegangen, es sei auf die folgende
Literaturstelle verwiesen: W. L EUPOLD (Hrsg.). Mathematik - ein Studienbuch für Ingenieure (Band 2: Reihen - Differentialgleichungen
- Analysis für mehrere Variable - Stochastik), 2. Auflage, S. 368-369.
68
Definition 13.5:
Sei X eine stetige ZV mit der Dichtefunktion f (x) (siehe (222)). Dann werden die Kennwerte von X
wie folgt berechnet:
Z∞
Erwartungswert:
x · f (x) dx
µ = E(X) =
(227)
−∞
Varianz (Streuung):
2
Z∞
2
σ = D (X) = Var(X) =
(x − µ)2 · f (x) dx
(228)
−∞
Standardabweichung: σ = D(X) =
p
Var(X)
(229)
Die Berechnung der Varianz kann wiederum mittels der Formel (226) (anstatt von (228)) erfolgen. Um den
benötigten Erwartungswert E(X 2 ) zu berechnen, ist in dem Integranden auf der rechten Seite von (227) der
Faktor x2 anstelle des Faktors x zu nehmen.
Beispiel 13.5:
Bemerkungen:
- Nicht jede ZV besitzt einen Erwartungswert. Der Erwartungswert existiert für eine stetige ZV nur dann,
wenn das uneigentliche Integral in (227) konvergiert. Im Fall einer diskreten ZV mit abzählbar unendlich
∞
P
vielen Realisierungen muss die Summe
xi · pi (vgl. Formel (223)) einen endlichen Wert besitzen, damit
i=1
der Erwartungswert existiert.


wenn gilt: E(X) = 0.
 zentriert,
normiert,
wenn gilt: Var(X) = 1.
- Eine ZV X heißt

 standardisiert, wenn sie zentriert und normiert ist.
69
13.4
Spezielle Wahrscheinlichkeitsverteilungen
In praktischen Anwendungssituationen der Wahrscheinlichkeitsrechnung werden spezielle Verteilungsfunktionen benötigt, welche den vorliegenden Sachverhalt möglichst gut beschreiben. Das Anliegen dieses Abschnitts
besteht darin, einige in der Praxis häufig vorkommende Wahrscheinlichkeitsverteilungen vorzustellen.
13.4.1
Binomialverteilung
Ausgangspunkt der Überlegungen bei der Einführung der Binomialverteilung ist das Bernoulli-Experiment35 .
Bernoulli-Experiment
- Zufallsexperiment, bei dem ein Ereignis A mit der Wahrscheinlichkeit p und das zu A komplementäre
Ereignis Ā mit der Wahrscheinlichkeit q = 1 − p eintritt (d.h. es gibt nur zwei mögliche Ergebnisse)
- Dies gilt auch für jede Wiederholung des Experiments.
- Beispiel: Beim Wurf einer homogenen Münze gibt es nur die Ereignisse:
A: Zahl“
und Ā: Wappen“.
”
”
Sie treten mit den Wahrscheinlichkeiten: p = P (A) = 21 und q = P (Ā) = 1 −
1
2
=
1
2
auf.
Bernoulli-Experiment vom Umfang n
- mehrstufiges Experiment: n-fache Ausführung eines Bernoulli-Experiments mit den beiden
möglichen Ereignissen A und Ā
- Das Ereignis A tritt in jedem der n Teilexperimente mit der gleichen Wahrscheinlichkeit p auf.
- Die Ergebnisse der einzelnen Stufen sind voneinander unabhängig.
- Ein derartiges Experiment wird als Bernoulli-Experiment vom Umfang n bezeichnet.
- Zufallsvariable X: Anzahl der Versuche, in denen das Ereignis A bei einem Bernoulli-Experiment
vom Umfang n auftritt ⇒ X kann jeden der Werte 0, 1, 2, . . . n annehmen
- Die Fragestellung: Mit welcher Wahrscheinlichkeit nimmt die ZV X den Wert k an?
(d.h.: Wie groß ist die Wahrscheinlichkeit, dass das Ereignis A genau k-mal eintritt?)
führt auf die Binomialverteilung.
Definition 13.6:
Eine diskrete ZV X heißt binomialverteilt mit den Parametern n und p, falls sie die Werte 0, 1, . . . , n
annehmen kann und diese mit den Einzelwahrscheinlichkeiten
n
pk = P (X = k) =
pk (1 − p)n−k
(k = 0, 1, . . . , n)
(230)
k
auftreten. Dabei gelten die folgenden Bezeichnungen:
p: konstante Wahrscheinlichkeit für das Ereignis A beim Einzelversuch
n: Anzahl der Ausführungen des Bernoulli-Experiments.
Um zum Ausdruck zu bringen, dass eine ZV X einer derartigen Verteilung unterliegt, kann auch die Schreibweise: X ∼ B(n, p) verwendet werden.
Zur weiteren Beschreibung der Binomialverteilung werden nachfolgend die Verteilungsfunktion sowie die Kennwerte dieser Verteilung angegeben (siehe nächste Seite).
35
Quelle: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 346-347
70
Verteilungsfunktion der Binomialverteilung B(n, p)


für x < 0
 0 P
F (x) =
n

pk (1 − p)n−k für x ≥ 0

k
k≤x
Insbesondere gilt: F (x) = 1 für x ≥ n.
Kennwerte der Binomialverteilung B(n, p)
Erwartungswert:
Varianz:
µ = np
σ 2 = np(1 − p)
Beispiel 13.6:
13.4.2
Poisson-Verteilung
Bei Ereignissen, die mit einer geringen Wahrscheinlichkeit (d.h. sehr selten36 ) auftreten, wird häufig von einer
Poisson-Verteilung ausgegangen.
Definition 13.7:
Eine diskrete ZV X heißt Poisson-verteilt mit dem Parameter λ, falls sie die Werte 0, 1, 2, . . .
annehmen kann und diese mit den Einzelwahrscheinlichkeiten
pk = P (X = k) =
λk −λ
e
k!
(k ∈ N)
(231)
auftreten.
Die symbolische Schreibweise X ∼ Π(λ) bedeutet, dass die ZV X Poisson-verteilt mit dem Parameter λ ist.
Die Poisson-Verteilung wird vollständig durch den Parameter λ charakterisiert.
Verteilungsfunktion der Poisson-Verteilung Π(λ)


für x < 0
 0
k
P λ −λ
F (x) =
e
für x ≥ 0


k!
k≤x
Kennwerte der Poisson-Verteilung Π(λ)
Erwartungswert:
Varianz:
µ=λ
σ2 = λ
Beispiel 13.7:
36
Die Poisson-Verteilung wird deshalb auch Verteilung der seltenen Ereignisse“ genannt.
”
71
Zwischen der Poisson-Verteilung und der Binomialverteilung (siehe Abschnitt 13.4.1) besteht ein wichtiger Zusammenhang. Die Poisson-Verteilung lässt sich nämlich aus der Binomialverteilung für den Grenzübergang
n → ∞, p → 0 herleiten, und zwar unter der Voraussetzung, dass dabei der Erwartungswert µ = np konstant
bleibt. Daraus ergibt sich die folgende Schlussfolgerung.
Zusammenhang zwischen Poisson-Verteilung und Binomialverteilung
Die Binomialverteilung mit den Parametern n und p darf für großes n und kleines p in guter Näherung
durch die rechnerisch bequemere Poisson-Verteilung mit dem Parameter (Erwartungswert) λ = np
ersetzt werden.
Dabei gilt die folgende Faustregel:
Falls die Bedingungen np < 10 und n > 1500 p erfüllt sind, darf die o.g. Ersetzung vorgenommen
werden.
Beispiel 13.8:
Die Poisson-Verteilung und die Binomialverteilung sind Verteilungen diskreter Zufallsvariablen. Die restlichen
Betrachtungen im Abschnitt 13.4 werden sich auf Verteilungen stetiger Zufallsvariablen beziehen. Es sei daran
erinnert, dass in diesen Fällen die Charakterisierung der ZV mittels der zugehörigen Dichtefunktion (siehe Abschnitt 13.2.2) erfolgt - im Gegensatz zu den betrachteten diskreten ZV, bei denen Einzelwahrscheinlichkeiten
angegeben werden konnten.
13.4.3
Stetige Gleichverteilung (Rechteckverteilung)
Das stetige Analogon zur diskreten Gleichverteilung (siehe Beispiel 13.2) ist die stetige Gleichverteilung.
Definition 13.8:
Eine stetige ZV X heißt gleichverteilt über dem Intervall [a, b], wenn ihre Dichtefunktion gegeben ist durch:

0
für − ∞ < x < a



1
für
a≤x≤b
(232)
f (x) =
b−a



0
für
b < x < ∞.
Auf Grund des Aussehens der Dichtefunktion (232) (siehe dazu auch Bild 13.3a) auf der nächsten Seite) wird
die stetige Gleichverteilung über [a, b] auch als Rechteckverteilung R(a, b) bezeichnet.
Verteilungsfunktion der stetigen Gleichverteilung (Rechteckverteilung) R(a, b)

0
für − ∞ < x < a


 x−a
für
a≤x≤b
F (x) =
b−a



1
für
b < x < ∞.
Kennwerte der stetigen Gleichverteilung (Rechteckverteilung) R(a, b)
Erwartungswert:
Varianz:
µ=
σ2 =
a+b
2
(b − a)2
12
72
Zur Berechnung des Erwartungswertes und der Varianz:
Die Verteilungsfunktion F (x) der stetigen Gleichverteilung steigt in dem Intervall [a, b] von dem Wert 0 linear
auf den Wert 1 an, siehe dazu auch Bild 13.3b).
f (x)
F (x)
6
6
1
1
b−a
0
a
b
x
0
a
Bild 13.3a)
b
x
Bild 13.3b)
Die stetige Gleichverteilung über dem Intervall [0, 1] spielt bei der Simulation von Zufallszahlen eine Rolle.
Beispiel 13.9:
13.4.4
Exponentialverteilung
Wichtige Anwendungsgebiete der Exponentialverteilung sind Lebensdauerverteilungen oder Bedienzeitverteilungen.
Definition 13.9:
Eine stetige ZV X heißt exponentialverteilt mit dem Parameter λ (λ > 0), wenn ihre Dichtefunktion
gegeben ist durch
(
0
für x < 0
f (x) =
(233)
−λx
λe
für x ≥ 0 .
Durch die symbolische Schreibweise X ∼ exp(λ) wird zum Ausdruck gebracht, dass die ZV X exponentialverteilt mit dem Parameter λ ist.
Verteilungsfunktion der Exponentialverteilung mit dem Parameter λ
(
0
für x < 0
F (x) =
−λx
1−e
für x ≥ 0 .
Zur Berechnung der Verteilungsfunktion der Exponentialverteilung:
73
In den Bildern 13.4a) und 13.4b) sind die Dichtefunktion und die Verteilungsfunktion einer Exponentialverteilung für verschiedene Werte des Parameters λ dargestellt.
F (x)
f (x)
0.5
6
1
λ=2
0.8
0.4
0.6
0.3
λ = 0.5
0.4
0.2
0.2
λ = 0.5
0.1
0
6 λ=2
2
4
6
8 x
0
Bild 13.4a)
2
4
6
-
8 x
Bild 13.4b)
Kennwerte der Exponentialverteilung exp(λ)
Erwartungswert:
Varianz:
µ=
1
λ
σ2 =
1
λ2
Ein besonderes Merkmal der Exponentialverteilung besteht also darin, dass ihr Erwartungswert und ihre Standardabweichung übereinstimmen (d.h. die Abweichungen der Realisierungen der ZV vom Erwartungswert sind
im Mittel genau so groß wie der Erwartungswert selbst).
Zur Berechnung des Erwartungswertes der Exponentialverteilung:
Beispiel 13.10:
13.4.5
Weibull-Verteilung
Die Weibull-Verteilung wird häufig zur Beschreibung von Ermüdungserscheinungen bei Werkstoffen sowie in
der Zuverlässigkeitstheorie verwendet.
Diese Wahrscheinlichkeitsverteilung wird (im Gegensatz zur Exponentialverteilung, welche vollständig durch
den Parameter λ bestimmt ist) durch zwei Parameter charakterisiert.37
Definition 13.10:
Eine stetige ZV X unterliegt einer Weibull-Verteilung mit den Parametern α und β, wenn ihre Dichtefunktion folgendermaßen lautet:

für x < 0
 0
α−1
f (x) =
(234)
−( x )α
 α x
e β
für x ≥ 0 .
β
β
Die symbolische Schreibweise X ∼ W (α, β) sagt aus, dass die ZV X Weibull-verteilt mit den Parametern α
und β ist.
37
Im vorliegenden Skript werden die Parameter mit α und β bezeichnet; in der Literatur findet man aber auch Darstellungen der
Weibull-Verteilung mit den Parametern γ und r, siehe z.B.: W. P REUSS , G. W ENISCH (Hrsg.): Lehr- und Übungsbuch Mathematik
(Band 3: Lineare Algebra - Stochastik), Fachbuchverlag Leipzig im Carl Hanser Verlag, 2. Auflage, S. 172.
74
Verteilungsfunktion der Weibull-Verteilung mit den Parametern α und β
(
0
für x < 0
x α
F (x) =
−( β
)
1−e
für x ≥ 0
In den Bildern 13.5a) und 13.5b) sind die Dichtefunktionen und die Verteilungsfunktionen von Weibull-Verteilungen
für verschiedene Werte der Parameter α und β dargestellt.
f (x) 6
F (x) 6
α = 1/2, β = 1/3
α = 1/2, β = 1/3
1
0.5
α = 2, β = 1
0
1
α = 2, β = 1
x
0
1
Bild 13.5a)
x
Bild 13.5b)
Bei der Berechnung des Erwartungswertes der Weibull-Verteilung nach der Formel (227) tritt ein Integral auf, das
mit elementaren Mitteln nicht berechenbar ist, jedoch mit Hilfe einer speziellen Funktion ausgedrückt werden
kann. Diese Funktion wird Gamma-Funktion genannt und mit dem Symbol Γ(x) bezeichnet. Für die Definition
dieser Funktion und einige Eigenschaften sei auf die folgende Literaturstelle verwiesen:
H.-J. BARTSCH . Taschenbuch mathematischer Formeln für Ingenieure und Naturwissenschaftler,
23. Auflage (2014), S. 563.
Nachfolgend werden der Erwartungswert und die Varianz der Weibull-Verteilung angegeben, ohne auf die Herleitung näher einzugehen.
Erwartungswert und Varianz der Weibull-Verteilung W (α, β)
1
Erwartungswert: µ = β · Γ 1 +
α
2
1 2
2
2
Varianz:
σ =β Γ 1+
− Γ 1+
α
α
Um diese Formeln anwenden zu können, müssen die entsprechenden Werte der Gamma-Funktion bekannt
sein. Diese Funktionswerte sind jedoch nur in speziellen Fällen einfach zu bestimmen; im allgemeinen Fall
ist die Verwendung von Rekursionsformeln, Näherungsformeln, tabellierten Werten oder der entsprechenden
Taschenrechner-Funktion erforderlich.
1
2
Der nachfolgende Tabelle können die Funktionswerte Γ 1 +
sowie Γ 1 +
für spezielle Werte des
α
α
Parameters α entnommen werden (jeweils auf vier Nachkommastellen gerundet).
α
1
Γ 1+
2
Γ 1+
1.0
1.0000
2.0000
1.5
0.9027
1.1906
2.0
0.8862
1.0000
2.5
0.8873
0.9314
3.0
0.8930
0.9027
3.5
0.8997
0.8906
4.0
0.9064
0.8862
α
75
α
Beispiel 13.11:
Bemerkung:
Die Exponentialverteilung (siehe Abschnitt 13.4.4) kann als ein Spezialfall der Weibull-Verteilung betrachtet
1
werden: setzt man nämlich in der Formel (234) speziell α = 1 und β = (mit λ > 0), so entsteht eine Dichteλ
funktion vom Typ (233).
13.4.6
Gaußsche Normalverteilung
Die Gaußsche Normalverteilung (kurz: Normalverteilung) ist eine der wichtigsten Wahrscheinlichkeitsverteilungen. Sie findet vielfach Anwendung in der Praxis. Wenn eine Zufallsvariable durch Überlagerung vieler einzelner, relativ geringer Einflüsse entsteht, kann die Normalverteilung verwendet werden (beispielsweise werden
Abweichungen von der Sollmenge bei der Abfüllung von Flüssigkeiten oder Messfehler häufig als normalverteilt
angenommen). Die Normalverteilung wird mit Hilfe von zwei Parametern beschrieben.
Definition 13.11:
Eine stetige ZV X genügt einer Normalverteilung mit den Parametern µ und σ 2 (mit σ > 0),
wenn sie die folgende Dichtefunktion besitzt:
f (x) = √
(x−µ)2
1
e− 2σ2
2π σ
(x ∈ R).
(235)
Die symbolische Schreibweise für eine mit µ und σ 2 normalverteilte ZV X ist: X ∼ N (µ, σ 2 ).
Die Parameter dieser Verteilung sind gleichzeitig auch Kennwerte: µ ist der Erwartungswert und
σ 2 die Varianz der genannten Normalverteilung.
Im Bild 13.6 ist die Dichtefunktion der Normalverteilung für spezielle Werte der Parameter µ und σ 2 (bzw. σ)
dargestellt.
f (x)
0.8
Symmetrieachse
6
Dichtefunktion f (x) mit µ = 3, σ = 0.5
0.53
Dichtefunktion f (x) mit µ = 3, σ = 0.75
0
-
x
3
Bild 13.6
Die Dichtefunktion f (x) aus (235) besitzt die folgenden Eigenschaften38 :
a) f (x) ist spiegelsymmetrisch bezüglich der Geraden x = µ.
b) Maximum: bei x1 = µ, Wendepunkte: bei x2,3 = µ ± σ
c) Die Gestalt der Dichtefunktion f (x) erinnert an eine Glocke. Man spricht daher auch häufig von der Gaußschen Glockenkurve.
d) Der Parameter σ bestimmt Breite und Höhe der Glockenkurve. Es gilt:
Je kleiner die Standardabweichung σ ist, umso höher liegt das Maximum und umso steiler fällt die Dichtekurve nach beiden Seiten hin ab (siehe auch Bild 13.6).
Die zu der Dichtefunktion (235) gehörige Verteilungsfunktion F (x) lautet (siehe dazu die Formeln (222) und
(235)):
Zx
Zx
(t−µ)2
1
e− 2σ2 dt .
(236)
F (x) = P (X ≤ x) =
f (t) dt = √
2π σ
−∞
38
−∞
Quelle: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 369
76
Das Integral auf der rechten Seite dieser Gleichung ist nicht in geschlossener Form lösbar. Dieses Problem kann
jedoch umgangen werden, indem eine Rückführung auf die standardisierte Normalverteilung mit den Parametern µ = 0 und σ 2 = 1 vorgenommen wird. Die Dichtefunktion der standardisierten Normalverteilung wird
mit ϕ(x) bezeichnet. Durch Einsetzen der Parameter µ = 0 und σ 2 = 1 in die Formel (235) erhält man:
2
x
(x−0)2
1
1
−
ϕ(x) = √
e− 2·1 = √ · e 2 .
2π · 1
2π
(237)
Im Bild 13.7 ist die Dichtefunktion ϕ(x) der standardisierten Normalverteilung dargestellt.
ϕ(x) 6
0.4 q
−1
0
-
x
1
Bild 13.7
Die Dichtefunktion ϕ(x) hat folgende Eigenschaften:
a) ϕ(x) ist eine gerade Funktion, d.h. ϕ(x) = ϕ(−x) (da die Symmetrieachse mit der Geraden x = 0, d.h. mit
der y-Achse zusammenfällt).
b) Maximum: bei x1 = 0, Wendepunkte: bei x2,3 = ±1
Die zu der Funktion ϕ(x) gehörige Verteilungsfunktion wird mit dem Symbol Φ(x) bezeichnet. Aus (236), jetzt
speziell mit f (t) = ϕ(t), sowie (237) ergibt sich:
Zx
Φ(x) = P (X ≤ x) =
−∞
1
ϕ(t) dt = √
2π
Zx
t2
e− 2 dt .
(238)
−∞
Diese Funktion wird auch häufig Gaußsches Fehlerintegral genannt.
Zusammenhang zwischen den Verteilungsfunktionen F (x) und Φ(x)
Zwischen der Verteilungsfunktion F (x) einer Normalverteilung mit den Parametern µ und σ 2 (siehe
Formel (236)) und der Verteilungsfunktion Φ(x) der standardisierten Normalverteilung mit den Parametern
µ = 0 und σ 2 = 1 (siehe Formel (238)) besteht der folgende Zusammenhang:
x−µ
F (x) = Φ
.
(239)
σ
Die Verteilungsfunktion Φ(x) ist tabelliert (siehe z.B.: H.-J. BARTSCH . Taschenbuch mathemat. Formeln für
Ingenieure u. Naturwissenschaftler, 23. Auflage, S. 780). Daher muss, wenn der Funktionswert F (x) bei vorge
x−µ
x−µ
gebenen Parametern µ und σ 2 zu ermitteln ist, lediglich der Wert
ausgerechnet und dann Φ
aus
σ
der Tabelle entnommen werden. Bei der Berechnung von
x−µ
σ
σ
können auch negative Zahlen entstehen. Solche
sind in der Tabelle nicht aufgeführt, aber es kann die folgende wichtige Beziehung zu Hilfe genommen werden:
Für die Werte der Verteilungsfunktion Φ(x) der standardisierten Normalverteilung gilt allgemein:
Φ(−x) = 1 − Φ(x) für x > 0.
(240)
Beispiel 13.12:
Bei Betrachtung der Funktionsbilder der Dichtefunktionen f (x) und ϕ(x) (siehe Bild 13.6 und Bild 13.7) bemerkt man, dass für solche x-Werte, die nahe bei µ liegen, die Werte dieser Dichtefunktionen relativ groß sind
(im Vergleich zu Werten von f (x) und ϕ(x), wenn x weit entfernt“ von µ ist). Mit anderen Worten: die Wahr”
scheinlichkeit, dass eine normalverteilte ZV X Werte annimmt, die nahe bei dem Erwartungswert µ liegen, ist
relativ hoch.
77
Dies gibt Anlass zu der folgenden Fragestellung:
Mit welcher Wahrscheinlichkeit hat ein Wert einer normalverteilten ZV X vom Erwartungswert µ
einen Abstand, der kleiner als ein vorgegebenes ε > 0 ist ?
Diese Frage kann wie folgt beantwortet werden39 , wenn man für ε bestimmte Vielfache der Standardabweichung σ nimmt.
Für jede ZV X, die einer Normalverteilung mit den Parametern µ und σ 2 genügt, gilt:
P (|X − µ| < σ) = 2Φ(1) − 1 = 0.6827
P (|X − µ| < 2σ) = 2Φ(2) − 1 = 0.9545
(241)
P (|X − µ| < 3σ) = 2Φ(3) − 1 = 0.9973 .
Daraus kann die folgende Schlussfolgerung gezogen werden: Bei einer normalverteilten Zufallsvariablen
liegen 99.73 % aller Werte (d.h. fast alle Werte) innerhalb der 3σ-Grenzen.
Die letzte Gleichung in (241) wird auch 3σ-Regel“ genannt. Sie spielt eine wichtige Rolle in der statistischen
”
Qualitätssicherung.
Begründung zu (241):
Es gelte: X ∼ N (µ, σ 2 ). Um die Wahrscheinlichkeit P (|X − µ| < ε) zu berechnen, wird ε = kσ gesetzt, eine
neue ZV Y eingeführt und der Zusammenhang mit der standardisierten Normalverteilung (vgl. (239)) genutzt:
|X − µ|
P (|X − µ| < kσ) = P
< k = P (|Y | < k) = P (−k < Y < k)
σ
= P (Y < k) − P (Y < −k) = Φ(k) − Φ(−k) = Φ(k) − (1 − Φ(k))
= 2Φ(k) − 1 .
Die obigen Aussagen ergeben sich nun, indem man in dieser Gleichung nacheinander k = 1, k = 2 und k = 3
setzt und den entsprechenden Wert von Φ(k) ermittelt.
39
Quelle: W. L EUPOLD (Hrsg.). Mathematik - ein Studienbuch für Ingenieure (Band 2: Reihen - Differentialgleichungen - Analysis
für mehrere Variable - Stochastik), 2. Auflage, S. 382
78
Im Abschnitt 13.4.2 wurde ausgeführt, dass die Binomialverteilung durch die rechnerisch bequemere PoissonVerteilung angenähert werden kann. Zwischen der Binomialverteilung und der Normalverteilung besteht ebenfalls ein Zusammenhang, der eine Approximation erlaubt.
Zusammenhang zwischen Binomialverteilung und Normalverteilung
Die Binomialverteilung mit den Parametern n und p kann, falls die Bedingung
n · p · (1 − p) > 9
(242)
erfüllt ist, durch die Normalverteilung mit den Parametern µ = np und σ 2 = np(1 − p)
approximiert werden.
Die Besonderheit besteht darin, dass jetzt eine stetige Wahrscheinlichkeitsverteilung zur Approximation der
Binomialverteilung (die ja bekanntlich eine diskrete Wahrscheinlichkeitsverteilung ist) verwendet wird. Dies ist
auch der Grund dafür, dass bei der Berechnung von Wahrscheinlichkeiten mit Hilfe dieser Approximation eine
Stetigkeitskorrektur vorgenommen werden muss. Es gilt die nachfolgend genannte Näherungsformel.
Näherungsformel zur Berechnung von Wahrscheinlichkeiten bei der Binomialverteilung
Die ZV X sei binomialverteilt mit den Parametern n und p, wobei die Ungleichung (242) erfüllt sein soll.
Dann kann zur Berechnung der Wahrscheinlichkeit P (a ≤ X ≤ b) die Formel
a − 0.5 − µ b + 0.5 − µ
P (a ≤ X ≤ b) ≈ Φ
−Φ
(243)
σ
σ
p
mit µ = np und σ = np(1 − p) verwendet werden (Φ: Verteilungsfunktion der standardisierten
Normalverteilung, siehe (238)).
Die Stetigkeitskorrektur wird durch die Summanden +0.5 bzw. −0.5 in der Formel (243) realisiert.
Beispiel 13.13:
13.5
Aussagen über Summen und Produkte von Zufallsvariablen
In den bisherigen Ausführungen wurde stets von genau einer ZV ausgegangen. Bei praktischen Anwendungen
liegt jedoch häufig die Situation vor, dass mehrere ZV auftreten, welche dann z.B. addiert oder multipliziert
werden. Zielstellung dieses Abschnittes ist es, die Kennzahlen von Summen oder Produkten von ZV anzugeben.
Eine große Bedeutung kommt dabei auch dem Zentralen Grenzwertsatz (siehe Abschnitt 13.5.2) zu.
13.5.1
Kennwerte von Summen und Produkten von Zufallsvariablen
Zunächst sei bemerkt, dass die Summe bzw. das Produkt von Zufallsvariablen wiederum eine Zufallsvariable ist.
Bevor Aussagen über den Erwartungswert und die Varianz dieser neuen“ ZV getroffen werden, wird der Begriff
”
der Unabhängigkeit zweier ZV eingeführt. Dazu ist es erforderlich, mehrdimensionale Verteilungsfunktionen
(d.h. Verteilungsfunktionen, die von mehr als einer Variablen abhängen) zu betrachten.
Seien X und Y zwei ZV, so kann aus diesen ein zweidimensionaler Zufallsvektor (X, Y ) gebildet werden. Dieser
kann vollständig durch die Verteilungsfunktion
F (x, y) = P (X ≤ x, Y ≤ y)
beschrieben
(244)
werden40 .
Definition 13.12:
Seien X und Y Zufallsvariable mit den zugehörigen Verteilungsfunktionen FX (x) und FY (y).
Weiterhin sei F (x, y) die Verteilungsfunktion des aus X und Y gebildeten zweidimensionalen Zufallsvektors (X, Y ) (siehe (244)). Die Zufallsvariablen X und Y heißen (stochastisch) unabhängig, wenn für
alle x und y die folgende Bedingung erfüllt ist:
F (x, y) = FX (x) · FY (y) .
(245)
40
Auf die allgemeinen Eigenschaften einer solchen Verteilungsfunktion sowie auf die zugehörige Dichtefunktion wird an dieser Stelle
nicht eingegangen. Es sei auf die folgende Literaturstelle verwiesen: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler,
Band 3, 5. Auflage, Kapitel II, Abschnitt 7.2.
79
Die Beziehung (245) ist das Analogen zur (stochastischen) Unabhängigkeit von Ereignissen (siehe dazu Abschnitt 12.3.3), denn sie sagt aus, dass die Ereignisse A : X ≤ x“ und B : Y ≤ y “ unabhängig sind.
”
”
Die Aussage von Definition 13.12 lässt sich auf eine endliche Anzahl n von Zufallsvariablen übertragen.
Für die Summe von n Zufallsvariablen gelten die folgenden Aussagen.
Additionssatz für Erwartungswerte
Seien X1 , X2 , . . ., Xn (diskrete oder stetige) Zufallsvariable mit den Erwartungswerten µ1 = E(X1 ),
µ2 = E(X2 ), . . . , µn = E(Xn ). Dann besitzt die Summe Z = X1 + X2 + . . . + Xn dieser Zufallsvariablen
den Erwartungswert
E(Z) = E(X1 + X2 + . . . + Xn ) = E(X1 ) + E(X2 ) + . . . + E(Xn )
(246)
(d.h. es gilt: E(Z) = µZ = µ1 + µ2 + . . . + µn ).
Additionssatz für Varianzen
Seien X1 , X2 , . . ., Xn (diskrete oder stetige) Zufallsvariable mit den Varianzen σ12 = Var(X1 ),
σ22 = Var(X2 ), . . . , σn2 = Var(Xn ). Weiterhin wird vorausgesetzt, dass diese Zufallsvariablen stochastisch
unabhängig sind. Dann besitzt die Summe Z = X1 + X2 + . . . + Xn dieser Zufallsvariablen die Varianz
Var(Z) = Var(X1 + X2 + . . . + Xn ) = Var(X1 ) + Var(X2 ) + . . . + Var(Xn )
(247)
(d.h. es gilt: Var(Z) = σZ2 = σ12 + σ22 + . . . + σn2 ).
Man beachte, dass der Additionssatz für Varianzen nur im Fall der Unabhängigkeit der ZV X1 , X2 , . . ., Xn gilt.
Beispiel 13.14:
Multiplikationssatz für Erwartungswerte
Seien X1 , X2 , . . ., Xn (diskrete oder stetige) Zufallsvariable mit den Erwartungswerten µ1 = E(X1 ),
µ2 = E(X2 ), . . . , µn = E(Xn ). Außerdem wird vorausgesetzt, dass diese Zufallsvariablen stochastisch
unabhängig sind. Dann besitzt das Produkt Z = X1 ·X2 ·. . .·Xn dieser Zufallsvariablen den Erwartungswert
E(Z) = E(X1 · X2 · . . . · Xn ) = E(X1 ) · E(X2 ) · . . . · E(Xn )
(248)
(d.h. es gilt: E(Z) = µZ = µ1 · µ2 · . . . · µn ).
Bisher wurden zwar Aussagen über den Erwartungswert bzw. die Varianz einer Summe von ZV getroffen, aber
die genannten Sätze gaben keine Auskunft über die Wahrscheinlichkeitsverteilung (d.h. den Typ der Verteilungsfunktion) dieser Summe. Wenn weitere Voraussetzungen getroffen werden, kann ggf. auch die Wahrscheinlichkeitsverteilung einer Summe von ZV benannt werden. Der folgende Fall ist für praktische Anwendungen von
großer Bedeutung.
80
Aussagen über die Summe von unabhängigen und normalverteilten ZV
Die Zufallsvariablen X1 , X2 , . . ., Xn seien unabhängig und normalverteilt mit den Erwartungswerten
µ1 , µ2 , . . . , µn und den Varianzen σ12 , σ22 , . . . , σn2 . Die Summe Z = X1 + X2 + . . . + Xn dieser Zufallsvariablen unterliegt dann ebenfalls einer Normalverteilung. Die Parameter dieser Normalverteilung sind:
µZ = µ1 + µ2 + . . . + µn sowie σZ2 = σ12 + σ22 + . . . + σn2 .
Beispiel: siehe Übung
13.5.2
Zentraler Grenzwertsatz
Im folgenden wird die Voraussetzung, dass die ZV einer Normalverteilung unterliegen müssen, fallengelassen.
Es wird nur verlangt, dass alle betrachteten ZV unabhängig sind und die gleiche (ggf. aber unbekannte!) Verteilungsfunktion besitzen.
Zentraler Grenzwertsatz der Wahrscheinlichkeitsrechnung
Seien X1 , X2 , . . ., Xn unabhängige Zufallsvariable, die alle der gleichen Verteilungsfunktion mit dem
Erwartungswert µ und der Varianz σ 2 genügen. Dann konvergiert die Verteilungsfunktion der standardisierten Zufallsvariablen Zn =
X1 + X2 + . . . + Xn − nµ
√
für n → ∞ gegen die Verteilungsfunktion Φ
nσ
der standardisierten Normalverteilung.
Bei praktischen Anwendungen wird anstelle der Grenzwertbetrachtung n → ∞ häufig die Faustregel angewendet, dass für die Anzahl n der ZV gelten soll: n ≥ 30. Dann kann davon ausgegangen werden, dass die Summe
X1 + X2 + . . . + Xn der ZV annähernd einer Normalverteilung mit den Parametern nµ und nσ 2 genügt.
Beispiel 13.15:
Bemerkung:
Die im Zentralen Grenzwertsatz angegebenen Voraussetzungen können auch noch abgeschwächt werden;
dazu sei auf die folgende Literaturstelle verwiesen: K. B OSCH. Statistik-Taschenbuch, 3. Auflage, S. 334-335.
81
14
14.1
Mathematische Statistik
Einführung
Eine grundlegende Aufgabe der Statistik besteht in der Gewinnung von Kenntnissen und Informationen über
die Eigenschaften oder Merkmale einer bestimmten Menge von Objekten, ohne dass dabei alle Objekte in die
Untersuchung einbezogen werden müssen. Statt dessen werden Stichproben aus einer Grundgesamtheit entnommen (zur Erläuterung der Begriffe Stichprobe“ und Grundgesamtheit“: siehe Abschnitt 14.1.1) und es wird
”
”
versucht, mit Hilfe der Wahrscheinlichkeitsrechnung die gewünschten Informationen zu bekommen.
14.1.1
Einige Grundbegriffe
Einige Grundbegriffe der mathematischen Statistik
Grundgesamtheit:
Gesamtheit gleichartiger Objekte oder Elemente, die hinsichtlich eines bestimmten Merkmals zu untersuchen sind; dieses Merkmal wird durch Zufallsvariable X beschrieben
Zufallsstichprobe vom Umfang n:
eine aus der Grundgesamtheit zufällig herausgegriffene Teilmenge mit n Elementen (dabei: Auswahl der
Elemente wahllos und unabhängig voneinander; alle Elemente müssen die gleiche Chance haben,
ausgewählt zu zu werden)
Im weiteren wird die Bezeichnung Stichprobe von Umfang n“ verwendet.
”
Stichprobenwerte:
beobachtete Merkmalswerte x1 , x2 , . . ., xn der n Elemente (Realisierungen der Zufallsvariablen X)
14.1.2
Verteilungsfunktion einer Stichprobe
Es wird von der folgenden Situation ausgegangen:
Aus einer (endlichen oder unendlichen) Grundgesamtheit wurde eine Stichprobe vom Umfang n entnommen und
es wurden die Merkmalswerte x1 , x2 , . . ., xn (Stichprobenwerte) beobachtet. Diese liegen in Form einer Urliste
vor, d.h. sie wurden in der Reihenfolge ihres Auftretens erfasst.
Die weitere Auswertung der vorliegenden Stichprobe kann wie folgt vorgenommen werden:
- Feststellung der verschiedenen, in der Stichprobe vorkommenden Werte; ihre Anzahl sei k (k ≤ n),
dann werden im folgenden die (der Größe nach geordneten) Stichprobenwerte x1 , x2 , . . ., xk betrachtet
- Feststellung, wie oft jedes xi in der Stichprobe enthalten ist
Dies führt auf den Begriff: absolute Häufigkeit ni des Stichprobenwertes xi (i = 1, 2, . . . , k),
k
P
es gilt:
ni = n
i=1
- Ermittlung der relativen Häufigkeit hi des Stichprobenwertes xi (i = 1, 2, . . . , k):
k
P
n
hi = i , wobei 0 < hi ≤ 1 und
hi = 1
n
i=1
- Darstellung von xi , ni und hi in einer Häufigkeitstabelle (siehe Beispiel 14.1)
Die grafische Darstellung der relativen Häufigkeiten erfolgt im Stabdiagramm (siehe Beispiel 14.1).
82
Beispiel 14.1:41
Aus der laufenden Produktion von Gewindeschrauben mit einem Solldurchmesser von x0 = 5.0 mm wurde eine
Stichprobe vom Umfang n = 25 entnommen.
Dabei ergab sich die folgende Urliste (Werte in mm):
4.9; 4.8; 5.0; 5.2; 5.2; 5.1; 4.7; 5.0; 5.0; 4.9; 4.8; 4.9; 5.1; 5.0; 5.0;
5.1; 5.0; 4.9; 4.8; 4.9; 4.9; 5.0; 5.0; 5.1; 5.0
Es treten nur 6 verschiedene Werte auf. Diese lauten der Größe nach geordnet:
4.7; 4.8; 4.9; 5.0; 5.1; 5.2
(jeweils in mm)
Zur Feststellung der absoluten Häufigkeiten ni (i = 1, 2, . . . , 6) dieser Werte dient die folgende Strichliste:
Stichprobenwert xi (in mm)
4.7
4.8
4.9
5.0
5.1
5.2
ni
|
|||
||||| |
||||| ||||
||||
||
Daraus kann die folgende Häufigkeitstabelle aufgestellt werden:
xi (in mm)
4.7
4.8
4.9
5.0
5.1
5.2
ni
1
3
6
9
4
2
hi
0.04
0.12
0.24
0.36
0.16
0.08
Die zugehörigen relativen Häufigkeiten sind im Bild 14.1a) grafisch dargestellt.
F (x) 6
hi 6
1.0
0.32
q
q
0.8
0.24
q
0.6
0.16
q
0.4
0.08
q
0.2
q
4.7 4.8 4.9 5.0 5.1 5.2
-
x/mm
4.7 4.8 4.9 5.0 5.1 5.2
Bild 14.1a)
x/mm
Bild 14.1b)
Durch Addition der relativen Häufigkeiten aller Stichprobenwerte, welche kleiner oder gleich einer gegebenen
reellen Zahl x sind, erhält man die Summenhäufigkeits- oder Verteilungsfunktion einer Stichprobe.
Definition 14.1:
Die Summenhäufigkeits- oder Verteilungsfunktion F (x) einer Stichprobe mit den Stichprobenwerten
x1 , x2 , . . ., xk und den zugehörigen relativen Häufigkeiten h1 , h2 , . . ., hk ist gegeben durch:
X
F (x) =
hi .
(249)
xi ≤x
Die grafische Darstellung dieser Funktion ergibt eine Treppenfunktion, welche an den Stellen x = xi
jeweils einen Sprung der Höhe hi besitzt.
41
Quelle: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 470-471
83
Fortsetzung zu Beispiel 14.1:
Mit Hilfe der Formel für die Summenhäufigkeits- oder Verteilungsfunktion erhält man die folgende Tabelle:
xi (in mm)
4.7
4.8
4.9
5.0
5.1
5.2
F (xi )
0.04
0.16
0.4
0.76
0.92
1
Das Bild 14.1b) (siehe vorige Seite) zeigt die grafische Darstellung der Funktion F (x).
14.1.3
Gruppierung der Stichprobenwerte bei umfangreichen Stichproben
Wenn die entnommene Stichprobe sehr umfangreich ist, kann die im vorangegangenen Abschnitt eingeführte
Häufigkeitstabelle sehr umfangreich oder sogar unübersichtlich werden. Daher erweist sich in derartigen Fällen
eine Gruppierung der Stichprobenwerte als vorteilhaft.
Dabei geht man wie folgt vor:
- Die Stichprobenwerte werden der Größe nach geordnet und der kleinste sowie der größte Stichprobenwert
(xmin und xmax ) werden bestimmt.
- Das Intervall I, das alle Stichprobenwerte enthält, wird in k Teilintervalle ∆Ii eingeteilt, welche rechtsseitig
halboffen sind und alle die gleiche Breite ∆x besitzen. Diese Teilintervalle werden Klassen genannt. Mit x̃i
bezeichnet man jeweils die Klassenmitte eines jeden Teilintervalls Ii .
- Es wird ausgezählt, wieviele Stichprobenwerte in welche Klasse fallen. Dann können die absoluten und relativen Klassenhäufigkeiten ni und hi (vgl. Abschnitt 14.1.2 für nicht gruppierte“ Stichproben) bestimmt
”
werden.
- Bei der Aufstellung der Häufigkeitstabelle (vgl. Abschnitt 14.1.2) wird allen Elementen einer Klasse die
entsprechende Klassenmitte als Wert zugeordnet.
Die relativen Klassenhäufigkeiten können in einem Stabdiagramm (vgl. Abschnitt 14.1.2) oder in einem Histogramm (siehe Bild 14.2a)) veranschaulicht werden. In einem Histogramm sind die Flächeninhalte der Rechtecke
proportional zu den jeweiligen Klassenhäufigkeiten.
Beispiel 14.2:42
Aus der laufenden Produktion von Ohmschen Widerständen mit einem Sollwiderstand von 100 Ω wurde eine
Stichprobe vom Umfang n = 50 entnommen. Die Widerstandswerte lagen dabei zwischen xmin = 96.7 Ω
und xmax = 104.2 Ω. Um möglichst einfache Zahlen für die Klassenbreiten und -mitten zu erhalten, wird das
Intervall I := [ 96.5 Ω, 104.5 Ω ) gewählt. Es erfolgt eine Einteilung in 8 Klassen der gleichen Breite 1 Ω. Somit
sind die Klassenmitten: 97, 98 ,. . . , 104 (jeweils in Ω).
Es wurde die folgende Häufigkeitstabelle ermittelt (die Urliste ist hier nicht mit aufgeführt):
Klassen-Nr. i
Klassengrenzen
(in Ω)
Klassenmitte x̃i
(in Ω)
abs. Klassenhäuf. ni
rel. Klassenhäuf. hi
1
[96.5, 97.5)
97
2
0.04
2
[97.5, 98.5)
98
5
0.10
3
[98.5, 99.5)
99
10
0.20
4
[99.5, 100.5)
100
13
0.26
5
[100.5, 101.5)
101
9
0.18
6
[101.5, 102.5)
102
6
0.12
7
[102.5, 103.5)
103
4
0.08
8
[103.5, 104.5)
104
1
0.02
50
1
Σ
42
Quelle: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 477-479
84
Das Bild 14.2a) zeigt die grafische Darstellung der relativen Klassenhäufigkeiten in einem Histogramm.
F (x)
hi 6
6
1.0
0.30
q
q
0.6
0.4
q
0.10
0.2
q
97
98 99 100 101 102 103 104
x/Ω
97
Bild 14.2a)
q
q
0.8
0.20
q
q
98 99 100 101 102 103 104
x/Ω
Bild 14.2b)
Durch Addition der relativen Häufigkeiten der Klassen, deren Klassenmitten kleiner oder gleich einer gegebenen
reellen Zahl x sind, entsteht die Verteilungsfunktion einer gruppierten Stichprobe.
Definition 14.2:
Die Verteilungsfunktion F (x) einer gruppierten Stichprobe mit den Klassenmitten x̃i (i = 1, 2, . . . , k)
und den zugehörigen relativen Klassenhäufigkeiten h1 , h2 , . . ., hk ist gegeben durch:
X
F (x) =
hi .
(250)
x̃i ≤x
Die grafische Darstellung dieser Funktion ergibt eine Treppenfunktion, welche an den Stellen x = x̃i
jeweils einen Sprung der Höhe hi besitzt.
Hinweis:
Es ist zu beachten, dass (im Unterschied zu der Formel (249) in der Definition 14.1) jetzt die Klassenmitten
anstelle der Stichprobenwerte sowie die relativen Klassenhäufigkeiten anstelle der relativen Häufigkeiten zu
nehmen sind.
Das Bild 14.2b) (siehe oben) zeigt die Verteilungsfunktion für die im Beispiel 14.2 untersuchte Stichprobe.
Bei der Festlegung der Klassenanzahl und der Klassenbreite für die Gruppierung einer Stichprobe sollten einige
allgemeine Regeln beachtet werden.
Allgemeine Regeln für die Gruppierung einer umfangreichen Stichprobe in Klassen
1) Man wähle möglichst Klassen gleicher Breite.
2) Die Klasseneinteilung sollte so festgelegt werden, dass die Klassenmitten durch möglichst einfache
Zahlen (z.B. ganze Zahlen) charakterisiert werden.
3) Die Festlegung der Anzahl k der Klassen bei n Stichprobenwerten kann mit Hilfe der folgenden
Faustregeln erfolgen:
√
bzw. k = 20 für n > 400.
k = 5 für n ≤ 30
bzw. k ≈ n für 30 < n ≤ 400
14.2
Kennwerte (Maßzahlen) einer Stichprobe
In den Abschnitten 14.1.2 und 14.1.3 wurden Methoden zur Auswertung von Stichproben vorgestellt, bei denen
sämtliche Stichprobenwerte dargestellt wurden. In vielen Fällen ist es jedoch sinnvoll, nur einige Größen anzugeben, welche eine gute Beschreibung der Stichprobenwerte liefern. Derartige Größen werden als Kennwerte
oder Maßzahlen einer Stichprobe bezeichnet.
85
Definition 14.3:
Es liege eine Stichprobe vom Umfang n mit den Stichprobenwerten x1 , x2 , . . ., xn (Urliste) vor.
Der Mittelwert dieser Stichprobe (oder Stichprobenmittelwert bzw. empirische Mittelwert ) wird
wie folgt berechnet:
n
x=
1X
xi .
n
(251)
i=1
Für die Varianz dieser Stichprobe (oder Stichprobenvarianz bzw. empirische Varianz ) gilt die Formel:
s2 =
n
1 X
(xi − x)2 .
n−1
(252)
i=1
Die Standardabweichung wird berechnet nach:
√
s = s2 .
(253)
Bei der Berechnung der Varianz ist die (zu (252) äquivalente) Formel
!
n
X
1
2
2
2
s =
xi − nx
n−1
(254)
i=1
meist bequemer zu handhaben.
Weitere Kennwerte zur Beschreibung von Stichproben sind: Modalwert (oder Dichtemittel), Median (oder Zentralwert), Spannweite (oder Variationsbreite) sowie Variationskoeffizient (oder Variabilitätskoeffizient).
Modalwert xD einer Stichprobe:
Stichprobenwert mit der größten absoluten Häufigkeit
Median x̃ einer Stichprobe:
bei der Größe nach geordneten Daten x∗1 ≤ x∗2 ≤ . . . ≤ x∗n :
( ∗
x(n+1)/2
falls n ungerade
x̃ =
(x∗n/2 + x∗n/2+1 )/2 falls n gerade
Spannweite R einer Stichprobe:
R = xmax − xmin
Variationskoeffizient v einer Stichprobe:
v=
s
x
(relatives Streuungsmaß)
Hinweise:
- Der Modalwert ist nicht immer eindeutig bestimmt. Es kann vorkommen, dass die größte absolute Häufigkeit
gleichzeitig von mehreren Stichprobenwerten angenommen wird.
- Falls jeder Stichprobenwert nur einmal auftritt, gibt es keinen Modalwert.
- Bei gruppierten Stichproben ergibt sich der Modalwert als Klassenmitte der am stärksten besetzten Klasse.
- Der Median hängt lediglich von dem mittelsten Wert bzw. den beiden mittleren Werten der Stichprobe ab,
wenn die Daten der Größe nach geordnet sind (vgl. obige Formel). Daher könnten die übrigen Stichprobenwerte beliebig variiert werden, ohne dass sich der Median verändert (wohingegen sich der Mittelwert der
Stichprobe in diesen Fällen stark verändern kann). Somit ist der Median - im Gegensatz zum Mittelwert der
Stichprobe - robust gegenüber Ausreißern“, d.h. gegenüber extrem kleinen oder extrem großen Stichproben”
werten.
Ebenso ist der Modalwert robust gegenüber Ausreißern“.
”
Beispiel 14.3:
86
Bei Anwendung der Formeln (251) bis (254) zur Berechnung der Kennwerte einer Stichprobe geht jeder einzelne
Stichprobenwert ohne Berücksichtigung seiner Häufigkeit in die Berechnung ein. Bei Stichproben, wo ein mehrfaches Auftreten von Stichprobenwerten beobachtet wurde, erweist sich die Berechnung der Kennwerte unter
Verwendung der absoluten Häufigkeiten als effektiver.
Berechnung der Kennwerte einer Stichprobe unter Berücksichtigung der absoluten Häufigkeiten
Es liege eine Stichprobe mit den verschiedenen Stichprobenwerten x1 , x2 , . . ., xk vor.
Weiterhin seien n1 , n2 , . . ., nk die zugehörigen absoluten Häufigkeiten. Für die Berechnung des Mittelwertes x und der Varianz s2 der Stichprobe gelten dann die folgenden Formeln:
k
x=
1X
xi ni
n
(255)
i=1
k
1 X
2
(xi − x)2 · ni
s =
n−1
oder
i=1
1
s2 =
n−1
k
X
!
x2i · ni − nx 2
(256)
i=1
Fortsetzung zu Beispiel 14.1:
Zur Berechnung des Mittelwertes und der Varianz von gruppierten Stichproben (siehe Abschnitt 14.1.3) wird die
jeweilige Klassenmitte herangezogen.
Berechnung der Kennwerte einer gruppierten Stichprobe
Gegeben sei eine gruppierte Stichprobe mit k Klassen und den Klassenmitten x̃i (i = 1, 2, . . . , k).
Weiterhin seien n1 , n2 , . . ., nk die absoluten Klassenhäufigkeiten (siehe Abschnitt 14.1.3). Der Mittelwert
x und die Varianz s2 dieser Stichprobe können dann nach den folgenden Formeln berechnet werden:
k
1X
x=
x̃i ni
n
(257)
i=1
k
1 X
2
s =
(x̃i − x)2 · ni
n−1
i=1
oder
1
s2 =
n−1
k
X
!
x̃2i · ni − nx 2
(258)
i=1
Fortsetzung zu Beispiel 14.2:
14.3
Korrelationsrechnung
Bei den bisherigen Betrachtungen wurde eine Stichprobe stets nur hinsichtlich eines Merkmals untersucht. Für
die Praxis ist es jedoch häufig von Interesse, zwei Merkmale einer Stichprobe zu beobachten und zu entscheiden,
ob zwischen diesen Merkmalen ein Zusammenhang (eine Abhängigkeit) besteht.
Im weiteren wird davon ausgegangen, dass bei einer vorliegenden Stichprobe zwei Merkmale zu untersuchen
sind. Diese werden durch die beiden Zufallsvariablen X und Y beschrieben. Die beobachteten Merkmalswerte
(Realisierungen der ZV X und Y ) seien x1 , x2 , . . ., xn sowie y1 , y2 , . . ., yn . Daraus werden n geordnete
Wertepaare
(x1 ; y1 ), (x2 ; y2 ), . . . , (xn ; yn )
gebildet (zweidimensionale Stichprobe vom Umfang n).
87
Der Zusammenhang zwischen den beiden Zufallsvariablen X und Y kann mit Hilfe zweier Kennwerte der zweidimensionalen Stichprobe: empirische Kovarianz und empirischer Korrelationskoeffizient charakterisiert werden.
Empirische Kovarianz und empirischer Korrelationskoeffizient
Gegeben sei eine zweidimensionale Stichprobe vom Umfang n: (x1 ; y1 ), (x2 ; y2 ), . . . , (xn ; yn ).
Dann gilt (unter der Voraussetzung, dass sX 6= 0, sY 6= 0):
n
X
1
·
empirische Kovarianz:
sXY =
(xi − x)(yi − y)
n−1
=
s2Y =
n
1 X
·
x ,
n i=1 i
1
·
n−1
n
X
y=
n
1 X
·
y ,
n i=1 i
(yi − y)2 =
i=1
1
n−1
s2X =
·
r = rXY =
empirischer Korrelationskoeffizient:
mit: x =
1
n−1
i=1
n
P
i=1
n
X
x i yi − n x y
i=1
sXY
sX · sY
n
X
1
·
(x
n − 1 i=1 i
yi2 − ny 2
(259)
− x)2 =
(260)
1
n−1
n
P
i=1
x2i − nx 2 ,
(vgl. dazu auch: Formeln (251), (252), (254)).
Die folgenden Formel ist zu (260) äquivalent:
n
P
r = s
xi yi − nx y
i=1
n
P
i=1
x2i − n x2
n
P
i=1
yi2 − n y 2
.
Für den empirischen Korrelationskoeffizienten r gilt stets: −1 ≤ r ≤ 1.
Wenn zudem eine Darstellung der Wertepaare (x1 ; y1 ), (x2 ; y2 ), . . . , (xn ; yn ) in einem rechtwinkligen kartesischen Koordinatensystem erfolgt ( Punktwolke“ im Streuungsdiagramm), können aus der Größe von r fol”
gende Schlussfolgerungen gezogen werden:
- Wenn sich r nur geringfügig von 1 oder -1 unterscheidet, liegen die Stichprobenpunkte (xi , yi ) nahezu auf
einer Geraden (siehe Bild 14.3a)).
- Falls |r| = 1 gilt, liegen die Stichprobenpunkte exakt auf einer Geraden. Es besteht eine exakte lineare Abhängigkeit zwischen den ZV X und Y . Für r = 1 hat die Gerade einen positiven Anstieg (siehe
Bild 14.3b)), für r = −1 einen negativen Anstieg (siehe Bild 14.3c)).
- Falls r = 0 gilt, besteht zwischen den Zufallsvariablen X und Y kein linearer Zusammenhang. Es handelt
sich dann um unkorrelierte ZV. Das bedeutet aber nicht unbedingt, dass diese ZV stochastisch unabhängig
(vgl. Definition 13.12) sind. Andererseits sind stochastisch unabhängige ZV stets unkorreliert.
Der empirische Korrelationskoeffizient r ist somit ein Maß für den linearen Zusammenhang der Ausprägungen
zweier Merkmale. Dabei ist zu beachten, dass die Berechnung des Korrelationskoeffizienten r nur dann sinnvoll
ist, wenn zwischen den Merkmalen ein sachlich begründeter innerer Zusammenhang besteht.
y 6
y 6
r
r
r
r
r
r
r
r
r
r
y 6
Sr r
S
r
S
r
x
Bild 14.3a)
Sr
Sr r
S
r
SS
x
Bild 14.3b)
88
x
Bild 14.3c)
Beispiel 14.4:
Die Jahresproduktion einer Firma wird als Zufallsvariable X und die Jahresgesamtkosten dieser Firma als Zufallsvariable Y angesehen. Die Wahrscheinlichkeitsverteilung dieser ZV ist nicht bekannt. In insgesamt n = 10
Zweigstellen dieser Firma wurden die folgenden Daten erfasst:
Zweigstelle i
1
2
3
4
5
6
7
8
9
10
Jahresproduktion (in 104 EUR)
12
15
18
18
20
21
24
25
36
37
Jahresgesamtkosten (in 104 EUR)
11
12
16
17
18
18
20
21
26
31
Im weiteren wird der Zusammenhang zwischen Korrelationsrechnung und Ausgleichsrechnung erläutert.
Die folgende Problemstellung wurde im Abschnitt 7.5 (siehe Skript zur Vorlesung Mathematik 2) betrachtet:
Gegeben seien n Punkte mit den kartesischen Koordinaten (xi ; yi ), i = 1, 2, . . . , n, mit n ≥ 3 sowie xi 6= xj
für i 6= j. Nun soll eine Gerade y = f (x) = a1 x + a0 so in diese Punktmenge eingepasst werden, dass der
Trend“ in der Anordnung der Punkte möglichst gut wiedergegeben wird (vgl. Bild 14.4). Diese Gerade wird als
”
Ausgleichs- oder Regressionsgerade bezeichnet. Als Kriterium für die Güte dieser Ausgleichsgeraden dient die
Summe aller Fehlerquadrate d2i (i = 1, 2, . . . , n) mit d2i = [f (xi ) − yi ]2 , welche minimal werden soll43 .
y 6
r r f (x) = a1 x + a0
r r r r r
r r
r
r
x
0
Bild 14.4
Im Abschnitt 7.5 wurden geeignete Größen a1 und a0 für die Ausgleichsgerade als Lösungen einer Extremwertaufgabe für eine Funktion zweier reeller Variabler berechnet.
Mit Hilfe der Lösung des linearen Gleichungssystems (122) im Abschnitt 7.5 und den Formeln (259) sowie
(260) kann der folgende Zusammenhang zwischen a1 (Anstieg der Ausgleichsgeraden) und dem empirischen
Korrelationskoeffizient r hergestellt werden:
a1 =
(n − 1)sXY
sXY
rsX sY
sY
= 2 =
=r
.
2
2
sX
(n − 1)sX
sX
sX
Weiterhin gilt:
a0 = y − a1 x .
Fortsetzung zu Beispiel 14.4:
43
Dieses Verfahren zur Berechnung der Ausgleichsgeraden wurde als Methode des Gaußschen Fehlerquadratminimums bezeichnet.
89
14.4
14.4.1
Statistische Schätzmethoden für die unbekannten Parameter einer Wahrscheinlichkeitsverteilung ( Parameterschätzungen“)
”
Einführung
Es wird von der Situation ausgegangen, dass die Wahrscheinlichkeitsverteilung einer Zufallsvariablen X (die ein
bestimmtes Merkmal der Elemente einer Grundgesamtheit beschreibt) zwar vom Typ her bekannt ist, aber noch
unbekannte Parameter (z.B. µ, σ 2 bei einer Normalverteilung) enthält. In solchen Fällen ist es wünschenswert,
zumindest Schätzungen für diese Parameter ermitteln zu können. Daraus ergeben sich die folgenden Aufgaben
der Parameterschätzung:44
1) Bestimmung von Schätz- oder Näherungswerten für die unbekannten Parameter der Verteilung
Dazu soll eine konkrete Stichprobe, die der betreffenden Grundgesamtheit entnommen wird, verwendet werden. Der Schätzwert eines Parameters kann als Punkt auf der Zahlengeraden gedeutet werden. Daher wird
diese Art der Parameterschätzung auch als Punktschätzung bezeichnet.
2) Konstruktion von sog. Konfidenz- oder Vertrauensintervallen
Es handelt sich hier um Intervalle, in denen die Werte der unbekannten Parameter mit einer vorgegebenen
Wahrscheinlichkeit vermutet werden. Diese Art von Schätzung wird auch als Intervall- oder Bereichsschätzung bezeichnet. Sie wird ebenfalls anhand einer konkreten Stichprobe durchgeführt.
14.4.2
Punktschätzungen
Um einen Schätzwert für einen unbekannten statistischen Parameter (hier allgemein mit ϑ bezeichnet) zu gewinnen, werden Schätzfunktionen verwendet. Dies sind spezielle Stichprobenfunktionen vom Typ
Θ = g(X1 , X2 , . . . , Xn )
die für jede konkrete Stichprobe x1 , x2 , . . . , xn einen Schätzwert
ϑ̂ = g(x1 , x2 , . . . , xn )
für den Parameter ϑ liefern. Dabei sind X1 , X2 , . . . , Xn unabhängige Zufallsvariable, die alle die gleiche Verteilungsfunktion F (x) besitzen.
Eine Schätzfunktion Θ wird dabei als optimal angesehen, wenn sie die folgenden Eigenschaften45 hat:
1) Die Schätzfunktion Θ ist erwartungstreu, d.h. ihr Erwartungswert ist gleich dem zu schätzenden Parameter:
E(Θ) = ϑ.
2) Die Schätzfunktion Θ ist konsistent (passend), d.h. Θ konvergiert mit zunehmendem Stichprobenumfang n
gegen den Parameter ϑ.
3) Die Schätzfunktion Θ ist effizient (wirksam), d.h. es gibt bei gleichem Stichprobenumfang n keine andere
erwartungstreue Schätzfunktion mit einer kleineren Varianz.
44
45
Quelle: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 488
Quelle: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 492
90
Schätzung für den Erwartungswert µ
Sei µ der unbekannte Erwartungswert der Wahrscheinlichkeitsverteilung der Zufallsvariablen X,
welche das zu untersuchende Merkmal beschreibt. Es liege eine konkrete Stichprobe x1 , x2 , . . . , xn
aus der zu betrachtenden Grundgesamtheit vor. Dann ist durch
n
µ̂ = x =
1X
xi
n
(261)
i=1
(vgl. auch Formel (251)) ein Schätzwert für den Erwartungswert µ gegeben.
Der Wert x ist eine konkrete Realisierung der Stichprobenfunktion
n
X=
1X
Xi
n
(262)
i=1
(Stichprobenmittel). Sie liefert eine erwartungstreue Schätzung für µ.
Schätzung für die Varianz σ 2
Sei σ 2 die unbekannte Varianz der Wahrscheinlichkeitsverteilung der Zufallsvariablen X. Dann liefert
n
σ̂ 2 = s2 =
1 X
(xi − x)2
n−1
mit x aus (261)
(263)
i=1
(vgl. auch Formel (252)) eine erwartungstreue Schätzung für die Varianz σ 2 .
Der Wert s2 ist eine konkrete Realisierung der Stichprobenfunktion
n
S2 =
1 X
(Xi − X)2
n−1
(264)
i=1
(Stichprobenvarianz).
Hinweise:
√
- Die Stichprobenfunktion S = S 2 ist eine Schätzfunktion für die Standardabweichung σ, jedoch ist diese
nicht erwartungstreu (d.h. es gilt: E(S) 6= σ).
- Wenn alle ZV Xi normalverteilt sind, so ist auch die Schätzfunktion X normalverteilt mit E(X) = µ und
Var(X) =
σ2
.
n
- Im Fall einer gruppierten Stichprobe mit k Klassen (siehe Abschnitt 14.1.3) können die Schätzungen µ̂ = x
mit x aus (257) für den Erwartungswert µ und σ̂ 2 = s2 mit s2 aus (258) für die Varianz σ 2 verwendet
werden.
Nachfolgend wird eine Schätzung für den unbekannten Parameter p einer Binomialverteilung (siehe Abschnitt
13.4.1) angegeben.
Schätzung für den Parameter p einer Binomialverteilung
Ein Bernoulli-Experiment (siehe Abschnitt 13.4.1) werde n-mal durchgeführt, wobei p die unbekannte
Wahrscheinlichkeit des Eintretens des Ereignisses A sei. Dann ist durch
p̂ = h(A) =
k
n
(k : absolute Häufigkeit des Eintretens des Ereignisses A)
(265)
ein Schätzwert für p gegeben.
X
Der Wert p̂ ist eine konkrete Realisierung der Schätzfunktion: P̂ =
(der Wert der ZV X ergibt sich
n
als Anzahl des Auftretens des Ereignisses A bei n-maliger Durchführung des Bernoulli-Experiments).
Die Schätzfunktion P̂ liefert eine erwartungstreue Schätzung für p.
91
14.4.3
Bestimmung von Konfidenzintervallen (Vertrauensintervallen)
Durch die im vorangegangenen Abschnitt beschriebene Methode konnten Schätzwerte für unbekannte Parameter
berechnet werden. Jedoch sind - insbesondere wenn der Stichprobenumfang klein ist - noch größere Abweichungen von dem tatsächlichen Wert möglich. Um das Problem der Genauigkeit und Sicherheit des Schätzwertes zu
lösen, soll ein Intervall bestimmt werden, das den unbekannten Parameterwert mit hoher Wahrscheinlichkeit
einschließt. Ein solches Intervall nennt man Konfidenzintervall (oder Vertrauensintervall).
Konfidenzintervall für den unbekannten Parameter ϑ einer vom Typ her bekannten Wahrscheinlichkeitsverteilunga
Sei X eine Zufallsvariable, deren Wahrscheinlichkeitsverteilung einen unbekannten Parameter ϑ enthalte.
Für diesen Parameter lässt sich unter Verwendung einer konkreten Stichprobe x1 , x2 , . . . , xn auf folgende
Weise ein Konfidenzintervall bestimmen:
1) Es wird ein bestimmtes Konfidenzniveau (Vertrauensniveau) γ = 1 − α gewählt
(0 < γ < 1; α: Irrtumswahrscheinlichkeit).
2) Dann werden für den Parameter ϑ zwei Stichproben- oder Schätzfunktionen
Θu = gu (X1 , X2 , . . . , Xn )
und
Θo = go (X1 , X2 , . . . , Xn )
bestimmt, die mit der gewählten Wahrscheinlichkeit γ = 1 − α den wahren Wert des Parameters ϑ
einschließen:
P (Θu ≤ ϑ ≤ Θo ) = γ = 1 − α .
3) Aus der vorgegebenen konkreten Stichprobe x1 , x2 , . . . , xn werden die Werte der beiden Stichprobenfunktionen Θu und Θo berechnet:
cu = gu (x1 , x2 , . . . , xn ) ,
co = go (x1 , x2 , . . . , xn ) .
Diese liefern die Grenzen des gesuchten Konfidenzintervalls.
4) Das Konfidenzintervall für den unbekannten Parameter ϑ lautet:
cu ≤ ϑ ≤ co .
a
Quelle: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 511
Die soeben beschriebene allgemeine Vorgehensweise wird nun in einem konkreten Fall angewendet: für den
unbekannten Erwartungswert µ einer Normalverteilung soll bei bekannter Varianz σ 2 ein Konfidenzintervall
ermittelt werden. Grundlage der Berechnung ist die Tatsache, dass die Stichprobenfunktion
X=
1
n
(X1 + X2 + . . . + Xn ) (Stichprobenmittel) normalverteilt ist mit E(X) = µ und Var(X) =
σ2
n
,
siehe dazu auch die Hinweise im Abschnitt 14.4.2.
Zudem wird der Begriff des Quantils (siehe Definition 13.3) benötigt.
Bestimmung eines Konfidenzintervalls für den unbekannten Erwartungswert einer Normalverteilung
bei bekannter Varianz σ 2
1) Festlegung eines Konfidenzniveaus γ (üblicherweise: γ = 0.95 od. γ = 0.99),
α = 1 − γ ist dann die Irrtumswahrscheinlichkeit
2) Ermittlung des (1 − α/2)-Quantils der Standard-Normalverteilung: z1−α/2 (aus der Tabelle)
3) Berechnung des Mittelwertes x der konkreten Stichprobe x1 , x2 , . . . , xn (gemäß Formel (251))
4) Berechnung der Grenzen des gesuchten Konfidenzintervalls [gu , go ]:
σ
gu = x − √ z1−α/2 ,
n
σ
go = x + √ z1−α/2 .
n
Hinweis:
In dem Fall, dass ein Konfidenzintervall in der Form [ gu , ∞) oder (−∞, go ] zu berechnen ist, muss im Schritt 2)
das (1 − α)-Quantil (anstelle des (1 − α/2)-Quantils) genommen werden.
92
Beispiel 14.5:46
Die Längenmessung (in mm) von 10 Schrauben, welche zufällig aus einem bestimmten Sortiment ausgewählt
wurden, ergab die folgenden Werte:
i
xi
1
10
2
8
3
9
4
10
5
11
6
11
7
9
8
12
9
8
10
12
Unter der Voraussetzung, dass diese Stichprobe aus einer normalverteilten Grundgesamtheit stammt, ist ein Konfidenzintervall für den unbekannten Erwartungswert µ (d.h. den Erwartungswert für die Länge der Schrauben)
zu berechnen. Es wird davon ausgegangen, dass die Varianz bekannt ist, und zwar: σ 2 = 4 mm2 .
Wenn ein Konfidenzintervall für den unbekannten Erwartungswert µ einer Normalverteilung bei unbekannter
√
X −µ
√ (wobei X aus (262) und S = S 2
Varianz σ 2 ermittelt werden soll, dann wird ausgenutzt, dass die ZV
S/ n
S2
mit
aus (264)) einer t-Verteilung mit n − 1 Freiheitsgraden unterliegt.
Die t-Verteilung47 ist eine Prüfverteilung, die bei statistischen Prüf- und Testverfahren angewendet wird.
Die wichtigsten Quantile der t-Verteilung sind tabelliert, siehe z.B.:
H.-J. BARTSCH . Taschenbuch mathematischer Formeln für Ingenieure und Naturwissenschaftler,
23. Auflage (2014), S. 781.
Bestimmung eines Konfidenzintervalls für den unbekannten Erwartungswert einer Normalverteilung
bei unbekannter Varianz σ 2
1) Festlegung eines Konfidenzniveaus γ (üblicherweise: γ = 0.95 od. γ = 0.99),
α = 1 − γ ist dann die Irrtumswahrscheinlichkeit
2) Bestimmung des (1 − α/2) -Quantils der t-Verteilung mit n − 1 Freiheitsgraden: tn−1;1−α/2
(aus der Tabelle)
3) Berechnung des Mittelwertes x und der Varianz s2 bzw. der Standardabweichung s
der konkreten Stichprobe x1 , x2 , . . . , xn (gemäß (251), (252))
4) Berechnung der Grenzen des gesuchten Konfidenzintervalls [gu , go ]:
s
gu = x − √ tn−1;1−α/2 ,
n
s
go = x + √ tn−1;1−α/2 .
n
Hinweis:
Bei umfangreichen Stichproben (n > 30) wird davon ausgegangen, dass σ ≈ s gilt. Dann kann bei der Bestimmung des Konfidenzintervalls auf den Fall bekannte Varianz“ (siehe vorige Seite) zurückgegriffen werden.
”
46
Quelle: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 517-518
Auf die Dichte- und die Verteilungsfunktion der t-Verteilung soll an dieser Stelle nicht näher eingegangen werden. Es sei auf die
folgende Literaturstelle verwiesen: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 440-443.
47
93
Beispiel 14.6:
Aus einer Serienproduktion von Widerständen wurden 12 Stück zufällig entnommen. Die Messung dieser Widerstände (in Ω) ergab:
i
1
2
3
4
5
6
7
8
9
10
11
12
xi
100
98
101
97
96
103
99
100
98
101
99
102
Unter der Voraussetzung, dass diese Stichprobe aus einer normalverteilten Grundgesamtheit stammt, ist ein Konfidenzintervall für den unbekannten Erwartungswert µ zu ermitteln, wobei die Varianz σ 2 ebenfalls unbekannt
ist.
Im Zusammenhang mit der Normalverteilung wird schließlich noch der Fall betrachtet, dass ein Konfidenzintervall für die unbekannte Varianz σ 2 bei ebenfalls unbekanntem Erwartungswert µ zu bestimmen ist. Bei dieser
√
S2
Berechnung wird genutzt, dass die ZV (n − 1) 2 (wobei S = S 2 mit S 2 aus (264)) einer Chi-Quadratσ
Verteilung mit n − 1 Freiheitsgraden genügt.
Die Chi-Quadrat-Verteilung48 (kurz: χ2 -Verteilung) ist ebenfalls eine Prüfverteilung.
Die wichtigsten Quantile der χ2 -Verteilung sind tabelliert, siehe z.B.:
H.-J. BARTSCH . Taschenbuch mathematischer Formeln für Ingenieure und Naturwissenschaftler,
23. Auflage (2014), S. 782.
Bestimmung eines Konfidenzintervalls für die unbekannte Varianz σ 2 einer Normalverteilung
1) Festlegung eines Konfidenzniveaus γ (üblicherweise: γ = 0.95 od. γ = 0.99),
α = 1 − γ ist dann die Irrtumswahrscheinlichkeit
2) Bestimmung des α/2-Quantils und des (1−α/2)-Quantils der χ2 -Verteilung mit n−1 Freiheitsgraden:
χ2n−1; α/2 und χ2n−1; 1−α/2 (aus der Tabelle)
3) Berechnung der Varianz s2 der konkreten Stichprobe x1 , x2 , . . . , xn (gemäß (252))
4) Berechnung der Grenzen des gesuchten Konfidenzintervalls [gu , go ]:
gu =
(n − 1)s2
,
χ2n−1; 1−α/2
go =
(n − 1)s2
.
χ2n−1; α/2
Fortsetzung zu Beispiel 14.6:
48
für die Dichte- und die Verteilungsfunktion der χ2 -Verteilung: siehe L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 435-439.
94
Um ein Konfidenzintervall für den unbekannten Parameter p einer Binomialverteilung zu erhalten, kann ausgenutzt werden, dass die Binomialverteilung mit den Parametern n und p durch eine Normalverteilung mit den
Parametern µ = np und σ 2 = np(1−p) approximiert werden kann (siehe dazu Abschnitt 13.4.6). Voraussetzung
dafür ist, dass eine umfangreiche Stichprobe (gemäß der Bedingung (242)) vorliegt.
Bestimmung eines Konfidenzintervalls für den unbekannten Parameter p einer Binomialverteilung
1) Festlegung eines Konfidenzniveaus γ (üblicherweise: γ = 0.95 od. γ = 0.99),
α = 1 − γ ist dann die Irrtumswahrscheinlichkeit
2) Ermittlung des (1 − α/2)-Quantils der standardisierten Normalverteilung: z1−α/2 (aus der Tabelle)
3) Berechnung des Schätzwertes p̂ =
k
n
aus der konkreten Stichprobe
( k Erfolge bei insgesamt n Ausführungen des Bernoulli-Experiments“, siehe auch (265))
”
4) Wenn die Bedingung ∆ = n · p̂ · (1 − p̂) > 9 für eine umfangreiche Stichprobe erfüllt ist,
lauten die Grenzen des gesuchten Konfidenzintervalls [ gu , go ]:
z1−α/2 √
z1−α/2 √
∆,
go = p̂ +
∆.
gu = p̂ −
n
n
Beispiel 14.7:
Bemerkung:
Bei den bisherigen Ausführungen zur Bestimmung von Konfidenzintervallen wurde stets davon ausgegangen,
dass der Typ der Wahrscheinlichkeitsverteilung bekannt ist (Normalverteilung oder Binomialverteilung). Bei
einer beliebig verteilten ZV können zur Berechnung von Konfidenzintervallen für den Erwartungswert E(X)
die genannten Methoden angewendet werden, falls der Stichprobenumfang hinreichend groß ist (Faustregel:
n > 30).
14.5
14.5.1
Statistische Prüfverfahren für die unbekannten Parameter einer Wahrscheinlichkeitsverteilung ( Parametertests“)
”
Statistische Hypothesen und Parametertests
statistische Hypothese:
Annahme (Vermutung, Behauptung) über die Wahrscheinlichkeitsverteilung
einer ZV und deren Parameter
Parametertest:
statistisches Prüfverfahren für unbekannte Parameter einer Wahrscheinlichkeitsverteilung, wobei der Verteilungstyp bekannt ist
Ziel des Parametertests:
Hypothese (Nullhypothese) überprüfen, um zu entscheiden,
ob diese Hypothese beibehalten (d.h. nicht abgelehnt) werden kann
Beispiel 14.8:
a) Bei dem Zufallsexperiment Wurf einer Münze“ wird das Ereignis A: Zahl wurde geworfen“ mit der Wahr”
”
scheinlichkeit p = 0.5 eintreten, wenn es sich um eine unverfälschte Münze handelt. Um dies zu überprüfen, führt man das Zufallsexperiment mehrfach aus und stellt die Häufigkeit des Ereignisses A fest. Bei
der anschließenden Auswertung wird die Nullhypothese H0 : p(A) = 0.5 gegen die Alternativhypothese H1 : p(A) 6= 0.5 getestet.
Es handelt sich hier um einen zweiseitigen Test, da die Alternativhypothese sowohl die Werte p < 0.5 als
auch p > 0.5 zulässt.
b) Für die Bruchfestigkeit von Werkstücken sei ein gewisser Mindestwert, hier mit µ0 bezeichnet, vorgegeben.
Bei einer gewissen Anzahl von Werkstücken wird die Bruchfestigkeit gemessen und aus dieser Stichprobe
ein Mittelwert µ = x berechnet. Dann wird die Nullhypothese H0 : µ ≥ µ0 ( Mindestwert für die Bruch”
festigkeit wird erreicht oder überschritten“) gegen die Alternativhypothese H1 : µ < µ0 ( Mindestwert für
”
die Bruchfestigkeit wird unterschritten“, d.h. das Werkstück ist unbrauchbar) getestet.
Hier handelt es sich um einen einseitigen Test, da die Alternativhypothese nur die Werte µ < µ0 zulässt.
95
Um einen Parametertest durchzuführen, wird eine Stichprobe (vom Umfang n) aus der betreffenden Grundgesamtheit entnommen und untersucht. Zur Untersuchung werden wiederum geeignete Stichprobenfunktionen,
d.h. Funktionen der unabhängigen ZV X1 , X2 , . . . , Xn (siehe auch Abschnitt 14.4.2), verwendet.
Planung und Durchführung eines Parametertestsa
Voraussetzungen:
Die Wahrscheinlichkeitsverteilung der ZV X sei vom Typ her bekannt, der Parameter ϑ der Verteilung sei
unbekannt. Es liege eine konkrete Stichprobe x1 , x2 , . . . , xn aus der zu betrachtenden Grundgesamtheit vor.
Vorgehensweise:
1) Formulierung der Nullhypothese H0 : ϑ = ϑ0 sowie der Alternativhypothese H1 : ϑ 6= ϑ0
(zweiseitiger Parametertest)
2) Festlegung der Signifikanzzahl (Signifikanzniveau, Irrtumswahrscheinlichkeit) α (0 < α < 1)
Diese entspricht der Wahrscheinlichkeit dafür, dass die Nullhypothese H0 abgelehnt wird,
obwohl sie richtig ist.
3) Bestimmung einer geeigneten Test- oder Prüfvariablen (Stichprobenfunktion) T , die noch von
den n unabhängigen Zufallsvariablen X1 , X2 , . . . , Xn abhängt: T = g(X1 , X2 , . . . , Xn )
4) Bestimmung des nicht-kritischen Bereichs cu ≤ T ≤ co derart, dass die Testvariable T
mit der Wahrscheinlichkeit γ = 1 − α Werte aus dem Intervall [cu , co ] annimmt
5) Berechnung des Wertes der Testvariablen T aus der konkreten Stichprobe x1 , x2 , . . . , xn
(Einsetzen dieser Werte für die ZV X1 , X2 , . . . , Xn )
Der erhaltene Funktionswert t̂ = g(x1 , x2 , . . . , xn ) heißt Test- oder Prüfwert von T .
6) Testentscheidung: Ablehnung oder Nichtablehnung der Nullhypothese?
1. Fall: Testwert t̂ fällt in den nicht-kritischen Bereich der Testvariablen T,
d.h. cu ≤ t̂ ≤ co ⇒ Nullhypothese wird nicht abgelehnt
2. Fall: Testwert t̂ fällt in den kritischen Bereich ⇒ Nullhypothese H0 wird abgelehnt
(d.h. zugunsten der Alternativhypothese H1 verworfen)
a
Quelle: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 435-439.
In den nächsten Abschnitten wird die soeben beschriebene allgemeine Vorgehensweise in konkreten Fällen angewendet.
Bemerkungen:
- Die Ausdrucksweise Nullhypothese wird nicht abgelehnt“ (vgl. oben) bedeutet nicht, dass die Richtigkeit
”
dieser Hypothese bewiesen ist. Sie besagt lediglich, dass die Auswertung der Stichprobe keinen Widerspruch
zur Nullhypothese ergeben hat.
- Die Ausdrucksweise Nullhypothese wird abgelehnt“ besagt, dass die Auswertung der Stichprobe signifi”
kante (statistisch gesicherte) Abweichungen zur Nullhypothese ergeben hat. Damit ist jedoch nicht bewiesen,
dass die Nullhypothese falsch ist.
- Bei der Testentscheidung können Fehler 1. Art (Ablehnung einer an sich richtigen Nullhypothese) oder
Fehler 2. Art (Nichtablehnung einer Nullhypothese, die an sich falsch ist) auftreten. Für eine detaillierte
Darstellung dieser Problematik sei auf die folgende Literaturstelle verwiesen:
W. D ÜRR , H. M AYER. Wahrscheinlichkeitsrechnung und Schließende Statistik, 8. Auflage, S. 160-163.
14.5.2
Tests für den unbekannten Erwartungswert µ einer Normalverteilung
Zunächst wird der Fall betrachtet, dass die Varianz σ 2 der normalverteilten ZV X bekannt ist und ein Test für
den unbekannten Erwartungswert µ durchzuführen ist. Dabei soll die Nullhypothese H0 : µ = µ0 gegen die
Alternativhypothese H1 : µ 6= µ0 getestet werden. Grundlage für diesen Test ist die Tatsache, dass die ZV
X − µ0
√
σ/ n
der standardisierten Normalverteilung genügt (X: Stichprobenmittel, siehe Formel (262)).
96
Zweiseitiger Test für den unbekannten Erwartungswert µ einer Normalverteilung bei bekannter
Varianz σ 2
1) Nullhypothese H0 : µ = µ0 , Alternativhypothese H1 : µ 6= µ0
2) Festlegung einer Signifikanzzahl α (meist α = 0.05 oder α = 0.01)
3) Testvariable: T =
X − µ0
√
σ/ n
4) Bestimmung des (1 − α/2)-Quantils der standardisierten Normalverteilung: z1−α/2 (aus der Tabelle)
und Festlegung des nicht-kritischen Bereiches: −z1−α/2 ≤ T ≤ z1−α/2 (oder: |T | ≤ z1−α/2 )
5) Berechnung des Mittelwertes x der vorliegenden Stichprobe sowie des Test- oder Prüfwertes:
t̂ =
x − µ0
√
σ/ n
6) Testentscheidung: Falls −z1−α/2 ≤ t̂ ≤ z1−α/2 ⇒ Nullhypothese H0 : µ = µ0 wird nicht abgelehnt.
Anderenfalls wird sie zugunsten der Alternativhypothese H1 abgelehnt.
Beispiel 14.9:
Bei einem einseitigen Test lautet die Nullhypothese: H0 : µ ≤ µ0 (oder: H0 : µ ≥ µ0 ). Die Alternativhypothese
ist dann: H1 : µ > µ0 (bzw. H1 : µ < µ0 ).
Im Schritt 4) der oben beschriebenen Vorgehensweise ist dann das (1 − α)-Quantil z1−α der standardisierten
Normalverteilung zu bestimmen (anstelle von z1−α/2 ). Der nicht-kritische Bereich lautet:
T ≤ z1−α , wenn die Hypothese H0 : µ ≤ µ0 getestet wird bzw.
T ≥ −z1−α , wenn die Hypothese H0 : µ ≥ µ0 getestet wird.
Die Testentscheidung (siehe Schritt 6)) ist dementsprechend zu modifizieren.
In dem Fall, dass ein Test für den unbekannten Erwartungswert µ einer Normalverteilung bei unbekannter Varianz durchzuführen ist, kann bei der Aufstellung der Testvariablen T nicht auf den Wert σ zurückgegriffen
werden.
√
X − µ0
√
Statt dessen wird verwendet, dass die ZV
einer t-Verteilung mit n−1 Freiheitsgraden genügt (S = S 2 ,
S/ n
wobei
S2
die gemäß (264) berechnete Stichprobenvarianz bezeichnet).
Zweiseitiger Test für den unbekannten Erwartungswert µ einer Normalverteilung bei unbekannter
Varianz σ 2
1) Nullhypothese H0 : µ = µ0 , Alternativhypothese H1 : µ 6= µ0
2) Festlegung einer Signifikanzzahl α (meist α = 0.05 oder α = 0.01)
3) Testvariable: T =
X − µ0
√
S/ n
4) Bestimmung des (1 − α/2)-Quantils der t-Verteilung mit n − 1 Freiheitsgraden: tn−1;1−α/2
(aus der Tabelle) und Festlegung des nicht-kritischen Bereiches: −tn−1;1−α/2 ≤ T ≤ tn−1;1−α/2
(oder: |T | ≤ tn−1;1−α/2 )
5) Berechnung des Mittelwertes x und der Standardabweichung s der vorliegenden Stichprobe sowie des
Test- oder Prüfwertes:
t̂ =
x − µ0
√
s/ n
6) Testentscheidung: Falls −tn−1;1−α/2 ≤ t̂ ≤ tn−1;1−α/2 ⇒ Nullhypothese H0 : µ = µ0 wird nicht
abgelehnt. Anderenfalls wird sie abgelehnt.
Beispiel 14.10:
97
Bemerkungen:
- Im Fall eines einseitigen Tests ist entsprechend das (1 − α)-Quantil (anstelle des (1 − α/2)-Quantils) der
t-Verteilung mit n − 1 Freiheitsgraden zu verwenden.
- Falls der Stichprobenumfang hinreichend groß ist (Faustregel: n > 30), kann davon ausgegangen werden,
dass die Testvariable T annähernd der Standard-Normalverteilung unterliegt. Dann kann die Testmethode für
den Fall bekannte Varianz“ angewendet werden.
”
14.5.3
Tests für die unbekannte Varianz σ 2 einer Normalverteilung
Methoden zum Test der Varianz werden z.B. bei der Untersuchung der Genauigkeit der Arbeitsweise von Geräten
oder Maschinen benötigt. Zunächst wird ein Parametertest vorgestellt, bei dem die Nullhypothese σ 2 = σ02 gegen die Alternativhypothese H1 : σ 2 6= σ02 getestet wird (zweiseitiger Test). Die Grundlage dieses Tests ist die
Tatsache, dass die Zufallsvariable (n − 1)
benvarianz, siehe Formel (264)).
S2
σ02
der χ2 -Verteilung mit n − 1 Freiheitsgraden genügt (S 2 : Stichpro-
Zweiseitiger Test für die unbekannte Varianz σ 2 einer Normalverteilung
1) Nullhypothese H0 : σ 2 = σ02 , Alternativhypothese H1 : σ 2 6= σ02
2) Festlegung einer Signifikanzzahl α (meist α = 0.05 oder α = 0.01)
3) Testvariable: T = (n − 1)
S2
σ02
4) Bestimmung des (α/2)-Quantils und des (1 − α/2)-Quantils der χ2 -Verteilung mit (n − 1) Freiheitsgraden: χ2n−1;α/2 und χ2n−1;1−α/2 (aus der Tabelle) und Festlegung des nicht-kritischen Bereiches:
χ2n−1;α/2 ≤ T ≤ χ2n−1;1−α/2
5) Berechnung der Varianz s2 der vorliegenden Stichprobe sowie des Test- oder Prüfwertes:
t̂ = (n − 1)
s2
σ02
6) Testentscheidung: Falls χ2n−1;α/2 ≤ t̂ ≤ χ2n−1;1−α/2 ⇒ Nullhypothese H0 : σ 2 = σ02 wird nicht
abgelehnt. Anderenfalls wird sie zugunsten der Alternativhypothese H1 abgelehnt.
Bei einem einseitigen Test lautet die Nullhypothese: H0 : σ 2 ≤ σ02 (oder: H0 : σ 2 ≥ σ02 ). Die Alternativhypothese
ist dann: H1 : σ 2 > σ02 (bzw. H1 : σ 2 < σ02 ). Im Schritt 4) sind die Quantile χ2n−1;1−α bzw. χ2n−1;α der χ2 Verteilung mit (n − 1) Freiheitsgraden zu bestimmen. Der nicht-kritische Bereich lautet:
T ≤ χ2n−1;1−α , wenn die Hypothese H0 : σ 2 ≤ σ02 getestet wird bzw.
T ≥ χ2n−1;α ,
wenn die Hypothese H0 : σ 2 ≥ σ02 getestet wird.
Die Testentscheidung (siehe Schritt 6)) ist dementsprechend zu modifizieren.
Beispiel 14.11:
14.5.4
Tests für die unbek. Erwartungswerte µ1 und µ2 zweier Normalverteilungen (Differenzentests)
Die Zielstellung solcher Tests besteht darin, dass festgestellt werden soll, ob die Erwartungswerte µ1 und µ2
zweier normalverteilter Grundgesamtheiten übereinstimmen oder sich signifikant voneinander unterscheiden.
Die Vorgehensweise beim Test wird dadurch bestimmt, ob die beiden Stichproben voneinander abhängig sind.
Definition 14.4:
Zwei Stichproben heißen voneinander abhängig, wenn
1) sie den gleichen Umfang haben und
2) jedem Wert der einen Stichprobe genau ein Wert der anderen Stichprobe zugeordnet wird.
Anderenfalls werden die Stichproben als voneinander unabhängige Stichproben bezeichnet.
98
Wenn zwei Messverfahren oder Messgeräte miteinander verglichen werden, entstehen häufig voneinander abhängige Stichproben, siehe dazu auch Beispiel 14.12.
Der Fall, dass ein Differenzentest unter Verwendung abhängiger Stichproben durchgeführt werden soll, lässt
sich auf die im Abschnitt 14.5.2 eingeführten Testverfahren zurückführen.
Zweiseitiger Test für die Gleichheit der unbekannten Erwartungswerte µ1 und µ2 zweier Normalverteilungen bei abhängigen Stichprobena
Voraussetzungen:
Die ZV X und Y seien normalverteilt mit den Erwartungswerten µ1 und µ2 . Es liegen zwei abhängige
Stichproben x1 , x2 , . . . , xn und y1 , y2 , . . . , yn aus den entsprechenden Grundgesamtheiten vor.
Zielstellung:
Auf der Basis dieser Stichproben soll die Nullhypothese H0 : µ1 = µ2 gegen die Alternativhypothese
H1 : µ1 6= µ2 getestet werden (zweiseitiger Parametertest).
Vorgehensweise:
Dieser Parametertest wird auf einen Test des Hilfsparameters µ = µ1 − µ2 zurückgeführt. Dann wird die
Nullhypothese H0 : µ = 0 gegen die Alternativhypothese H1 : µ 6= 0 getestet.
Dazu werden aus den beiden abhängigen Stichproben die Differenzen zi = xi − yi (i = 1, 2, . . . , n) gebildet. Diese werden als Stichprobenwerte einer neuen Stichprobe vom Umfang n betrachtet: z1 , z2 , . . . , zn .
Mittels der im Abschnitt 14.5.2 erläuterten Testverfahren (bezogen auf die Stichprobe z1 , z2 , . . . , zn ) kann
über die Nichtablehnung oder Ablehnung der Hypothese H0 : µ = 0 entschieden werden. Dabei ist zu
beachten: Wenn die Varianzen der Zufallsvariablen X und Y bekannt sind oder umfangreiche Stichproben
vorliegen (Faustregel: n > 30), ist die im Abschnitt 14.5.2 zuerst genannte Vorgehensweise (d.h. der Fall
bekannte Varianz“) anzuwenden. Anderenfalls ist so vorzugehen wie im Fall unbekannte Varianz“.
”
”
a
Quelle: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 566
Beispiel 14.12:49
Zwei verschiedene Messmethoden für elektrische Widerstände sollen miteinander verglichen werden. Dazu wurden an 6 Widerständen Parallelmessungen durchgeführt, deren Ergebnisse in dem folgenden Messprotokoll dargestellt sind (xi : Messwerte nach der Methode A, yi : Messwerte nach der Methode B).
i
1
2
3
4
5
6
xi in Ω
100.5
102.0
104.3
101.5
98.4
102.9
yi in Ω
98.2
99.1
102.4
101.1
96.2
101.8
Zu jedem der 6 Widerstände gehört genau ein Wertepaar (xi , yi ). Daher handelt es sich um abhängige Stichproben. Durch Differenzbildung zi = xi − yi ergibt sich als neue Stichprobe:
i
1
2
3
4
5
6
zi in Ω
2.3
2.9
1.9
0.4
2.2
1.1
Die beiden Messmethoden A und B werden als gleichwertig angesehen, wenn diese Stichprobe aus einer (normalverteilten) Grundgesamtheit mit dem Erwartungswert µ = 0 stammt.
Da es sich um eine Stichprobe vom Umfang n < 30 handelt und die Varianz der Normalverteilung nicht vorgegeben ist, muss hier der zweiseitige Test für den unbekannten Erwartungswert µ einer Normalverteilung bei
unbekannter Varianz (siehe Abschnitt 14.5.2) angewendet werden. Anstelle der Bezeichnungen xi , x und X
werden jetzt die Bezeichnungen zi , z und Z verwendet.
49
L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 567-570
99
Im weiteren wird die Vorgehensweise beim Test für die Gleichheit der Erwartungswerte µ1 und µ2 zweier Normalverteilungen unter Verwendung unabhängiger Stichproben beschrieben. Die entsprechenden Varianzen σ12
und σ22 seien gleich, müssen aber nicht unbedingt bekannt sein. Es wird vorausgesetzt, dass die erste Stichprobe
den Umfang n1 und die zweite den Umfang n2 hat (wobei n1 6= n2 möglich ist). Die Stichprobenwerte der ersten
Stichprobe seien: x1 , x2 , . . . , xn und die Stichprobenwerte der zweiten Stichprobe seien: y1 , y2 , . . . , yn .
Zweiseitiger Test für die Gleichheit der unbekannten Erwartungswerte µ1 und µ2 zweier Normalverteilungen bei unabhängigen Stichproben
1) Nullhypothese H0 : µ1 = µ2 , Alternativhypothese H1 : µ1 6= µ2
2) Festlegung einer Signifikanzzahl α (meist α = 0.05 oder α = 0.01)
r
n1 n2 (n1 + n2 − 2)
X −Y
·p
3) Testvariable: T =
2
2
n1 + n2
(n1 − 1)S1 + (n2 − 1)S2
(X, Y : Stichprobenmittel der ersten bzw. zweiten Stichprobe; S1 , S2 : Stichprobenvarianz der ersten
bzw. zweiten Stichprobe)
4) Bestimmung des (1 − α/2)-Quantils der t-Verteilung mit n1 +n2 −2 Freiheitsgraden: tn1 +n2 −2;1−α/2
(aus der Tabelle) und Festlegung des nicht-kritischen Bereiches:
−tn1 +n2 −2;1−α/2 ≤ T ≤ tn1 +n2 −2;1−α/2 (oder: |T | ≤ tn1 +n2 −2;1−α/2 )
5) Berechnung der Mittelwerte x, y und der Varianzen s21 , s22 der vorliegenden Stichproben sowie
des Test- oder Prüfwertes:
r
t̂ =
n1 n2 (n1 + n2 − 2)
x−y
·p
n1 + n2
(n1 − 1)s21 + (n2 − 1)s22
6) Testentscheidung: Falls −tn1 +n2 −2;1−α/2 ≤ t̂ ≤ tn1 +n2 −2;1−α/2 ⇒ Nullhypothese H0 : µ1 = µ2
wird nicht abgelehnt. Anderenfalls wird sie abgelehnt.
100
14.6
Statistische Prüfverfahren für die unbekannte Verteilungsfunktion einer Wahrscheinlichkeitsverteilung ( Anpassungs- oder Verteilungstests“)
”
Bei den im Abschnitt 14.5 beschriebenen Prüfverfahren wurde stets davon ausgegangen, dass der Verteilungstyp
(d.h. die Art der Verteilungsfunktion) bekannt war. Die Hypothesen bezogen sich auf die Parameterwerte der
jeweiligen Wahrscheinlichkeitsverteilung. Es ist jedoch auch die Situation möglich, dass der Verteilungstyp nicht
als bekannt vorausgesetzt werden kann, sondern eine Hypothese bzgl. der Art der Verteilungsfunktion überprüft
werden soll. Derartige Tests werden als Anpassungstests50 (oder Verteilungstests) bezeichnet.
Das Ziel solcher Tests besteht in folgendem: einer ZV X mit der unbekannten Verteilungsfunktion F (x) soll eine
bekannte Verteilungsfunktion F0 (x) angepasst“ werden, d.h. es wird über die Ablehnung oder Nichtablehnung
”
der Nullhypothese H0 : F (x) = F0 (x) entschieden. Ein sehr häufig angewendeter Anpassungstest ist der
Chi-Quadrat-Anpassungstest (kurz: χ2 -Test). Dieser Test beruht auf einem Vergleich der aus der Stichprobe
gewonnenen empirischen Häufigkeitsverteilung mit der theoretisch erwarteten Verteilung.
χ2 -Test zur Überprüfung einer Hypothese über die unbekannte Verteilungsfunktion
einer Grundgesamtheit
Voraussetzung: Es liege eine konkrete Stichprobe x1 , x2 , . . . , xn aus der zu betrachtenden Grundgesamtheit
vor.
Vorgehensweise bei der Durchführung des Tests:
1) Nullhypothese H0 : F (x) = F0 (x) , Alternativhypothese H1 : F (x) 6= F0 (x)
2) Festlegung eines Signifikanzniveaus α (meist α = 0.05 oder α = 0.01)
3) Unterteilung der n Stichprobenwerte in k Klassen I1 , I2 , . . . , Ik und Feststellung der absoluten
Klassenhäufigkeiten n1 , n2 , . . . , nk
4) Für jede Klasse Ii (1 ≤ i ≤ k): mit Hilfe von F0 (x) die hypothetische Wahrscheinlichkeit
pi = P (X ∈ Ii ) und die Anzahl n∗i = npi der theoretisch erwarteten Stichprobenwerte berechnen
Dabei sollte für alle i gelten: npi ≥ 5 (Faustregel); anderenfalls müssen nachträglich Klassen
zusammengelegt werden.
5) Testvariable: T =
k
X
(Ni − n∗ )2
i
n∗i
i=1
=
k
X
(Ni − npi )2
i=1
npi
(Ni : beobachtete Anzahl der Stichprobenwerte in der i-ten Klasse)
6) Bestimmung des (1 − α) -Quantils der χ2 -Verteilung mit (k − r − 1) Freiheitsgraden: χ2k−r−1; 1−α
(r: Anzahl der geschätzten Parameter von F0 (x)) und Festlegung
des nicht-kritischen Bereiches: T ≤ χ2k−r−1; 1−α
7) Berechnung des Testwertes
t̂ =
k
X
(ni − n∗ )2
i
i=1
n∗i
=
k
X
(ni − npi )2
i=1
npi
8) Testentscheidung: Falls t̂ ≤ χ2k−r−1; 1−α gilt ⇒ Nullhypothese H0 wird nicht abgelehnt.
Anderenfalls wird sie zugunsten der Alternativhypothese H1 abgelehnt.
Hinweis:
Im Fall einer diskreten ZV sind die Klassen die Werte (Realisierungen) der ZV selbst (vgl. Beispiel 14.13), für
stetige ZV sind die Klassen Intervalle.
50
Anpassungstests gehören zu den nichtparametrischen Tests. Weitere nichtparametrische Tests - außer dem hier vorgestellten ChiQuadrat-Anpassungstest - findet man z.B in: W. P REUSS , G. W ENISCH (Hrsg.): Lehr- und Übungsbuch Mathematik (Band 3: Lineare
Algebra - Stochastik), 2. Auflage, Kapitel 19.5 und 21.5 oder K. B OSCH: Großes Lehrbuch der Statistik, Kapitel 10.
101
Beispiel 14.13:51
Bei 120 Würfen mit einem Würfel ergaben sich die folgenden absoluten Häufigkeiten für die Augenzahlen:
i
1
2
3
4
5
6
abs. Häufigk. ni
15
19
22
21
17
26
Die Hypothese: Alle 6 möglichen Augenzahlen sind gleichwahrscheinlich.“ soll mit Hilfe des χ2 -Tests über”
prüft werden.
Klasse
(Augenz. i)
ni
1
15
2
19
3
22
4
21
5
17
6
26
pi
n∗i = npi
∆ni = ni − n∗i
(∆ni )2
n∗i
Σ
51
Quelle: L. PAPULA. Mathematik für Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 607-608
102
Beispiel 14.14:
Die Bedienzeit an einem Schalter wird zunächst als eine ZV X mit unbekannter Verteilung angesehen.
Um Erkenntnisse über die Verteilung von X zu gewinnen, wurde eine Stichprobe vom Umfang n = 100 erhoben, d.h. bei insgesamt 100 Kunden wurde jeweils die Bedienzeit erfasst. Durch Gruppierung der erhaltenen
Stichprobenwerte ergab sich die folgende Häufigkeitstabelle:
Bedienzeit
Anzahl Kunden
X ∈ [0, 1)
60
X ∈ [1, 2)
25
X ∈ [2, ∞)
15
Die Hypothese Die ZV X unterliegt einer Exponentialverteilung mit dem Parameter λ = 1“ soll mit Hilfe
”
eines χ2 -Tests überprüft werden.
i
Klasse Ii
ni
pi
n∗i = npi
Σ
103
∆ni = ni − n∗i
(∆ni )2
n∗i
Quellenangaben
Das Vorlesungsskript wurde unter Verwendung der nachfolgend aufgeführten Literatur erstellt:
H.-J. BARTSCH: Taschenbuch mathematischer Formeln für Ingenieure und Naturwissenschaftler. Fachbuchverlag Leipzig
im Carl Hanser Verlag, 23. Auflage, 2014.
K. B OSCH: Großes Lehrbuch der Statistik. R. Oldenbourg Verlag, 1996.
K. B OSCH: Statistik-Taschenbuch. R. Oldenbourg Verlag, 3. Auflage, 1998.
H. DALLMANN , K.-H. E LSTER: Einführung in die höhere Mathematik für Naturwissenschaftler und Ingenieure (Band
III). Gustav Fischer Verlag Jena, 1. Auflage, 1983.
W. D ÜRR , H. M AYER: Wahrscheinlichkeitsrechnung und Schließende Statistik, Carl Hanser Verlag München,
8. Auflage, 2017.
G. E NGELN -M ÜLLGES , W. S CH ÄFER , G. T RIPPLER: Kompaktkurs Ingenieurmathematik mit Wahrscheinlichkeitsrechnung und Statistik. Fachbuchverlag Leipzig im Carl Hanser Verlag, 3. Auflage, 2004.
A. F ETZER , H. F R ÄNKEL: Mathematik 2: Lehrbuch für ingenieurwissenschaftliche Studiengänge. Springer, 6. Auflage,
2009.
S. H ANDROCK -M EYER : Differenzialgleichungen für Einsteiger. Fachbuchverlag Leipzig im Carl Hanser Verlag, 2. Auflage, 2007.
J. KOCH , M. S T ÄMPFLE : Mathematik für das Ingenieurstudium. Carl Hanser Verlag München, 2010.
W. L EUPOLD (Hrsg.): Mathematik - ein Studienbuch für Ingenieure (Band 2: Reihen - Differentialgleichungen - Analysis
für mehrere Variable - Stochastik). Fachbuchverlag Leipzig im Carl Hanser Verlag, 2. Auflage, 2006.
G. M ERZIGER , G. M ÜHLBACH , D. W ILLE , T H . W IRTH. Formeln + Hilfen zur höheren Mathematik, Binomi Verlag,
7. Auflage, 2014.
K. M EYBERG , P. VACHENAUER: Höhere Mathematik 1 (Differential- und Integralrechnung, Vektor- und
Matrizenrechnung), Springer, 5. Auflage, 1999.
K. M EYBERG , P. VACHENAUER: Höhere Mathematik 2 (Differentialgleichungen, Funktionentheorie, Fourier-Analysis,
Variationsrechnung), Springer, 2. Auflage, 1997.
L. PAPULA : Mathematik für Ingenieure und Naturwissenschaftler: Ein Lehr- und Arbeitsbuch für das Grundstudium
(Band 2). Vieweg+Teubner, 12. Auflage, 2009.
L. PAPULA : Mathematik für Ingenieure und Naturwissenschaftler: Ein Lehr- und Arbeitsbuch für das Grundstudium
(Band 3). Vieweg+Teubner, 5. Auflage, 2008.
W. P REUSS , H. K IRCHNER : Mathematik in Beispielen (Band 8: Partielle Differentialgleichungen), Fachbuchverlag Leipzig, 1. Auflage, 1990.
W. P REUSS , G. W ENISCH (Hrsg.): Lehr- und Übungsbuch Mathematik (Band 2: Analysis). Fachbuchverlag Leipzig im
Carl Hanser Verlag, 3. Auflage, 2003.
W. P REUSS , G. W ENISCH (Hrsg.): Lehr- und Übungsbuch Mathematik (Band 3: Lineare Algebra - Stochastik). Fachbuchverlag Leipzig im Carl Hanser Verlag, 2. Auflage, 2001.
W. P REUSS , G. W ENISCH (Hrsg.): Lehr- und Übungsbuch Mathematik für Elektro- und Automatisierungstechniker, Fachbuchverlag Leipzig im Carl Hanser Verlag, 1998.
W. P REUSS: Funktionaltransformationen. Fachbuchverlag Leipzig im Carl Hanser Verlag, 2. Auflage, 2009.
I. R ENNERT, B. B UNDSCHUH: Signale und Systeme - Einführung in die Systemtheorie, Fachbuchverlag Leipzig im Carl
Hanser Verlag, 2013.
M. R ICHTER . Grundwissen Mathematik für Ingenieure, Vieweg+Teubner, 2. Auflage, 2009.
M. R. S PIEGEL : Höhere Mathematik f. Ingenieure u. Naturwissenschaftler - Theorie u. Anwendung,
McGraw-Hill, Nachdruck 1991.
P. S TINGL : Mathematik für Fachhochschulen, Carl Hanser Verlag München, 8. Auflage, 2009.
R. S TORM : Wahrscheinlichkeitsrechnung, mathematische Statistik und statistische Qualitätskontrolle.
Fachbuchverlag Leipzig im Carl Hanser Verlag, 12. Auflage, 2007.
104
Herunterladen