Von Daten zu Funktionen - Ötti und Manfred Burghardt

Werbung
Manfred Burghardt
Allgemeine Hochschulreife und Fachhochschulreife
in den Bereichen Erziehung, Gesundheit und Soziales
Version 2013/2014
Inhaltsverzeichnis
I
Inhaltsverzeichnis
Inhaltsverzeichnis ................................................................................................................................. I
1
Funktionale Beziehungen ........................................................................................................ 1
1.1
1.2
1.2.1
1.2.2
1.2.3
1.2.4
1.3
1.4
1.5
1.6
1.7
1.7.1
1.7.2
1.8
1.9
Die neue KiTa ........................................................................................................................... 1
Klärung der Grundbegriffe: Merkmale, Daten und Zusammenhang ...................................... 2
Merkmale und Daten .............................................................................................................. 2
Linearer Zusammenhang ......................................................................................................... 2
Beispiel: Prognosen des Sachverständigenrates ..................................................................... 4
Beispiel: BSP und Geburtenrate .............................................................................................. 5
Funktionen............................................................................................................................... 5
Übungen .................................................................................................................................. 7
Die graphische Darstellung von Daten und Funktionen ......................................................... 8
Übungen .................................................................................................................................. 9
Lineare Funktionen .................................................................................................................. 9
Definition sowie Bedeutung und Berechnung der Parameter ................................................ 9
Methoden zum Zeichnen von linearen Funktionen .............................................................. 11
Übungen ................................................................................................................................ 12
Ausblick: Lineare Korrelation und Regression ....................................................................... 15
2
Der Korrelationskoeffizient ................................................................................................... 17
2.1
2.2
2.2.1
2.2.2
2.2.3
2.3
2.3.1
2.3.2
2.4
2.5
2.6
2.7
2.7.1
2.7.2
2.8
Positiver und negativer Zusammenhang und Korrelation .................................................... 17
Drei Grenzen des Korrelationskoeffizienten ......................................................................... 18
Zusammenhang ohne linearen Zusammenhang ................................................................... 19
Die Richtung des Zusammenhangs ....................................................................................... 19
Fehlen direkter Kausalität trotz starker Korrelation ............................................................. 19
Zentrum von Daten und Abweichungen vom Zentrum ........................................................ 20
Der Mittelwert (arithmetisches Mittel)................................................................................. 20
Varianz und Standardabweichung ........................................................................................ 21
Übungen ................................................................................................................................ 22
Kovarianz und Korrelationskoeffizient .................................................................................. 23
Übungen ................................................................................................................................ 29
Weitere statitische Kenngrößen ........................................................................................... 30
Der Median ............................................................................................................................ 31
Der Modus (Modalwert) und Häufigkeiten ........................................................................... 31
Übungen ................................................................................................................................ 34
3
Lineare Regression ................................................................................................................ 36
3.1
3.2
3.3
3.4
3.5
3.6
Ausgleichsgerade – ein Beispiel ............................................................................................ 36
Quadratische Funktionen ...................................................................................................... 39
Übungen zu quadratischen Funktionen ................................................................................ 42
Ausgleichsgerade – ein Beispiel (Finale) ............................................................................... 43
Die Ausgleichsgerade – allgemeiner Fall ............................................................................... 44
Übungen ................................................................................................................................ 48
Burghardt – RWB 2013/2014
Inhaltsverzeichnis
II
4
Funktionen in wirtschaftswissenschaftlichen Anwendungen ............................................... 53
4.1
4.2
4.3
Die Zentralküche von Krippe e.V. .......................................................................................... 53
Gewinnfunktionen und ihre Interpretation .......................................................................... 55
Übungen ................................................................................................................................ 57
5
Exkurs: Zahlen........................................................................................................................ 61
5.1
5.2
5.3
5.4
5.5
5.6
Natürliche Zahlen .................................................................................................................. 61
Ganze Zahlen ......................................................................................................................... 61
Rationale Zahlen .................................................................................................................... 61
Irrationale Zahlen .................................................................................................................. 63
Reelle Zahlen ......................................................................................................................... 64
Übungen ................................................................................................................................ 65
6
Nullstellenbestimmung bei ganzrationalen Funktionen ....................................................... 66
6.1
6.2
6.3
6.3.1
6.3.2
6.3.3
6.4
6.5
Ganzrationale Funktionen und ihr Grad................................................................................ 66
Übungen ................................................................................................................................ 66
Nullstellen ganzrationaler Funktionen .................................................................................. 67
Lösen mit Hilfe der Nullteilerfreiheit der reellen Zahlen ...................................................... 68
Polynomdivision .................................................................................................................... 69
Substitutionsverfahren .......................................................................................................... 73
Übungen ................................................................................................................................ 74
Ausblick: Nullstellenbestimmung mit dem Newton-Verfahren ............................................ 75
7
Lösungen der Übungen ......................................................................................................... 79
7.1
7.2
7.3
7.4
7.5
7.6
Lösungen zu Kapitel 1 ............................................................................................................ 79
Lösungen zu Kapitel 2 ............................................................................................................ 86
Lösungen zu Kapitel 3 ............................................................................................................ 93
Lösungen zu Kapitel 4 .......................................................................................................... 102
Lösungen zu Kapitel 5 .......................................................................................................... 106
Lösungen zu Kapitel 6 .......................................................................................................... 107
8
Arbeitsblätter ...................................................................................................................... 117
Burghardt – RWB 2013/2014
1 Funktionale Beziehungen
1
1 Funktionale Beziehungen
1.1 Die neue KiTa
Krippe e.V. ist ein gemeinnütziger Verein, der verschiedene Kindertagesstätten betreibt. In Bonn
will Krippe e.V. im Jahr 2016 eine neue KiTa eröffnen, falls der Bedarf genügend groß ist. Anhand
der Anzahl der Kinder im Kindergartenalter in den vergangenen Jahren will eine Planungsgruppe
von Krippe e.V. den Bedarf im Jahr 2016 und in der weiteren Zukunft prognostizieren.
Von der Stadtverwaltung hat die Planungsgruppe die folgende Tabelle erhalten. Sie gibt an, wie
viele Kinder im Kindergartenalter in den vergangenen Jahren im möglichen Einzugsbereich der geplanten KiTa lebten.
Jahr
Kinder
2004
17
2005
18
2006
20
2008
20
2009
22
28
Wie kann hieraus eine möglichst verlässliche Prognose für die Zahlen der Zukunft
entwickelt werden?
24
20
16
In einem ersten Schritt tragen die Mitglieder der Planungsgruppe die Datenpaare in
ein Koordinatensystem ein.
12
8
Es fällt auf, dass die Punkte nahezu auf einer Geraden liegen.
4
0
2002
2004
2008
2010
2012
2014
2016
Wenn diese Gerade möglichst günstig eingezeichnet ist, sollte der bei 2016 erreichte
Wert eine gute Prognose für die Anzahl der
Kindergartenkinder im Jahr 2016 sein.
28
24
20
Im Jahr 2016 ist also mit etwa 28 Kindern
zu rechnen!
16
12
8
4
0
2002
2006
2004
2006
Burghardt – RWB 2013/2014
2008
2010
2012
2014
2016
Wir wollen dieses anschauliche Verfahren
mathematisch fundieren und die dabei wesentlichen mathematischen Begriffe und
Sachverhalte kennen lernen.
1 Funktionale Beziehungen
2
1.2 Klärung der Grundbegriffe: Merkmale, Daten und Zusammenhang
1.2.1 Merkmale und Daten
Definition. Eine Eigenschaft, die an einem Objekt betrachtet werden, nennt man im Rahmen der
mathematischen Statistik auch Merkmal. Die möglichen Werte, die ein Merkmal haben kann, werden auch Merkmalsausprägungen genannt. Die bei einer Untersuchung tatsächlich vorkommenden
(beobachteten oder erfragten/erhobenen) Ausprägungen, werden auch Daten genannt.
Im Beispiel Krippe e.V. werden die Merkmale „Jahr“ (genauer: Jahreszahl) und „Kinder“ (genauer:
Kinder im Kindergartenalter im Einzugsbereich) betrachtet.
· Die möglichen Werte des Merkmals „Jahr“ sind alle ganzen Zahlen. In der Untersuchung werden
allerdings nur die Ausprägungen 2004, 2005, 2006, 2008 und 2009 beobachtet.
· Die möglichen Werte des Merkmals „Kinder“ sind alle nicht negativen ganzen Zahlen. Tatsächlich beobachtet werden die Ausprägungen 17, 18, 20 und 22.
Weitere Beispiele:
Merkmal
Haarfarbe
Körpergröße
Schuhgröße
Gewicht
Wohnungsgröße
Monatseinkommen
mögliche Ausprägungen (Werte)
schwarz, braun, blond, rot, ...
z.B.: Haarfarbe blond
alle ganzen Zahlen von 0 bis 250
z.B.: Körpergröße 178 cm
alle ganzen Zahlen von 35 bis 50
z.B.: Schuhgröße 41
alle positiven Zahlen mit einer Nachkommastelle
z.B.: Gewicht (eines Babys) 3,5 kg
alle positiven Zahlen
z.B.: Wohnungsgröße 53,25 m²
alle positiven Zahlen mit zwei Nachkommastellen
z.B.: Monatseinkommen 975,83 €
1.2.2 Linearer Zusammenhang
Definition. Bestehen beobachtete Daten – wie im Beispiel von Krippe e.V. – aus zwei Werten – im
Beispiel Krippe e.V. jeweils aus einer Jahreszahl und der Anzahl der Kinder im entsprechenden Jahr
–, spricht man im Rahmen der mathematischen Statistik auch von Datenpaaren und zweidimensionalen Daten.
Burghardt – RWB 2013/2014
1 Funktionale Beziehungen
3
Zweidimensionale Daten können – wie wir es oben bereits gemacht haben – sehr gut in einem
rechtwinkligen Koordinatensystem dargestellt werden:1
Um einen Punkt eindeutig anzugeben, wird zunächst die x -Koordinate und dann die y -Koordinate
als Adresse angegeben.
1
Die beiden folgenden Bilder stammen aus dem Buch Mathe macchiato von Werner Tiki Küstenmacher, Heinz Partoll
und Irmgard Wagner, Pearson Studium
Burghardt – RWB 2013/2014
1 Funktionale Beziehungen
4
Definition. Werden zweidimensionale Daten in einem Koordinatensystem dargestellt, so nennt
man das entstehende Bild auch Streudiagramm.
Insbesondere wenn sehr viele Datenpaare
eingetragen werden, sieht das entstehende
Diagramm wie eine Wolke aus Punkten im
Koordinatensystem aus. Wir werden deshalb – auch im Fall, dass nur wenige Datenpaare im Streudiagramm eingetragen sind –
jeweils von einer Punktwolke sprechen.
Im Beispiel Krippe e.V. verläuft die Wolke
der Punkte im Koordinatensystem von links
unten nach rechts oben. Man spricht hier
von einem positiven linearen Zusammenhang der Daten.
28
24
20
16
12
8
4
0
2002
2004
2006
2008
2010
2012
2014
2016
(anschauliche) Definition.
· Verläuft die Punktwolke der Datenpaare zweier Merkmale X und Y im Streudiagramm von
links unten nach rechts oben (wie bei Krippe e.V.), so sagen wir, die Merkmale X und Y haben
einen positiven linearen Zusammenhang.
· Verläuft die Punktwolke von links oben nach rechts unten, so sagen wir, die Merkmale X und
Y haben einen negativen linearen Zusammenhang.
Dies bedeutet:
·
·
Bei positivem linearem Zusammenhang führen zunehmende X -Werte in der Regel zu zunehmenden Y -Werten.
Bei negativem linearem Zusammenhang führen zunehmende X -Werte in der Regel zu abnehmenden Y -Werten.
Wenn Merkmale einen positiven oder einen negativen Zusammenhang haben, kann man – wie im
Beispiel Krippe e.V. angedeutet – mit Hilfe einer in das Streudiagramm möglichst passend eingezeichneten Gerade sinnvoll versuchen, aus den gegebenen Daten Vorhersagen zu erstellen.
Zwei Beispiele sollen die Begriffe positiver und negativer linearer Zusammenhang erläutern.
1.2.3 Beispiel: Prognosen des Sachverständigenrates
Der Sachverständigenrat der Bundesregierung gibt jedes Jahr eine Prognose über die wirtschaftliche
Entwicklung im kommenden Jahr ab. Die folgende Tabelle enthält für die Jahre von 1975 bis 1994
Burghardt – RWB 2013/2014
1 Funktionale Beziehungen
5
jeweils die vom Sachverständigenrat prognostizierte Höhe des Wirtschaftswachstums sowie die tatsächliche Höhe des Wirtschaftswachstums.
Jahr
%
Prognose x i
Wachstum y i
Jahr
%
Prognose x i
Wachstum y i
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
2,0
4,5
4,5
3,5
3,75
2,75
0,5
0,5
1,0
2,5
-3,6
5,6
2,4
3,4
4,4
1,8
-0,3
-1,2
1,2
2,6
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
3,0
3,0
2,0
1,5
2,5
3,0
3,5
2,5
0,0
0,0
2,5
2,5
1,7
3,4
4,0
4,6
3,4
1,5
-1,9
2,3
Das Streudiagramm (siehe rechts) legt nahe, dass
die Merkmale einen positiven linearen Zusammenhang zeigen: Die Punktwolke verläuft von
links unten nach rechts oben.
tatsächliches Wachstum in %
6
1.2.4 Beispiel: BSP und Geburtenrate
Geburtenrate
Im folgenden Streudiagramm (siehe unten) sind
für verschiedene Staaten der Welt die Höhe des
Bruttosozialprodukts pro Einwohner und die Geburtenrate eingezeichnet.
3,5
3
2,5
2
1,5
1
0,5
0
-0,5 0
-1
5
4
3
2
1
0
-1
-1
1
3
5
-2
-3
-4
prognostiziertes Wachstum in %
Hier verläuft die Punktwolke im Wesentlichen von links oben nach rechts unten.
Zwischen dem BSP je Einwohner und der
Geburtenrate besteht ein negativer linearer Zusammenhang.
5
10
15
20
BSP je Einw ohner in 1000 US-$
25
Das heißt: Je höher das BSP je Einwohner
ist, desto geringer ist die Geburtenrate. Da
das BSP je Einwohner ein Indikator für den
Wohlstand der Menschen ist, bedeutet
das: Je wohlhabender die Menschen in einem Land sind, desto weniger Kinder haben sie.
1.3 Funktionen
Die bei positivem bzw. negativem linearen Zusammenhang skizzierte Methode, Prognosen aus Daten zu gewinnen (wie im Beispiel Krippe e.V.) läuft letztlich darauf hinaus, auf der Basis der gegebenen Daten eine Vorschrift zu finden, die jedem x -Wert (im Beispiel Krippe e.V. die Jahreszahl) einen
und nur einen y -Wert (im Beispiel Krippe e.V. die Kinderanzahl) zuzuweisen. Ein mathematisches
Burghardt – RWB 2013/2014
1 Funktionale Beziehungen
6
Objekt, das jeder Eingabe (Input) eine und nur eine Ausgabe (Output) zuordnet, nennt man in der
Mathematik eine Funktion:
Definition. Eine Funktion ist ein mathematisches Objekt, das jedem Input aus einer Menge zulässiger Eingaben ein und nur ein Element aus einer Menge möglicher Ausgaben zuordnet.
Funktion
Menge zulässiger Eingaben
Berechnet eine
Ausgabe
zum
eingegebenen
Wert gemäß einer einprogrammierten
Vorschrift
Menge möglicher Ausgaben
Schematisch kann eine Funktion wie folgt dargestellt werden:
Menge zulässiger
Eingaben
Menge möglicher
Ausgaben
Die Menge zulässiger Eingaben heißt meist Definitionsbereich der Funktion. Die Menge der möglichen Ausgaben heißt oft Wertebereich der Funktion:
Definitionsbereich
Wertebereich
Burghardt – RWB 2013/2014
1 Funktionale Beziehungen
7
Die Objekte des Definitionsbereichs heißen auch Argumente oder Stellen der Funktion. Funktionen
werden meist mit dem Buchstaben f bezeichnet. Mit f ( x ) wird dasjenige Objekt des Wertebereichs bezeichnet, das der Stelle x von der Funktion zugeordnet wird.
Beispiele.
1. Was tut die durch
ì-1, falls x < 0;
f (x) = í
î +1, falls x ³ 0.
gegebene Funktion?
Um den Funktionswert einer Eingabe x zu bestimmen, muss zunächst überprüft werden ob die
Bedingung „ x < 0 “ (also: die Eingabe x ist negativ) oder die Bedingung x ³ 0 (also: die Eingabe
x ist nicht negativ) erfüllt ist. Ist ersteres der Fall, ist der Funktionswert -1 , im zweiten Fall ist
der Funktionswert +1 .
Zum Beispiel ist f ( -5, 3) = -1 , weil -5, 3 negativ ist, und f (10, 9 ) = +1 sowie f ( 0 ) = +1 weil
10, 9 und 0 nicht negativ sind.
2. Um den Funktionswert bei der durch
ì1, falls 2 £ x und x £ 5;
f (x) = í
î0, sonst;
gegebenen Funktion zu bestimmen, muss zuerst überprüft werden, ob 2 £ x und x £ 5 gilt, also
ob die Eingabe x zwischen 2 und 5 liegt oder nicht. Im ersten Fall ist der Funktionswert 1 , im
zweiten Fall ist der Funktionswert 0 . Zum Beispiel ist f (1) = 0 und f ( 3) = 1 .
Wie der Output aus dem Input bestimmt wird, wird in der Regel durch eine Funktionsgleichung
festgelegt. Zum Beispiel bedeutet die Funktionsgleichung f ( x ) = - x 3 + 2x - 2 , dass jeder Zahl x die
Zahl - x 3 + 2x - 2 zugeordnet wird. So ordnet die Funktion also der Zahl 3 die Zahl
3
f ( 3) = -33 + 2 × 3 - 2 = -23 zu und der Zahl -4 den Wert f ( -4 ) = - ( -4 ) + 2 × ( -4 ) - 2 = 54 .
1.4 Übungen
1.4.1 Berechnen Sie für die folgenden Funktionen die Funktionswerte an den angegebenen Stellen.
a)
ì-1, falls x < 2;
f (x) = í
b)
î+1, falls x ³ 2;
für x = -3 ; x = 0 ; x = 2
und x = 5
Burghardt – RWB 2013/2014
ì x, falls x < 0;
f (x) = í 2
î- x , falls x ³ 0;
für x = -5 ; x = -1 ;
x = 0 ; x = 3 und x = 6
c)
ì
ï 0, falls x < 0;
f (x) = í
ï
î x , falls x ³ 0;
für x = -9 ; x = -1 ; x = 0 ;
x = 4 und x = 16
1 Funktionale Beziehungen
d)
8
f ( x ) = 3x - 4
f ( x ) = 4 x2 - x + 2
e)
für x = -3 ; x = 0
und x = 6
f ( x ) = - x 2 + 2x - 3
f)
für x = -3 ; x = -2 ;
x = 2 und x = 3
für x = -4 ; x = -1
und x = 3
1.5 Die graphische Darstellung von Daten und Funktionen
Wie die zweidimensionalen Daten einer statistischen Erhebung, können auch Funktionen graphisch
in einem Koordinatensystem veranschaulicht werden:
Wenn die durch f ( x ) = - x 3 + 2x - 2 gegebene Funktion für x Î [ -3 | 3] , also für Eingaben x zwischen -3 und 3 , in einem Koordinatensystem dargestellt werden soll, geht man in der Regel so
vor:
· Zuerst wird eine Wertetabelle mit zwei Zeilen aufgestellt. In die obere Zeile werden die Zahlen
von -3 bis 3 in Einerschritten eingetragen. In die Zeile darunter kommt jeweils der von der
Funktion hierfür festgelegte Funktionswert:
-3
-2
-1
0
1
2
3
x
f (x)
19
2
-3
-2
-1
-6
-23
·
Die Zahlenpaare werden wie in einem Streudiagramm in ein Koordinatensystem übertragen:
25
20
15
10
5
0
-3
-2
-1
-5 0
1
2
3
-10
-15
-20
-25
-30
·
Damit sind aber bei weitem noch nicht
alle möglichen Punkte ( x | f ( x ) ) in das
25
Diagramm eingetragen.
15
20
10
Zum Beispiel fehlen noch ( -2, 5 | 8, 625)
und
( 0, 5 | -1, 125)
und
( -1, 8 | 0, 232)
und noch viele, viele andere. Alle fehlenden Punkte auszurechnen und einzuzeichnen ist unmöglich. Es sind nämlich
unendlich viele. Man behilft sich hier, indem man die vorhandenen Punkte mit einer gebogenen Linie möglichst glatt verbindet, siehe rechts.
Burghardt – RWB 2013/2014
5
0
-3
-2
-1
-5 0
-10
-15
-20
-25
-30
1
2
3
1 Funktionale Beziehungen
9
Zur Kontrolle steht rechts noch mal der
Funktionsgraph, wobei zusätzlich die
Punkte ( -2, 5 | 8, 625) und ( 0, 5 | -1, 125)
25
20
15
sowie ( -1, 8 | 0, 232) eingezeichnet sind.
10
5
Unsere Zeichnung stimmt offenbar relativ gut.
0
-3
-2
-1
-5
0
1
2
3
-10
-15
1.6 Übungen
-20
-25
1.6.1 Stellen Sie die durch die folgenden Gleichungen gegebenen Funktionen im angegebenen Bereich in jeweils einem Koordinatensystem dar!
a) f ( x ) = 2x - 4 für x Î [ -3 | 5]
d)
f ( x ) = -0, 5x 2 + 4 x + 3 für x Î [ -2 | 10]
b)
f ( x ) = -3x + 2 für x Î [ -3 | 4]
e)
f ( x ) = x 3 - x 2 - 6x + 1 für x Î [ -3 | 4]
c)
f ( x ) = 4 x 2 - 8x - 5 für x Î [ -2 | 4]
f)
f ( x ) = x 4 - 10 x 2 + 9 für x Î [ -3 | 3]
-30
1.7 Lineare Funktionen
1.7.1 Definition sowie Bedeutung und Berechnung der Parameter
Im Beispiel Krippe e.V. wurde die Prognose mit Hilfe einer Geraden ermittelt, die möglichst passend
durch die Punkte des Streudiagramms gezeichnet wurde. Diese Gerade ist der Graph einer Funktion,
deren genaue Funktionsgleichung noch unbekannt ist. Funktionen, deren Funktionsgraph eine Gerade ist, haben in der Mathematik einen speziellen Namen:
Definition. Eine Funktion ist eine lineare Funktion, wenn ihr Funktionsgraph eine Gerade ist.
Die Funktionsgleichung jeder linearen Funktion hat die Form
f (x) = m× x + b,
wobei m und b zwei feste Zahlen (Konstanten) sind. Sie werden manchmal auch Parameter der
linearen Funktion genannt.
Die Parameter (Kenngrößen) b und m haben folgende Bedeutung:
· Der Anfangswert b gibt an, welchen Wert die Funktion annimmt, wenn man für x die Zahl Null
einsetzt. Bei der graphischen Darstellung der Funktion gibt die Zahl b an, bei welchem y -Wert
der Funktionsgraph durch die y -Achse geht.
Burghardt – RWB 2013/2014
1 Funktionale Beziehungen
·
10
Der Parameter m ist die Zunahme bzw. Abnahme der Funktionswerte je x -Einheit: Wird x um
1 erhöht, verändert sich der Funktionswert um m . Bei der graphischen Darstellung der Funktion gibt die Zahl m an, wie stark der Funktionsgraph steigt bzw. fällt. Wie im Straßenverkehr
wird die Steigung angegeben, indem man den überwundenen Höhenunterschied durch die
überbrückte Strecke teilt:2
Steigung =
überwundener Höhenunterschied
überbrückte Strecke
Das links stehende Warnschild bedeutet also, dass die Straße auf einer Strecke von 100 Metern um
20 Meter steigt:
20 Meter
100 Meter
Die Steigung einer Geraden lässt sich leicht berechnen, wenn man zwei Punkte auf der Geraden
kennt: Wenn die Gerade durch die Punkte P1 = ( x1 | y1 ) und P2 = ( x2 | y2 ) läuft, gilt:
·
Der zwischen P1 und P2 überwundene Höhenunterschied ist y2 - y1 .
·
Die zwischen P1 und P2 überbrückte Strecke ist x2 - x1 .
Deshalb ist
m=
überwundener Höhenunterschied y2 - y1
=
überbrückte Strecke
x2 - x1
Diese Formel kann man sich am einfachsten in der Form
Dy
m=
Dx
merken. D ist ein großes Delta (ein griechischer Buchstabe) und steht in der Mathematik oft als
Abkürzung für „Differenz“: m ist die Differenz der y -Werte geteilt durch die Differenz der x -Werte
zweier Punkte, jeweils in gleicher Reihenfolge.
2
Die auf Warnschildern üblichen Prozentangaben erhält man, wenn man diesen Wert mit 100 multipliziert.
Burghardt – RWB 2013/2014
1 Funktionale Beziehungen
11
Die Steigung kann im Koordinatensystem auch abgelesen werden, wenn man ein Steigungsdreieck
wie folgt einzeichnet:
1.7.2 Methoden zum Zeichnen von linearen Funktionen
Da der Graph einer linearen Funktion eine Gerade ist, kann er sehr leicht gezeichnet werden. Man
benötigt keine umfangreiche Wertetabelle, denn es genügt, zwei Punkte zu bestimmen, die auf der
Geraden liegen. Zwei Methoden bieten sich hierfür an:
Methode 1.
· Wähle zwei beliebige x -Werte x1 , x2 aus.
· Setze jeden in die Funktionsgleichung ein und rechne jeweils den dazu gehörenden y -Werte
y1 , y2 aus.
·
Trage die beiden Punkte ( x1 | y1 ) und ( x2 | y2 ) in das Koordinatensystem ein.
·
Die Gerade verläuft durch die beiden eingezeichneten Punkte.
Folgendes sollte man beachten:
· Oft kann man Rechenarbeit sparen, wenn man als einen x -Wert die Zahl Null wählt, denn der
dazu gehörende y -Wert ist b .
1
· Die Zeichnung ist umso genauer, je weiter die
beiden ausgewählten x -Werte auseinander
0
-2
-1
0
1
2
3
4
5
6
liegen.
-1
Beispiel: f ( x ) = 0, 25x - 3 .
Ein auf der Geraden liegender Punkt ist ( 0 | -3) .
-2
Um einen weiteren Punkt zu bekommen, setzen
wir x = 4 ein: f ( 4 ) = 0, 25 × 4 - 3 = -2 . Der zweite
-3
Punkt ist ( 4 | -2 ) .
Methode 2.
· Stelle die Steigung als Bruch dar:
Burghardt – RWB 2013/2014
-4
1 Funktionale Beziehungen
12
·
p
mit p ³ 0 und q > 0 .
q
Wähle einen beliebigen x -Wert x1 aus.
·
Setze x1 in die Funktionsgleichung ein und berechne den dazu gehörigen Funktionswert y1 .
·
Trage den Punkt ( x1 | y1 ) in das Koordinatensystem ein.
·
Finde einen zweiten Punkt ( x2 | y2 ) , indem Du von ( x1 | y1 ) aus um q x -Einheiten nach rechts
m=±
und um p y -Einheiten
- nach oben (falls m positiv ist)
- nach unten (falls m negativ ist)
gehst.
· Die Gerade verläuft durch die beiden eingezeichneten Punkte.
Oft ist es möglich, als Ausgangspunkt den Punkt ( 0 | b ) zu nehmen.
1.8 Übungen
1.8.1 Bestimmen Sie die Parameter m und b der durch die folgenden Gleichungen gegebenen linearen Funktionen. Zeichnen Sie den Graphen und visualisieren Sie die Steigung durch ein Steigungsdreieck.
1
f ( x ) = 4x
f ( x ) = - x + 1 g)
f (x) = 6 - x
f ( x ) = - x + 8 j)
a)
d)
2
3
x
f ( x ) = 2x - 3 e)
f ( x ) = -2x - 2 h)
f (x) = x - 4
f (x) =
b)
k)
4
5
2
f ( x ) = 3x + 4 f)
f ( x ) = -5 + x
f ( x ) = 1 - 0, 5x l)
f (x) = 9 - x
c)
i)
3
1.8.2 Bringen Sie die folgenden Gleichungen in die Form f ( x ) = mx + b und lesen Sie die Steigung
und die Koordinaten des Schnittpunktes der Gerade mit der y -Achse ab.
a)
2x - f ( x ) = 6
d)
-6 x + 3 × f ( x ) = 12
g)
27x - 9 × f ( x ) = 36
j)
b)
3x + f ( x ) = 9
e)
5x - 4 × f ( x ) = 5
h)
7 × f ( x ) + 21x = 14
k)
c)
f ( x ) - x = 14
f)
3 + x = 2× f (x)
i)
4 x - 3 × f ( x ) = 12
l)
1
f (x) + x = 4
3
1
1
x - f (x) = 8
2
2
1
f ( x ) - 6 = 4x + 2
2
1.8.3 Welcher der Punkte liegt auf den Graphen der durch die folgenden Gleichungen gegebenen
Funktionen?
Beispiel: P1 = (2 | 4 ) liegt auf dem Graphen der durch f ( x ) = 5x - 6 gegebenen Funktion, denn
f ( 2 ) = 4 . Dagegen liegt der Punkt P1 = ( -3 | 2) nicht dem Graphen der durch f ( x ) = 5x - 6 gegebenen Funktion, denn f ( -3) = -21 ¹ 2 .
a)
f ( x ) = 2x - 3
P 1 = (1 | -1) ;
P 2 = (3 | 6) ;
Burghardt – RWB 2013/2014
b)
P 4 = ( -2 | -7)
;
P 5 = ( -4 | 3) ;
f ( x ) = -2x - 4
P 1 = ( 0 | -4 ) ;
P 4 = ( -3 | 2) ;
P 2 = ( 3 | 1) ;
P 5 = (1 | -6 ) ;
1 Funktionale Beziehungen
P 3 = ( 2 | 1) ;
13
P 6 = ( 0, 5 | -2)
P 3 = (2, 5 | -9 ) ;
P 6 = (1, 5 | 7)
1.8.4. Die folgenden Punkte P1 und P2 liegen auf dem Graphen einer durch die Gleichung
f ( x ) = mx + b gegebenen linearen Funktion. Berechnen Sie zunächst mit Hilfe der Formel
m = Dy Dx den Parameter m und bestimmen Sie dann den Parameter b .
Beispiel: P1 = (1 | 1) , P2 = ( 5 | -11) . Die Gleichung der Gerade findet man so:
·
m = ( -11 - 1) ( 5 - 1) = -12 4 = -3
·
1 = f (1) = -3 × 1 + b Þ 1 = -3 + b + 3 Þ 4 = b
(oder: -11 = f ( 5) = -3 × 5 + b Þ - 11 = -15 + b + 15 Þ 4 = b )
Die Gleichung der Funktion lautet also f ( x ) = -3x + 4
a)
P1 = (1 | 5) , P2 = (2 | 7 )
e)
P1 = ( -1 | -7) , P2 = (1 | 3)
i)
P1 = ( -4 | -1) , P2 = ( 4 | 5)
b)
P1 = ( -1 | -3) , P2 = (1 | -2)
f)
P1 = (1 | 3) , P2 = (2 | -1)
j)
P1 = ( -4 | 3) , P2 = ( 6 | -2)
c)
P1 = (1 | -2) , P2 = (2 | -6 )
g)
P1 = ( -2 | 2) , P2 = (2 | 4 )
k)
P1 = ( -3 | 0 ) , P2 = ( 3 | -4 )
d)
P1 = ( -2 | 5) , P2 = ( 0 | -1)
h)
P1 = ( -6 | -5) , P2 = ( 3 | 1)
l)
P1 = ( 0 | -1) , P2 = ( 4 | -1)
1.8.5 Bestimmen Sie jeweils m so, dass der Punkt P auf dem Graphen der durch f ( x ) gegebenen
Funktion liegt.
Beispiel. f ( x ) = mx - 2 ; P = ( 4 | 1) . Der Parameter m kann so bestimmt werden:
1 = f ( 4 ) = m × 4 - 2 Þ 1 = 4m - 2 + 2 Þ 3 = 4m : 4 Þ 0, 75 = m
a)
f ( x ) = mx + 2 ; P = (1 | 5)
f)
f ( x ) = mx - 2 ; P = (1 | 5)
b)
f ( x ) = mx - 1 ; P = (2 | 3)
g)
f ( x ) = mx - 0, 5 ; P = (1 | 0 )
c)
f ( x ) = mx - 4 ; P = ( -1 | -3)
h)
f ( x ) = mx + 7 ; P = ( 3 | 6 )
d)
f ( x ) = mx + 1 ; P = ( -2 | 9 )
i)
f ( x ) = mx - 3 ; P = ( 5 | -1)
e)
f ( x ) = mx + 3 ; P = ( 4 | 2 )
1.8.6 Verwenden Sie lineare Funktionen in den folgenden einfachen Anwendungen.
a) Auf ein Konto mit einem Guthaben von 100 € wird jeden Monat ein Betrag von 50 € eingezahlt. f ( x ) gebe das Guthaben nach x Monaten an. Bestimmen Sie die Funktionsgleichung.
b)
Bei einer Autovermietung wird ein Auto ausgeliehen. Man zahlt hierfür eine Grundgebühr von
65 € und für jeden gefahrenen Kilometer 1,50 €. f ( x ) gebe die Leihkosten bei einer gefahrenen Strecke von x Kilometern an. Bestimmen Sie die Funktionsgleichung und berechnen Sie
mit Hilfe der Funktion f ( x ) , wie viel man bezahlen muss, wenn man mit dem Mietwagen 250
c)
km fährt. Wie viele Kilometer wurde ein Auto gefahren, für das man 552,50 € Leihgebühr
zahlen musste?
Bei einer anderen Autovermietung kann ein vergleichbares Auto ohne Grundgebühr ausgeliehen werden. Für jeden gefahrenen Kilometer werden 2,30 € berechnet. g ( x ) gebe die
Leihkosten bei einer gefahrenen Strecke von x Kilometern an.
Bestimmen Sie die Funktionsgleichung und berechnen Sie, wie viel man hier für 250 km bezahlen muss.
Burghardt – RWB 2013/2014
1 Funktionale Beziehungen
d)
e)
14
Von einem Konto mit einem Guthaben von 2.400 € werden jeden Monat 200 € abgehoben.
f ( x ) gebe das Guthaben nach x Monaten an. Bestimmen Sie die Funktionsgleichung und
berechnen Sie hiermit, wie viel Geld nach 8 Monaten noch auf dem Konto ist.
In einer Tropfsteinhöhle wurde ein hängender Tropfstein vermessen. Er hat eine Länge von
819 mm. Man geht davon aus, dass er jedes Jahr um 3 mm wächst. f ( x ) gebe die Länge des
Tropfsteins in mm nach x Jahren an. Bestimmen Sie die Funktionsgleichung und berechnen
Sie mit Hilfe der Funktion f
· wie lang der Tropfstein in 150 Jahren sein wird.
· in welchem Jahr der Tropfstein 1,4 m lang sein wird.
· in welchem Jahr der Tropfstein zu wachsen begann.
1.8.7 Eine Jugendgruppe plant einen Ausflug. Die Leiterin beauftragt Sie mit der Organisation des
Reisebusses. Sie erkundigen sich bei zwei Busunternehmen nach den Preisen für die Anmietung
eines Busses.
· Firma Flott Reisen macht dieses Angebot: Grundgebühr 50 € und je gefahrenem Kilometer
1,10 €.
· Von der Firma Universal Reisen erhalten Sie folgendes mitgeteilt: Grundgebühr 15 € und je
gefahrenem Kilometer 1,25 €.
f ( x ) bzw. g ( x ) geben die Kosten an, die von Flott Reisen bzw. von Universal Reisen für eine Reise
von x Kilometern berechnet werden.
a) Geben Sie die Funktionsgleichungen für f ( x ) und g ( x ) an.
b) Für den Ausflug wird der Bus etwa 200 km weit gefahren. Wie viel muss man bei beiden Anbietern dafür zahlen?
c) Welches der beiden Angebote ist für kurze Strecken günstiger, welches für lange? Versuchen
Sie heraus zu finden, bei welcher Fahrtstrecke sich das Verhältnis umkehrt.
1.8.8 In einer Großstadt ist eine Grippeepidemie ausgebrochen. Man geht davon aus, dass die Kosten, die durch die Epidemie für die Volkswirtschaft entstehen, im Wesentlichen mit der Anzahl der
Erkrankten linear wachsen. Bei 30 Erkrankten hat man Kosten in Höhe von rund 13,5 Tausend Euro
ermittelt, bei 70 Erkrankten betragen die Kosten 33,5 Tausend Euro.
a) Bestimmen Sie die lineare Funktion f , bei der f ( x ) die Höhe der Kosten (in Tausend Euro)
b)
c)
angibt, wenn x Menschen erkrankt sind.
Berechnen Sie die Kosten bei 65 bzw. bei 90 Erkrankten.
Berechnen Sie, bei wie vielen Erkrankten Kosten in Höhe von 50.000 € entstehen.
1.8.9 Eine Arbeitsgruppe der Landesregierung untersucht die Kosten, die durch die Masernepidemie
2006 für die Volkswirtschaft entstanden sind. Ein Sachbearbeiter geht davon aus, dass die Kosten
mit der Anzahl der Erkrankten linear wachsen. Nach seinen Nachforschungen führen 40 Erkrankte
zu Kosten in Höhe von rund 25 Tausend Euro und 90 Erkrankte zu Kosten von 45 Tausend Euro.
a) Ermitteln Sie die lineare Funktion f , bei der f ( x ) die Höhe der Kosten (in Tausend Euro)
b)
c)
angibt, wenn x Menschen erkrankt sind.
Berechnen Sie, welche Kosten entstehen, wenn 135 Menschen krank sind.
Bestimmen Sie, bei welchem Krankenstand Kosten von 55.000 € zu erwarten sind.
1.8.10 Eine Arbeitsgruppe des Bundesfinanzministeriums soll Prognosen über zukünftige Steuereinnahmen erarbeiten. Die Beamten gehen davon aus, dass die Steuereinnahmen linear von der
Burghardt – RWB 2013/2014
1 Funktionale Beziehungen
15
Bevölkerungszahl abhängen. Aus den Zahlen für das Jahr 2006 geht hervor, dass bei 82 Millionen
Einwohnern jährliche Steuereinnahmen in Höhe von 460 Milliarden Euro zu verzeichnen sind. Vor
ein paar Jahren, als die Einwohnerzahl noch bei 87 Millionen lag, betrugen die Steuereinnahmen
490 Milliarden Euro im Jahr.
a) Bestimmen Sie die Gleichung der linearen Funktion f , bei der f ( x ) die Höhe der Steuer-
b)
c)
einnahmen (in Milliarden Euro) angibt, wenn die Bevölkerungszahl x Millionen Menschen
beträgt.
Berechnen Sie, welche Steuereinnahmen zu erwarten sind, wenn die Bevölkerungszahl (im
Vergleich zum Wert von 2006) um 5 % sinkt.
Um die jährlichen Investitionen finanzieren zu können, geht die Arbeitsgruppe davon aus,
dass die jährlichen Steuereinnahmen mindestens 400 Milliarden Euro betragen müssen. Untersuchen Sie, was dies dies für die Bevölkerungszahl bedeutet.
1.8.11 Die jährlichen Einnahmen eines Pflegeheims betrugen im Jahr 2000 rund 460.000 €. Dem
gegenüber standen Ausgaben in Höhe von rund 340.000 €. Fünf Jahre später betrugen die Jahreseinnahmen 475.000 € und die Ausgaben 390.000 €. Die Verwaltung des Heims geht davon aus, dass
beide Entwicklungen linear verlaufen.
a) Bestimmen Sie die Gleichungen der linearen Funktionen f und g , wenn f ( x ) die Höhe
der Jahreseinnahmen und g ( x ) die jährlichen Ausgaben (in Tausend Euro) im Jahr x anb)
c)
gibt.
Berechnen Sie, welche Einnahmen und Ausgaben im Jahr 2015 zu erwarten sind.
Bestimmen Sie, in welchem Jahr die Einnahmen die Ausgaben nicht mehr decken.
1.8.12 Das Altenheim Abendglück hatte im Jahr 2004 im Schnitt 22 Bewohner. Bis zum Jahr 2010 ist
die Zahl auf 31 gestiegen. Die Verwaltung geht davon aus, dass diese Entwicklung linear verläuft.
Je Bewohner nimmt das Heim monatlich 1.500 € ein und bekommt zusätzlich einen monatlichen
städtischen Zuschuss von 9.500 €.
a) Geben Sie die Gleichungen der linearen Funktionen f und g an, wenn f ( x ) die Bewohnerzahl im Jahr x und g ( x ) die monatlichen Einnahmen (in Tausend Euro) bei einer Beb)
c)
wohnerzahl von x Menschen angibt.
Berechnen Sie, wie viele Menschen im Jahr 2014 im Heim leben werden, und mit welchen
Einnahmen das Heim dann rechnen kann.
Ermitteln Sie, wann werden genügend Menschen in dem Heim leben werden, damit der monatliche Gewinn bei 74.000 € liegt.
1.9 Ausblick: Lineare Korrelation und Regression
Wir werden ein Verfahren entwickeln, mit dem wir berechnen können, ob zwei Merkmale X und
Y einen positiven oder einen negativen oder keinen linearen Zusammenhang haben.
Wir werden außerdem ein Verfahren entwickeln, dass es uns ermöglicht, bei Bestehen eines linearen Zusammenhangs die lineare Funktion zu bestimmen, mit deren Hilfe man die besten Prognosen
gewinnen kann. Hierbei werden wir insbesondere klären, was es bedeutet, dass eine Gerade „möglichst günstig“ oder „möglichst passend“ durch die Punktwolke läuft.
Burghardt – RWB 2013/2014
1 Funktionale Beziehungen
16
Die entsprechende Gerade nennt man Regressionsgerade oder auch Ausgleichsgerade. Sie ist die
„Zentrumsgerade“, entlang derer sich die Datenpaare mehr oder weniger gleichmäßig zu beiden
Seiten verteilen.
Wir werden überdies weitere Grundbegriffe der mathematischen Statistik kennenlernen und uns
noch genauer mit Funktionen beschäftigen.
Im Vorfeld soll noch verraten werden, wie die Ausgleichsgerade für Krippe e.V. aussieht. Es ist die
durch die Gleichung f ( x ) = 0, 8837x - 1753, 7 gegebene Funktion. Im Jahr 2016 ist also mit
f (2016 ) = 27, 8392 » 28 Kindern zu rechnen.
Burghardt – RWB 2013/2014
2 Der Korrelationskoeffizient
17
2 Der Korrelationskoeffizient
2.1 Positiver und negativer Zusammenhang und Korrelation
Ein positiver linearer Zusammenhang zweier Merkmale X und Y bedeutet anschaulich, dass die für
X und Y erhobenen Datenpaare im Wesentlichen entlang einer „Zentrumsgerade“ liegen, die im
Streudiagramm von links unten nach rechts oben läuft. Wir haben dies am Beispiel der Merkmale
„Jahr“ und „Kinderanzahl“ bei Krippe e.V. gesehen. Negativer linearer Zusammenhang zweier Merkmale X und Y andererseits bedeutet anschaulich, dass die für X und Y erhobenen Datenpaare im
Wesentlichen entlang einer „Zentrumsgerade“ liegen, die im Streudiagramm von links oben nach
rechts unten läuft. Ein Beispiel hierfür war der Zusammenhang des BIP und der Geburtenrate eines
Landes.
Die bisher angegebene Charakterisierungen der Begriffe „positiver linearer Zusammenhang“ und „negativer linearer Zusammenhang“ ist rein anschaulich. Sie
überlässt es dem Betrachter zu entscheiden, ob er die
Punktwolke als von links unten nach rechts oben oder
von links oben nach rechts unten verlaufen sieht, was
in Zweifelsfällen durchaus problematisch sein kann:
Verläuft die Punktwolke in dem rechts stehenden
Streudiagramm von links unten nach rechts oben oder
von rechts oben nach links unten oder trifft keins von
beidem zu?
Wir wollen nun ein Verfahren vorstellen, mit dem man nicht nur berechnen kann, ob ein positiver
oder ein negativer linearer Zusammenhang besteht, sondern auch die Stärke des Zusammenhangs
messen kann: Ein linearer Zusammenhang ist umso stärker, je enger die Datenpaare im Streudiagramm an der Zentrumslinie liegen.
Definition. Die Stärke des linearen Zusammenhangs zwischen zwei Merkmalen wird auch Korrelation genant.
Die Korrelation zweier Merkmale X und Y kann mit Hilfe des empirischen Korrelationskoeffizienten rXY gemessen werden.3 Er kann relativ leicht aus den für X und Y beobachteten Werten berechnet werden. Wie das geht, werden wir in diesem Kapitel sehen. Zuerst halten wir fest, auf welche Weise man aus dem Korrelationskoeffizienten Aussagen über die Korrelation gewinnen kann.
·
·
3
Der Korrelationskoeffizient ist eine Zahl, die zwischen -1 und +1 liegt: -1 £ rXY £ 1 .
Ist rXY » 0 , so sind die Merkmale X und Y unkorreliert: Es besteht kein linearer Zusammenhang.
Empirisch bedeutet hier, dass der Korrelationskoeffizient aus beobachteten Daten berechnet wird.
Burghardt – RWB 2013/2014
2 Der Korrelationskoeffizient
·
·
18
Ist rXY größer als Null, sind die Merkmale X und Y positiv korreliert: Je näher rXY bei +1 liegt,
desto näher liegen die Datenpaare entlang einer Geraden, die positive Steigung hat (im Streudiagramm also von links unten nach rechts oben verläuft). Ist rXY = 1 , dann liegen die Datenpaare alle auf einer Geraden, die positive Steigung hat.
Ist rXY kleiner als Null, sind die Merkmale X und Y negativ korreliert: Je näher rXY bei -1 liegt,
desto näher liegen die Datenpaare entlang einer Geraden, die negative Steigung hat (im Streudiagramm also von links oben nach rechts unten verläuft). Ist rXY = -1 , so liegen die Datenpaare
alle auf einer Geraden, die negative Steigung hat.
alle Punkte auf einer Geraden mit
positiver Steigung
positiv korreliert
unkorreliert
negativ korreliert
zunehmender positiver linearer
Zusammenhang
kein linearer Zusammenhang
zunehmender negativer linearer
Zusammenhang
alle Punkte auf einer Geraden mit
negativer Steigung
Ob ein gemessener Korrelationskoeffizient als groß oder klein interpretiert wird, hängt stark von
der Art der untersuchten Daten ab. Bei psychologischen Fragebogendaten werden z. B. Werte bis
ca. 0,3 häufig als klein angesehen, während man ab ca. 0,8 von einer sehr hohen Korrelation spricht.
Als Faustregel kann man aber festhalten:
· rXY nahe bei +1 Þ X und Y haben einen positiven linearen Zusammenhang
·
·
rXY nahe bei -1 Þ X und Y haben einen negativen linearen Zusammenhang
rXY nahe bei 0 Þ X und Y haben keinen linearen Zusammenhang
2.2 Drei Grenzen des Korrelationskoeffizienten
Auf drei Grenzen der Untersuchung von Merkmalen mit Hilfe des Korrelationskoeffizienten soll hier
hingewiesen werden:
1. Zusammenhang ohne linearen Zusammenhang
2. Die Richtung des Zusammenhangs
3. Fehlen direkter Kausalität trotz starker Korrelation.
Burghardt – RWB 2013/2014
2 Der Korrelationskoeffizient
19
2.2.1 Zusammenhang ohne linearen Zusammenhang
Wenn die Merkmale keinen linearen Zusammenhang haben – also unkorreliert sind – können Sie
durchaus einen Zusammenhang haben. Ein Beispiel: In einem Krankenhaus wird bei einem Patienten über 24 Stunden in dreistündigen Abständen die Körpertemperatur gemessen:
Uhrzeit
Temperatur
0
37,1
3
37,5
6
37,5
9
38,2
12
38,9
15
38,8
18
38,2
21
37,1
24
36,9
Der Korrelationskoeffizient hier ist nahezu 0. Sie werden dies später selbst berechen. Trägt man die
Daten in ein Streudiagramm ein, erkennt man aber sehr wohl einen Zusammenhang. (Welchen?)
2.2.2 Die Richtung des Zusammenhangs
Im Rahmen einer Untersuchung über die Leistungen deutscher Schülerinnen und Schüler wurde
eine starke positive Korrelation dazwischen erkannt, wie oft eine Schülerin oder ein Schüler die
Hausaufgaben in Mathematik erledigt und wie gut die Schülerin bzw. der Schüler dem Unterricht
folgen kann. Das heißt: Je öfter eine Schülerin oder ein Schüler die Hausaufgaben macht, desto besser kann sie oder er dem Unterricht folgen. Oder ist die Kausalität vielleicht doch umgekehrt: Je
besser eine Schülerin oder ein Schüler dem Unterricht folgen kann, desto häufiger macht sie oder
er die Hausaufgaben (weil ein Verständnis des Unterrichtsstoffs für das Bewältigen der Hausaufgaben notwendig ist)?
2.2.3 Fehlen direkter Kausalität trotz starker Korrelation
Bei fünf zufällig ausgewählten Kindern einer Kindertagesstätte wurden der Wortschatz und die Körpergröße erhoben. Es wurden die folgenden Daten gemessen:
Wortschatz
Körpergröße
37
130
30
112
20
108
28
114
35
136
Zeichnen Sie das Streudiagramm! Das Streudiagramm zeigt einen positiven linearen Zusammenhang zwischen dem Wortschatz eines Kindes und dessen Körpergröße: Je umfangreicher der Wortschatz des Kindes, desto größer ist es! Der Korrelationskoeffizient, den Sie später berechnen werden, zeigt ebenfalls eine starke positive Korrelation: rXY = 0, 86 . Dennoch scheint es widersinnig,
dass ein höherer Wortschatz eines Kindes zu einer größeren Körpergröße führen sollte. Dies ist auch
nicht der Fall! Tatsächlich hängen beide Merkmale von einem dritten Merkmal ab, das hier nicht
untersucht wurde: dem Alter des Kindes. Je älter ein Kind ist, desto Größer sind im Allgemeinen
Wortschatz und Körpergröße.
Werden Daten mit Hilfe des Korrelationskoeffizienten oder des Streudiagramms interpretiert, muss
zwischen einem eventuell bestehenden Zusammenhang und einem Kausalzusammenhang4 deutlich
unterschieden werden. Kausalzusammenhänge können in der Regel nicht durch eine statistische
Analyse begründet werden. Hierfür müssen sachlogische Überlegungen herangezogen werden.
Wie kann nun der Korrelationskoeffizient bestimmt werden? Um dies zu klären, benötigen wir einige vielleicht bereits aus der Mittelstufe bekannte Kenngrößen: den Mittelwert und die Varianz.
4
kausal: ursächlich
Burghardt – RWB 2013/2014
2 Der Korrelationskoeffizient
20
2.3 Zentrum von Daten und Abweichungen vom Zentrum
Der Korrelationskoeffizient misst im Wesentlichen, wie stark Datenpaare im Streudiagramm von der
Ausgleichsgerade abweichen. Die Ausgleichsgerade haben wir auch als „Zentrumsgerade“ bezeichnet, entlang derer sich die Datenpaare mehr oder weniger gleichmäßig zu beiden Seiten verteilen.
Was aber ist genau unter dem Zentrum von Daten zu verstehen und wie man die Abweichung vom
Zentrum messen? Statt sofort Datenpaare zu betrachten, untersuchen wir zuerst den Fall, dass die
Daten eindimensional sind, also nicht aus zwei sondern nur aus einer Zahl bestehen.
2.3.1 Der Mittelwert (arithmetisches Mittel)
Die aus dem Alltagsleben bekannteste Methode, die Lage des Zentrums von Zahlendaten festzulegen, ist das arithmetische Mittel. Dieses erhält man, indem man alle beobachteten Werte addiert
und diese Summe durch die Anzahl der Beobachtungen dividiert. Es wird in der Regel mit X bezeichnet und kurz Mittelwert genannt:
Definition. Für das Merkmal X wurden die Werte x1 , x2 , , xN gemessen.
Der Mittelwert ist dann die Zahl
( x + x + + xN ) .
X= 1 2
N
Mit dem Summenzeichen å kann dies auch so geschrieben werden:
N
X=
åx
i
i =1
N
N
åx
i
bedeutet, dass in den Term nach dem Summenzeichen für i nacheinander die Zahlen
i =1
N
1, 2, 3,
,N
, N eingesetzt werden und diese Terme dann addiert werden:
åx
i
= x1 + x2 + x3 +
+ xN .
i =1
Beispiel. Von allen Absolventen des Studienganges Soziale Arbeit an einer Fachhochschule wurden
12 anonym befragt. Dabei wurde unter anderem Folgendes erhoben:
· das Geschlecht;
· die Studiendauer (in Semestern);
· die Diplomnote.
Die 12 Befragten gaben folgende Studiendauern (in Semestern) an:
Person
Studiendauer
1
8
2
8
3
16
4
7
5
8
6
7
7
9
8
11
9
9
10
8
11
11
12
6
Den Mittelwert erhält man, indem man alle Studiendauern addiert und das Ergebnis durch 12 teilt:
( 8 + 8 + 16 + 7 + 8 + 7 + 9 + 11 + 9 + 8 + 11 + 6 ) = 9 .
X=
12
Burghardt – RWB 2013/2014
2 Der Korrelationskoeffizient
21
Unter den angegebenen Studiendauern sind die 16 Semester von Person 3 ein Ausreißer: Ausreißer
sind Werte, die in der Stichprobe nur sehr selten auftreten und von den ansonsten beobachteten
Ausprägungen stark nach oben oder unten abweichen. Berechnet man die durchschnittliche Studiendauer ohne den Ausreißer 16 mit einzubeziehen, ergibt sich der Mittelwert X = 8, 36 .
Da der Korrelationskoeffizient ein Maß dafür ist, wie weit zweidimensionale Daten von der „Zentrumsgeraden“ abweichen, ist zu vermuten, dass auch ein Maß für die Abweichung eindimensionaler
Daten von ihrem Zentrum – dem Mittelwert – bei seiner Berechnung benötigt wird. Dieses Maß ist
die Varianz und die hieraus leicht zu berechnende Standardabweichung.
2.3.2 Varianz und Standardabweichung
Wir nehmen an, es werden N Daten x1 ,
wie üblich – mit X bezeichnet:
, xN eines Merkmals X gemessen. Ihr Mittelwert wird –
1 N
å xi .
N i =1
, ( xN - X ) messen, wie stark die einzelnen Messwerte vom
X=
Die Abweichungen ( x1 - X ) , ( x2 - X ) ,
Mittelwert abweichen. Sollte dann nicht
N
å( x - X ) = ( x
1
i
- X ) + ( x2 - X ) +
+ ( xN - X )
i =1
ein gutes Maß für die Gesamtabweichung aller Daten vom Mittelwert sein? Nein, denn in der
Summe treten sowohl negative als auch positive Abweichungen auf, die sich beim Addieren gegenseitig aufheben – die gerade angegebene Summe ist stets Null:
N
å(x
i
- X) =
i =1
=
=
( x1 - X ) + ( x2 - X ) +
+ ( xN - X )
( x1 + x2 + + xN ) - ( X + X +
( x + x + + xN ) - NX
N 1 2
+ X)
N
= NX - NX
= 0
Man sorgt deshalb dafür, dass die einzelnen Abweichungen stets größer oder gleich Null sind, indem
N
man sie quadriert. Das heißt, statt å i =1 ( xi - X ) berechnet man
N
å( x - X ) = ( x
2
i
1
- X ) + ( x2 - X ) +
2
2
+ ( xN - X ) .
2
i =1
Das Quadrieren hat einen meist erwünschten Nebeneffekt: Große Abweichungen vom Mittelwert
bekommen ein stärkeres Gewicht als kleinere.
Nun tritt aber ein weiteres Problem auf: Wenn die Anzahl der Daten sehr groß ist, dann ist die Zahl
å (x - X )
2
N
i =1
i
in der Regel allein schon deswegen groß, weil sehr viele positive Zahlen addiert wer-
den. Dieses Problem lösen wir, indem wir durch die Anzahl der Daten teilen. Wir berechnen also
nicht die „absolute“ quadratische Abweichung sondern die durchschnittliche quadratische Abweichung:
Burghardt – RWB 2013/2014
2 Der Korrelationskoeffizient
22
Definition. Die (empirische) Varianz der Datenreihe eines Merkmals X , die mit s2X bezeichnet wird,
ist der Mittelwert der quadratischen Abweichungen:
( x1 - X ) + ( x2 - X ) +
2
1 N
s = å ( xi - X ) =
N i =1
N
2
+ ( xN - X )
2
2
2
X
.
Die Varianz ist groß, wenn die Daten weit um den Mittelwert streuen, also im Schnitt stark vom
Mittelwert abweichen; sie ist klein, wenn die Daten eng um den Mittelwert streuen, sich also im
Schnitt nur wenig vom Mittelwert unterscheiden.
Zur schnellen Berechnung der Varianz kann man den so genannten Verschiebungssatz verwenden:
x 2 + x22 + + xN 2
1 N
s2X = å xi 2 - X 2 = 1
- X2 .
N i =1
N
Infolge des Quadrierens hat s2X nicht die gleiche Maßeinheit wie die Daten, etwa Euro, Meter oder
Grad Celsius, sondern das Quadrat davon also „Quadrateuro“ (was immer man sich darunter vorzustellen hat), Quadratmeter oder „Quadratgrad“ (auch hier wird die Anschauung stark strapaziert).
Indem man aus der Varianz die Wurzel zieht, erhält man ein Maß für die Abweichung vom Mittelwert, die die gleiche Maßeinheit hat wie die Daten.
Definition. Die (empirische) Standardabweichung ist die Wurzel aus der Varianz: sX = s2X .
2.4 Übungen
2.4.1 Schreiben Sie die folgenden Summen mit Hilfe des Summenzeichens.
a) 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10
f) 3 + 6 + 9 + 12 + 15 + 18
b)
13 + 23 + 33 + 43 + 53 + 63 + 73 + 83
g)
1 + 3 + 5 + 7 + 9 + 11 + 13 + 15
c)
31 + 32 + 33 + 34 + 35 + 36 + 37 + 38
h)
-1 + 1 + ( -1) + 1 + ( -1) + 1 + ( -1) + 1 + ( -1)
d)
1×2 + 2 ×2 + 3×2 + 4 ×2 + 5×2 + 6 ×2 + 7 ×2
i)
e)
2 + 4 + 6 + 8 + 10 + 12 + 14
j)
-1 + 2 - 3 + 4 - 5 + 6 - 7 + 8 - 9 + 10
1 1 1 1 1 1
1+ + + + + +
2 3 4 5 6 7
2.4.2 Schreiben Sie die folgenden Summen ohne das Summenzeichen.
11
7
12
10
æ 1ö
i
5
i
3
+
1
4
k
a) å ( )
d) å (
g) å ( )
j)
)
å
ç1 + ÷
kø
i =1
k =1
k =1 è
i=1
9
b)
å ( 3i - 2)
6
e)
i =1
Burghardt – RWB 2013/2014
å (2i
i =1
2
+ 3)
9
h)
å kk
k =1
9
k)
å i ( i + 1)
i =1
2 Der Korrelationskoeffizient
12
c)
23
9
å i4
12
å ( i 2 - 4i + 1 )
f)
i =1
i)
i =1
6
1
å
2
k =1 k
l)
å (2i + 1) ( i
i =1
2
- 1)
2.4.3 Bei einer Umfrage am Mathematischen Institut der Universität Bonn nannten im Jahr 1995
zehn zufällig ausgewählte Diplomanden die folgenden Studiendauern (in Semestern) vor Beginn der
Diplomarbeit:
7
10
10
11
12
13
13
13
14
14
Bestimmen Sie den Mittelwert, die Varianz und die Standardabweichung.
2.4.4 Bei der Erstellung eines Mietspiegels ergaben sich für die in einem Stadtteil untersuchten
Wohnungen ohne zentrale Wasserversorgung mit maximal 50 qm Wohnfläche folgende Nettomieten:
178,73 €
346,01 €
178,88 €
193,47 €
115,93 €
192,11 €
87,94 €
Bestimmen Sie den Mittelwert, die Varianz und die Standardabweichung.
2.4.5 Im Rahmen einer Erhebung über Mietpreise von Studentenappartements wurden in München
und Wien je 10 Appartements zufällig ausgewählt und deren Monatsmiete in Euro erhoben. Folgende Werte wurden ermittelt:
München
Wien
300
280
360
240
350
300
360
350
370
390
290
310
370
300
280
390
350
220
300
280
a) Berechnen Sie für München und für Wien den Mittelwert der Monatsmieten.
b) Bestimmen Sie die Varianz und die Standardabweichung.
2.5 Kovarianz und Korrelationskoeffizient
Um eine Maßzahl zu gewinnen, die die Stärke des linearen Zusammenhangs zweier Merkmale charakterisiert, stellen wir uns zunächst eine große Menge von Datenpaaren
(x1 | y1 ), (x2 | y2 ),K, (x N | y N ) zu den zwei Merkmalen X und Y in einem Streudiagramm eingezeichnet vor.
Den Mittelwert der zum Merkmal X gehörenden Daten x1 , x2 , , xN bezeichnen wir mit X , den
Mittelwert der zum Merkmal Y gehörenden Daten y1 , y2 , , yN bezeichnen wir mit Y :
X=
1 N
1 N
Y
=
und
x
å yi .
åi
N i =1
N i =1
Den Punkt ( X | Y ) können wir ebenfalls in das Streudiagramm einzeichnen; er teilt das Diagramm
dann in vier Felder ein, siehe Abbildung unten.
Burghardt – RWB 2013/2014
2 Der Korrelationskoeffizient
24
FELD II
FELD I
FELD III
FELD IV
Wie liegt nun die „Wolke“ der Punkte ( x1 | y1 ) , ( x2 | y2 ) ,
, ( xN | yN ) in Bezug auf diesen Punkt
( X | Y ) im Streudiagramm? Die X -Werte erstrecken sich in diesem Diagramm von links nach rechts.
Da X das Zentrum der X -Werte ist, liegt X irgendwo in der Mitte zwischen diesen Werten. Sie
können also nicht nur links und nicht nur rechts von X liegen. Für die Datenpaare bedeutet das: Sie
liegen nicht ausschließlich links des Punktes ( X | Y ) und auch nicht ausschließlich rechts des Punktes ( X | Y ) . Genau so ergibt sich – wenn man den Y -Mittelwert betrachtet –, dass die Datenpaare
nicht ausschließlich oberhalb des Punktes ( X | Y ) und auch nicht ausschließlich unterhalb des Punktes ( X | Y ) liegen können. Die Wolke der Punkte ( x1 | y1 ) , ( x2 | y2 ) ,
, ( xN | yN ) „umschließt“ also
den Punkt ( X | Y ) .
FELD
LD IIII
FELD
FE
LD I
FELD
FE
LD IIII
II
FELD
FE
LD IV
Ein positiver linearer Zusammenhang der Merkmale X und Y liegt nur dann vor, wenn die Punktwolke von links unten nach rechts oben verläuft. Ein negativer Zusammenhang liegt nur dann vor,
wenn die Punktwolke von links oben nach rechts unten verläuft.
Da die Punktwolke den Punkt ( X | Y ) umschließt, sieht die Punktwolke also wie auf den folgenden
beiden Bildern dargestellt aus.
Burghardt – RWB 2013/2014
2 Der Korrelationskoeffizient
25
FELD II
FELD
FE
LD I
FELD
FE
LD IIII
FELD I
FELD
FE
LD IIII
II
FELD IV
FELD III
FELD
FE
LD IV
Punktwolke bei positivem linearem Zusam- Punktwolke bei negativem linearem Zusammenhang
menhang
Erstes Ergebnis:
· Positiver linearer Zusammenhang bedeutet, dass die Punkte hauptsächlich in den Feldern I
und III liegen. Je stärker der positive lineare Zusammenhang ist, umso mehr der Punkte liegen
in den Feldern I und III und umso weniger liegen in anderen Feldern.
· Negativer linearer Zusammenhang bedeutet, dass die Punkte ( x1 | y1 ) , ( x2 | y2 ) , , ( xN | yN )
·
hauptsächlich in den Feldern II und IV liegen. Je stärker der negative lineare Zusammenhang
ist, umso mehr der Punkte liegen in den Feldern II und IV und umso weniger liegen in anderen
Feldern
Liegt kein oder nur ein sehr geringer linearer Zusammenhang vor, so liegen die Punkte
( x1 | y1 ) , ( x2 | y2 ) , , ( xN | yN ) in allen vier Feldern relativ gleichmäßig verteilt. Je kleiner der
lineare Zusammenhang ausfällt, umso mehr sind alle Felder gleichmäßig mit Punkten der
Punktwolke getroffen.
Dieses Ergebnis formen wir nun in eine Aussage über Zahlen um. Wir überlegen uns, wie wir charakterisieren können, ob ein Punkt ( x | y ) in Feld I, II, III oder IV liegt.
Wir beginnen mit Feld I: Der Punkt ( x | y ) liege in Feld I. Weil ein
Streudiagramm ein normales rechtwinkliges Koordinatensystem ist,
ist dann x größer als X und y ist größer als Y . Das bedeutet:
·
Die Differenz ( x - X ) ist positiv.
·
Die Differenz ( y - Y ) ist positiv.
Als Ergebnis halten wir fest:
Dass der Punkt ( x | y ) in Feld I liegt, drückt sich dadurch aus,
dass das Produkt ( x - X ) × ( y - Y ) positiv ist!
Burghardt – RWB 2013/2014
2 Der Korrelationskoeffizient
26
Nun zu Feld II: Der Punkt ( x | y ) liege in Feld II. Dann ist x kleiner
als X und y ist größer als Y . Das bedeutet:
·
Die Differenz ( x - X ) ist negativ.
·
Die Differenz ( y - Y ) ist positiv.
Als Ergebnis halten wir fest:
Dass der Punkt ( x | y ) in Feld II liegt, drückt sich dadurch aus,
dass das Produkt ( x - X ) × ( y - Y ) negativ ist!
Zu Feld III: Der Punkt ( x | y ) liege in Feld III. Dann ist x kleiner als
X und y ist kleiner als Y . Das bedeutet:
· Die Differenz ( x - X ) ist negativ.
·
Die Differenz ( y - Y ) ist negativ.
Als Ergebnis halten wir fest:
Dass der Punkt ( x | y ) in Feld III liegt, drückt sich dadurch aus,
dass das Produkt ( x - X ) × ( y - Y ) positiv ist!
Zu Feld IV: Der Punkt ( x | y ) liege in Feld IV. Dann ist x größer als
X und y ist kleiner als Y . Das bedeutet:
·
Die Differenz ( x - X ) ist positiv.
·
Die Differenz ( y - Y ) ist negativ.
Als Ergebnis halten wir fest:
Dass der Punkt ( x | y ) in Feld IV liegt, drückt sich dadurch aus,
dass das Produkt ( x - X ) × ( y - Y ) negativ ist!
Unser erstes Ergebnis von oben war
· Positiver linearer Zusammenhang Û Die Punkte ( x1 | y1 ) , ( x2 | y2 ) ,
·
·
, ( xN | yN ) liegen haupt-
sächlich in den Feldern I und III und dies umso mehr, je stärker der positive lineare Zusammenhang ist.
Negativer linearer Zusammenhang Û Die Punkte ( x1 | y1 ) , ( x2 | y2 ) , , ( xN | yN ) liegen hauptsächlich in den Feldern II und IV und dies umso mehr, je stärker der negative lineare Zusammenhang ist.
Kein oder nur ein sehr geringer linearer Zusammenhang Û Die Punkte
( x1 | y1 ) , ( x2 | y2 ) , , ( xN | yN ) liegen in allen vier Feldern und auf diese umso gleichmäßiger
aufgeteilt, je kleiner der lineare Zusammenhang ausfällt.
Mit den jetzt gefunden Vorzeichencharakterisierungen der Lage eines Punktes in Feld I, II, III und IV
wird dies wie folgt umformuliert:
Burghardt – RWB 2013/2014
2 Der Korrelationskoeffizient
Zweites Ergebnis:
· Positiver linearer
27
Zusammenhang
bedeutet,
( x2 - X ) × ( y2 - Y ) , ..., ( xN - X ) × ( yN - Y )
·
die
Produkte
( x1 - X ) × ( y1 - Y ) ,
hauptsächlich positiv sind. Je stärker der positive line-
are Zusammenhang ist, desto mehr der Produkte sind positiv.
Negativer linearer Zusammenhang bedeutet, dass die Produkte
( x2 - X ) × ( y2 - Y ) , ..., ( xN - X ) × ( yN - Y )
·
dass
( x1 - X ) × ( y1 - Y ) ,
hauptsächlich negativ sind. Je stärker der negative
lineare Zusammenhang ist, desto mehr der Produkte sind negativ.
Kein oder nur ein sehr geringer linearer Zusammenhang bedeutet, dass in den Produkten
( x1 - X ) × ( y1 - Y ) , ( x2 - X ) × ( y2 - Y ) , ..., ( xN - X ) × ( yN - Y ) positive und negative Zahlen vorkommen. Je kleiner der lineare Zusammenhang ist, desto mehr entsprechen sich positive und
negative Produkte.
Addiert man die Produkte auf, bildet also
N
å( x - X ) ×(y -Y ) ,
i
i
i =1
so ist die Summe
· positiv und umso größer, je stärker ein positiver linearer Zusammenhang ist (da dann mehr
und mehr Summanden positiv sind);
· negativ und eine umso größere negative Zahl, je stärker ein negativer linearer Zusammenhang
ist (da dann mehr und mehr Summanden negativ sind);
· nahe bei Null und umso näher bei Null, je kleiner ein linearer Zusammenhang ist (da sich dann
mehr und mehr positive und negative Summanden die Waage halten).
Die Zahl
N
å( x - X ) ×(y -Y )
i
i
i =1
scheint also geeignet, positiven, negativen oder keinen linearen Zusammenhang in einer Zahl auszudrücken. Ein Problem tritt noch auf. Wie bei Definition der Varianz oder der absoluten Häufigkeit
können auch hier große Datenmengen allein schon wegen der Anzahl der Summanden automatisch
zu großen (positiven oder negativen) Summen führen. Wie üblich wird dies dadurch gelöst, dass
man durch die Anzahl der Datenpaare teilt.
Definition. Liegen zweidimensionale Messwerte ( x1 | y1 ) , ( x2 | y2 ) ,
, ( xN | yN ) für ein Merkmals-
paar X , Y vor, dann heißt die Zahl
( x1 - X ) × ( y1 - Y ) + + ( xN - X ) × ( yN - Y )
1 N
xi - X ) × ( yi - Y ) =
(
å
N i =1
N
die (empirische) Kovarianz der Merkmale X , Y .
sXY =
Unsere bisherigen Ergebnisse können wir nun so zusammenfassen:
· Je größer die Kovarianz ist, desto stärker ist der positive lineare Zusammenhang
· Je weiter die Kovarianz im negativen Bereich liegt, desto größer ist der negative lineare Zusammenhang.
Burghardt – RWB 2013/2014
2 Der Korrelationskoeffizient
28
·
Je näher die Kovarianz bei Null liegt, desto geringer ist der lineare Zusammenhang. Eine
Kovarianz sehr nahe bei Null korrespondiert also dazu, dass kein linearer Zusammenhang
vorliegt.
Indem man die Kovarianz durch die Standardabweichungen sX bezüglich des Merkmals X und die
Standardabweichung sY bezüglich des Merkmals Y teilt, erhält man den (empirischen) Korrelationskoeffizienten der Merkmale X , Y .
Definition. Der (empirische) Korrelationskoeffizienten der Merkmale X , Y ist
sXY
.
rXY =
( sX × sY )
Der Korrelationskoeffizient hat dasselbe Vorzeichen wie die Kovarianz. Seine Werte sind jedoch normiert auf Zahlen zwischen -1 und +1.5 Eine deutlich positive Kovarianz führen auf Werte nahe bei
+1; eine deutlich negative Kovarianz führen auf Werte nahe bei -1. In Hinblick auf das, was bereits
über die Kovarianz gesagt wurde, kann mit Hilfe des Korrelationskoeffizienten die Korrelation – also
die Stärke des linearen Zusammenhangs – wie folgt gemessen werden:
·
·
·
Ist rXY » 0 , so sind die Merkmale X und Y unkorreliert: Es besteht kein linearer Zusammenhang.
Ist rXY größer als Null, sind die Merkmale X und Y positiv korreliert: Je näher rXY bei +1 liegt,
desto näher liegen die Datenpaare entlang einer Geraden, die positive Steigung hat (im Streudiagramm also von links unten nach rechts oben verläuft). Ist rXY = 1 , dann liegen die Datenpaare alle auf einer Geraden, die positive Steigung hat.6
Ist rXY kleiner als Null, sind die Merkmale X und Y negativ korreliert: Je näher rXY bei -1 liegt,
desto näher liegen die Datenpaare entlang einer Geraden, die negative Steigung hat (im Streudiagramm also von links oben nach rechts unten verläuft). Ist rXY = -1 , dann liegen die Datenpaare alle auf einer Geraden, die negative Steigung hat.
Als Faustregel kann man festhalten:
·
·
·
rXY nahe bei +1 Þ X und Y haben einen positiven linearen Zusammenhang
rXY nahe bei -1 Þ X und Y haben einen negativen linearen Zusammenhang
rXY nahe bei 0 Þ X und Y haben keinen linearen Zusammenhang
Zur einfacheren Berechnung der Kovarianz gibt es – wie bei der Varianz – einen Verschiebungssatz,
den man in der Praxis immer verwenden sollte:
5
Diese Eigenschaft steht für ambitionierte Schülerinnen und Schüler im Rahmen der Herleitung der Parameter der
Ausgleichsgerade als Übung bereit.
6
Diese letzte Aussage folgt nicht aus dem, was wir bislang bewiesen haben. Wir werden Sie im Zusammenhang mit der
Herleitung der Parameter der Ausgleichsgeraden verifizieren, siehe Übung 3.6.11. In Übung 2.6.7 kommen wir auf die
Umkehrung der Aussage zurück: Wenn die Punkte alle auf einer Gerade liegen, so ist der Korrelationskoeffizient eins,
falls die Gerade positive Steigung hat, und minus eins, falls die Gerade negative Steigung hat.
Burghardt – RWB 2013/2014
2 Der Korrelationskoeffizient
29
sXY =
x × y + + xN × yN
1 N
xi × yi - X × Y = 1 1
- X ×Y
å
N i =1
N
2.6 Übungen
2.6.1 Berechnen Sie für das Beispiel Krippe e.V., also die Daten der folgenden Tabelle, den Korrelationskoeffizienten und interpretieren Sie ihn.
Jahr
Kinder
2004
17
2005
18
2006
20
2008
20
2009
22
2.6.2 Bei einem Patienten wurden zu verschiedenen Uhrzeiten die Körpertemperatur gemessen:
Uhrzeit
Temperatur
0
37,1
3
37,5
6
37,5
9
38,2
12
38,9
15
38,8
18
38,2
21
37,1
24
36,9
a) Berechnen Sie den Korrelationskoeffizienten und interpretieren Sie ihn.
b) Zeichnen Sie das Streudiagramm.
c) Charakterisieren Sie den Zusammenhang zwischen den Merkmalen „Uhrzeit“ und „Temperatur“, den Sie im Streudiagramm erkennen können.
2.6.3 Bei fünf zufällig ausgewählten Kindern einer Kindertagesstätte wurden der Wortschatz und
die Körpergröße erhoben. Es wurden die folgenden Daten gemessen:
Wortschatz
Körpergröße
37
130
30
112
20
108
28
114
35
136
Berechnen Sie den Korrelationskoeffizienten und interpretieren Sie ihn sorgfältig.
2.6.4 Für die zehn umsatzstärksten Unternehmen Deutschlands ergaben sich 2002 folgende Beschäftigungszahlen X (in Tausend) und Umsätze Y (in Milliarden Euro):
Unternehmen
Beschäftigte X
Umsatz Y
a)
b)
1
311
52,94
2
3
4
5
6
7
8
9
10
373 242,4 125,2 135,1 161,6 106,6 115,8 142,9 83,3
45,38 45,06 37,00 33,45 26,67 25,26 23,59 22,73 21,44
Berechnen Sie den Korrelationskoeffizienten und interpretieren Sie ihn.
Zeichnen Sie ein Streudiagramm. Bestätigt dies Ihre Interpretation in a)?
2.6.5 In einer Studie zur Auswirkung von Fernsehprogrammen mit gewalttätigen Szenen auf das
Sozialverhalten von Kindern wurden die Zeitdauer in Minuten X , während der das Kind pro Tag
gewöhnlich solche Sendungen sieht, ein Aggressivitätsscore Y (mit Y = 1 nur geringfügiges aggressives Verhalten bis Y = 8 extrem aggressives Verhalten) und das Geschlecht Z des Kindes (mit
Z = 0 männlich und Z = 1 weiblich) erfasst. Folgende Ausprägungen wurden ermittelt:
Kind
Dauer X
Aggressivität Y
Geschlecht Z
a)
1
10
4
0
2
50
5
0
3
30
2
0
4
70
6
0
5
80
6
0
6
60
8
0
7
90
7
0
8
40
2
1
9
10
7
1
10
20
3
1
11
30
5
1
12
50
1
1
13
60
3
1
Zeichnen Sie für die Merkmale X und Y ein Streudiagramm und berechnen Sie den Korrelationskoeffizienten zwischen X und Y .
Burghardt – RWB 2013/2014
2 Der Korrelationskoeffizient
b)
c)
d)
30
Erläutern Sie, ob Sie anhand des Streudiagramms oder des Korrelationskoeffizienten einen Zusammenhang zwischen dem Beobachten gewalttätiger Szenen im Fernsehen und aggressivem
Verhalten erkennen können.
Zeichnen Sie für Jungen und Mädchen getrennt jeweils ein Streudiagramm und berechnen Sie
für beide Geschlechter getrennt den Korrelationskoeffizienten.
Untersuchen Sie, ob Sie nun anhand der Streudiagramme und der Korrelationskoeffizienten aus
c) abhängig vom Geschlecht des Kindes einen Zusammenhang zwischen dem Beobachten gewalttätiger Szenen im Fernsehen und aggressivem Verhalten erkennen können.
2.6.6 Ein Medikament zur Behandlung von Depressionen steht im Verdacht, als Nebenwirkung das
Reaktionsvermögen zu reduzieren. In einer Klinik wurde deshalb eine Studie durchgeführt, an der
zehn zufällig ausgewählte Personen teilnahmen, die das Präparat in verschiedenen Dosierungen
verabreicht bekamen. Das Reaktionsvermögen wurde mit Hilfe des folgenden Experiments gemessen: Der Patient musste einen Knopf drücken, sobald er ein bestimmtes Signal erhalten hat. Die Zeit
zwischen Signal und Knopfdruck wurde als Maß für das Reaktionsvermögen betrachtet. Es ergaben
sich folgende Werte für die Dosierung X in mg und die dazugehörige Reaktionszeit Y in Sekunden:
Patient
Dosierung X
Reaktionszeit Y
1
2
3
4
5
6
7
8
9
10
1
5
3
8
2
2
10
8
7
4
0,32 1,42 0,32 1,42 0,76 0,54 1,86 1,2 1,42 0,54
a) Was sagt das Streudiagramm über den Zusammenhang von X und Y ?
b Untermauert der Korrelationskoeffizient Ihre Interpretation in a)?
2.6.7 Angenommen, die Datenpaare
y = mx + b , das heißt y1 = mx1 + b,
( x1 | y1 ) , ( x2 | y2 ) ,
, ( xN | yN ) liegen alle auf der Gerade
, yN = mx
m N + b . Im Rahmen dieser Übung beweisen Sie, dass
dann rXY = 1 ist, falls m positiv ist, und rXY = -1 ist, falls m negativ ist.
a) Beweisen Sie durch Nachrechnen, dass Y = mX + b gilt!
b) Beweisen Sie durch Nachrechnen, dass sY2 = m2 s2X gilt!
c) Beweisen Sie durch Nachrechnen, dass s2XY = m × sX2 gilt!
d)
Folgern Sie aus den bisher gewonnen Ergebnissen, dass rXY = m
e)
Überlegen Sie: Ist m positiv, so ist
m2 gilt!
m2 = m ; also ist rXY = 1 . Wenn m negativ ist, dann ist
m2 = -m ; also ist rXY = -1 .
2.7 Weitere statitische Kenngrößen
Der Mittelwert reagiert empfindlich auf extreme Werte oder Ausreißer in den Daten. Dies kann
unerwünscht sein, wenn Ausreißer zum Beispiel durch Fehler bei der Datenerhebung oder Datenaufbereitung verursacht wurden. Überdies kann der Mittelwert nur dann bestimmt werden, wenn
es sich bei den vorliegenden Daten um Zahlen handelt.
In der mathematischen Statistik sind deshalb weitere Begriffe entwickelt worden, um das Zentrum
von Daten festzulegen: der Median und der Modus.
Burghardt – RWB 2013/2014
2 Der Korrelationskoeffizient
31
2.7.1 Der Median
Median nennt man jeden Wert, der folgende Eigenschaft hat: Werden alle beobachteten Merkmalsausprägungen der Reihe nach sortiert, so liegen genau so viele links wie rechts von ihm. Der
Median kann also nur für Merkmale bestimmt werden, deren Ausprägungen eine festgelegte Reihenfolge haben (zum Beispiel Zahlen).
Um den Median der Studiendauern in der Absolventenstudie zu berechnen, werden zuerst die Studiendauern aufsteigend von kürzeren zu längeren Studiendauern sortiert:
Person
Studiendauer
12
6
4
7
6
7
1
8
2
8
5
8
10
8
7
9
9
9
8
11
11
11
3
16
In diesem Fall liegt der Median zwischen der „8“ von Person 5 und der „8“ von Person 10, er muss
also 8 sein.
In einer zweiten Absolventenstudie nannten 10 Befragte des Studiengangs „Wirtschaftsmathematik
die folgenden Studienzeiten:
Person
Studiendauer
1
7
2
8
3
8
4
15
5
11
6
9
7
7
8
9
9
13
10
8
9
13
4
15
Sortieren nach der Größe der Studiendauer ergibt die folgende Tabelle:
Person
Studiendauer
1
7
7
7
2
8
3
8
10
8
6
9
8
9
5
11
Der Median liegt also zwischen der „8“ von Person 10 und der „9“ von Person 6. In diesem Fall
nimmt man als Median das arithmetische Mittel dieser beiden Werte, also ( 8 + 9 ) / 2 = 8, 5 .
Der Median hat folgende Eigenschaften:
· mindestens 50 % aller beobachteten Werte kleiner oder gleich dem Median
· mindestens 50 % aller beobachteten Werte größer oder gleich dem Median.
Der Median teilt also die Daten in eine untere und eine obere Hälfte.
Alle bisher herangezogenen Lagemaße sind nur für Zahlen (Mittelwert) oder für Werte, die zumindest der Größe nach geordnet werden können (Median), verwendbar. Dies gilt nicht für das letzte
vorzustellende Lagemaß: den Modus.
2.7.2 Der Modus (Modalwert) und Häufigkeiten
In der Absolventenstudie gaben die 12 befragten Absolventen folgende Geschlechter an:
Person
1
2
3
4
5
6
7
8
9
10
11
12
Geschlecht
w
w
m
w
m
m
w
w
w
m
w
w
Modus einer Datenreihe nennt man jeden Wert, der am häufigsten vorkommt. In dieser Datenreihe
kommt der Wert „w“ (weiblich) 8 mal und der Wert „m“ (männlich) 4 mal vor. Modus ist also „w“.
Im Rahmen der Absolventenstudie wurden für das Merkmal „Diplomnote“ von den befragten Personen folgende Ausprägungen notiert:
Burghardt – RWB 2013/2014
2 Der Korrelationskoeffizient
Person
Ausprägung
1
3
2
2
32
3
4
4
3
5
3
6
1
7
3
8
4
9
2
10
2
11
4
12
2
Um den Modus zu bestimmen, müssen wieder die absoluten Häufigkeiten eines jeden Vorkommens
bestimmt werden:
Definition. Die absolute Häufigkeit ( aH ) einer Ausprägung gibt an, wie oft diese Ausprägung in der
Datenreihe vorkommt.
Die Ausprägungen des Merkmals „Diplomnote“ haben folgende absoluten Häufigkeiten:
· aH (1) = 1 , denn die Note 1 kommt einmal vor (bei Person 6);
·
aH (2 ) = 4 , denn die Note 2 kommt viermal vor (bei Person 2, 9, 10 und 12);
·
aH ( 3) = 4 , denn die Note 3 kommt viermal vor;
·
aH ( 4 ) = 3 , denn die Note 4 kommt dreimal vor.
In diesem Fall gibt es also zwei Modi: den Wert 2 und den Wert 3, denn beide kommen am häufigsten vor.
Die absoluten Häufigkeiten hängen natürlich von der Größe der Datenreihe ab: Werden mehr als
12 Absolventen befragt, wird es sicher mehr Einsen, Zweien, Dreien und Vieren geben. Um verschiedene Datenreihen eines Merkmals (wie hier der Diplomnote) in Bezug auf die Häufigkeit des Vorkommens von Werten zu vergleichen, darf aber die Größe der Datenreihe keine Rolle spielen. Man
geht deshalb von der absoluten Häufigkeit zur relativen Häufigkeit über:
Definition. Die relative Häufigkeit ( rH ) einer Ausprägung x gibt den Anteil der Werte in der Datenreihe an, die mit x übereinstimmen. Man erhält die relative Häufigkeit, indem man die absolute
Häufigkeit durch die Größe N der Datenreihe dividiert.
aH ( x )
.
rH ( x ) =
N
Die Absolventenstudie hat die Größe 12. Die Ausprägungen des Merkmals „Diplomnote“ haben somit folgende relative Häufigkeiten:
aH (1) 1
· rH (1) =
=
» 0, 083 , also etwa 8,3 %: rund 8,3% aller Befragten haben die Note 1;
12
12
aH ( 2 ) 4 1
· rH ( 2 ) =
=
= » 0, 333 , also 33,3 %: 33,3 % aller Befragten haben die Note 2;
12
12 3
aH ( 3) 4
· rH ( 3) =
=
» 0, 333 , also 33,3 %: rund 33,3 % aller Befragten haben die Note 3;
12
12
aH ( 4 ) 3 1
· rH ( 4 ) =
=
= = 0, 25 , also 25 %: 25 % aller Befragten haben die Note 4.
12
12 4
Burghardt – RWB 2013/2014
2 Der Korrelationskoeffizient
33
Sind die Häufigkeiten bekannt, kann man eindimensionale Daten in einem Diagramm darstellen.
Drei Diagrammarten sollen vorgestellt werden
Säulendiagramm. Auf der horizontalen Achse werden die beobachteten Ausprägungen des
Merkmals abgetragen. Über den Merkmalen wird jeweils eine Säule in Höhe der absoluten (oder
relativen) Häufigkeit der Ausprägung in der Stichprobe mittig eingezeichnet. Die Säulen haben
alle die gleiche Breite und sollten nicht aneinander stoßen.
4
40
3
30
Anteil in %
Anzahl
·
2
1
20
10
0
0
1
2
3
4
1
2
Note
·
4
Balkendiagramm. Das Balkendiagramm ergibt sich aus dem Säulendiagramm, indem man die
Ausprägungen an der vertikalen und die Häufigkeiten an der horizontalen Achse abträgt.
4
4
3
3
Note
Note
2
2
1
1
0
1
2
3
4
0
10
20
Anzahl
·
3
Note
Kreisdiagramm. Die Flächen der Kreissektoren sind
proportional zu den Kreissektoren. Die Winkel der
Kreissektoren, die einer bestimmten Ausprägung
entsprechen, erhält man, indem man die relative
Häufigkeit der Ausprägung mit 360 multipliziert.
30
40
Anteil in %
1
4
2
Eine Merkmalsausprägung ist Modus, wenn im Säulendiagramm die dazu gehörende Säule, im Balkendiagramm
der dazu Balken bzw. im Kreisdiagramm das dazu gehörende Kreissegment am größten ist.
Burghardt – RWB 2013/2014
3
2 Der Korrelationskoeffizient
34
2.8 Übungen
2.8.1 Bestimmen Sie für das Umfrageergebnis unter den Diplomanden des Mathematischen Instituts (siehe Aufgabe 2.4.3) den Median der Studiendauer.
2.8.2 Ermitteln Sie für den Mietspiegel der Nettomieten (siehe Aufgabe 2.4.4) den Median.
2.8.3 Bei der der Erstellung eines Mietspiegels wurden folgende Ausprägungen des Merkmals
„Wohnungsgröße in m2“ erhoben:
30 145
35
35
35
95
40
80
45
50
75
50
70
50
55
75
45
30
55
50
70
60
70
50
75
55
75
55
80
85
95
40
95
105
55
a)
b)
c)
60
Bestimmen Sie für jede Ausprägung die relative und die absolute Häufigkeit!
Bestimmen Sie den Modus.
Zeichnen Sie für die Daten das Säulendiagramm.
2.8.4 Um die Entwicklung der Telefonkosten des letzten Jahres zu analysieren, wird Melissa von
ihrem Vater beauftragt, die mittleren monatlichen Telefonkosten zu berechnen. Die Rechnungen
betrugen jeweils in Euro:
Jan. Feb. März April Mai Juni Juli
Aug. Sept. Okt. Nov. Dez.
35,46 33,60 40,44 34,20 36,18 38,34 31,44 30,18 41,04 33,60 38,16 132,36
a)
b)
Berechnen Sie die mittleren monatlichen Telefonkosten
Melissa, die im Monat Dezember auf Anraten einer Freundin oft bei teuren 0900-Talklines
angerufen hat, ist entsetzt über den hohen Mittelwert und befürchtet Taschengeldentzug
durch den Vater. Geben Sie Melissa einen Tipp, mit welchem Trick sie sich aus der Klemme
ziehen kann!
2.8.5 Analysieren Sie die erhobenen Mietpreise für die Studentenappartments in München und für
Wien (siehe Aufgabe 2.4.5).
a) Berechnen Sie den Median der Monatsmieten.
b) Sie wollen in München studieren und bekommen dort eine Wohnung mit einer Monatsmiete
von 340 € angeboten. Untersuchen Sie, ob dies eher eine preiswerte oder eine teure Wohnung ist.
2.8.6 Ein Wirtschaftsforschungsinstitut untersuchte im Jahr 2009 den Umsatz von elf repräsentativ
ausgesuchten Filialen eines Drogeriemarktes im Jahr 2008. Folgende Werte stellte das Wirtschaftsforschungsinstitut fest (in Millionen Euro):
Filiale
Umsatz
a)
b)
c)
d)
e)
1
50
2
35
3
30
4
30
5
25
6
30
7
62
8
40
9
40
10
25
11
40
Bestimmen Sie die absoluten und die relativen Häufigkeiten für die Umsätze.
Stellen Sie die Daten in einem Kreisdiagramm dar.
Bestimmen Sie den Modus.
Berechnen Sie den Mittelwert, den Median, die Varianz und die Standardabweichung.
Ein Filialleiter, dessen Filiale nicht zu den in der Tabelle betrachteten gehörte, hatte am Ende
des Jahres 2008 einen Gewinn von 36 Mio. Euro. Gehört seine Filiale zu den Filialen mit eher
hohem Umsatz oder zu denen mit eher niedrigem Umsatz?
Burghardt – RWB 2013/2014
2 Der Korrelationskoeffizient
35
2.8.7 Die nebenstehende Tabelle zeigt die Anzahl der Privathaushalte HaushaltsAnzahl der
in München aufgeteilt nach ihrer Haushaltsgröße (Stand: 1995).
Haushalte
größe
a) Bestimmen Sie die relativen Häufigkeiten und zeichnen Sie ein
1
380131
Balkendiagramm für die angegebenen Daten.
2
182838
b) Eine große deutsche Tageszeitung schloss aus Daten wie der
3
87444
oben angegeben Tabelle, dass mehr als die Hälfte der Bevölke4
52033
rung allein lebt. Stützt die Tabelle wirklich diese Aussage? Wie
5
20235
viel Prozent der Bevölkerung Münchens lebten in Ein-, Zwei-,
Drei-, Vier- bzw. Fünfpersonenhaushalten? Stellen Sie diese Werte in einem Kreisdiagramm
dar.
Burghardt – RWB 2013/2014
3 Lineare Regression
36
3 Lineare Regression
Wenn zwei Merkmale X und Y einen linearen Zusammenhang haben, können wir beobachtete
Datenpaare benutzen, um den „Mechanismus“, der von X zu Y führt, mit Hilfe einer linearen Funktion (deren Graph die Ausgleichs- oder Regressionsgerade ist) zu simulieren. Wir untersuchen jetzt,,
wie wir von den Datenpaaren zu dieser Funktion kommen. Dabei behandeln wir zuerst ein Beispiel
und in einem zweiten Schritt den allgemeinen Fall, der uns einfache Formeln für die Parameter m
und b der linearen Funktion liefert.
3.1 Ausgleichsgerade – ein Beispiel
Krippe e.V. ist ein gemeinnütziger Verein, der verschiedene Kindertagesstätten betreibt. In einer
Nachbarschaft in Bonn will Krippe e.V. im Jahr 2016 eine neue Kindertagesstätte eröffnen. Im Rahmen der Planungen wollen die hierfür zuständigen Mitarbeiter unter anderem in Erfahrung bringen,
wie viele Kinder im Kindergartenalter in dieser Nachbarschaft im Jahr 2016 zu erwarten sein werden. Von der Stadtverwaltung haben sie die folgende Tabelle erhalten, die angibt, wie viele Kinder
im Kindergartenalter in den vergangenen Jahren in dieser Nachbarschaft lebten:
Jahr
Kinder
2004
17
2005
18
2006
20
2008
20
2009
22
Sowohl der Korrelationskoeffizient als auch das Streudiagramm zeigen, dass hier ein starker linearer
Zusammenhang vorliegt. Wir halten die Mittelwerte noch fest:
X = 2006, 4 und Y = 19, 4 .
Die gesuchte Funktion f ( x ) = mx + b soll so gewählt werden, dass die Unterschiede zwischen den
tatsächlichen y -Werten und den durch die Funktion bestimmten y -Werten „insgesamt möglichst
klein“ ist.
Unterschied zwischen
und
Burghardt – RWB 2013/2014
3 Lineare Regression
37
durch die Funktion
berechneter y -Wert:
Differenz der beiden y
17
f (2004 ) = m × 2004 + b
17 - (2004m + b )
2005
18
f (2005) = m × 2005 + b
18 - (2005m + b )
2006
20
f (2006 ) = m × 2006 + b
20 - (2006m + b )
2008
20
f (2008 ) = m × 2008 + b
20 - (2008m + b )
2009
22
f (2009 ) = m × 2009 + b
22 - (2009m + b )
x -Wert:
Jahr x i
tatsächlicher
y -Wert: y i
2004
-Werte: yi - f ( xi )
Natürlich genügt es nicht, die Differenz nur bei einem Datenpaar klein zu halten. Vielmehr muss die
Gesamtdifferenz unter Berücksichtigung der Differenzen bei allen Datenpaaren möglichst klein
sein. Um die Gesamtdifferenz zu berechnen, ist man zunächst versucht, die einzelnen Differenzen
einfach zu addieren:
17 - (2004
20 m + b ) + 18 - (2005m + b ) + 20 - (2006m + b ) + 20 - (2008m + b ) + 22 - (20
2009m + b )
Differenz für 2004
Differenz für 2005
Differenz für 2006
Differenz für 2008
Differenz für 2009
Sie können vielleicht bereits erraten, was dagegen spricht, die Gesamtdifferenz auf diese Weise zu
bestimmen? Es ist derselbe Grund, mit dem wir uns bei der Herleitung der Varianz auseinandersetzen mussten: Die einzelnen Summanden dieser Summe können positiv oder negativ sein, sodass
sich Werte bei der Addition „wegheben“ können. Die Lösung des Problems ist dieselbe wie die, die
uns zur Varianz geführt hat: Die einzelnen Summanden werden quadriert und wir gehen von der
Gesamtdifferenz zur quadratischen Gesamtdifferenz über:
Gesamtdifferenz:
17 - (2004m + b )
+18 - (2005m + b )
+20 - (2006m + b )
+20 - (2008m + b )
+22 - (2009m + b )
quadratische
Gesamtdifferenz:
(17 - (2004m + b))
+ (18 - (2005m + b ) )
+ (20 - (2006m + b ) )
+ (20 - (2008m + b ) )
+ (22 - (2009m + b ) )
2
2
2
2
2
Die Parameter m und b müssen nun so gewählt werden, dass die quadratische Gesamtdifferenz
(also der „lange“ Term rechts) so klein wie möglich wird.
Um uns das Leben etwas zu vereinfachen, machen wir eine Zusatzannahme, die es ermöglicht, in
dem Term für die quadratische Gesamtdifferenz einen der beiden Parameter „los zu werden“ – genauer: ihn durch den anderen auszudrücken. Diese Zusatzannahme ist: Die Ausgleichsgerade läuft
durch den Schwerpunkt ( X | Y ) , das heißt:
f (X) =Y .
(Später wird klar werden, dass wir diese Zusatzannahme nicht zu machen brauchen – sie erleichtert
hier aber das Rechnen sehr.)
Burghardt – RWB 2013/2014
3 Lineare Regression
38
Zunächst wird f ( X ) = Y so umgeformt, dass der Parameter b aus dem Parameter m berechnet
werden kann:
f ( X ) = Y Û mX + b = Y Û b = Y - mX ,
also (wenn wir die Werte X = 2006, 4 und Y = 19, 4 einsetzen):
b = 19, 4 - 2006, 4m .
Dies wird jetzt in die quadratische Gesamtdifferenz eingesetzt, und dann werden in den Klammern
die Terme mit m zusammengefasst:
b = 19, 4 - 2006, 4m
eingesetzt
quadratische
Gesamtdifferenz:
(17 - (2004m + b))
+ (18 - (2005m + b ) )
+ (20 - (2006m + b ) )
+ (20 - (2008m + b ) )
+ (22 - (2009m + b ) )
2
2
in der inneren Klammer
zusammengefasst
(17 - (2004m + 19, 4 - 2006, 4m))
+ (18 - (2005m + 19, 4 - 2006, 4m) )
+ (20 - (2006m + 19, 4 - 2006, 4m) )
+ (20 - (2008m + 19, 4 - 2006, 4m) )
+ (22 - (2009m + 19, 4 - 2006, 4m) )
(17 - (19, 4 - 2, 4m) )
+ (18 - (19, 4 - 1, 4m ) )
+ (20 - (19, 4 - 0, 4m ) )
+ (20 - (19, 4 + 1, 6m ) )
+ (22 - (19, 4 + 2, 6m ) )
2
2
2
2
2
2
2
2
2
2
2
2
2
Um m so zu bestimmen, dass die quadratische Gesamtdifferenz kleinstmöglich wird, bleibt uns im
Moment nichts anderes übrig, als die Terme der Summe rechts immer aufzulösen und zusammen
zu fassen:
quadratische
Gesamtdifferenz:
innere Klammer aufgelöst Klammern mit Hilfe der binomiund zusammengefasst
schen Formeln aufgelöst
(17 - (19, 4 - 2, 4m) )
+ (18 - (19, 4 - 1, 4m ) )
+ (20 - (19, 4 - 0, 4m ) )
+ (20 - (19, 4 + 1, 6m ) )
+ (22 - (19, 4 + 2, 6m ) )
2
2
2
2
2
( -2, 4 + 2, 4m)
2
+ ( -1, 4 + 1, 4m )
2
+ ( 0, 6 + 0, 4m )
2
+ ( 0, 6 - 1, 6m )
2
+ ( 2, 6 - 2, 6m )
2
5, 76 - 11, 52m + 5, 76m2
+1, 96 - 3, 92m + 1, 96m2
+0, 36 + 0, 48m + 0, 16m2
+0, 36 - 1, 92m + 2, 56m2
+6, 76 - 13, 52m + 6, 76m2
Nun wird die rechte Summe zusammengefasst: Es werden jeweils alle Werte mit m2 , alle Werte mit
m und alle Werte ohne m bzw. m2 zusammengezogen. Es ergibt sich als quadratische Gesamtdifferenz 17, 2m2 - 30, 4m + 15, 2 . Der Parameter m muss also so gewählt werden, dass die durch
D ( m) = 17, 2m2 - 30, 4m + 15, 2
gegebene Funktion D den kleinstmöglichen Wert annimmt. D ist eine quadratische Funktion. Ihr
Graph ist eine Parabel, sie ist hier gezeichnet:
Burghardt – RWB 2013/2014
3 Lineare Regression
39
24
22
20
18
16
14
12
10
8
6
4
2
0
-0,2
0
0,2
0,4
0,6
0,8
1
1,2
1,4
1,6
1,8
2
Quadratische Funktionen haben den kleinstmöglichen (oder größtmöglichen) Wert an ihrem Scheitelpunkt. Aus der Zeichnung kann man ablesen, dass der Scheitelpunkt der Parabel ungefähr
( 0, 9 | 1, 7) ist: Der kleinste Funktionswert wird also ungefähr für m = 0, 9 erreicht. Die Steigung der
Ausgleichsgerade muss also ungefähr m = 0, 9 sein. Um einen genauen Wert zu bekommen, müssen wir den Scheitelpunkt einer Parabel exakt berechnen. Wir werden deshalb jetzt einen wichtigen
Exkurs unternehmen und die wichtigsten Resultate über quadratische Funktionen zusammenstellen.
3.2 Quadratische Funktionen
Jede Funktion mit einer Funktionsgleichung der Art
f ( x ) = ax 2 + bx + c
mit a ¹ 0 heißt quadratische Funktion oder auch ganzrationale Funktion zweiten Grades. Die Parameter a, b, c heißen auch Koeffizienten. Der Parameter a heißt auch führender Koeffizient.
Der Funktionsgraph einer quadratischen Funktion ist eine Parabel. Jede Parabel hat einen Scheitelpunkt, der entweder Hochpunkt oder Tiefpunkt der Parabel ist, je nachdem, ob die Parabel nach
unten oder nach oben geöffnet ist. Die Parabel ist nach unten geöffnet und hat einen Hochpunkt,
wenn der führende Koeffizient negativ ist. Die Parabel ist nach oben geöffnet und hat einen Tiefpunkt, wenn der führende Koeffizient positiv ist.
Ist ( xS | yS ) der Tiefpunkt einer Parabel, so hat die dazu gehörige quadratische Funktion 7 an der
Stelle x S ihren kleinsten Wert, nämlich f ( xS ) = yS : Für alle x ¹ xS ist f ( x ) > f ( xS ) .
Ist ( xS | yS ) der Hochpunkt einer Parabel, so hat die dazu gehörige quadratische Funktion an der
Stelle x S ihren größten Wert, nämlich f ( xS ) = yS : Für alle x ¹ xS ist f ( x ) < f ( xS ) .
7
Also diejenige quadratische Funktion, deren Funktionsgraph die betrachtete Parabel ist.
Burghardt – RWB 2013/2014
3 Lineare Regression
40
Hochpunkt
Scheitelpunkt
Tiefpunkt
Jede Parabel ist symmetrisch zu der senkrechten Achse durch ihren
Scheitelpunkt (siehe Bild rechts). Dies bedeutet: x -Werte, die gleich weit
vom Scheitelpunkt entfernt sind, haben denselben y -Wert.
Eine Parabel kann die x -Achse an maximal zwei Stellen treffen. Diese
Stellen heißen auch Nullstellen der zur Parabel gehörenden Funktion.
Dieser Begriff ist auch bei beliebigen Funktionen von Interesse:
Definition. Eine Zahl x 0 heißt Nullstelle einer Funktion f , wenn f ( x0 ) = 0 ist. Anschaulich bedeutet dies, dass der Graph von f an der Stelle x 0 auf die x -Achse trifft.
Beispiele für Parabeln mit keiner, einer bzw. zwei Nullstellen:
4,5
6
0
-3
4
-2
-1
0
1
2
3
-0,5
5
3,5
4
-1
3
-1,5
2,5
-2
3
2
2
-2,5
1,5
-3
1
1
-3,5
0,5
0
-3
-2
-1
-4
0
0
1
keine Nullstelle
2
3
-3
-2
-1
0
eine Nullstelle
1
2
3
-4,5
zwei Nullstellen
Um die Nullstellen einer quadratischen Funktion f ( x ) = ax 2 + bx + c zu bestimmen, muss die Gleichung ax2 + bx + c = 0 nach x aufgelöst werden. Eine derartige Gleichung heißt auch quadratische
Gleichung. Jede quadratische Gleichung kann mithilfe der p - q -Formel gelöst werden:
Schritt 1.
Dividiere die Gleichung ax2 + bx + c = 0 durch den führenden Koeffizienten a , damit
vor dem x 2 eine 1 steht.
Burghardt – RWB 2013/2014
3 Lineare Regression
Schritt 2.
41
Wende auf die so „normierte“ Gleichung die p - q -Formel an:
2
p
æpö
x1/2 = - ± ç ÷ - q
2
è2ø
Dabei ist p der Koeffizient von x in der normierten Gleichung und q ist die allein
stehende Zahl der normierten Gleichung jeweils mit Vorzeichen.
Um zum Beispiel die Nullstellen der quadratischen Funktion f ( x ) = -0, 25x 2 - 0, 5x + 6 zu bestimmen, wird die quadratische Gleichung -0, 25x2 - 0, 5x + 6 = 0 zuerst durch den führenden Koeffizienten -0, 25 geteilt. Es entsteht die normierte Gleichung x2 + 2x - 24 = 0 . Von dieser Gleichung
können die Parameter p und q abgelesen werden: p = 2 und q = -24 . Diese Werte werden in die
p - q -Formel eingesetzt werden:
2
2
p
2
æ pö
æ2ö
x1/2 = - ± ç ÷ - q = - ± ç ÷ - ( -24 ) = -1 ± 25 = 1 ± 5 .
2
2
è2ø
è2ø
Die Nullstellen sind also x1 = 1 + 5 = 6 und x2 = 1 - 5 = -4 .
Ist der Term unter der Wurzel der p - q -Formel negativ, hat die Parabel keine Nullstellen. Ist der
Term unter der Wurzel positiv, so hat die Parabel die beiden Nullstellen
2
2
p
p
æpö
æpö
x1 = - + ç ÷ - q sowie x2 = - - ç ÷ - q .
2
2
è2ø
è2ø
Ist der Term unter der Wurzel Null, so hat die Parabel nur eine Nullstelle, nämlich x = - p 2 .
Um rasch Scheitelpunkte von Parabeln bestimmen zu können, leiten wir jetzt eine Formel für die x
-Koordinate des Scheitelpunktes her. Die Idee der hier vorgestellten Herleitung wurde von Martin
Alsbach, einem Schüler der FOS 112, vorgeschlagen und ersetzt den ursprünglich dargestellten,
komplizierteren Weg.
Wir bezeichnen die x -Koordinate des Scheitelpunktes der
durch f ( x ) = ax 2 + bx + c gegebenen Parabel mit x S .
Es ist f ( 0 ) = c , d.h. die Parabel schneidet die y -Achse bei
der Zahl c . Da die Parabel symetisch zur durch x S verlaufenden senkrechten Geraden ist, nimmt die Funktion f den
Wert c ein zweites Mal an, und zwar genau an der Stelle, die
nach rechts ebensoweit von x S entfernt ist wie die Null nach
links. Dies ist die Stelle xS + xS = 2xS .
Deshalb gilt f (2xS ) = c , siehe Zeichnung rechts.
Wir versuchen nun, die Gleichung f (2xS ) = c , also
a × ( 2x S ) + b × ( 2x S ) + c = c
2
nach x S aufzulösen. Zunächst ziehen wir auf beiden Seiten der Gleichung c ab und lösen die Klammern auf. Wir erhalten
Burghardt – RWB 2013/2014
3 Lineare Regression
42
4a × xS2 + 2b × xS = 0 .
Dies ist letztlich wieder eine quadratische Gleichung, nur dass die Unbekannte nun x S und nicht x
heißt. Zur Lösung der Gleichung können wir wieder die p - q -Formel verwenden. Dazu teilen wir
zuerst durch den führenden Koeffizienten, also 4a :
2b
xS2 + × xS = 0 .
4a
2b b
und q = 0 zu setzen. Es ergibt sich
In der p - q -Formel ist also p =
=
4a 2a
2
xS = -
b 2a
b 2a b 2a
æ b 2a ö
.
± ç
±
÷ -0 = 2
2
2
è 2 ø
Nimmt man hier die Lösung mit „ + “ erhält man xS = 0 . Dies kommt daher, da nicht nur f (2xS ) = c
sondern auch f ( 0 ) = c ist. Nimmt man die Lösung mit „ - “ muss sich dann die gesuchte x -Koordinate des Scheitelpunktes ergeben. Diese ist
b 2a b 2a
b
xS = =- .
2
2
2a
Wir halten dies noch einmal fest:
Die x -Koordinate x S des Scheitelpunktes der durch die Gleichung f ( x ) = ax 2 + bx + c gegebenen
Parabel kann mit der Formel
xS = -
b
(2a )
berechnet werden. Um die y -Koordinate des Scheitelpunktes zu berechnen, setzt man x S in die
Funktionsgleichung ein.
Beispiel. Die x -Koordinate des Scheitelpunktes der durch f ( x ) = -0, 25x 2 - 0, 5x + 6 gegebenen
quadratischen Funktion ist
xS = -
-0, 5
= -1 .
(2 × ( -0, 25) )
Die y -Koordinate des Scheitelpunktes ist f ( -1) = 6, 25 . Der Scheitelpunkt ist ein Hochpunkt, da
der führende Koeffizient der Funktion negativ ist ( -0, 25 ). Dies bedeutet: Die durch
f ( x ) = -0, 25x 2 - 0, 5x + 6 gegebenen quadratischen Funktion nimmt an der Stelle x = -1 ihren
größten Wert an. Dieser ist 6, 25 .
3.3 Übungen zu quadratischen Funktionen
3.3.1 Berechnen Sie die folgenden Terme mit Hilfe der binomischen Formeln!
Beispiele:
2
2
· ( -2x + 3) wird mit der ersten binomischen Formel ( a + b ) = a2 + 2ab + b2 berechnet, wobei
a = -2x und b = 3 ist: ( -2x + 3) = ( -2x ) + 2 × ( -2x ) × 3 + 32 = 4 x 2 - 12x + 9
2
Burghardt – RWB 2013/2014
2
3 Lineare Regression
·
( 5 - 3y )
2
43
wird mit der zweiten binomischen Formel ( a - b ) = a2 - 2ab + b2 berechnet, wobei
2
a = 5 und b = 3y ist: ( 5 - 3y ) = 52 - 2 × 5 × ( 3y ) + ( 3y ) = 25 - 30 x + 9y 2
2
a)
b)
c)
( 4 x + 3)
2
( -3x + 1)
2
( 2 x - 5)
2
d)
e)
f)
2
( 4 + 3z )
2
( -6 x - 2)
2
( 5 - 3y )
2
( 3x + 4 y )
2
( 8 x - 2z )
2
( -3y - 4 z )
2
g)
h)
i)
3.3.2 Zeichnen Sie die Graphen der durch
f ( x ) = 0, 5x 2 - 2, 5x + 1 sowie f1 ( x ) = 0, 5x 2 - 2, 5x + 4 und f2 ( x ) = 0, 5x 2 - 2, 5x - 2
gegebenen quadratischen Funktionen für x Î [ -2 | 7] in ein Koordinatensystem. Zeichnen Sie die
Symmetrieachse ein. Worin unterscheiden sich die Funktionsgraphen, was ist bei ihnen gleich?
3.3.3 Berechnen Sie die Nullstellen der durch die folgenden Gleichungen gegebenen quadratischen
Funktionen. Geben Sie jeweils p und q an!
a)
f ( x ) = x2 + 6x + 5
d)
f ( x ) = 3x 2 + 12x + 12
g)
f ( x ) = 5x 2 + 20 x + 2
b)
f ( x ) = x 2 + 10 x - 11
e)
f ( x ) = -2x 2 + 4 x - 5
h)
f ( x ) = x 2 - 36
c)
f ( x ) = x 2 - 14 x + 49
f)
f ( x ) = -4 x 2 + 24 x - 20 i)
f ( x ) = x 2 + 25
3.3.4 Bestimmen Sie die Scheitelpunkte der durch die folgenden Gleichungen gegebenen quadratischen Funktionen. Handelt es sich jeweils um einen Hoch- oder um einen Tiefpunkt?
a)
f ( x ) = x 2 + 2x - 2
g)
f ( x ) = 3x 2 + 6 x - 3
m)
f ( x ) = -2x 2 - 5x + 5
b)
f ( x ) = x2 + 4 x + 1
h)
f ( x ) = -5x 2 - 10x + 5
n)
f ( x ) = -5x 2 - 2x - 10
c)
f ( x ) = x2 - 9
i)
f ( x ) = 2x 2 - 8 x + 6
o)
f ( x ) = 2x 2 + 4 x + 3
d)
f ( x ) = x 2 - 2x - 4
j)
f ( x ) = 3x 2 - 9 x - 12
p)
f ( x ) = 7x 2 - 14 x - 17, 5
e)
f ( x ) = -x2 - 6x - 2
k)
f ( x ) = -2x 2 + 10 x + 4
q)
f ( x ) = 4x2 - 4x - 5
f)
f ( x ) = - x 2 - 7x - 1
l)
f ( x ) = -6 x 2 + 3
r)
f ( x ) = 3x 2 - 1
3.3.5 Berechnen Sie, für welchen x -Wert die durch die folgenden Gleichungen gegebenen quadratischen Funktionen ihren größten bzw. kleinsten Wert annehmen. Wie groß ist dieser?
a)
f ( x ) = 6 x 2 + 24 x - 21
e)
f ( x ) = 5x 2 - 30 x + 52
i)
f ( x ) = 5x 2 - 12x - 14
b)
f ( x ) = -3x 2 + 48x - 189
f)
f ( x ) = 4 x2 + 5
j)
f ( x ) = -3x 2 + 1
c)
f ( x ) = 8 x 2 - 24 x + 22
g)
f ( x ) = -9 x 2 - 18x + 4, 5 k)
f ( x ) = -0, 5x 2 - 5x + 9, 5
d)
f ( x ) = -3x 2 - 24 x - 51
h)
f ( x ) = - x 2 - 10 x - 17
f ( x ) = -2x 2 + 11x - 3
l)
3.4 Ausgleichsgerade – ein Beispiel (Finale)
Ausgangspunkt unserer Überlegungen war die Aufgabe, für die Krippe e.V. vorliegenden Daten über
die Anzahl der Kinder im Kindergartenalter in den Jahren 2004 bis 2009
Burghardt – RWB 2013/2014
3 Lineare Regression
Jahr
Kinder
2004
17
44
2005
18
2006
20
2008
20
2009
22
eine lineare Funktion f ( x ) = mx + b zu finden, dies es uns ermöglicht, eine Prognose über die Anzahl der Kinder im Kindergartenalter im Jahr 2016 zu geben. Dazu müssen die Parameter m und b
so gewählt werden, dass die quadratische Gesamtdifferenz zwischen den tatsächlichen Daten y i
und den durch die Funktion berechneten Werten f ( xi ) = mxi + b kleinstmöglich ist. Die quadratische Gesamtdifferenz hatten wir unter der – wie wir später sehen werden – überflüssigen Voraussetzung, dass f ( X ) = Y ist, berechnet als
D ( m) = 17, 2m2 - 30, 4m + 15, 2 .
Dies ist eine quadratische Funktion mit positivem führendem Koeffizienten. Die zugehörige Parabel
hat also einen Tiefpunkt und die x -Koordinate des Tiefpunkts ist die Stelle, an der die Funktion
ihren kleinstmöglichen Wert annimmt. Die x -Koordinate mS des Tiefpunkts kann mit der Formel
b
mS = (2a )
berechnet werden, sodass der kleinste Wert erreicht wird für
-30, 4
mS = = 0, 88372093 » 0, 8837 .
(2 × 17, 2)
Aus unserer Zusatzvoraussetzung f ( X ) = Y hatten wir den Parameter b die Beziehung
b = 19, 4 - 2006, 4m
hergeleitet. Setzen wir hier den für mS gefundenen Wert ein, erhalten wir
b = -1753, 697674 » -1753, 7 ,
sodass die gesuchte Funktion f ( x ) = 0, 8837x - 1753, 7 ist.
3.5 Die Ausgleichsgerade – allgemeiner Fall
Wir wiederholen nun unsere Argumentation für eine allgemeine Situation, in der N Datenpaare
eines Merkmalspaars X und Y erhoben wurden:
X
x1
x2
x3
xN
Y
y1
y2
y3
yN
Um die Darstellung zu vereinfachen, beschränken wir uns auf den Fall N = 3 . Wir betrachten hier
also die Datenpaare
X
x1
x2
x3
Y
y1
y2
y3
Für die Ausgleichsgerade machen wir wieder den Ansatz f ( x ) = mx + b . Wir bestimmen zunächst
wieder die Differenzen zwischen den tatsächlichen Daten y i und den durch die Funktion berechneten Werten f ( xi ) = mxi + b
Burghardt – RWB 2013/2014
3 Lineare Regression
45
Differenz der beiden y -
x -Wert:
xi
tatsächlicher
y -Wert y i
durch die Funktion
berechneter y -Wert:
x1
y1
f ( x1 ) = m × x1 + b
y1 - ( m × x1 + b )
x2
y2
f ( x2 ) = m × x2 + b
y2 - ( m × x2 + b )
x3
y3
f ( x3 ) = m × x3 + b
y3 - ( m × x3 + b )
Werte: yi - f ( xi )
Nun berechnen wir die quadratische Gesamtdifferenz:
Quadratische
Gesamtdifferenz
(y - (m × x
+ (y - (m × x
+ (y - (m × x
Ausmultiplizieren der
äußeren Klammen
Ausmultiplizieren der restlichen
Klammern
1
1
+ b))
y12 - 2y1 ( mx1 + b ) + ( mx1 + b )
2
2
+ b))
+y22 - 2y2 ( mx2 + b ) + ( mx2 + b )
+y22 - 2mx2 y2 - 2by2 + m2 x22 + 2mbx2 + b2
3
3
+ b))
+y32 - 2y3 ( mx3 + b ) + ( mx3 + b )
+y32 - 2mx3y3 - 2by3 + m2 x32 + 2mbx3 + b2
2
2
2
2
2
2
y12 - 2mx1y1 - 2by1 + m2 x12 + 2mbx1 + b2
Im nächsten Umformungsschritt addieren wir die Terme in der rechten Spalte. Dabei addieren wir
direkt jeweils gleiche Teilterme zusammen, also zuerst alle Terme y12 , y22 , y32 , dann alle Terme
-2mx1y1 , -2mx2y2 , -2mx3y3 usw.:
D ( m, b ) =
(y + y
+ (m x
2
1
2
2
2 2
1
+ y32 ) + ( -2mx1y1 - 2mx2 y2 - 2mx3y3 ) + ( -2by1 - 2by2 - 2by3 )
+ m2 x22 + m2 x32 ) + ( 2mbx1 + 2mbx2 + 2mbx3 ) + ( b2 + b2 + b2 )
Wir klammern nun in jeder Klammer die Terme aus, die in jedem Summanden vorkommen:
D ( m, b ) =
(y
2
1
+ y22 + y32 ) - 2m ( x1y1 + x2 y2 + x3y3 ) - 2b ( y1 + y2 + y3 )
+m2 ( x12 + x22 + x32 ) + 2mb ( x1 + x2 + x3 ) + 3b2
Hier erinnern einige Ausdrücke an Mittelwerte: Nur die Multiplikation mit 1 N (also 1 3 ) fehlt:
(y + y + y )
D ( m, b ) = ( y12 + y22 + y32 ) - 2m ( x1y1 + x2 y2 + x3y3 ) - 2b × 3 × 1 2 3
3
(x + x + x )
+m2 ( x12 + x22 + x32 ) + 2mb × 3 × 1 2 3 + 3b2
3
= ( y12 + y22 + y32 ) - 2m ( x1y1 + x2 y2 + x3y3 ) - 2b × 3Y + m2 ( x12 + x22 + x32 ) + 2mb × 3X + 3b2
Weitere Ausdrücke erinnern an Varianzen und die Kovarianz, diesen widmen wir in späteren Rechenschritten unsere Aufmerksamkeit.
Wir müssen m und b so wählen, dass diese Funktion ihren kleinsten Wert annimmt. Wir kümmern
uns zunächst um b und sortieren den Term nach Potenzen von b :
Burghardt – RWB 2013/2014
3 Lineare Regression
D ( m, b ) =
(y
2
1
46
+ y22 + y32 ) - 2m ( x1y1 + x2 y2 + x3y3 ) - 2b × 3Y + m2 ( x12 + x22 + x32 ) + 2mb × 3X + 3b2
= 3b2 + 6mbX - 6bY + ( y12 + y22 + y32 ) - 2m ( x1y1 + x2 y2 + x3y3 ) + m2 ( x12 + x22 + x32 )
= 3b2 + 6 ( mX - Y ) b + ( y12 + y22 + y32 ) - 2m ( x1y1 + x2 y2 + x3y3 ) + m2 ( x12 + x22 + x32 )
Erneut zeigt sich eine quadratische Funktion, nämlich
g ( b ) = 3b2 + 6 ( mX - Y ) b + éë( y12 + y22 + y32 ) - 2m ( x1y1 + x2y2 + x3y3 ) + m2 ( x12 + x22 + x32 )ùû
Der Wert dieser Funktion ist am kleinsten (der führende Koeffizient ist positiv!) für
b=-
6 ( mX - Y )
2×3
= - ( mX - Y ) = Y - mX
Dies ist genau der gleich Wert, den wir bei der Behandlung des Beispiels direkt aus der Zusatzannahme f ( X ) = Y erhalten hatten, was zeigt, dass diese Zusatzannahme nicht notwendig war. Wie
im Beispiel setzen wir nun dies im Term für die quadratische Gesamtdifferenz (im doppelt unterstrichenen Term) für b ein. Die quadratische Gesamtdifferenz hängt dann nur noch von m ab:
Term 1
D ( m) =
3 (Y - mX ) + 6 ( mX - Y )(Y - mX ) +
2
(y
2
1
+ y22 + y32 ) - 2m ( x1y1 + x2 y2 + x3y3 ) + m2 ( x12 + x22 + x32 )
Term 2
Wir beschäftigen uns zunächst mit Term 1 und multiplizieren aus:
(
3 (Y - mX )
)
= 3 Y 2 - 2mXY + ( mX ) = 3Y 2 - 6mXY + 3m2 X 2
2
2
6 ( mX - Y )(Y - mX ) = -6 (Y - mX ) = -6Y 2 + 12mXY - 6m2 X 2
2
Damit ergibt sich für Term 1:
3 (Y - mX ) + 6 ( mX - Y )(Y - mX ) = 3Y 2 - 6mXY + 3m2 X 2 - 6Y 2 + 12mXY - 6m2 X 2
2
= -3Y 2 + 6mXY - 3m2 X 2
Die neuen Teilterme -3Y 2 sowie +6mXY und -3m2 X 2 von Term 1 können nun mit geeigneten
Teiltermen von Term 2 zu Varianzen und zur Kovarianz zusammengefasst werden:
·
-3Y 2 wird mit dem Teilterm ( y12 + y22 + y32 ) zusammen gefasst:
·
æ ( y12 + y22 + y32 )
ö
-3Y + ( y + y + y )
- 3Y = 3 × ç
- Y 2 ÷ = 3 × sY2
ç
÷
3
3
è
ø
6mXY wird mit dem Teilterm -2m ( x1y1 + x2 y2 + x3y3 ) zusammen gefasst:
2
2
1
2
2
Burghardt – RWB 2013/2014
2
3
(y
= 3×
2
1
+ y22 + y32 )
2
3 Lineare Regression
47
6mXY - 2m ( x1 y1 + x2 y2 + x3y3 ) = -2m ( ( x1y1 + x2 y2 + x3y3 ) - 3XY )
æ (x y + x y + x y )
ö
= -2m ç 3 × 1 1 2 2 3 3 - 3 XY ÷
3
è
ø
æ (x y + x y + x y )
ö
= -6m ç 1 1 2 2 3 3 - XY ÷ = -6m × sXY
3
è
ø
·
-3m2 X 2 wird mit dem Teilterm m2 ( x12 + x22 + x32 ) zusammen gefasst:
-3m2 X 2 + m2 ( x12 + x22 + x32 ) = m2 ( x12 + x22 + x32 ) - 3m2 X 2
= m2
(( x
2
1
+ x22 + x32 ) - 3 X 2
)
æ ( x12 + x22 + x32 )
ö
= m ç3×
- 3X 2 ÷
ç
÷
3
è
ø
2
æ ( x12 + x22 + x32 )
ö
= 3m ç
- X 2 ÷ = 3m2 s2X
ç
÷
3
è
ø
Damit sind alle Teilterme von Term 1 und Term 2 behandelt. Es ergibt sich also insgesamt:
2
D ( m) = 3s2X m2 - 6sXY m + 3sY2
Erneut ist eine quadratische Funktion entstanden. m muss so gewählt werden, dass diese Funktion
den kleinsten Wert annimmt. Dies ist der Fall für
-6 sXY sXY
= 2 .
m=sX
6 s2X
Wir haben damit bewiesen:
Die Parameter der Ausgleichsgerade sind
s
m = XY2 und b = Y - mX .
sX
Wir können noch berechnen, wie groß die quadratische Gesamtdifferenz ist:
2
æs ö
æs ö
s
s2
s2
D ç XY2 ÷ = 3s2X ç XY2 ÷ - 6 sXY XY2 + 3sY2 = 3 XY2 - 6 XY2 + 3sY2
sX
sX
sX
è sX ø
è sX ø
æ æ s ö2 ö
s2XY
s2XY ö
2
2 æ
2
= -3 2 + 3sY = 3sY × ç 1 - 2 2 ÷ = 3sY × ç 1 - ç XY ÷ ÷
ç è sX sY ø ÷
sX
sX sY ø
è
è
ø
= 3sY2 × (1 - rXY2 )
Wenn wir noch berücksichtigen, dass hier die Zahl 3 für die Anzahl N der Datenpaare steht, ergibt
sich:
Burghardt – RWB 2013/2014
3 Lineare Regression
48
Die quadratische Gesamtdifferenz der Datenpaare zur Ausgleichsgerade ist
D = NsY2 × (1 - rXY2 ) .
Dies zeigt, dass der Korrelationskoeffizient in der Tat misst, wie nah die Datenpaare an der Ausgleichsgerade liegen. Insbesondere ergibt sich D ( sXY s2X ) = 0 , falls der Korrelationskoeffizient +1
oder -1 ist. In diesem Fall gibt es also keinen Abstand zwischen den Datenpaaren und der Ausgleichsgerade: Die Datenpaare liegen alle auf der Ausgleichsgerade.
3.6 Übungen
3.6.1 Berechnen Sie mit Hilfe der allgemeinen Formel nochmals die Ausgleichsgerade für das Beispiel Krippe e.V.:
Jahr
Kinder
2004
17
2005
18
2006
20
2008
20
2009
22
3.6.2 Für die zehn umsatzstärksten Unternehmen Deutschlands ergaben sich 2002 folgende Beschäftigungszahlen X (in Tausend) und Umsätze Y (in Milliarden Euro):
Unternehmen
Beschäftigte X
Umsatz Y
1
311
52,94
2
3
4
5
6
7
8
9
10
373 242,4 125,2 135,1 161,6 106,6 115,8 142,9 83,3
45,38 45,06 37,00 33,45 26,67 25,26 23,59 22,73 21,44
Sie haben in Übung 2.6.4 für die beiden Merkmale bereits einen positiven linearen Zusammenhang
festgestellt.
a)
b)
c)
Berechnen Sie nun die Gleichung der Ausgleichsgerade und zeichnen Sie die Ausgleichsgerade mit den Datenpaaren in ein Streudiagramm ein.
Ermitteln Sie eine Prognose für den Umsatz eines Unternehmens mit 275.000 Beschäftigten.
Ein Unternehmen meldet einen Umsatz von 30,4 Milliarden Euro. Auf wie viele Beschäftigte
lässt dies schließen?
3.6.3 In einer Studie zur Auswirkung von Fernsehprogrammen mit gewalttätigen Szenen auf das
Sozialverhalten von Kindern wurden die Zeitdauer in Minuten X , während der das Kind pro Tag
gewöhnlich solche Sendungen sieht, ein Aggressivitätsscore Y (mit Y = 1 nur geringfügiges aggressives Verhalten bis Y = 8 extrem aggressives Verhalten) und das Geschlecht Z des Kindes (mit
Z = 0 männlich und Z = 1 weiblich) erfasst. Folgende Ausprägungen wurden ermittelt:
Kind
Dauer X
Aggressivität Y
Geschlecht Z
1
10
4
0
2
50
5
0
3
30
2
0
4
70
6
0
5
80
6
0
6
60
8
0
7
90
7
0
8
40
2
1
9
10
7
1
10
20
3
1
11
30
5
1
12
50
1
1
13
60
3
1
In Übung 2.6.5 haben Sie bereits festgestellt, dass zwischen X und Y
· bei Jungen ein positiver linearer Zusammenhang,
· bei Mädchen ein negativer Zusammenhang
besteht.
a) Berechnen Sie für beide Teilstichproben jeweils die Gleichung der Ausgleichsgerade und
zeichnen Sie jeweils die Datenpaare und die Ausgleichsgerade in ein Streudiagramm ein.
Burghardt – RWB 2013/2014
3 Lineare Regression
b)
49
Welchen Aggressivitätsscore erwarten Sie bei einem Jungen und bei einem Mädchen, wenn
täglich 45 Minuten lang gewalttätige Fernsehprogramme angesehen werden?
3.6.4 Ein Medikament zur Behandlung von Depressionen steht im Verdacht, als Nebenwirkung das
Reaktionsvermögen zu reduzieren. In einer Klinik wurde deshalb eine Studie durchgeführt, an der
zehn zufällig ausgewählte Personen teilnahmen, die das Präparat in verschiedenen Dosierungen
verabreicht bekamen. Das Reaktionsvermögen wurde mit Hilfe des folgenden Experiments gemessen: Der Patient musste einen Knopf drücken, sobald er ein bestimmtes Signal erhalten hat. Die Zeit
zwischen Signal und Knopfdruck wurde als Maß für das Reaktionsvermögen betrachtet. Es ergaben
sich folgende Werte für die Dosierung X in mg und die dazugehörige Reaktionszeit Y in Sekunden:
Patient
Dosierung X
Reaktionszeit Y
1
2
3
4
5
6
7
8
9
10
1
5
3
8
2
2
10
8
7
4
0,32 1,42 0,32 1,42 0,76 0,54 1,86 1,2 1,42 0,54
Sie haben in Übung 2.6.6 für die beiden Merkmale bereits einen positiven linearen Zusammenhang
festgestellt.
a) Berechnen Sie die Gleichung der Ausgleichsgerade und zeichnen Sie die Ausgleichsgerade
und die Datenpaare in ein Streudiagramm ein.
b) Ein Patient wird mit 5,5 mg des Medikaments behandelt. Welche Reaktionszeit prognostizieren Sie?
3.6.5 In einer Studie zur Situation ausländischer Kinder in deutschen Kindergärten wurden zehn
ausländische Kinder eines Bonner Kindergartens untersucht. Dabei interessierte vor allem, welche
Bedeutung der Erwerb der deutschen Sprache für die Integration der Kinder in die Gruppe hat.
Aufgrund des beobachteten Verhaltens in der Kindergartengruppe erhielt jedes Kind einen Integrationsscore auf einer Skala von 0 (völlige Isolation) bis 10 (völlige Integration).
Außerdem nahmen die Kinder an einem Sprachtest teil. In diesem Test konnten die Kinder 0 Punkte
(keinerlei Kenntnisse der deutschen Sprache) bis 20 Punkte (mit gleichaltrigem deutschem Kind vergleichbare Kenntnisse der deutschen Sprache) erzielen.
Folgende Ergebnisse wurden notiert:
Kind
Ergebnis des Sprachtests X
Integrationsscore Y
a)
b)
c)
1
15
9
2
4
0
3
10
8
4
7
7
5
20
10
6
5
2
7
0
1
8
3
3
9
8
4
10
12
6
Tragen Sie die Daten in ein Streudiagramm ein.
Können Sie eine lineare Abhängigkeit erkennen? Untermauern Sie Ihre Beobachtung, indem
Sie den Korrelationskoeffizienten berechnen.
Berechnen Sie die Gleichung der Ausgleichsgerade und zeichnen Sie die Ausgleichsgerade in
das Streudiagramm ein.
3.6.6 In einer Studie des Pharmakonzerns wurde die erfolgte Blutzuckersenkung eines neu entwickelten Medikaments (in mg/dl) in Abhängigkeit von der Höhe der Dosierung (in mg) ermittelt.
Folgende Daten liegen vor:
Dosierung des Medikaments
Blutzuckersenkung
a)
100
15,5
320
32,0
640
55,5
1000
69,0
Bestimmen Sie die Korrelation der beiden Merkmale. Erkennen Sie einen linearen Zusammenhang?
Burghardt – RWB 2013/2014
3 Lineare Regression
b)
c)
d)
50
Berechnen Sie die Gleichung der Regressionsgerade und stellen Sie die Messwertpaare sowie
die Regressionsgerade in einem Streudiagramm dar. Runden Sie Steigung und y -Achsenabschnitt auf zwei Stellen hinter dem Komma.
Welche Blutzuckersenkung ist bei einem Patienten zu erwarten, der täglich eine Tablette des
Medikaments einnimmt, die 1100 mg des Wirkstoffs enthält?
Bei Herrn Maurer wird ein Nüchternzucker von 287 mg/dl gemessen. Der Wert soll auf 105
mg/dl gesenkt werden. Wie hoch muss das Medikament dosiert werden, damit diese Absenkung eintritt?
3.6.7 Bei der Untersuchung eines neu entwickelten Schmerzmittels wurde zwischen der Wirkstoffmenge im Körper eines Patienten in mg ( x ) und dem durch eine Zahl zwischen 0 (keine Wirkung)
und 10 (maximale Wirkung) dargestellten Wirkungsfaktor ( f ( x ) ) die Regressionsgerade
f ( x ) = 0, 005x + 0, 01 ermittelt.
Bei der Untersuchung des Verhältnisses der Wirkstoffmenge x zu der durch das Medikament hervorgerufenen Reaktionszeitverlängerung in % ( g ( x ) ) wurde die Regressionsgerade
g ( x ) = 0, 01x - 2, 2 gefunden.
a)
b)
Welche Wirkstoffmenge muss sich im Körper befinden, damit der Wirkungsfaktor 5,25 erreicht wird? Welche Reaktionszeitverlängerung ist dann zu erwarten?
Darf ein Lokführer, bei dem aus beruflichen Gründen nur eine Reaktionszeitverlängerung von
10 % akzeptabel ist, mit dem Medikament behandelt werden, wenn ein Wirkungsfaktor von
8,5 erreicht werden soll?
3.6.8 Für das Blutzuckermessgerät Accu-Chek Compact wurde in einem klinischen Test zwischen
dem durch das Gerät gemessenen Blutzuckerwert x und dem tatsächlichen Blutzuckerwert f ( x )
die Ausgleichsgerade f ( x ) = 1, 01x - 3, 64 ermittelt.
Beim Gerät Accu-Chek Compact Plus wurde zwischen dem durch das Gerät gemessenen Blutzuckerwert x und dem tatsächlichen Blutzuckerwert g ( x ) die Ausgleichsgerade g ( x ) = 1, 04 x - 3, 2 ermittelt.
a) Welchem tatsächlichen Wert dürfte eine Messung von 130 mg/dl entsprechen?
b) Bei welchem tatsächlichen Blutzuckerwert zeigt jedes der Geräte den richtigen Wert an?
c) Sind die Werte, die die Geräte bei einem tatsächlichen Blutzuckerspiegel im normalen Bereich (80 mg/dl bis 120 mg/dl) zeigen, zu hoch oder zu niedrig?
3.6.9 In seinem nicht ganz 36 Jahre dauernden Leben schuf der Komponist Wolfgang Amadé Mozart,
geboren am 27. Januar 1756 in Salzburg, gestorben am 5. Dezember 1791 in Wien, weit über 600
Werke. Im Jahr 1862 unternahm es der Musikwissenschaftler Ludwig Alois Ferdinand Ritter von Köchel, ein Verzeichnis aller dieser Werke aufzustellen und zu veröffentlichen: das „Köchelverzeichnis“. So ist heute jedem Werk Mozarts eine Nummer zugewiesen, die angibt, an welcher Stelle im
Köchelverzeichnis (KV) das Werk erscheint. Hier fünf bekannte Werke Mozarts mit Kompositionsjahr und KV-Nummer:
· Die Zauberflöte, KV 620, 1791
· Jupiter-Symphonie, KV 551, 1788
· Eine kleine Nachtmusik, KV 525, 1787
· Haffner-Serenade, KV 250, 1776
· Die Entführung aus dem Serail, KV 384, 1782
Burghardt – RWB 2013/2014
3 Lineare Regression
a)
b)
c)
d)
51
Stellen Sie fest, welche Korrelation zwischen der KV-Nummer und der Jahreszahl der Komposition besteht.
Berechnen Sie die Ausgleichsgerade.
Schätzen Sie mit der in b) bestimmten Ausgleichsgerade bei den folgenden Werken Mozarts
aus der KV-Nummer das Kompositionsjahr – zum Vergleich sind die tatsächlichen Kompositionsjahre mit angegeben.
· Requiem d-Moll KV 626 (zur Kontrolle: 1791)
· Symphonie g-Moll KV 183 „kleine g-Moll Symphonie“ (zur Kontrolle: 1773)
· Symphonie D-Dur KV 297 „Pariser Symphonie“ (zur Kontrolle: 1778)
· Symphonie C-Dur KV 425 „Linzer Symphonie“ (zur Kontrolle: 1783)
· Symphonie D-Dur KV 504 „Prager Symphonie (zur Kontrolle: 1786)
· Symphonie g-Moll KV 550 „große g-Moll Symphonie“ (zur Kontrolle: 1788)
· Klavierkonzert F-Dur KV 459 „2. Krönungskonzert“ (zur Kontrolle: 1784)
· Klavierkonzert g-Moll KV 466 (zur Kontrolle: 1785)
· Klarinettenkonzert A-Dur KV 622, (zur Kontrolle: 1791)
· Idomeneo KV 366 (zur Kontrolle: 1781)
· Serenade D-Dur KV 320 „Posthorn-Serenade“ (zur Kontrolle: 1779)
· Große Messe c-Moll KV 427 (zur Kontrolle: 1782)
· Messe C-Dur „Krönungsmesse“ KV 317 (zur Kontrolle: 1779)
Beurteilen Sie anhand der Ergebnisse die Güte der Ausgleichsgerade als Prognoseinstrument.
Im Booklet zu einer Gesamtaufnahme der Symphonien Mozarts schreibt der amerikanische
Musikwissenschaftler Prof. Neal Zaslaw: „Although Köchel had no such intention in devising
his catalogue, Mozart’s age at the time of composition of a work may be calculated with
some degree of accuracy from the KV number. (This works, however, only for the numbers
over 100.) To find Mozart’s age divide the KV number by 25 and add 10. Then, if one keeps
in mind that Mozart was born in January 1756, the year of composition is also readily approximated.”
Beurteilen Sie Prof. Zaslaws Aussage in Hinblick auf die von Ihnen gefundene Ausgleichsgerade und das Ergebnis in c).
3.6.10 Für zwei Merkmale X und Y wurden die Daten
X
x1
x2
x3
xN
Y
y1
y2
y3
yN
erhoben. Man hat außerdem festgestellt, dass sY2 = 0 gilt.
a) Beweisen Sie, dass in diesem Fall y1 = y2 = y3 = = yN = Y gilt.
b) Beweisen Sie, dass s2XY = 0 gilt. Was folgt hieraus für den linearen Zusammenhang von X
und Y ?
c) Betrachten Sie ihr Ergebnis aus b) in Verbindung mit der Tatsache, dass die Datenpaare
( x1 , y1 ) , , ( xN , yN ) offenbar alle auf der Gerade y = 0x + Y liegen – ist dies nicht ein Widerspruch?
3.6.11 Im Rahmen dieser Übung sollen Sie beweisen, dass der Korrelationskoeffizient nur Werte
zwischen -1 und +1 annimmt. Unterscheiden Sie hierzu die Fälle sY2 = 0 und sY2 > 0 . Im ersten Fall
wissen Sie aus der vorhergehenden Übung, dass s2XY = 0 gilt, also im angegebenen Rahmen liegt. Im
Burghardt – RWB 2013/2014
3 Lineare Regression
52
Fall sY2 > 0 wissen Sie, dass die quadratische Gesamtdifferenz der Punkte zur Ausgleichsgerade nicht
negativ ist, und wie folgt berechnet werden kann:
æs ö
D ç XY2 ÷ = NsY2 × (1 - rXY2 ) .
è sX ø
Nutzen Sie dies aus, um auf die Beziehung rXY2 £ 1 zu kommen. Überlegen Sie dann, dass dies bedeutet, dass rXY zwischen -1 und +1 liegen muss.
Burghardt – RWB 2013/2014
4 Funktionen in wirtschaftswissenschaftlichen Anwendungen
53
4 Funktionen in wirtschaftswissenschaftlichen Anwendungen
4.1 Die Zentralküche von Krippe e.V.
Um seine Kindertagesstätten mit Mittagessen zu versorgen, betreibt der Verein Krippe e.V. eine
Zentralküche, in der im Augenblick elf Mitarbeiter beschäftigt sind. Die Zentralküche beliefert gegen
Bezahlung auch zwei städtische Gymnasien, bei denen Ganztagsunterricht stattfindet, und wirft
deshalb einen kleinen Gewinn ab, den Krippe e.V. für die Verbesserung des Betreuungsangebots in
den Kindertagesstätten verwendet. Im Rahmen eines Seminars haben Studentinnen und Studenten
des Fachbereichs Wirtschaft einer Fachhochschule die Wirtschaftlichkeit der Zentralküche untersucht. Sie haben festgestellt, dass Einnahmen und Ausgaben dieser Zentralküche im Wesentlichen
von der Anzahl der beschäftigten Arbeitskräfte bestimmt werden. Misst man die Anzahl der in der
Zentralküche beschäftigten Arbeiterinnen und Arbeiter in Einheiten von zwei Personen und die monatlichen Einnahmen und Ausgaben in Geldeinheiten von 10 €, dann
· kann der von den Beschäftigten erwirtschaftete Erlös (die Einnahmen) mit Hilfe einer Funktion
berechnet werden, die durch E ( x ) = 50 x gegeben ist, und
·
können die durch die Beschäftigten verursachten Kosten mit Hilfe einer Funktion berechnet
werden, die durch K ( x ) = x 2 + 35x + 31, 25 gegeben ist.
Die Graphen der Erlösfunktion (gestrichelt) und der Kostenfunktion sind hier dargestellt:
700
600
500
400
300
200
100
0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
Um den von elf Beschäftigten erwirtschafteten Erlös zu berechnen, muss zunächst die Personenzahl
11 in Einheiten der Erlösfunktion („ x -Einheiten“) umgerechnet werden. Dieser Wert wird dann in
die Gleichung E ( x ) = 50 x für x eingesetzt: 11 Beschäftigte entsprechen 11 2 = 5, 5 x -Einheiten.
Damit beträgt der Erlös E ( 5, 5) = 50 × 5, 5 = 275 Geldeinheiten. Da eine Geldeinheit 10 € entspricht,
bedeutet der berechnete Erlös eine Einnahme von 275 × 10 = 2750 € je Monat.
Um die von elf Beschäftigten verursachten Kosten zu berechnen, wird wieder zuerst die Beschäftigtenzahl x -Einheiten umgerechnet: 11 2 = 5, 5 . Dieser Wert wird dann in die Gleichung
Burghardt – RWB 2013/2014
4 Funktionen in wirtschaftswissenschaftlichen Anwendungen
54
K ( x ) = x 2 + 35x + 31, 25 eingesetzt: K ( 5, 5) = 254 Geldeinheiten. Weil eine Geldeinheit 10 € entspricht, bedeutet dies, dass die Kosten 254 × 10 = 2540 € je Monat betragen.
Um den von elf Beschäftigten erwirtschafteten Gewinn zu bestimmen, müssen die Kosten von den
Einnahmen abgezogen werden:
Gewinn = Erlös - Kosten .
Der Gewinn beträgt also 2750 - 2540 = 210 € je Monat.
Mit der Beziehung Gewinn = Erlös - Kosten kann Krippe e.V. auch direkt aus der Gleichung für die
Erlösfunktion, E ( x ) = 50 x , und der Gleichung für die Kostenfunktion, K ( x ) = x 2 + 35x + 31, 25 , eine
Gleichung für die Gewinnfunktion G berechnen:
G(x) = E (x) - K (x)
= 50 x - ( x 2 + 35x + 31, 25)
= 50 x - x 2 - 35x - 31, 25
= - x 2 + 15x - 31, 25
Zur Kontrolle: Bei elf Mitarbeitern, also x = 11 2 = 5, 5 ergibt sich ein Gewinn von G ( 5, 5) = 21 Geldeinheiten, also 21 × 10 = 210 € je Monat, wie eben schon berechnet.
Der Graph der Gewinnfunktion ist hier gezeichnet:
35
30
25
20
15
10
5
0
-5 0
1
2
3
4
5
6
7
8
9
10
11
12
13
-10
-15
-20
-25
-30
-35
Man erkennt:
· Sind zu wenige oder zu viele Mitarbeiter beschäftigt, verläuft der Graph unterhalb der x -Achse.
Die Gewinnfunktion nimmt hier also negative Werte an, die Zentralküche macht Verlust.
· Es gibt eine optimale Beschäftigtenzahl, bei der der Gewinn am größten ist. Hier hat der Funktionsgraph seinen höchsten Punkt.
Burghardt – RWB 2013/2014
4 Funktionen in wirtschaftswissenschaftlichen Anwendungen
55
4.2 Gewinnfunktionen und ihre Interpretation
In einfachen wirtschaftswissenschaftlichen Anwendungen wird ein funktionaler Zusammenhang
hergestellt zwischen der Menge eines bestimmten Gutes, das produziert oder bereitgehalten wird
– im Fall der Zentralküche von Krippe e.V. sind dies die beschäftigten Arbeitskräfte –, und
· den Kosten, die durch dessen Produktion oder Bereithaltung entstehen, bestimmbar durch eine
Kostenfunktion K
· sowie dem Erlös, der durch dieses Gut erzielt werden kann, bestimmbar durch eine Erlösfunktion E .
Der erzielbare Gewinn ergibt sich dann als Differenz aus Erlös und Kosten:
Gewinn = Erlös - Kosten ,
sodass die Gewinnfunktion G durch
G(x) = E (x) - K (x)
berechnet wird. Liefert die Gewinnfunktion ein negatives Ergebnis, bedeutet dies, dass ein Verlust
entsteht.
typischer Verlauf einer Gewinnfunktion
Gewinnmaximum
Gewinn
maximaler Gewinn
Gewinnzone
Gewinnschwelle,
Break-even-point
Fixkosten
te
Gewinngrenze
optimale Menge des
Gutes
Me
Menge
des
Gutes
Mit Fixkosten werden diejenigen Kosten bezeichnet, die schon entstehen, wenn kein Gut produziert
oder bereitgehalten wird. Die Fixkosten können berechnet werden, indem x = 0 in die Gewinnfunktion eingesetzt wird. Für die Zentralküche von Krippe e.V. betragen die Fixkosten G ( 0 ) = -31, 25
Geldeinheiten. Dies sind 31, 25 × 10 = 312, 50 € je Monat.
Die Gewinnentwicklung verläuft dann in der Regel strukturell so wie bei der Zentralküche von Krippe
e.V.: Bei geringer Menge des Gutes ist der Gewinn in der Regel negativ, zum Beispiel weil die Kosten
für den Unterhalt von Maschinen und Anlagen so hoch sind, dass sie durch den Erlös weniger Güter
nicht aufgewogen werden können. Mit zunehmender Menge des Gutes wird dann ein Punkt erreicht, an dem Erlös und Kosten gleich hoch sind und somit weder eine Verlust entsteht noch ein
Gewinn erwirtschaftet wird. Dieser Punkt wird Gewinnschwelle oder Break-even-point genannt.
Burghardt – RWB 2013/2014
4 Funktionen in wirtschaftswissenschaftlichen Anwendungen
56
Nach Überschreiten der Gewinnschwelle ist der Erlös größer als die Kosten. Der Gewinn steigt zuerst
weiter an, fällt aber schließlich bei „zu großer“ Menge des Gutes wieder ab bis schließlich Kosten
und Erlös wiederum gleich groß sind. Ab diesem Wert, der als Gewinngrenze bezeichnet wird, wird
wieder Verlust erwirtschaftet, weil zum Beispiel die produzierten Güter in dieser Menge nicht auf
dem Markt abgesetzt werden können.
Um Gewinnschwelle und Gewinngrenze zu berechnen, muss man bestimmen, an welchen Stellen
der Graph der Gewinnfunktion die x -Achse schneidet. Es muss also die Gleichung
G(x) = 0
gelöst werden. Die Gewinnschwelle und Gewinngrenze werden also mit Hilfe der Nullstellen der
Gewinnfunktion ermittelt.
Für die Zentralküche von Krippe e.V. ergibt sich die folgende Rechnung:
G(x)
= 0
- x 2 + 15x - 31, 25 = 0 : ( -1 )
x 2 - 15x + 31, 25
= 0 p = -15, q = 31, 25
2
x1
-15
æ -15 ö
= ± ç
÷ - 31, 25 = 7, 5 ± 5
2
è 2 ø
= 12, 5
x2
= 2, 5
x1/2
Da eine x -Einheit zwei Mitarbeitern entspricht, liegt die Gewinnschwelle bei 2, 5 × 2 = 5 Beschäftigten und die Gewinngrenze bei 12, 5 × 2 = 25 Beschäftigten.
Die Mengen an Gut, die zwischen Gewinnschwelle und Gewinngrenze liegen – die also nicht zu einem Verlust führen – bilden die Gewinnzone. Die Gewinnzone der Zentralküche von Krippe e.V.
geht dann von 5 bis zu 25 Beschäftigten.
Innerhalb der Gewinnzone liegt das Gewinnmaximum: Hier ist die Menge des Gutes optimal in dem
Sinn, dass sie zu dem größtmöglichen Gewinn führt. Um das Gewinnmaximum zu bestimmen, muss
der Hochpunkt der Gewinnfunktion bestimmt werden: Die x -Koordinate des Hochpunktes ergibt
nach Multiplikation mit der Größe einer x -Einheit die optimale Menge des Gutes, die y -Koordinate
ergibt nach Multiplikation mit der Größe einer Geldeinheit den größtmöglichen Gewinn.
Bei quadratischen Gewinnfunktionen können wir den Hochpunkt bereits bestimmen, indem wir die
Formel für den Scheitelpunkt verwenden. Bei komplizierten Gewinnfunktionen müssen allerdings
andere Verfahren hierfür herangezogen werden.
Für die durch G ( x ) = - x 2 + 15x - 31, 25 gegebene quadratische Gewinnfunktion der Zentralküche
von Krippe e.V. ergibt sich für die Koordinaten des Scheitelpunktes
Burghardt – RWB 2013/2014
4 Funktionen in wirtschaftswissenschaftlichen Anwendungen
57
b
15
== 7, 5
2a
2 × ( -1)
xS
= -
yS
= G ( 7, 5) = 25
Hieraus ergibt sich als optimale Mitarbeiterzahl 7, 5 × 2 = 15 und als maximaler Gewinn 25 × 10 = 250
€ je Monat.
Oft interessiert, bei welcher Menge des Gutes ein bestimmter Gewinn g erzielt wird oder gewisse
Kosten k entstehen. In diesen Fällen sind die Gleichungen G ( x ) = g bzw. K ( x ) = k nach x aufzulösen. Man verwendet hierzu im ersten Schritt in der Regel das mathematische Verfahren der Transformation auf ein Nullstellenproblem:
· G ( x ) = g - g Û G ( x ) - g = 0 bzw.
·
K (x) = k - k
Û K (x) - k = 0 .
Die entstehenden Gleichungen kann man in einfachen Fällen direkt lösen, zum Beispiel wenn die
Gewinnfunktion bzw. die Kostenfunktion eine quadratische Funktion ist. In diesem Fall liefert die p
- q -Formel alle Nullstellen.
Soll zum Beispiel bestimmt werden, bei welcher Mitarbeiterzahl der Zentralküche von Krippe e.V.
monatliche Kosten in Höhe von 3.250 € entstehen, wird zunächst der Geldbetrag in Geldeinheiten
umgerechnet: 3250 10 = 325 . Zu lösen ist dann K ( x ) = 325 :
x 2 + 35x + 31, 25
= 325 - 325
x + 35x - 293, 75 = 0 p = 35, q = -293, 75
2
2
x1
35
æ 35 ö
= - ± ç ÷ + 293, 75 » -17, 5 ± 24, 49
2
è 2 ø
= 6, 99
x2
= -41, 99
x1/2
Da negative Werte nicht in Frage kommen, liefert nur x1 = 6, 99 eine Lösung des Problems.
x1 = 6, 99 entspricht 6, 99 × 2 = 13, 98 » 14 Mitarbeitern. Bei 14 Mitarbeitern macht die Zentralküche also einen Gewinn von 3.250 € im Monat.
4.3 Übungen
4.3.1 Ein Pflegeheim kann höchstens 75 Personen aufnehmen. Bei x Bewohnern rechnet die Betreibergesellschaft mit einem monatlichen Erlös in Höhe von E ( x ) = 70 x Geldeinheiten und monatliche Kosten in Höhe von K ( x ) = x 2 - 10 x + 700 Geldeinheiten. Eine Geldeinheit entspricht dabei
20 €.
a) Weisen Sie nach, dass die Gewinnfunktion gegeben ist durch die Gleichung
G ( x ) = - x 2 + 80x - 700 .
b)
c)
Ermitteln Sie den Monatsgewinn des Heims bei 55 Bewohnern.
Berechnen Sie die Fixkosten des Heims.
Burghardt – RWB 2013/2014
4 Funktionen in wirtschaftswissenschaftlichen Anwendungen
d)
e)
f)
g)
h)
i)
58
Berechnen Sie die Gewinnschwelle und die Gewinngrenze des Pflegeheims.
Bestimmen Sie die Gewinnzone des Pflegeheims. Untersuchen Sie, ob es sinnvoll ist, das
Heim bis an seine Kapazitätsgrenze zu belegen.
Bestimmen Sie die optimale Belegungsgröße. Geben Sie auch den maximalen Gewinn des
Heims in einem Jahr an.
Zeichnen Sie den Graphen der Gewinnfunktion über dem Intervall der in Frage kommenden
Belegungszahlen. Wählen Sie auf der x -Achse 1 cm je 10 Personen und auf der y -Achse 1
cm für 100 Geldeinheiten. Markieren Sie in der Zeichnung die Gewinnzone, die Gewinnschwelle, die Gewinngrenze, das Gewinnmaximum, die optimale Belegung und den maximalen Gewinn.
Berechnen Sie, bei welcher Belegung das Heim einen Gewinn von 12.220 € im Monat erzielt.
Berechnen Sie, bei welcher Belegungszahl dem Heim Kosten in Höhe von 14.780 € im Monat
entstehen.
4.3.2 Die Belegungszahlen des Pflegeheims aus Übung 4.3.1 haben sich in den vergangenen Jahren
wie folgt entwickelt:
Jahr
2005
2007
2010
2012
2013
Bewohner
16
33
31
43
43
a)
b)
c)
d)
e)
f)
Bestimmen Sie die Korrelation der Daten und ermitteln Sie, ob ein positiver oder ein negativer linearer Zusammenhang vorliegt.
Bestimmen Sie die Ausgleichsgerade.
Berechnen Sie, in welchem Jahr der Break-even-point erreicht wird.
Ermitteln Sie, in welchem Jahr der größte Gewinn zu erwarten ist.
Berechnen Sie, in welchem Jahr der Monatsgewinn 12.220 € beträgt.
Untersuchen Sie, in welchem Jahr wird das Heim erstmals voll ausgelastet sein wird.
4.3.3 Ein Behindertenheim ist auf eine maximale Belegung mit 68 Personen ausgelegt. Den monatlichen Gewinn berechnet die Verwaltung des Pflegeheims mit der durch G ( x ) = - x 2 + 37x - 160
gegebenen Gewinnfunktion. Hierbei wird x in Einheiten zu 2 Personen angegeben und G ( x ) in
Einheiten zu 50 € gemessen.
a) Berechnen Sie die Fixkosten und die Gewinnzone des Heims und untersuchen Sie, ob es sinnvoll ist, das Heim bis zu seiner Kapazitätsgrenze zu belegen.
b) Berechnen Sie, bei welcher Belegungsgröße das Heim einen Gewinn von 5.500 € im Monat
macht.
c) Bestimmen Sie das Gewinnmaximum.
d) Zeichnen Sie den Graphen der Gewinnfunktion über dem Intervall der in Frage kommenden
Belegungszahlen. Markieren Sie die wesentlichen Kenngrößen der Gewinnfunktion im Graphen.
4.3.4 Die Bewohnerzahlen des Behindertenheims aus Übung 4.3.3 haben sich in den vergangenen
Jahren wie folgt entwickelt:
Jahr
2005
2007
2009
2011
2013
Bewohner
58
55
39
35
23
a)
Bestimmen Sie die Korrelation der Daten und entscheiden Sie begründet, ob ein positiver
oder ein negativer linearer Zusammenhang vorliegt. Interpretieren Sie Ihr Ergebnis in Bezug
Burghardt – RWB 2013/2014
4 Funktionen in wirtschaftswissenschaftlichen Anwendungen
b)
c)
d)
e)
59
auf die Entwicklung der Bewohnerzahlen des Heims und entwickeln Sie Hypothesen, die
diese Entwicklung begründen können.
Bestimmen Sie die Ausgleichsgerade.
Berechen Sie, in welchem Jahr das Heim (letztmals) voll belegt war.
Berechnen Sie das Jahr, in dem das Heim einen Gewinn von 5.500 € im Monat macht.
Ermitteln Sie, mit welchem Gewinn im Jahr 2017 zu rechnen ist.
4.3.5 Bei den Berechnung der monatlichen Einnahmen und Ausgaben eines städtischen Jugendheims legt die Stadtverwaltung Einheiten von 5 Personen und 200 € zugrunde. Bei einer Bewohnerzahl in Höhe von x Einheiten rechnet die Stadtverwaltung mit monatlichen Einnahmen in Höhe von
E ( x ) = 35x Geldeinheiten und monatliche Kosten in Höhe von K ( x ) = 2x 2 - 13x + 238 Geldeinheiten.
Über die vergangenen Jahre hat sich die Belegungszahl des Jugendheims wie folgt entwickelt:
Jahr
Bewohner
1995
78
1999
69
2003
72
2009
66
2013
68
a)
Weisen Sie nach, dass die Gewinnfunktion gegeben ist durch die Gleichung
G ( x ) = -2x 2 + 48x - 238 .
b)
c)
Bestimmen Sie Gewinnschwelle, Gewinngrenze und Gewinnzone.
Berechnen Sie die Korrelation zwischen den Jahreszahlen und den Belegungszahlen und bestimmen Sie, welcher lineare Zusammenhang vorliegt. Interpretieren Sie die Bedeutung des
festgestellten linearen Zusammenhangs für das Jugendheim.
Berechnen Sie die Ausgleichsgerade.
Berechnen Sie, in welchem Jahr das Jugendheim den größtmöglichen Gewinn erzielen wird.
Bestimmen Sie den voraussichtlichen Gewinn Sie für das Jahr 2017.
Berechnen Sie, in welchem Jahr wird das Heim einen Gewinn von 2.356 € in der Woche machen wird.
Ein Politiker der Opposition im Stadtrat kritisiert im Kommunalwahlkampf, dass das Jugendheim seit Jahren überbelegt sei. Untersuchen Sie, worauf er seine Argumentation stützen
könnte.
d)
e)
f)
g)
h)
4.3.6 Die Finanzverwaltung einer Klinik führt Buch darüber, wie in vergangenen Jahren die Auslastung der Klinik war. In der folgenden Tabelle ist für einige Jahre die jährliche Auslastung in Prozent
angegeben:
Jahr
Auslastung in %
1995
15
1996
22
1997
25
20012
41
2003
45
2005
52
2009
66
2013
80
Den bei einer Auslastung von x % erzielten jährlichen Gewinn kalkuliert die Finanzverwaltung mit
der durch G ( x ) = -0, 1x 2 + 18, 5x - 400 gegebenen Gewinnfunktion. G ( x ) wird in Einheiten zu
1.000 € gemessen.
a) Untersuchen Sie die Daten in der Tabelle auf linearen Zusammenhang.
b) Berechnen Sie die Regressionsgerade und bestimmen Sie, welche Auslastung im Jahr 2016
zu erwarten ist. Berechnen Sie auch, mit welchem Gewinn die Verwaltung 2016 kalkulieren
kann.
c) Ermitteln Sie, in welchem Jahr hat die Klinik zum ersten Mal keinen Verlust erwirtschaftet.
d) Berechnen Sie, in welchem Jahr der größte Gewinn zu erwarten ist, und bestimmen Sie, wie
hoch dieser Gewinn voraussichtlich sein wird.
Burghardt – RWB 2013/2014
4 Funktionen in wirtschaftswissenschaftlichen Anwendungen
e)
60
Die Verwaltung will die Auslastung der Klinik so begrenzen, dass der Jahresgewinn stets mindestens 452.000 € beträgt. Bestimmen Sie, ab welchem Jahr dies der Fall sein wird.
Burghardt – RWB 2013/2014
5 Exkurs: Zahlen
61
5 Exkurs: Zahlen
In der Mathematik kennt man verschiedene Familien von Zahlen, die hier kurz vorgestellt werden
sollen.
5.1 Natürliche Zahlen
Als natürliche Zahlen bezeichnet man die Zahlen, die man üblicherweise zum Zählen verwendet,
nämlich die Zahlen 1, 2, 3, 4, 5, . Die Menge (Familie) aller natürlichen Zahlen bezeichnet man mit
dem Zeichen . Will man ausdrücken, dass die Variable/Unbekannte x eine natürliche Zahl ist,
schreibt man oft x Î : x gehört zur (ist ein Element der) Menge der natürlichen Zahlen.
5.2 Ganze Zahlen
Unter den ganzen Zahlen versteht man sämtliche natürlichen Zahlen sowie Null und die Zahlen
-1, -2, -3, -4, -5, Die Menge (Familie) aller ganzen Zahlen bezeichnet man mit dem Zeichen .
Will man ausdrücken, dass die Variable/Unbekannte x eine natürliche Zahl ist, schreibt man oft
x Î : x gehört zur (ist ein Element der) Menge der ganzen Zahlen.
Jede natürliche Zahl ist eine ganze Zahl. Hierfür schreibt man manchmal auch Í : Die Familie
(in der mathematischen Fachsprache meist „Menge“ genannt) der natürlichen Zahlen ist ein Teil
der Familie der ganzen Zahlen. Die Umkehrung gilt aber nicht: Es gibt ganze Zahlen, die keine natürlichen Zahlen sind, zum Beispiel die Zahl -1 .
5.3 Rationale Zahlen
Neben den ganzen Zahlen verwenden wir im täglichen Leben Brüche, um Anteile am Ganzen zu
kennzeichnen. Die Menge aller Brüche bezeichnet man in der Mathematik mit dem Zeichen : Eine
Zahl x gehört zur Menge
der rationalen Zahlen, wenn es eine ganze Zahl p und eine natürliche
Zahl q gibt, sodass
p
x=
q
ist. Jede natürliche oder ganze Zahl x ist eine rationale Zahl, denn x lässt sich schreiben als x = x 1
.
Jede rationale Zahl x = p q lässt sich als Dezimalzahl (Kommazahl) schreiben, indem man die Division p : q durchführt. Verwandelt man eine rationale Zahl in eine Dezimalzahl, so entsteht eine abbrechende Dezimalzahl (mit nur endlich vielen von Null verschiedenen Zahlen hinter dem Komma)
oder eine periodische Dezimalzahl, die unendlich viele Zahlen hinter dem Komma hat, wobei es ab
einer gewissen Stelle hinter dem Komma eine Ziffernfolge gibt, die sich immer wiederholt.
Also: Bei einer abbrechenden Dezimalzahl gibt es natürliche Zahlen a1 , , ak und b1 ,
0 und 9 mit
x = a1 ak , b1 bl oder x = -a1 ak , b1 bl .
Burghardt – RWB 2013/2014
, bl zwischen
5 Exkurs: Zahlen
62
Bei einer periodische Dezimalzahl gibt es natürliche Zahlen a1 , , ak und b1 , , bl sowie c1 , , cm
mit
x = a1 ak , b1 bl c1 cmc1 cmc1 cm oder x = -a1 ak , b1 bl c1 cmc1 cmc1 cm .
Die Zahlenfolge, die sich hinter dem Komma fortwährend wiederholt, also c1 ,
, cm , nennt man
Periode. Die Zahlenfolge b1 , , bl , die nach dem Komma und vor der Periode steht, nennt man auch
Vorperiode. Wenn es keine Vorperiode gibt, beginnt die Periode direkt nach dem Komma. Dann ist
l = 0 . Meist kennzeichnet man die Periode durch einen waagerechten Strich:
±a1 ak , b1 bl c1 cmc1 cmc1 cm = ±a1 ak , b1 bl c1 cm
Beispiele:
1
·
= 0, 5 Þ a1 = 0, b1 = 5
2
7
·
= 1, 16 Þ a1 = 1, b1 = 1, c1 = 6
6
41
·
= 3, 416 Þ a1 = 3, b1 = 4, b2 = 1, c1 = 6
12
99653
·
= 14, 236142857
7000
Þ a1 = 1, a2 = 4, b1 = 2, b2 = 3, b3 = 6, c1 = 1, c2 = 4, c3 = 2, c4 = 8, c5 = 5, c6 = 7
Umgekehrt kann man jede abbrechende oder periodische Dezimalzahl in einen Bruch umrechnen:
Bei einer abbrechenden Dezimalzahl ist das sehr einfach:
a ak b1 bl
,
±a1 ak , b1 bl = ± 1
10l
zum Beispiel
45987 45987
45, 987 =
=
103
1000
Wie eine periodische Dezimalzahl umgerechnet wird, wird anhand des Beispiels x = 3, 416 gezeigt:
Schritt 1. Multipliziere die Gleichung x = a1 ak , b1 bl c1 cm zunächst mit 10l , also mit einer 1
mit sovielen Nullen dahinter, wie die Vorperiode lang ist. Hierdurch wird in der neuen Gleichung
auf der rechten Seite das Komma direkt vor die erste Periode geschoben:
10l x = a1 ak b1 bl , c1 cm
Im Beispiel x = 3, 416 ist l = 2 , also 10l = 102 = 100 :
x
=
3, 416 × 102
100 x = 341, 6
Schritt 2. Multipliziere nun diese Gleichung mit 10m , also mit einer 1 mit sovielen Nullen dahinter,
wie die Periode lang ist. Hierdurch wird in der neuen Gleichung auf der rechten Seite das Komma
hinter die erste Periode geschoben:
10l +m x = a1 ak b1 bl c1 cm , c1 cm
Im Beispiel x = 3, 416 ist m = 1 , also 10m = 101 = 10 :
Burghardt – RWB 2013/2014
5 Exkurs: Zahlen
63
=
100 x
341, 6 × 10
1.000 x = 3416, 6
Schritt 3. Ziehe die Gleichung aus Schritt 1 ab von der Gleichung aus Schritt 2:
10l + m x
= a1 ak b1 bl c1 cm , c1 cm
-
= a1
ak b1
bl , c1
x - 10 x = a1
ak b1
bl c1
10l x
10
l +m
l
cm
cm - a1
ak b1
bl
Im Beispiel:
-
1.000 x = 3416, 6
100 x = 341, 6
900 x = 3075
Schritt 4. Löse die letzte Gleichung nach x auf:
10l + m x - 10l x = a1 ak b1 bl c1
(10
l +m
cm - a1
ak b1
bl
- 10l ) x = a1
ak b1
bl c1
cm - a1
ak b1
bl : (10
1 l + m - 10l )
a1
ak b1
bl c1 cm - a1
(10l +m - 10l )
ak b1
bl
x
=
Die Zahl auf der rechten Seite hat im Zähler eine ganze Zahl und im Nenner eine natürliche Zahl.
Gegebenenfalls kann man hier noch kürzen; dies ist aber für das Umwandeln der periodischen Dezimalzahl in einen Bruch nicht erforderlich.
Im Beispiel:
900 x = 3075 : 900
3075
x
=
(kürzen durch 75)
900
41
.
x
=
12
5.4 Irrationale Zahlen
Es gibt auch Dezimalzahlen, die nicht als Bruch geschrieben werden können. Solche Zahlen heißen
irrationale Zahlen. Das bekannteste und einfachste Beispiel einer solchen Zahl ist 2 . Der Beweis,
dass man 2 nicht als Bruch schreiben kann, ist wahrscheinlich einer der berühmtesten Beweise
der gesamten Mathematik. Es handelt sich um einen „indirekten Beweis“. Bei einem indirekten Beweis zeigt man, dass das Gegenteil dessen, was man nachweisen will, nicht richtig sein kann. Um
nachzuweisen, dass 2 eine irrationale Zahl ist, also nicht als Bruch geschrieben werden kann, geht
man also zunächst davon aus, 2 ließe sich als Bruch schreiben, und weist nach, dass dies zu einem
Widerspruch führt.
Wir stellen diesen Beweis hier vor und nehmen deshalb an, 2 ließe sich als Bruch schreiben. Das
bedeutet: Für zwei bestimmte (aber noch unbekannte) natürliche Zahlen p und q gilt
p
2= .
q
Burghardt – RWB 2013/2014
5 Exkurs: Zahlen
64
Wir können annehmen:
p
ist gekürzt.
q
Ansonsten kürzen wir zuerst soweit wie möglich. Insbesondere bedeutet das:
Der Bruch
Nicht beide der Zahlen p und q sind gerade.
Ansonsten könnte man nämlich noch mindestens einmal durch 2 kürzen. Durch Quadrieren der
Ausgangsgleichung 2 = p q ergibt sich
p2
Û 2q2 = p2
q2
Das bedeutet: p2 ist eine gerade Zahl. Man macht sich leicht klar:
2=
·
·
Quadriert man eine gerade Zahl, erhält man wieder eine gerade Zahl.
Quadriert man eine ungerade Zahl, erhält man wieder eine ungerade Zahl.
Deshalb kann p nicht ungerade sein:
p ist gerade.
Also ist p das Doppelte einer natürlichen Zahl n , d.h. p = 2n . Mit der oben gewonnenen Gleichung
2q2 = p2 ergibt sich also
2q2 = p2 = (2n ) = 4n2 : 2 Û q2 = 2n2 .
2
Also ist auch q 2 eine gerade Zahl. Wie oben schon für p2 gesehen, kann dann q nicht ungerade
sein, das heißt:
q ist gerade.
Wir hatten aber überlegt, dass nicht beide Zahlen p und q gerade sind. Eine Darstellung von
2
als Bruch ist also nicht möglich. Insbesondere hat also die Dezimalzahl 2 keine Periode und bricht
niemals ab.
Neben 2 sind auch alle Quadratwurzeln aus natürlichen Zahlen, sofern sich beim Wurzelziehen
keine natürliche Zahl ergibt, irrational, und auch die „Kreiszahl“ p ist eine irrationale Zahl. Die Mathematiker können sogar beweisen, dass es „viel mehr“ irrationale Zahlen gibt als rationale!
5.5 Reelle Zahlen
Die Menge aller Dezimalzahlen (ob abbrechend, periodisch oder nicht periodisch – also irrational)
nennt man Menge der reellen Zahlen. Man bezeichnet sie mit dem Symbol . Alle natürlichen,
ganzen und rationalen Zahlen sind reelle Zahlen.
Burghardt – RWB 2013/2014
5 Exkurs: Zahlen
65
5.6 Übungen
5.6.1 Kreuzen Sie jeweils jede Menge an, zu den die Zahl gehört:
1
1, 75
15
3
- 117
3
8
2
-96
-22
-1, 3
6, 10235678
5.6.2 Verwandeln Sie die folgenden Dezimalzahlen in Brüche.
a)
0, 2
g)
1, 36
m)
3, 1005
b)
0, 35
h)
2, 125
n)
2, 0001
c)
0, 125
i)
7, 007
o)
-10, 12
d)
0, 25
j)
13, 26983
p)
0, 000001
e)
0, 198
k)
-5, 4
q)
6, 10250
f)
0, 1254
l)
-7, 12
r)
-2, 22222
Burghardt – RWB 2013/2014
6 Nullstellenbestimmung bei ganzrationalen Funktionen
66
6 Nullstellenbestimmung bei ganzrationalen Funktionen
6.1 Ganzrationale Funktionen und ihr Grad
Lineare Funktionen f ( x ) = mx + b und quadratische Funktionen f ( x ) = ax 2 + bx + c sind die einfachsten Vertreter einer großen Klasse von Funktionen, den so genannten ganzrationalen Funktionen:
Definition. Eine Funktion f heißt ganzrationale Funktion n -ten Grades (wobei n eine natürliche
Zahl, also eine der Zahlen 1, 2, 3, 4, ist), wenn es reelle Zahlen a1 , , an gibt mit an ¹ 0 und
f ( x ) = an x n + an-1 x n-1 +
Die
Zahlen
a0 ,
an x n + an-1 x n-1 +
, an
heißen
auch
+ a1 x1 + a0 .
Koeffizienten
der
Funktion.
Den
Funktionsterm
+ a1 x1 + a0 nennt man auch Polynom.
Die Funktionsgleichung jeder ganzrationale Funktionen ersten Grades ist von der Form
f ( x ) = a1 x1 + a0 – wir kennen diese Funktionen als lineare Funktionen.
Die Funktionsgleichung jeder ganzrationale Funktionen zweiten Grades ist von der Form
f ( x ) = a2 x 2 + a1 x1 + a0 – wir kennen diese Funktionen als quadratische Funktionen.
Die Funktionsgleichung jeder ganzrationale Funktionen dritten Grades ist von der Form
f ( x ) = a3 x 3 + a2 x 2 + a1 x1 + a0 – man nennt diese Funktionen auch kubische Funktionen.
6.2 Übungen
6.2.1 Untersuchen Sie, ob die folgenden Funktionen ganzrational sind, und bestimmen Sie gegebenenfalls den Grad.
4
a) f ( x ) = - x + 3x - 1
e) f ( x ) = x + sin ( x )
b)
f ( x ) = 7, 5x 3 + 2x 2 - 5x + 3, 8
f)
f ( x ) = x 5 - 4x2
c)
f ( x ) = 4 x - 2x -3
g)
f ( x ) = 2x
d)
f ( x ) = x10 - 9
h)
f ( x ) = 2 - 5x 7 - 3, 75x 4 + 3x - x 9
6.2.2 Zeichnen Sie die Graphen der folgenden Funktionen und markieren Sie die Nullstellen.
3
2
a) f ( x ) = 0, 2x + 0, 2x - 1, 8 x - 1, 8 für x Î [ -4 | 4] .
b)
f ( x ) = 0, 5x 3 - 3x 2 + 6 x - 3 für x Î [ -0, 5 | 4, 5]
Burghardt – RWB 2013/2014
6 Nullstellenbestimmung bei ganzrationalen Funktionen
67
6.3 Nullstellen ganzrationaler Funktionen
Bei der ersten Untersuchung von Funktionen in wirtschaftswissenschaftlichen Anwendungen haben
wir bereits gesehen, dass die Nullstellen einer Funktion von großer Bedeutung sind. In Anwendungen aus der Betriebswirtschaft kann zum Beispiel durch Berechnen der Nullstellen der Gewinnfunktion die Gewinnschwelle und die Gewinngrenze bestimmt und damit die Gewinnzone identifiziert
werden. Viele Probleme lassen sich in Nullstellenprobleme transformieren: Soll zum Beispiel in betriebswirtschaftlichen Anwendungen bestimmt werden, wann ein Unternehmen ein Gewinn von
5.000 € erzielt, dann ist die Gleichung G ( x ) = 5000 zu lösen, wobei wir der Einfachheit halber annehmen, dass die durch G ( x ) definierte Gewinnfunktion den Gewinn in Euros misst. Durch Subtraktion von 5000 wird dies zu G ( x ) - 5000 = 0 , und damit zu einem Nullstellenproblem.
Wir wollen uns deshalb nun mit der Frage beschäftigen, wie man die Nullstellen von ganzrationalen Funktion berechnen kann.
Wir wissen, dass jede lineare Funktion genau eine Nullstelle hat. Jede quadratische Funktion hat
höchstens zwei Nullstellen. Jedoch gibt es auch quadratische Funktionen, die keine Nullstellen
haben. Dies sind Spezialfälle der folgenden allgemeinen Aussagen über die Anzahl der Nullstellen
von ganzrationalen Funktionen.
Satz über die Anzahl der Nullstellen ganzrationaler Funktionen.
· Jede ganzrationale Funktion n -ten Grades hat höchstens n Nullstellen.
· Ist der Grad einer ganzrationalen Funktion eine ungerade Zahl, hat die Funktion mindestens
eine Nullstelle.
· Es gibt ganzrationale Funktionen, deren Grad eine gerade Zahl ist, die keine Nullstelle haben.
Nullstellen von linearen und quadratischen Funktionen können wir mit Hilfe mehr oder weniger
einfacher Umformungen oder der p - q -Formel entweder bestimmen oder wir können feststellen,
dass die Funktion keine Nullstellen hat, weil unter einer Quadratwurzel eine negative Zahl steht.
Wir können also in diesen Fällen die Gleichung f ( x ) = 0 vollständig behandeln.
Wir würden erwarten, auch bei allen ganzrationalen Funktionen mit höherem
Grad Formeln finden zu können, mit deren Hilfe wir die Gleichung f ( x ) = 0
vollständig behandeln können. Diese Formeln sollten natürlich „einfach“ sein in
dem Sinn, dass sie aus einer Rechenvorschrift bestehen, in der neben den Koeffizienten der Funktion nur die arithmetischen Operationen +, -, ×, ¸ und ggf.
Wurzelziehen vorkommen.
Niels Henrik Abel
Leider geht dies im Allgemeinen nicht! 1824 bewies der norwegische Mathematiker Niels Henrik Abel (geb. 5. August 1802, gestorben 6. April 1829), dass es bei ganzrationale
Burghardt – RWB 2013/2014
6 Nullstellenbestimmung bei ganzrationalen Funktionen
68
Funktionen fünften oder höheren Grades für die Nullstellenberechnung keine allgemeine Rechenvorschrift8 gibt, die nur arithmetischen Operationen und Wurzeln verwendet. Allgemeine Lösungsformeln existieren noch für ganzrationale Funktionen dritten und vierten Grades. Diese sind aber
sehr kompliziert.
Wir werden deshalb für Funktionen vom Grad größer als zwei keine Lösungsformeln behandeln!
Stattdessen werden wir einige „Reduktionsmethoden“ kennenlernen, mit deren Hilfe man unter
bestimmten Voraussetzungen das Problem f ( x ) = 0 auf eines oder mehrere Probleme der Art
g ( x ) = 0 reduzieren kann, wobei g ( x ) einen kleineren Grad als f ( x ) hat. Die Gleichung
g ( x ) = 0 ist dann womöglich zu lösen. Solche Reduktionsmethoden, bei denen ein zu lösendes
Problem auf ein einfacheres, womöglich bereits gelöstes Problem zurückgeführt wird, stellen auch
allgemein eine wichtige Strategie zum Lösen mathematischer Probleme dar.
Für die Fälle, in denen eine solche Reduktion nicht möglich ist oder in denen man die reduzierte
Funktion nicht lösen kann, werden wir später auf ein ganz anderes Verfahren zurückgreifen, mit
dessen Hilfe man die Nullstellen zwar nicht vollkommen exakt bestimmen kann, sich ihnen aber
im Verlauf weniger Rechenschritte beliebig genau annähern kann.
Wir werden drei Reduktionsmethoden kennen lernen:
a. Lösen mit Hilfe der Nullteilerfreiheit der reellen Zahlen
b. Polynomdivision
c. Substitutionsverfahren
6.3.1 Lösen mit Hilfe der Nullteilerfreiheit der reellen Zahlen
Mit „Nullteilerfreiheit der reellen Zahlen“ bezeichnet man folgenden sehr einfachen Sachverhalt:
Nullteilerfreiheit der Menge der reellen Zahlen. Ein Produkt ist reeller Zahlen ist nur dann Null,
wenn mindestens einer der Faktoren Null ist!
Man kann dies verwenden, um die Nullstellen einer Funktion zu bestimmen, deren Funktionsterm
„faktorisiert“, also ein Produkt ist.
Beispiele.
1. f ( x ) = ( x - 5)(2x + 7) ( x 2 - 4 )
8
Das bedeutet: Eine Rechenvorschrift, die für alle ganzrationalen Funktionen des entsprechenden Grades die Nullstellen liefert!
Burghardt – RWB 2013/2014
6 Nullstellenbestimmung bei ganzrationalen Funktionen
69
Die Funktion f ( x ) = ( x - 5)(2x + 7) ( x 2 - 4 ) hat also die Nullstellen x = 5 , x = 3, 5 ,
x = -2 und x = 2 .
2.
f ( x ) = ( x 2 + 6 )( x 3 + 8 ) ( x - 3)
2
Die Funktion f ( x ) = ( x 2 + 6 )( x 3 + 8 ) ( x - 3) hat also die Nullstellen x = -2 und x = 3 .
2
3.
f ( x ) = x ( x 2 + 3x - 18 )
Die Funktion f ( x ) = x ( x 2 + 3x - 18 ) hat die Nullstellen x = 0 , x = 3 und x = -6 .
4.
Manchmal muss man erst durch Ausklammern faktorisieren: f ( x ) = x 5 - 3x 2 wird durch Ausklammern von x 2 zu f ( x ) = x 2 ( x 3 - 3) .
Die Funktion f ( x ) = x 5 - 3x 2 hat also die Nullstellen x = 0 und x = 1, 442 .
6.3.2 Polynomdivision
Polynomdivision ist eine Verallgemeinerung des Ausklammerns aus dem letzten Beispiel. Wenn
man x nicht ausklammern kann, aber eine Nullstelle x 0 kennt, so kann man aus dem Funktionsterm
Burghardt – RWB 2013/2014
6 Nullstellenbestimmung bei ganzrationalen Funktionen
70
den Faktor x - x0 „ausklammern“. (Wie das geht, erklären wir unten.) Durch Ausprobieren (Einsetzen verschiedener Zahlenwerte für die Unbekannte x ) findet man zum Beispiel leicht heraus, dass
die Zahl 1 eine Nullstelle der durch f ( x ) = -5x 3 + 16, 5x 2 - 6, 1x - 5, 4 gegebenen Funktion ist. Indem man ausmultipliziert, kann man nachrechnen, dass
-5x 3 + 16, 5x 2 - 6, 1x - 5, 4 = ( x - 1) × ( -5x 2 + 11, 5x + 5, 4 )
ist. Der Term x - 1 ist hier sozusagen aus dem Funktionsterm -5x 3 + 16, 5x2 - 6, 1x - 5, 4 ausgeklammert. Wegen der Nullteilerfreiheit müssen nun alle weiteren Nullstellen der Funktion f im
Term -5x 2 + 11, 5x + 5, 4 stecken, sodass noch -5x2 + 11, 5x + 5, 4 = 0 zu lösen ist. Mithilfe der p q -Formel findet man die Lösungen x1 = 2, 7 und x2 = -0, 4 . Damit sind alle Nullstellen von f gefunden: x0 = 1 sowie x1 = 2, 7 und x2 = -0, 4 .
Durch das „Ausklammern“ des Faktors x - 1 wurde hier das bislang unlösbare Problem, die Nullstellen einer Funktion dritten Grades zu berechnen, auf das lösbare Problem, die Nullstellen einer
Funktion zweiten Grades zu berechnen, reduziert. Dies geht nicht nur bei Funktionen dritten Grades: Das Problem, die Nullstellen einer ganzrationalen Funktion n -ten Grades zu bestimmen, kann
unter der Voraussetzung, dass man eine Nullstelle x 0 der Funktion bereits kennt,9 auf das Problem
zurückgeführt werden, die Nullstellen einer Funktion n - 1 -ten Grades zu bestimmen, indem man
den Faktor x - x0 „ausklammert“. In der Mathematik bezeichnet man dieses verallgemeinerte Ausklammern als „Abspalten eines Linearfaktors“.
Satz über die Abspaltung eines Linearfaktors. Wenn f eine Funktion n -ten Grades und x 0 eine
Nullstelle von f ist, dann kann man eine Funktion g finden, die den Grad n - 1 hat, sodass für
alle x
f ( x ) = ( x - x0 ) × g ( x )
gilt. Man sagt: Es wurde der Linearfaktor ( x - x0 ) abgespaltet.
Hat man den Linearfaktor ( x - x0 ) abgespaltet, findet man nach dem Resultat über die Nullteilerfreiheit der reellen Zahlen wie im obigen Beispiel alle weiteren Nullstellen, indem man die Nullstellen der „Restfunktion“ g berechnet. Da der Grad von g kleiner ist als der von f , kann man hoffen,
dass dies möglich ist. Im Fall n = 3 hatten wir dies oben gesehen.
Wie man den Linearfaktor abspaltet und damit die Funktion g findet, wird anhand eines Beispiels
erläutert. Das angewendete Verfahren ist die Polynomdivision:
Wie schon erläuternt hat die Funktion f mit f ( x ) = -5x 3 + 16, 5x 2 - 6, 1x - 5, 4 eine Nullstelle bei
x = 1 . Dies findet man z.B. mit Hilfe der Wertetabelle oder durch Ausprobieren heraus.
9
Vielleicht kann man eine Nullstelle durch Ausprobieren leicht finden, oder man kann sie aus einer Zeichnung ablesen,
oder sie ergibt sich aus einer Anwendung heraus.
Burghardt – RWB 2013/2014
6 Nullstellenbestimmung bei ganzrationalen Funktionen
Um
( -5x
die
3
quadratische
Funktion
+ 16, 5x 2 - 6, 1x - 5, 4 ) : ( x - 1) =
g
zu
finden,
71
führt
man
eine
Polynomdivision
durch, indem man wie folgt vorgeht:
Schritt 1. Teile die höchste Potenz von x in der kubischen Funktion durch x und schreibe das Resultat rechts auf: -5x 3 : x = -5x2 ;
2
(-5x 3 +16, 5x 2 -6, 1x -5, 4) : ( x - 1) = -5x
Schritt 2. Multipliziere das rechts hingeschriebene Divisionsergebnis mit ( x - 1) und schreibe das
Ergebnis unter die entsprechenden Terme der kubischen Funktion: -5x 2 × ( x - 1) = -5x 3 + 5x 2
2
(-5x 3 +16, 5x 2 -6, 1x -5, 4) : ( x - 1) = -5x
-5x 3 +5x 2
Schritt 3. Subtrahiere die untere Zeile von der obersten.
2
(-5x 3 +16, 5x 2 -6, 1x -5, 4) : ( x - 1) = -5x
-(-5x 3 +5x 2 )
+11, 5x 2
Schritt 4. Ziehe den nächsten Summanden herunter.
2
(-5x 3 +16, 5x 2 -6, 1x -5, 4) : ( x - 1) = -5x
-(-5x 3 +5x 2 )
¯
+11, 5x -6, 1x
2
Schritt 5. Teile die höchste Potenz von x in der letzten Zeile durch x und schreibe das Resultat ganz
rechts auf: 11, 5x 2 : x = 11, 5x
2
(-5x 3 +16, 5x 2 -6, 1x -5, 4) : ( x - 1) = -5x + 11, 5x
-(-5x 3 +5x 2 )
+11, 5x 2 -6, 1x
Schritt 6. Multipliziere das ganz rechts aufgeschriebene Divisionsergebnis mit ( x - 1) und schreibe
das Ergebnis unter die entsprechenden Terme der letzten Zeile: 11, 5x × ( x - 1) = 11, 5x 2 - 11, 5x
2
(-5x 3 +16, 5x 2 -6, 1x -5, 4) : ( x - 1) = -5x + 11, 5x
-(-5x 3 +5x 2 )
11, 5x 2 -6, 1x
11, 5x 2 -11, 5x
Schritt 7. Subtrahiere die untere Zeile von der darüber stehenden.
2
(-5x 3 +16, 5x 2 -6, 1x -5, 4) : ( x - 1) = -5x + 11, 5x
-(-5x 3 +5x 2 )
Burghardt – RWB 2013/2014
6 Nullstellenbestimmung bei ganzrationalen Funktionen
11, 5x 2
72
-6, 1x
-(11, 5x 2 -11, 5x )
5, 4x
Schritt 8. Ziehe den nächsten Summanden herunter.
2
(-5x 3 +16, 5x 2 -6, 1x -5, 4) : ( x - 1) = -5x + 11, 5x
-(-5x 3 +5x 2 )
11, 5x 2
-6, 1x
-(11, 5x 2 -11, 5x ) ¯
5, 4x -5, 4
Schritt 9. Teile die höchste Potenz von x in der letzten Zeile durch x und schreibe das Resultat ganz
rechts auf: 5, 4 x : x = 5, 4 ;
2
(-5x 3 +16, 5x 2 -6, 1x -5, 4) : ( x - 1) = -5x + 11, 5x + 5, 4
-(-5x 3 +5x 2 )
11, 5x 2
-6, 1x
-(11, 5x 2 -11, 5x )
5, 4x -5, 4
Schritt 10. Multipliziere das ganz rechts aufgeschriebene Divisionsergebnis mit ( x - 1) und schreibe
das Resultat unter die entsprechenden Terme der letzten Zeile: 5, 4 × ( x - 1) = 5, 4 x - 5, 4
(-5x 3 +16, 5x 2
-6, 1x -5, 4) : ( x - 1) = -5x 2 + 11, 5x + 5, 4
-(-5x 3 +5x 2 )
11, 5x 2
-6, 1x
-(11, 5x 2 -11, 5x )
5, 4x -5, 4
5, 4x -5, 4
Schritt 11. Subtrahiere die untere Zeile von der darüber stehenden.
2
(-5x 3 +16, 5x 2 -6, 1x -5, 4) : ( x - 1) = -5x + 11, 5x + 5, 4
-(-5x 3 +5x 2 )
11, 5x 2
-6, 1x
-(11, 5x 2 -11, 5x )
5, 4x -5, 4
-(5, 4x -5, 4)
0
Burghardt – RWB 2013/2014
6 Nullstellenbestimmung bei ganzrationalen Funktionen
73
6.3.3 Substitutionsverfahren
Auch beim Substitutionsverfahren wird das Problem, die Nullstellen einer ganzrationalen Funktion
f zu finden, zurückgeführt auf ein Nullstellenproblem bei einer ganzrationalen Funktion mit niedrigerem Grad. Es kann immer dann angewendet werden, wenn alle im Funktionsterm von f vorkommenden Exponenten einen gemeinsamen Teiler haben, der größer als 1 ist.
Dies ist zum Beispiel bei der Funktion f ( x ) = x 6 - 9x 3 + 8 der Fall: Alle Exponenten haben den gemeinsamen Teiler 3 . Man kann x 6 schreiben als x 3×2 , und nach der aus der Mittelstufe bekannten
Potenzregel ( am ) n = am×n ist dies ( x 3 ) 2 . Die zu lösende Gleichung x 6 - 9 x 3 + 8 = 0 kann also geschrieben werden als ( x 3 ) 2 - 9 x 3 + 8 = 0 . Ihre Lösung hängt also zunächst nicht vom Wert von x
sondern vom Wert von x 3 ab. Zur Abkürzung schreiben wir z statt x 3 . Die zu lösende Gleichung ist
dann z2 - 9z + 8 = 0 . Dies können wir lösen. Die p - q -Formel liefert die Lösungen z = 8 und z = 1 .
Da z = x 3 ist, bedeutet dies x 3 = 8 bzw. x 3 = 1 . Indem wir jeweils die dritte Wurzel ziehen, können
wir diese beiden Gleichungen nach x auflösen und erhalten die Lösungen der ursprünglichen Gleichung: x = 3 8 = 2 bzw. x = 3 1 = 1 .
Gradreduzierung durch Substitution. Angenommen, alle im Term der ganzrationalen Funktion f
vorkommenden Exponenten sind Vielfache der natürlichen Zahl t > 1 , also
f ( x ) = a0 + a1 x t + a2 x 2×t + + an x n×t .
Bei der Substitution z = x t wird jeder Exponent durch den gemeinsamen Teiler t geteilt und als
Unbekannte wird z statt x geschrieben. Es entsteht die ganzrationale Funktion
g ( z ) = a0 + a1 z + a2 z2 + + an z n ,
die den Grad n hat, der kleiner ist als der Grad von f .
Sämtliche Nullstelle der ursprünglichen Funktion f erhält man nun, indem man sämtliche Nullstellen der Funktion g bestimmt und für jede dieser Nullstellen z
·
·
falls t gerade und z ³ 0 ist, die Zahlen ± t z berechnet;
falls t ungerade ist, die Zahl t z berechnet.
Durch die Substitution wird der gemeinsame Teiler aus den Exponenten herausgeteilt, wodurch sich
der Grad reduziert. Drei weitere Beispiele sollen dieses zunächst umständlich erscheinende Verfahren erläutern:
Beispiel 1.
Schritt 1.
Schritt 2.
Löse x 4 - 6x2 - 27 = 0 . In diesem Fall ist der gemeinsame Teiler t = 2 .
Substituiere x 2 = z : x 4 - 6x2 - 27 = z2 - 6z - 27
Löse die quadratische Gleichung z2 - 6z - 27 = 0 mit der p - q -Formel:
Schritt 3.
-6
æ6ö
± ç ÷ - ( -27 ) = 3 ± 6 Û z1 = 9; z2 = -3
z - 6z - 27 = 0 Û z1/2 = 2
è2ø
Bestimme die Lösungen der Ausgangsgleichung:
z = x2 Þ x = ± z , falls z ³ 0 ist.
· z = 9 Þ x = ± 9 Þ x = ±3
2
2
Burghardt – RWB 2013/2014
6 Nullstellenbestimmung bei ganzrationalen Funktionen
Resultat:
· z = -3 Þ liefert keine Lösung der Ausgangsgleichung x 4 - 6x2 - 27 = 0
Die Gleichung x 4 - 6x2 - 27 = 0 hat die zwei Lösungen x = 3 bzw. x = -3 .
Beispiel 2.
Schritt 1.
Schritt 2.
Löse x 6 - 6 x 3 - 27 = 0 . In diesem Fall ist der gemeinsame Teiler t = 3 .
Substituiere x 3 = z : x 6 - 6x 3 - 27 = z2 - 6z - 27
Löse die quadratische Gleichung z2 - 6z - 27 = 0 mit der p - q -Formel:
Die Lösungen sind (siehe Beispiel 1) z1 = 9; z2 = -3
Schritt 3.
Bestimme die Lösungen der Ausgangsgleichung: z = x 3 Þ x = 3 z .
· z = 9 Þ x = 3 9 » 2, 08
Resultat:
Beispiel 3.
Schritt 1.
Schritt 2.
74
· z = -3 Þ x = 3 -3 » -1, 442
Die Gleichung x 6 - 6 x 3 - 27 = 0 hat die zwei Lösungen x = 2, 08 bzw. x = -1, 442 .
Löse x 6 - 2x2 - 4 = 0 . In diesem Fall ist der gemeinsame Teiler t = 2 .
Substituiere x 2 = z : x 6 - 2x2 - 4 = z3 - 2z - 4
Löse z3 - 2z - 4 = 0 . Glücklicherweise kann man eine Nullstelle erraten: z = 2 . Es
wird nun eine Polynomdivision durchgeführt:
2
( z 3 +0z 2
-2z -4) : ( z - 2) = z + 2z + 2
-( z 3
-2z 2 )
-2z
-4z )
2z 2
-(2z 2
2z -4
-(2z -4)
0
Alle weiteren Lösungen von z3 - 2z - 4 = 0 sind also die Lösungen der Gleichung
z2 + 2z + 2 = 0 . Löse die quadratische Gleichung z2 - 6z - 27 = 0 mit der p - q -Formel:
2
Schritt 3.
Resultat:
2
æ2ö
z 2 + 2z + 2 = 0 Û z1/2 = - ± ç ÷ - 2 = -1 ± -1 ,
2
è2ø
es liegen also außer z = 2 keine weiteren Lösungen vor.
Bestimme die Lösungen der Ausgangsgleichung: z = x2 Þ x = z .
· z = 2 Þ x = ± 2 » ±1, 414
Die Gleichung x 6 - 2x2 - 4 = 0 hat die zwei Lösungen x = 1, 4142 bzw. x = -1, 4142 .
6.4 Übungen
6.4.1 Berechnen Sie die Nullstellen der folgenden Funktionen.
2
2
a) f ( x ) = ( x - 7)( x - 4 )( x + 9 )
d) f ( x ) = ( x - 6x + 9 ) x
b)
f ( x ) = 3 ( x + 0, 5)( x - 2)
e)
f ( x ) = x 5 + 3x 4
c)
f ( x ) = 0, 2 ( x + 1, 2) ( x 2 - 25)
f)
f ( x ) = x 4 + 12x 3 + 36x 2
2
6.4.2 Führen Sie die Polynomdivision durch.
Burghardt – RWB 2013/2014
6 Nullstellenbestimmung bei ganzrationalen Funktionen
a)
b)
( x - 4 x - 16x + 15) : ( x + 3)
(3x - 11x - 13x + 36 ) : ( x - 4 )
3
2
3
c)
2
d)
75
(2x - 3x - 12x - 5) : ( x + 0, 5)
( x - x + 120) : ( x + 5)
3
2
3
6.4.3 Prüfen Sie, welche der Zahlen -5; -2; + 3; 7; 10 Nullstellen der Funktion f sind. Spalten Sie
dann den entsprechenden Linearfaktor ab und bestimmen Sie die restlichen Nullstellen.
3
2
3
2
a) f ( x ) = 4 x + 2x + 5x - 1505
b) f ( x ) = 0, 5x + 3x - 2x - 12
6.4.4 Ermitteln Sie eine Nullstelle, spalten Sie den entsprechenden Linearfaktor ab und bestimmen
Sie alle weiteren Nullstellen.
3
2
f ( x ) = 4 x 3 - 2x 2 + x - 0, 5
a) f ( x ) = x - x - 22x + 40
c)
b)
f ( x ) = 6 x 3 + 19 x 2 + 2x - 3
d)
1
8
f ( x ) = x 3 - 2x 2 + 4 x 3
3
6.4.5 Bestimmen Sie die Nullstellen der folgenden ganzrationalen Funktionen vierten Grades.
4
3
2
f ( x ) = -2x 4 + 12x 3 - 26, 5x 2 + 25, 5x - 9
a) f ( x ) = x + x - 0, 75x - x - 0, 25
c)
b)
f ( x ) = 4 x 4 + x 3 - 11, 5x 2 - 11, 5x - 3
d)
f ( x ) = x 4 - 2x 3 - x + 2
6.4.6 Bestimmen Sie die Nullstellen der folgenden Funktionen vierten Grades.
4
2
4
2
4
2
a) f ( x ) = x - 5x + 4
c) f ( x ) = 2x - 14 x + 24
e) f ( x ) = x - 3x + 2, 5
b)
f ( x ) = x 4 + 3x 2 - 10
d)
f ( x ) = -0, 5x 4 + 2x 2 + 6
f)
f ( x ) = 0, 2x 4 - x 2 - 1, 2
6.4.7 Bestimmen Sie die Nullstellen der folgenden Funktionen.
6
3
f ( x ) = 0, 5x 6 - 3, 5x 2 - 18
a) f ( x ) = 0, 5x - 3x - 8
c)
b)
f ( x ) = -0, 2x 6 + 4 x 3 - 37, 8
d)
f ( x ) = 0, 1x 6 - 0, 48 x 4 - 0, 5
6.5 Ausblick: Nullstellenbestimmung mit dem Newton-Verfahren
Abels Resultat von 1824 hat uns gezeigt, dass nur in wenigen Spezialfällen allgemeine Lösungsformeln für ganzrationale Funktionen existieren. Und die vorhandenen allgemeinen Lösungsformeln
sind – falls der Grad größer oder gleich 3 ist – sehr kompliziert und für die Schule ungeeignet. Noch
schlimmer ist die Lage bei Funktionen, die nicht ganzrational sind, also zum Beispiel Ausdrücke wie
sin oder cos oder tan oder 2 x oder log beinhalten. In diesen Fällen existieren in der Regel gar
keine Lösungsformeln.
Aber selbst wenn Lösungsformeln existieren, können die Nullstellen in der Regel nur ungefähr angegeben werden: Die einfache quadratische Gleichung x 2 - 2 = 0 hat die Nullstellen x = 2 und
x = - 2 . Will man die Lösung als Dezimalzahl angeben, muss man notgedrungen nach einer bestimmten Anzahl an Nachkommastellen runden oder abschneiden. Die gefundene Lösung stimmt
also mit der exakten Nullstelle nur näherungsweise überein. Bei komplizierten Lösungsformeln
kommen überdies bereits im Lauf des Rechenwegs selbst Rundungsfehler hinzu, die dazu führen,
dass auch in diesem Fall die gefundene Lösung die tatsächlichen Nullstellen nur näherungsweise
angibt.
Burghardt – RWB 2013/2014
6 Nullstellenbestimmung bei ganzrationalen Funktionen
76
Dies rechtfertigt die Überlegung, nicht mehr nach exakten Lösungsverfahren zu suchen sondern
nach solchen, die gestatten, die Nullstellen nur näherungsweise aber beliebig genau zu bestimmen.
Bei solchen Verfahren wird in der Regel in einzelnen aufeinander aufbauenden Rechenschritten
eine immer genauere Approximation der Nullstellen berechnet. Ein wichtiges Verfahren, Nullstellen
näherungsweise zu berechnen, ist das Newton-Verfahren. Ihm liegt folgende Beobachtung zu
Grunde: Wird eine Nullstelle gesucht
gesuchte Nullstelle
und wählt man in der Nähe der Nullstelle eine weitere Zahl x 0 und zeichnet dort eine Tangente an
den Funktionsgraphen, so schneidet diese Tangente irgendwo die x -Achse. Verblüffenderweise
liegt diese Schnittstelle x1 (in der Regel) näher an der gesuchten Nullstelle als der ursprünglich gewählte Wert:
Tangente an den Graphen der Funktion
an der Stelle
Schnittstelle
der Tangente mit der Achse – liegt näher an der gesuchten Nullullstelle
gesuchte Nullstelle
Startwert
Wie kann dann die Schnittstelle x1 berechnet werden? Angenommen, wir könnten die Steigung m
der Tangente, die durch den Punkt ( x0 | f ( x0 ) ) läuft, bestimmen. Von linearen Funktionen wissen
Burghardt – RWB 2013/2014
6 Nullstellenbestimmung bei ganzrationalen Funktionen
77
wir, dass die Steigung auch über ein Steigungsdreieck aus der Gerade abgelesen werden kann. Wir
zeichnen deshalb ein Steigungsdreieck ein:
gesuchte Nullstelle
In diesem Fall ist Dx = x0 - x1 und Dy = f ( x0 ) - 0 = f ( x0 ) . Nach der Formel für die Steigung
m=
Dy
Dx
gilt also
f ( x0 )
.
x0 - x1
(Achtung: Da x1 unbekannt ist, können wir hieraus nicht die Steigung der Tangente berechnen. Wir
m=
nehmen im Augenblick vielmehr an, dass wir m schon kennen, und wollen x1 berechnen!)
Diese Gleichung können wir relativ einfach nach x1 umstellen:
=
f ( x0 )
x0 - x1
m × ( x0 - x1 ) =
f ( x0 )
:m
x0 - x1
f ( x0 )
m
- x0
m
=
× ( x0 - x1 )
f ( x0 )
× ( -1)
m
f ( x0 )
= x0 x1
m
Wäre die Tangentensteigung bekannt, könnte man also x1 problemlos berechnen. Für die Steigung
der Tangente an den Funktionsgraphen existiert in der Mathematik eine fest etablierte Bezeichnung, nämlich f ¢ ( x0 ) . Damit lässt sich die oben gefundene Gleichung für x1 wie folgt darstellen:
- x1
= - x0 +
x1 = x0 Hierbei ist
Burghardt – RWB 2013/2014
f ( x0 )
.
f ¢ ( x0 )
6 Nullstellenbestimmung bei ganzrationalen Funktionen
·
x 0 der Startwert, also eine beliebig gewählte Zahl in der Nähe der gesuchten Nullstelle;
·
f ( x0 ) der Funktionswert an der Stelle x 0 ;
·
f ¢ ( x0 ) die Steigung der Tangente an der Stelle x 0 .
78
Führt man dasselbe Verfahren nochmals mit dem neuen Startwert x1 durch, sollte man wiederum
näher an der Nullstelle landen. Mehrmaliges Wiederholen des Verfahrens sollte also schließlich zu
einem Wert führen, der sich nahezu nicht mehr von der tatsächlichen Nullstelle unterscheidet. Dies
ist (in der Regel) wirklich so. Es bleibt zu klären, was unter der Tangente an einen Funktionsgraphen
zu verstehen ist, und wie deren Steigung berechnet werden kann.
Diese Fragen wurden erstmals vollständig geklärt von
dem englischen Naturwissenschaftler Isaac Newton (geboren 25. Dezember 1642, gestorben 20. März 1726, nach
dem damals in England noch gültigen Julianischen Kalender; nach dem heute verwendeten gregorianischen Kalender entsprechen die Daten dem 4. Januar 1643 und
dem 31. März 1727) und dem deutschen Naturwissenschaftler und Philosophen Gottfried Wilhelm Leibniz (geIsaac Newton
Gottfried Wilhelm
Leibniz
boren 21. Juni 1646 (julianischer Kalender) bzw.
1. Juli 1646 (gregorianischer Kalender), gestorben 14. November 1716). Das von beiden begründete
Teilgebiet der Mathematik, das sich u.a. mit der Berechnung von Tangentensteigungen beschäftigt,
heißt heute Differentialrechnung und gehört neben der Integralrechnung (die sich mit Flächenberechnungen beschäftigt) zur Analysis oder auch Infinitesimalrechnung.
Burghardt – RWB 2013/2014
Herunterladen