ISBN 978-3-8689-4042-8

Werbung
KAPITEL
1
Statistische Merkmale und Variablen
Am Anfang jeder Gewinnung von statistischer Information steht die Erhebung einer
großen Zahl von Einzeldaten. Die erste Aufgabe der Statistik ist es, diese zuweilen
unübersichtliche Datenmenge so darzustellen und aufzubereiten, dass danach die in der
Menge der Einzeldaten verborgene Information mit statistischen Methoden herausgefiltert und analysiert werden kann. In diesem Kapitel werden die fundamentalen Konzepte
der Darstellung von statistischem Datenmaterial eingeführt und gezeigt, was sie leisten
und wie man mit ihnen arbeitet. Zuvor sind einige technische Begriffe zu definieren und
auch ein Blick auf die Objekte zu werfen, an denen die Daten erhoben wurden.
1.1
Statistische Einheiten und Grundgesamtheiten
Die Objekte, deren Merkmale in einer gegebenen Fragestellung von Interesse sind und im
Rahmen einer empirischen Untersuchung erhoben, also beobachtet, erfragt oder gemessen
werden sollen, heißen Untersuchungseinheiten oder statistische Einheiten.
Als statistische Einheiten können grundsätzlich alle materiellen Gegenstände oder
Lebewesen sowie immateriellen Dinge auftreten: Personen, Haushalte, Unternehmungen,
Waren, Länder, Ereignisse, Handlungen usw.
Beispiel
[1] Statistische Einheiten können sein: Kraftfahrzeuge, Gebäude, Pferde,
Studenten, Beamte, Bauernhöfe, Branchen, Äpfel, Verkäufe, Eheschließungen, Geburten, Unfälle, Girokonten.
Die statistische Einheit ist Träger der Information, die erhoben werden soll. Das
Hauptinteresse der Statistik gilt nicht der einzelnen statistischen Einheit. In diesem Sinne
interessiert sie sich nur für Massenphänomene, also dafür, was in einer statistischen
Masse, das heißt einer bestimmten Menge von im Wesentlichen gleichartigen Einheiten
vor sich geht. Die Abgrenzung dieser Menge muss stets sehr sorgfältig erfolgen und der
jeweiligen Fragestellung der statistischen Untersuchung entsprechen. Man könnte dazu
die Elemente der Menge einzeln aufzählen. Meistens wird man jedoch nicht so verfahren,
20
KAPITEL 1
Statistische Merkmale und Variablen
sondern zur Identifikation der gleichartigen statistischen Einheiten, die zu einer solchen
statistischen Menge gehören sollen, sogenannte Identifikationskriterien angeben. In der
Regel werden die statistischen Einheiten durch mindestens jeweils ein Kriterium
1. zeitlicher,
2. räumlicher und
3. sachlicher Art
identifiziert oder definiert. Diese Kriterien sollten dabei möglichst objektiv und genau
sein, das heißt, es sollte nicht von subjektiven Einschätzungen abhängen, ob ein
bestimmter Gegenstand diese Kriterien erfüllt oder nicht. Mit Hilfe der Identifikationskriterien wird gleichzeitig die interessierende statistische Masse abgegrenzt.
Definition:
Die Menge
Ω := { ω ⎪ ω erfüllt IK }
(1-1)
aller statistischen Einheiten ω , die dieselben wohldefinierten Identifikationskriterien IK erfüllen, heißt Grundgesamtheit.
Häufig verwendete Synonyme für den Terminus Grundgesamtheit sind statistische
Masse, Population und Kollektiv.
Beispiele [2] Verkehrsunfälle im Jahre 2008 in Bayern.
[3] Verkehrsunfälle mit Personenschaden im Jahre 1999 in Deutschland.
[4] Studenten in der Vorlesung am Mittwoch, den 23.04.2008 um 14.15 Uhr,
im Audimax der Universität Duisburg-Essen, Campus Duisburg.
[5] Angemeldete Konkurse von Bauunternehmungen im April 2009 in Nordrhein-Westfalen.
Eine Grundgesamtheit wird damit als eine ganz gewöhnliche Menge Ω im mengentheoretischen Sinne definiert. Die Elemente ω dieser Menge sind die statistischen Einheiten,
die die Identifikationskriterien erfüllen: Es sind diese Kriterien, die die Grundgesamtheit
bestimmen bzw. abgrenzen, indem sie ihre Elemente definieren.
Die Identifikation von statistischen Einheiten und die Abgrenzung von Grundgesamtheiten scheint im Prinzip einfach, kann aber in der Praxis durchaus schwierig sein. Sollen
für eine bestimmte Erhebung Unternehmen, Betriebe oder Arbeitsstätten erfasst werden?
Soll das Einkommen erhoben werden, das von Inländern oder im Inland erzielt wird?
Die Anzahl n(Ω) ihrer Elemente heißt der Umfang einer Grundgesamtheit Ω. In der
Regel hat man es in der beschreibenden Statistik mit sogenannten realen Grundgesamtheiten (Bevölkerung eines Landes, Unternehmen eines Landes etc.) zu tun. Reale Grundgesamtheiten haben stets einen endlichen Umfang n. Demgegenüber stehen hypothetische
oder fiktive Grundgesamtheiten, die durchaus unendlich viele Elemente haben können –
1.2
Merkmale und Merkmalsausprägungen
21
wie zum Beispiel die Menge der Würfe, die man mit einem Würfel je machen kann. Mit
derartigen Grundgesamtheiten werden wir aber erst in späteren Kapiteln Bekanntschaft
machen.
1.2
Merkmale und Merkmalsausprägungen
Das Interesse der Statistik gilt nicht den statistischen Einheiten ω selbst, sondern lediglich einigen ihrer Eigenschaften, den sogenannten Merkmalen M(ω ). Deshalb bezeichnet
man die statistischen Einheiten auch als die Merkmalsträger. Unterscheidbare Erscheinungsformen eines Merkmals heißen Merkmalsausprägungen oder Modalitäten.
Beispiele [6] Das Merkmal „Geschlecht“ hat die beiden Modalitäten männlich und
weiblich.
[7] Das Merkmal „Familienstand“ hat die vier Merkmalsausprägungen:
ledig, verheiratet, geschieden, verwitwet. Oder etwas moderner: verheiratet
und single.
[8] Für das Merkmal „Körpergewicht“ erwachsener Menschen müssen als
Ausprägungen alle Werte zwischen 30 und 300 kg zugelassen werden.
Statistische Variable
Die Begriffe Merkmal und Variable werden häufig synonym verwendet, obwohl sie
streng genommen nicht ganz dasselbe bedeuten. Statistische Variablen ordnen den statistischen Einheiten ω bzw. ihren Merkmalswerten M(ω ) reelle Zahlen x zu. Somit ist die
statistische Variable eine reellwertige Funktion X
x = X(ω ) = Fkt(M(ω ))
der Untersuchungseinheiten ω . Man bringt deshalb gerne statistische Variablen ins Spiel,
weil man mit Zahlen besser arbeiten kann. Da nun sehr häufig die Merkmalsausprägungen bereits als reelle Zahlen vorliegen, kann das Merkmal selbst als Variable benutzt
werden: Die Funktion Fkt ist dann die identische Funktion.
Mit dem Symbol X bezeichnet man die Abbildung bzw. Funktion
X: Ω ⎯
⎯→ IR
ω ⎯
⎯→ X (ω ) = x ,
aber man benutzt es auch für den Namen der statistischen Variablen und meistens eben
auch für den Namen des Merkmals selbst. Man sagt einfach: „die statistische Variable X“
oder „das Merkmal X“.
22
KAPITEL 1
Statistische Merkmale und Variablen
Merkmalstypen und Messbarkeitsniveaus
Merkmale und Variablen sind nicht alle von gleicher Qualität, was die Möglichkeiten
ihrer statistischen Analyse und Interpretation angeht. Es ist deshalb angebracht, sie in
verschiedene Kategorien einzuteilen. Man unterscheidet zunächst qualitative und quantitative Merkmale.
1. Qualitative Merkmale sind solche Eigenschaften, die qualitativ, das heißt der
Beschaffenheit nach, artmäßig variieren. Sie besitzen nur endlich viele Ausprägungen. Beispiele sind Geschlecht, Religionszugehörigkeit und Rechtsform von
Unternehmungen.
2. Quantitative Merkmale sind dagegen solche Eigenschaften von Untersuchungseinheiten, die quantitativ, das heißt der Größe nach oder zahlenmäßig, variieren.
Ihre Merkmalsausprägungen sind von vornherein Zahlen, mit oder ohne Maßeinheit. Quantitativ sind Merkmale wie Alter, Kinderzahl, Einkommen.
Auch ursprünglich qualitative Merkmale werden oft in Zahlen ausgedrückt. Drückt man
das Ausbildungsniveau einer Person durch die zu seiner Erreichung mindestens erforderliche Anzahl von Jahren an Ausbildungszeit aus, spricht man von Quantifizierung und
hat damit eine echt quantitative Variable. Ordnet man aber etwa den Ausprägungen des
Merkmals „Familienstand“ die Zahlen 1 für ledig, 2 für verheiratet und 3 für verwitwet
zu, spricht man von Signierung und hat nur scheinbar quantitative Größen.
Die quantitativen Variablen werden in stetige und diskrete unterteilt:
1. Diskrete Merkmale können nur ganz bestimmte (endlich viele oder schlimmstenfalls abzählbar unendlich viele) abgestufte Werte als Merkmalsausprägung
haben. Diskret sind alle Merkmale, deren Ausprägungen man durch Zählen erhält,
auch wenn keine Obergrenze vorhanden ist.
2. Stetige oder kontinuierliche Merkmale können in einem Intervall jeden reellen
Wert als Ausprägung annehmen (überabzählbar unendlich viele verschiedene
mögliche Merkmalsausprägungen innerhalb eines Intervalls). Stetig sind alle
Merkmale, deren Ausprägungen gemessen werden. Hierzu gehören beispielsweise
alle Messungen in Zeit-, Längen- oder Gewichtseinheiten.
Besonders fein abgestufte diskrete Variablen werden in der statistischen Praxis wie
stetige behandelt; man spricht von quasi-stetigen Merkmalen. Andererseits werden im
Prinzip stetige Variablen durch den Mess- oder Erhebungsvorgang zu quasi-stetigen oder
gar diskreten. Denn jede Messung kann aus technischen Gründen nur mit einer bestimmten Genauigkeit durchgeführt werden, so dass dadurch das ursprünglich stetige Intervall
in diskrete Größenklassen aufgeteilt wird. Obwohl beispielsweise die Körpergröße ein
stetiges Merkmal ist, wird es in der Praxis meist nur in Abstufungen erhoben. Eine Größe
von 180 cm bedeutet, dass die Person zwischen 179.5 cm und 180.5 cm misst.
1.2
Merkmale und Merkmalsausprägungen
23
Eine andere sehr wichtige Einteilung der Typen von statistischen Variablen ist die
nach dem Niveau der Messbarkeit, also danach, mit welcher Skala oder welchem
Maßstab sie gemessen werden können. Das Niveau der Messbarkeit bestimmt dabei, wie
wir noch sehen werden, die Möglichkeiten und Grenzen der statistischen Auswertungen,
die man sinnvoll mit den erhobenen Daten vornehmen kann. In der Reihenfolge aufsteigender Messbarkeit unterscheiden wir:
1. Nominal messbare Variablen. Ein Merkmal oder eine Variable ist nominal
skaliert, wenn lediglich die Gleichheit oder Andersartigkeit verschiedener
Ausprägungen festgestellt werden kann. Beispiele für nominal skalierte Merkmale
sind Religion, Nationalität, Beruf, Rechtsform eines Unternehmens. Ein Merkmal
ist immer dann nominal, wenn mit ihm keinerlei Bewertung oder Quantifizierung
intendiert werden soll. Nominale Merkmale sind stets qualitativ.
2. Ordinal messbare Variablen. Ein Merkmal oder eine Variable ist ordinal
skaliert, wenn die möglichen Merkmalsausprägungen unterscheidbar sind und zusätzlich in eine natürliche oder sinnvoll festzulegende Rangordnung gebracht
werden können. Als Beispiele wären hier Intelligenzquotient, sozialer Status,
Schulnoten oder aber Tabellenplätze der Fußball-Bundesliga zu nennen.
3. Kardinal messbare Variablen. Schließlich spricht man von einem kardinal oder
metrisch skalierten Merkmal, wenn die verschiedenen Ausprägungen nicht nur eine
Rangfolge ausdrücken, sondern außerdem der quantitative Unterschied zwischen
ihnen bestimmt ist. Die Ausprägungen müssen numerisch, das heißt in Zahlen,
angegeben werden. Die meisten in den Wirtschaftswissenschaften interessierenden
Merkmale wie zum Beispiel BIP, Investitionen und Inflation oder aber Kosten,
Umsatz und Gewinn sind kardinal skaliert.
Man unterscheidet bei kardinal skalierten Merkmalen noch, ob ihr Maßstab einen
sachlogisch begründeten absoluten Nullpunkt hat oder nicht. Ist ein solcher vorhanden,
lassen sich sinnvoll Quotienten aus Merkmalsausprägungen bilden, und man spricht von
einem verhältnisskalierten Merkmal. Zum Beispiel haben die Merkmale „Gewicht“,
„Einkommen“ oder „Preis“ einen absoluten Nullpunkt, und man kann sagen, der Merkmalsträger ω1 hat ein Einkommen, das doppelt so groß ist wie das von ω 2 , wenn
X (ω1 ) = 2 ⋅ X (ω 2 ) .
Hat die Skala hingegen keinen absoluten Nullpunkt, liegt ein intervallskaliertes
Merkmal vor, und nur die Differenzen zwischen den Merkmalsausprägungen können
sinnvoll interpretiert werden. Ein Beispiel für eine Intervallskala ist die Messung der
Temperatur in Celsius-Graden. 40º warmes Wasser ist eben nicht „doppelt so warm“ wie
Wasser mit 20ºC. Aber der Temperaturunterschied zwischen 50ºC und 60ºC und der
zwischen 70ºC und 80ºC wird als gleich erachtet, denn man benötigt etwa die gleiche
Energiemenge, um einen Temperaturanstieg um 10º zu erzeugen. Nur die Kelvin-Skala
verfügt über einen absoluten Nullpunkt bei –273.15ºC = 0 K.
24
1.3
KAPITEL 1
Statistische Merkmale und Variablen
Teilgesamtheiten, Stichproben
Werden die Merkmalsausprägungen des interessierenden Merkmals aller statistischen
Einheiten einer Grundgesamtheit festgestellt oder erhoben, spricht man von einer
Vollerhebung oder Totalerhebung. Technisch erfolgt eine Erhebung – je nach Merkmalsträger und untersuchtem Merkmal – meist in Form von
Beobachtungen,
Messungen
oder Befragungen.
Oftmals ist es jedoch unpraktisch oder zu teuer, eine Vollerhebung durchzuführen, z. B.
alle Bürger der Bundesrepublik zu ihren täglichen Ausgaben für Brot zu befragen, die
Körpergröße aller Bundesbürger zu messen oder die Zahl der Autos, die eine bestimmte
Straße befahren, an jedem Tag zu beobachten. Dies wird besonders deutlich, wenn man
bedenkt, dass allein die Vorbereitung einer Volkszählung oder der Arbeitsstättenzählung
mehrere Jahre in Anspruch nimmt. Aus diesem Grund werden häufig nur Teilgesamtheiten oder Stichproben erhoben und untersucht.
Ist Ω* eine Auswahl oder Teilmenge von der Grundgesamtheit Ω, so erfüllt jedes
Element von Ω* die Kriterien IK. Wenn Ω endlich ist, gilt n(Ω*) ≤ n(Ω).
Definition:
Jede echte Teilmenge Ω* von Ω heißt Teilgesamtheit der Grundgesamtheit. Teilgesamtheiten heißen Stichproben, wenn bei der Auswahl der
Elemente der Zufall wesentlich beteiligt war.
Der Zweck einer Teilerhebung besteht meist darin, die interessierenden Merkmale nur
von einer Teilgesamtheit erheben zu müssen, aber auf Basis dieser Ergebnisse Aussagen
über die Merkmale in der Grundgesamtheit machen zu können.
Reine Zufallsstichprobe
Bei der reinen Zufallsauswahl soll jedes Element der Grundgesamtheit die gleiche
„Chance“ haben, in die Stichprobe mit aufgenommen zu werden. Auf diesem Wege wird
versucht, sicherzustellen, dass kein Merkmalsträger oder keine Gruppe von Merkmalsträgern bevorzugt ausgewählt und somit die Struktur der Grundgesamtheit systematisch
verfälscht wird. Es scheint paradox, dass die Zufälligkeit der Auswahl durch eine sorgfältige Planung der Vorgehensweise bei der Bestimmung der Merkmalsträger sichergestellt werden muss.
Repräsentative Stichprobe
Wünschenswert wäre es, eine Teilgesamtheit auszuwählen, die repräsentativ für die
Grundgesamtheit ist, also eine Struktur bezüglich der interessierenden Merkmale
1.4
Statistische Verteilung
25
aufweist, die der Grundgesamtheit möglichst ähnlich ist. Da man diese Struktur aber vor
der Erhebung noch gar nicht kennen kann, versucht man, die Repräsentanz bezüglich
anderer Merkmale zu gewährleisten. Denn man nimmt an, dass das zu untersuchende
Merkmal in einem gewissen „statistischen Zusammenhang“ mit diesen anderen Merkmalen steht. Es gibt unterschiedliche Auswahlverfahren, um zu erreichen, dass die gewonnene Teilgesamtheit repräsentativ ist. Man spricht von eingeschränkter Zufallsauswahl.
Beispiel
1.4
[9] Ein Meinungsforschungsinstitut will eine Wahlprognose erstellen. Dazu
wird 3000 Wahlberechtigten die sogenannte Sonntagsfrage gestellt: „Welche
Partei würden Sie wählen, wenn am nächsten Sonntag Wahl wäre?“ Um
verlässlichere Ergebnisse zu bekommen, wird die Stichprobe repräsentativ
gestaltet: Dazu überlegt man, welche anderen Merkmale die Parteienpräferenz „statistisch beeinflussen“. In der Stichprobe soll der Anteil der
Frauen dem in der Grundgesamtheit aller Wahlberechtigten entsprechen. Die
Altersstruktur soll mit der der Grundgesamtheit übereinstimmen. Damit ist
die Stichprobe für diesen Zweck schon recht repräsentativ. Wichtig wäre
sicherlich noch, die geographische Verteilung zu berücksichtigen, damit es
nicht vorkommen kann, dass zu viele Befragte zufällig in Baden-Württemberg wohnen. Weiterhin wäre es gut, wenn die Berufsstruktur, wenigstens
in den Ausprägungen Arbeiter, Angestellte, Beamte, Selbständige, analog
wäre. Ja, und natürlich müssen Studenten in der Stichprobe sein, sonst wären
die Wähler der Grünen eventuell „unterrepräsentiert“.
Statistische Verteilung
Eine Grundgesamtheit, Teilgesamtheit oder Stichprobe vom Umfang n und mit den
Elementen ω i sei bezüglich eines Merkmals X untersucht worden. Von jedem Element ω i
sei sein „individueller“ Merkmalswert xi festgestellt und in der Urliste notiert worden:
Urliste
Elemente
ω1
ω2
⋅⋅⋅
ωi
⋅⋅⋅
ωn
Merkmalswerte
x1
x2
⋅⋅⋅
xi
⋅⋅⋅
xn
Das Hauptinteresse der beschreibenden Statistik gilt aber nicht den Merkmalsträgern,
sondern den Merkmalswerten.
26
KAPITEL 1
Definition:
Statistische Merkmale und Variablen
Die Folge der n Werte
x1 , x 2 ,
, xi ,
(1-2)
, xn
mit xi = X(ω i), für i = 1, · · · , n , heißt Beobachtungsreihe der Variablen X oder einfach statistische Reihe X.
Spielt dabei die Reihenfolge, in der die Beobachtungen gemacht wurden, keine Rolle, ist
auch die Anordnung der Werte in der statistischen Reihe ohne Bedeutung und sie könnten
beliebig umgestellt werden. Die Nummerierung (Indizierung) dient nur der Unterscheidung der einzelnen Werte; eine Umnummerierung wäre zulässig und würde den Informationsgehalt der statistischen Reihe nicht verändern. Nur bei den sogenannten
Zeitreihen ist das anders, diese werden aber erst in Kapitel 5 behandelt.
Häufig ist es sinnvoll, die Merkmalswerte der Urliste der Größe nach zu sortieren und
umzunummerieren, so dass dann
x1 ≤ x 2 ≤ x 3 ≤
≤ xi ≤
≤ xn
(1-3)
geschrieben werden kann. In der Praxis wird es oft vorkommen, dass in dieser Abfolge
gleich große Werte nebeneinanderstehen, weil einzelne Ausprägungen in der statistischen
Reihe mehrfach auftauchen, beispielsweise
1.6 1.6 3.0 3.0 3.0 3.0 4.1 4.1 4.1 4.1 4.1 4.1 4.1
4.1 5.0 5.0 5.0 5.0 5.0 5.0 ,
(1-4)
weshalb in (1-3) ja die ≤−Zeichen stehen. Dann ordnet man die k vorkommenden, aber
unterschiedlichen Variablenwerte der Größe nach zu
x1 < x 2 <
< xk ,
mit k ≤ n
und gibt zu jedem Variablenwert xi die absolute Häufigkeit
(1-5)
ni := absH(X = xi)
an, das heißt, man gibt an, wie oft die statistische Variable X den Wert xi in der statistischen Reihe X annimmt. Man beachte, dass k, die Anzahl der vorkommenden
Merkmalsausprägungen, nicht größer als n sein kann, in der Praxis aber meist viel kleiner
ist. Auf diese Weise erhalten wir eine Tabelle, die den vorkommenden Variablenwerten
die zugehörigen Häufigkeiten zuordnet. Diese kann noch übersichtlicher werden, wenn
statt der absoluten die relativen Häufigkeiten
hi := relH(X = xi) = ni /n ,
verwendet werden.
0 < hi ≤ 1
(1-6)
1.5
Definition:
Häufigkeitsfunktion und Verteilungsfunktion
27
Die Tabellen
x1 x 2 ⋅ ⋅ ⋅ x k
n1 n2 ⋅ ⋅ ⋅ nk
∑ ni = n
und
x1 x 2 ⋅ ⋅ ⋅ x k
∑ hi
h1 h2 ⋅ ⋅ ⋅ hk
=1
(1-7)
heißen absolute bzw. relative Häufigkeitsverteilung der statistischen
Variablen X.
Häufigkeitsverteilungen lassen sich auf sehr einfache Weise anschaulich graphisch
darstellen. Man braucht nur die Häufigkeiten als Ordinate über der statistischen Variablen
als Abszisse in ein Koordinatensystem einzuzeichnen. Zur Erhöhung der Anschaulichkeit
verbindet man die Punkte durch senkrechte Linien mit der Abszisse: Die Längen der
einzelnen Linien sind somit proportional zu den Häufigkeiten.
ni
10
hi
0.5
xi
1.6
BILD 1.1
1.5
3
4.1
5
Häufigkeitsverteilung
Häufigkeitsfunktion und Verteilungsfunktion
Der einfachste Weg, zur Häufigkeitsfunktion zu gelangen, ist, ausgehend von der
relativen Häufigkeitsverteilung (1-7), alle reellen Zahlen x, die nicht in der statistischen
Reihe X vorkommen, mit aufzunehmen, ihnen aber die relative Häufigkeit Null zuzuweisen.
28
KAPITEL 1
Definition:
Statistische Merkmale und Variablen
Die Funktion
⎧ hi
h( x ) = ⎨
⎩ 0
falls x = xi
sonst
(1-8)
heißt Häufigkeitsfunktion der statistischen Variablen X.
Diese Funktion gibt für jede reelle Zahl und damit auch für jeden möglichen Variablenwert x an, ob und mit welcher relativen Häufigkeit er in der statistischen Reihe vorkommt. Der Definitionsbereich der Häufigkeitsfunktion ist somit die ganze reelle Achse,
während der Wertebereich der Funktion sich auf die rationalen Zahlen im Intervall [0,1]
beschränkt. Ihre graphische Darstellung entspricht derjenigen der Häufigkeitsverteilung.
Definition:
Die Funktion
H ( x) =
∑ h ( xi )
(1-9)
xi ≤ x
heißt empirische Verteilungsfunktion der statistischen Variablen X.
Die empirische Verteilungsfunktion gibt für jedes x ∈ IR die relative Häufigkeit aller
Beobachtungen an, die gleich groß oder kleiner als x sind. Ihre Definitions- und Wertebereiche sind identisch mit denen der Häufigkeitsfunktion.
Der Graph von H(x) hat die typische Gestalt einer Treppenfunktion. Die Sprungstellen
finden sich an den x-Werten mit positiver relativer Häufigkeit; an diesen Stellen springt
der Funktionswert um den Betrag der relativen Häufigkeit hi bzw. um den Wert der
Häufigkeitsfunktion h(xi) nach oben. Zwischen zwei benachbarten Sprungstellen verharrt
die Funktion auf konstantem Niveau.
Beispiel
[10] Die Häufigkeitsfunktion h(x) und die Verteilungsfunktion H(x) zur
statistischen Reihe (1-4) bzw. zur Verteilung
xi
1.6
3.0
4.1
5.0
hi
0.1
0.2
0.4
0.3
sind in BILD 1.2 dargestellt.
Es ist darauf zu achten, dass die Funktion H(x) stets auf der ganzen reellen Achse
– ∞ < x < + ∞ erklärt ist. Sie hat im Beispiel [10] für – ∞ < x < 1.6 den Wert H(x) = 0 und
für 5 ≤ x < ∞ den Wert H(x) = 1. An den Sprungstellen selbst hat die Verteilungsfunktion
grundsätzlich den oberen Wert. Die empirische Verteilungsfunktion in der Definition
(1-9) hat die folgenden Eigenschaften:
Häufigkeitsfunktion und Verteilungsfunktion
1.5
29
h (x)
Häufigkeitsfunktion
0.5
x
1
2
3
H (x)
4
5
6
Verteilungsfunktion
1.0
0.5
x
1
BILD 1.2
1.
2
3
4
5
6
Häufigkeitsfunktion und Verteilungsfunktion
Die Funktion H(x) ist überall wenigstens rechtsseitig stetig, das heißt es gilt für
jedes x ∈ IR (mit Δx > 0)
lim H ( x + Δx ) = H ( x ) .
Δx → 0
(1-10)
An den Sprungstellen ist sie jedoch nur rechtsseitig stetig; dort gilt
lim H ( x − Δx ) ≠ H ( x ) .
Δx→ 0
2.
(1-11)
Die Funktion H ist monoton steigend, das heißt für jedes a und b ∈ IR gilt
H ( a ) ≤ H (b) ,
falls a < b .
(1-12)
30
3.
KAPITEL 1
Statistische Merkmale und Variablen
Der untere Grenzwert der Verteilungsfunktion ist Null, der obere Grenzwert ist
Eins, das heißt
lim H ( x ) = 0 ,
x→ − ∞
lim H ( x ) = 1 .
x→ ∞
(1-13)
Weiter ist anzumerken:
1.
Die Differenz
H (b) − H ( a ) = relH ( a < X ≤ b)
(1-14)
gibt für a < b die relative Häufigkeit der Beobachtungswerte der Variablen X an,
die größer als a, aber nicht größer als b sind.
2.
Der Funktionswert an jeder Stelle x gibt die relative Häufigkeit an, mit welcher
Werte, die kleiner oder gleich x sind, in der statistischen Reihe vorkommen:
H ( x ) = relH ( X ≤ x )
3.
(1-15)
An jeder Stelle x ∈ IR erhält man aus der empirischen Verteilungsfunktion die
Werte der Häufigkeitsfunktion als Differenz
h ( x ) = H ( x ) − lim H ( x − Δ x )
Δx → 0
(1-16)
zwischen dem Funktionswert und dem linksseitigen Grenzwert.
Wir beachten, dass mit der Formel (1-16) nur an den Sprungstellen der Verteilungsfunktion positive Differenzen herauskommen können: An allen anderen Stellen von H ist
der linksseitige Grenzwert gleich dem Funktionswert, so dass die Häufigkeitsfunktion
Null bleibt.
Die hier definierte empirische Verteilungsfunktion H mag aus der Sicht der beschreibenden Statistik wenig Anschaulichkeit besitzen und es scheint auch, dass man eigentlich
nicht sehr viel damit anfangen kann, jedenfalls nicht viel mehr als mit der anschaulicheren Häufigkeitsfunktion h selbst. Aber die für die Anwendung sehr wichtigen
Instrumente Histogramm und Häufigkeitsdichte, die im nächsten Abschnitt eingeführt
werden, lassen sich am besten auf der Grundlage der Verteilungsfunktion verstehen.
Darüber hinaus dient die Beschäftigung mit H nicht zuletzt der didaktischen Hinführung zu ihrem Analogon, der stochastischen Verteilungsfunktion F, die in Kapitel 9
eingeführt werden wird. Diese betrifft nicht statistische Variablen, sondern sogenannte
stochastische Variablen. Das sind Variablen, deren Werte nicht aus Beobachtungen
stammen, sondern vom Zufall abhängig sind.
1.6
1.6
Häufigkeitsdichte und Histogramm
31
Häufigkeitsdichte und Histogramm
In der Praxis kommt es häufig vor, dass große Gesamtheiten mit einer Vielzahl verschiedener Merkmalsausprägungen untersucht werden müssen. Aus messtechnischen
Gründen, aber auch aus erhebungs- oder aufbereitungstechnischen Gründen kann dabei
selbst bei stetigen oder quasi-stetigen Merkmalen und vielen Einzelbeobachtungen oft nur
eine endliche und verhältnismäßig kleine Zahl unterschiedlicher Merkmalsausprägungen
Berücksichtigung finden, so dass für eine Variable X Größenklassen oder Schichten
gebildet werden müssen. Dazu wird das von möglichen Merkmalsausprägungen belegte
reelle Intervall durch geeignet gewählte Klassengrenzen
ξ0, ξ1, ξ2, · · · , ξm
in m Abschnitte unterteilt, wie in BILD 1.3 dargestellt.
x
ξ0
ξ1 ξ2
BILD 1.3
ξ3
…
ξm
Bildung von Größenklassen
Diese m Abschnitte haben die Klassenbreiten
Δi := ξi – ξi–1 ,
i = 1, · · ·, m
(1-17)
und die relative Häufigkeit der Werte in jeder Größenklasse sei mit
hi := relH(ξi–1 < X ≤ ξi) ,
i = 1, · · ·, m
(1-18)
angegeben. Die weißen Punkte in BILD 1.3 sollen Beobachtungswerte darstellen, die in die
einzelnen Größenklassen fallen. Fällt ein Wert genau auf die Klassengrenze, so ist er der
kleineren Größenklasse zuzuordnen. Ordnet man nun diese Klassenhäufigkeiten den
Klassenobergrenzen zu (eine alternative Möglichkeit wäre, die Klassenhäufigkeiten den
Klassenmitten zuzuordnen), so kann aus den Werten der folgenden Häufigkeitstabelle
ξ1 ξ 2 ⋅ ⋅ ⋅ ξ m
h1 h2 ⋅ ⋅ ⋅ hm
∑ hi = 1
(1-19)
32
KAPITEL 1
Statistische Merkmale und Variablen
die Verteilungsfunktion der Klassen HK(x) gezeichnet werden.
Durch diese Erhebungs- bzw. Aufbereitungstechnik ist natürlich die Information der
Häufigkeitsverteilung innerhalb der Klassen verloren gegangen bzw. gar nicht erst
erhoben worden. Es bieten sich zwei Möglichkeiten an, die verlorene Information
annäherungsweise zu ersetzen, um die „wahre“ Verteilungsfunktion H(x) wenigstens
ungefähr zu bestimmen.
Approximierender Polygonzug
Im oberen Teil von BILD 1.4 verbinden wir die Funktionswerte von HK an den Sprungstellen durch gerade Linien und erhalten so eine approximierende Verteilungsfunktion
H (x ) als Polygonzug. Die Sprungstellen von HK werden zu Knickstellen von H , an
denen sich die Steigung von H abrupt ändert, während sie dazwischen konstant ist und
H K (ξ i ) − H K (ξ i −1 )
h
= i ,
ξ i − ξ i −1
Δi
i = 1, · · ·, m
beträgt. Diese Vorgehensweise zur Gewinnung einer Approximation unterstellt eine
„gleichmäßige Verteilung“ innerhalb jeder einzelnen Größenklasse.
Definition:
Ist HK(x) die Verteilungsfunktion eines nach Größenklassen erhobenen
Merkmals mit den Klassenobergrenzen ξ1 , ξ2 , · · · , ξm und H (x ) die
durch einen Polygonzug approximierte Verteilungsfunktion, so heißt der
Quotient
H K (ξ i ) − H K (ξ i −1 )
h
= i
ξ i − ξ i −1
Δi
(1-20)
die (durchschnittliche) Häufigkeitsdichte der i-ten Größenklasse
(i = 1, · · · , m). Die erste Ableitung
h ( x ) :=
d H ( x)
dx
(1-21)
in den Intervallen ξi-1 < x < ξi heißt Häufigkeitsdichtefunktion und ihr
Graph Histogramm.
Diese gleichmäßige Verteilung der Merkmalsausprägungen innerhalb einer jeden
Größenklasse wird in den meisten Fällen zwar nicht mit der Realität übereinstimmen,
gleichwohl stellt das Histogramm eine gute Visualisierung der Verteilung HK dar. Nur
wenn die Besetzungszahlen einzelner Größenklassen allzu gering sind, kann durch das
Histogramm ein falscher Eindruck vermittelt werden.
Wie im Bild angedeutet, müssen die einzelnen „Säulen“ des Histogramms, die jeweils
eine Größenklasse repräsentieren, durchaus nicht die gleiche Breite Δi haben. Im
1.6
Häufigkeitsdichte und Histogramm
33
Gegensatz zum Graphen der Häufigkeitsfunktion gibt nicht die Höhe der Säule, sondern
die Fläche
hi
⋅ Δi
Δi
die relative Häufigkeit in der Größenklasse an.
H(x)
HK(x)
1
x
ξ0
ξ1
ξ2
ξ3
ξm
ξ0
ξ1
ξ2
ξ3
ξm
h(x)
BILD 1.4
Approximierender Polygonzug und Histogramm
Die Gesamtfläche der Säulen des Histogramms ergibt somit
m
h
∑ Δ j Δj
j =1
j
= 1.
x
34
KAPITEL 1
Beispiel
Statistische Merkmale und Variablen
[11] Im untenstehenden Histogramm sind alle Klassenbreiten mit
Δi = 10 000 Euro gleich. Nur die unterste und die oberste Einkommensklasse
haben eine andere Breite. Deshalb entspricht bei den anderen nicht nur die
Fläche sondern auch die Höhe der Säulen den Klassenhäufigkeiten, die hier
in Prozent angegeben sind
Empfänger
in Prozent
18 19
20
20
13
10
10
8
BILD 1.5
2
>130
1
120 bis 130
1
110 bis <120
2
100 bis <110
80 bis <90
90 bis <100
70 bis <80
60 bis <70
50 bis <60
40 bis <50
bis <30
3
30 bis <40
Gehaltsklassen
in Tausend EUR
3
0
Verteilung der jährlichen Gesamtbezüge von
Führungs- und Fachkräften des Außendienstes
Man beachte, dass die Approximation nur bei stetigen (oder quasi-stetigen) Merkmalen
sinnvoll sein kann. Außerdem verlassen wir dadurch eigentlich den gesicherten Boden
der auf Beobachtungen gründenden beschreibenden Statistik. Zwar geben wir nicht an,
wie eine Verteilungsfunktion aussehen müsste, wenn in feinerer Klasseneinteilung oder
ohne eine solche erhoben worden wäre, sondern es soll nur eine Annäherung an die
„wahren“ Verhältnisse sein. Dabei können wir uns irren, und wir wissen zunächst auch
gar nicht, wie groß die Fehler sein mögen. Wir wissen auch nichts über die Fehlerwahrscheinlichkeiten. Die Unterstellung, dass die Häufigkeitsdichte über die ganze
Klassenbreite hinweg gleich groß ist, erscheint in Ermangelung besserer Information
sinnvoll, bedeutet aber gleichzeitig, dass sie sich an den willkürlich gewählten Klassengrenzen abrupt ändert. Dieses ist aber eher unrealistisch.
Beispiel
[12] Bevölkerungspyramiden sind Histogramme. Die senkrechte Achse
ist hier die Achse der Merkmalswerte. Die Bevölkerungspyramiden für
Deutschland, Frankreich, Italien und Ungarn, aber auch die für die USA
zeigen alle den für moderne Gesellschaften typischen „Bauch“. Die hier und
auf der folgenden Seite dargestellten Graphiken demonstrieren, dass der
Begriff „Pyramide“ die Form des Histogramms der Altersverteilung auch für
China und Brasilien nicht mehr adäquat beschreibt. Nur die Altersstruktur in
Entwicklungsländern mit hohem Bevölkerungswachstum, wie z. B. Indien,
erzeugt noch das früher für die meisten Länder typische pyramidenförmige
35
Häufigkeitsdichte und Histogramm
1.6
Histogramm. Interessant ist in diesem Zusammenhang, dass sich die Auswirkungen einer Änderung des generativen Verhaltens der Bevölkerungen
zuerst in Deutschland und Frankreich, dann in Ungarn und den USA, relativ
spät in Italien und China und erst jüngst in Brasilien bemerkbar machten.
Deutschland
2005
Männer
%
6
4
Frauen
2
0
2
4
6
Italien
2005
Männer
%
6
4
BILD 1.6
Frauen
2
0
2
4
6
Alter
90 +
85-90
80-84
75-79
70-74
65-69
60-64
55-59
50-54
45-49
40-44
35-39
30-34
25-29
20-24
15-19
10-14
5-9
<5
%
Frankreich
2003
Männer
%
Alter
90 +
85-90
80-84
75-79
70-74
65-69
60-64
55-59
50-54
45-49
40-44
35-39
30-34
25-29
20-24
15-19
10-14
5-9
<5
%
6
4
Frauen
2
0
2
4
6
%
Ungarn
2003
Männer
%
6
4
Frauen
2
0
2
4
6
%
Bevölkerungspyramiden alter Länder: Europa
Die Ursachen für diese Änderungen können dabei recht unterschiedlicher
Natur sein, und es lassen sich Vermutungen über die Auswirkungen des
2. Weltkriegs in Deutschland und Frankreich, der 68er-Bewegung (Pillenknick) in Deutschland, Frankreich, Italien und den USA, des sowjetischen
Einmarschs in Ungarn 1956, der Kulturrevolution und der späteren 1-KindPolitik in China anstellen.
36
Statistische Merkmale und Variablen
KAPITEL 1
USA
2005
Männer
%
6
4
Frauen
2
0
2
4
6
Brasilien
2004
Männer
%
6
4
Frauen
2
BILD 1.7
0
2
4
6
Alter
90 +
85-90
80-84
75-79
70-74
65-69
60-64
55-59
50-54
45-49
40-44
35-39
30-34
25-29
20-24
15-19
10-14
5-9
<5
%
China
2000
Männer
%
Alter
90 +
85-90
80-84
75-79
70-74
65-69
60-64
55-59
50-54
45-49
40-44
35-39
30-34
25-29
20-24
15-19
10-14
5-9
<5
%
6
4
Frauen
2
0
2
4
6
%
Indien
2005
Männer
%
6
4
Frauen
2
0
2
4
6
%
Bevölkerungspyramiden anderer Länder
Approximierende glatte Kurve
Verbindet man hingegen die Funktionswerte HK(xi) durch eine glatte Kurve ohne
Knickstellen, so gibt man dadurch die Annahme der gleichmäßigen Verteilung innerhalb
der einzelnen Größenklassen auf. Meistens ist diese Annahme auch nicht realistisch, denn
sie bedeutet, dass sich die Häufigkeitsdichte an den oft willkürlich gewählten Grenzen
der Größenklassen abrupt ändert. Wählt man deshalb als
~ approximierende VerteiH
( x ) , hat die Dichtefunktion
lungsfunktion
eine
stetige
und
differenzierbare
Funktion
~
~
h ( x ) := d H ( x ) d x auch keine Sprungstellen, und es gilt
1.6
x
~
Häufigkeitsdichte und Histogramm
~
∫ h (u ) d u = H ( x )
−∞
und
+∞
∫
~
h ( x) d x =
~
∫ h ( x) d x
~
= H (ξ m ) = H (ξ m ) = 1 .
ξ0
−∞
~
H(x)
ξm
HK(x)
1
x
ξ0
ξ1
ξ2
ξ3
ξm
~
h(x)
ξ0
BILD 1.8
ξm
Approximierende glatte Kurven
x
37
38
KAPITEL 1
Statistische Merkmale und Variablen
PRAXIS
Sterben die Deutschen aus?
Die künftige demographische Entwicklung Deutschlands bereitet Sorgen. Der Vergleich
der beiden Bevölkerungspyramiden in Bild 1.9 macht dies deutlich. Die rechte Pyramide
ist eine Projektionsrechnung. Sie zeigt den Altersaufbau unter der Voraussetzung, dass
die Geburtenrate wie seit einem Vierteljahrhundert weiterhin auf dem Niveau von 1.3 bis
1.4 Kindern pro Frau bleibt und der Einwanderungsüberschuss wie im langjährigen
Durchschnitt auch künftig rund 170 000 Personen pro Jahr beträgt. Zusätzlich wird noch
die absehbare Zunahme der Lebenserwartung um rund sechs Jahre berücksichtigt.
Altersstruktur der Bevölkerung Deutschlands
im Jahr 2000
im Jahr 2050 (Prognose)
100
Männer
Männer
Frauen
80
Frauen
Aq = 91
Aq = 41
60
40
20
1.2
0.8
0.4
0
0.4
0.8
1.2
Mio
1.2
0.8
0.4
0
0.4
0.8
1.2
Quelle: H. Birg/E.−J. Flöthmann, Demographische Projektionsrechnungen für die Rentenreform 2000
IBS−Materialien Bd. 47, Bielefeld 2001
BILD 1.9
Bevölkerungspyramiden für Deutschland
So standen 100 Menschen der ökonomisch aktiven Altersgruppe 20 bis 60 im Jahre 2000
rund 41 über Sechzigjährige gegenüber. Nach der Prognose würde dieser Altenquotient
Aq im Jahre 2050 auf 91 ansteigen. Dies hätte enorme sozialpolitische Konsequenzen.
KAPITEL 1
Statistische Merkmale und Variablen
39
Kontrollfragen
1 Was ist der Unterschied zwischen Merkmal und Variable?
2 Welche verschiedenen Skalenarten kennen Sie? Überlegen Sie sich eigene
Beispiele!
3 Warum werden in der Praxis zumeist repräsentative Stichproben erhoben?
4 Welche Eigenschaften hat die Treppenfunktion? Welchen Aussagegehalt
besitzt sie?
5 Warum ist die Bildung von Größenklassen oft notwendig? Überlegen Sie sich
ein Beispiel!
6 Welche Annahme liegt der approximierenden Verteilungsfunktion H (x)
implizit zugrunde?
7 Was ist der Unterschied zwischen Säulendiagramm und Histogramm? Unter
welcher Bedingung sehen beide gleich aus?
E RGÄNZENDE L ITERATUR
Bohley, Peter, Statistik, 7. Aufl., München, Wien: Oldenbourg, 2000, Kapitel III
Hochstädter, Dieter: Statistische Methodenlehre, 8. Aufl., Frankfurt am Main:
Harri Deutsch, 1996
Krämer, Walter: So lügt man mit Statistik, 4. Aufl., München: Piper, 2003
Schlittgen, Rainer: Einführung in die Statistik: Analyse und Modellierung von Daten,
9. Aufl., München, Wien: Oldenbourg, 2003, Kapitel 1 und 2
Schwarze, Jochen: Grundlagen der Statistik I, 10. Aufl., Herne: Neue Wirtschaftsbriefe, 2005
A UFGABEN
1.1
Zuckerpakete. Bei einer Nachwiegung von 20 verpackten Pfundpaketen Zucker
ergaben sich folgende Werte (in g):
492
511
499
497
499
500
478
504
507
482
508
502
Zeichnen Sie ein Histogramm mit der
a) Klassenbreite 1 g
b) Klassenbreite 2 g .
499
496
500
512 503
502 500
499.
40
1.2
KAPITEL 1
Statistische Merkmale und Variablen
Merkmale. Geben Sie zu den folgenden Merkmalen Beispiele für statistische
Einheiten und Merkmalsausprägungen an. Nennen Sie Merkmalstyp und
Skalierung.
Haarfarbe
Verdienst
Abiturnote in Deutsch
Geschlecht
Beruf
Kontobewegungen/Monat
1.3
1.4
Körpergröße
Gewicht
Religionsbekenntnis
Zugehörigkeit zu einer sozialen Schicht
Vermögen
FAZ. Ein Kioskbesitzer notiert 200 Tage lang
die Zahl der verkauften Exemplare der FAZ.
Verkaufte
Zeitungen
Anzahl der
Tage
a) Geben Sie Merkmalsträger und mögliche
Merkmalsausprägungen an. Um welche
Merkmalstypen handelt es sich?
b) Zeichnen Sie die Verteilungsfunktion.
0
1
2
3
4
5
6
21
46
54
40
24
10
5
Punkte
von … bis unter …
Statistikklausur. Bei der letzten Statistikklausur machte sich der Prüfer die
nebenstehenden Aufzeichnungen über
die erreichten Punktezahlen.
a) Skizzieren Sie die Verteilungsfunktion.
0
25
50
75
Anzahl
– 25
– 50
– 75
– 100
50
90
170
90
b) Wie viele Klausurteilnehmer erzielten weniger als 90 Punkte? Erläutern Sie
Ihre Antwort.
1.5
Polygonzug und glatte Kurve. Ein Merkmal X wurde nach Größenklassen
erhoben:
Größenklassen
relative
Häufigkeiten
0–5
5–8
8 – 10
0.1
0.7
0.2
a) Zeichnen Sie H K ( x) und H (x) .
b) Zeichnen Sie das Histogramm.
c) Zeichnen Sie die approximierende Verteilungsfunktion als ein Polynom
3. Grades
~
H ( x ) = ax 3 + bx 2 + cx
im Intervall [0,10]. Berechnen Sie dazu die Koeffizienten a, b und c.
KAPITEL 1
Statistische Merkmale und Variablen
41
~
d) Wie lautet die approximierende Dichtefunktion h( x) ?
Zeichnen Sie sie in das Histogramm ein.
1.6
Einkommensverteilung. Im „Statistischen Taschenbuch“ 2007 des BUNDESMINISTERIUMS FÜR ARBEIT UND SOZIALES (BMAS) findet sich als Ergebnis der
Einkommensteuerstatistik folgende Tabelle für 2002:
Gesamtbetrag
der Einkünfte
%
Jahreseinkünfte in Euro
von . . . bis unter . . .
Steuerpflichtige
%
unter 2 500
2 500 – 5 000
5 000 – 7 500
7 500 – 10 000
10 000 – 12 500
12 500 – 25 000
25 000 – 37 500
37 500 – 50 000
50 000 – 125 000
125 000 – 250 000
250 000 – 500 000
500 000 und mehr
3.1
3.7
4.3
4.4
4.3
24.2
23.0
13.6
17.5
1.4
0.3
0.1
0.1
0.4
0.8
1.1
1.4
12.8
19.7
16.3
33.9
6.5
2.8
4.2
100
100
a) Zeichnen Sie aus diesen Angaben ein Histogramm und eine Verteilungsfunktion.
b) An welcher Stelle hätte die approximierende glatte Kurve der Verteilungsfunktion – nach der Freihandmethode gezeichnet – ihre größte Steigung?
Eine näherungsweise Angabe genügt.
1.7
Diplomnoten. Ein frischgebackener Master of Arts in Ökonomie bewirbt sich bei
einem großen Stuttgarter Unternehmen und erhält postwendend eine formlose
Absage. Eher empört über diese Art der Benachrichtigung ruft er den
Personalchef an und befragt ihn nach den Gründen für die Ablehnung. Dieser
erklärt dem Absolventen, dass das Unternehmen eine Vorauswahl nach Notendurchschnitten vornehme und er ja leider nur eine befriedigende Gesamtnote
vorzuweisen habe, daher also nicht in Frage käme.
Der Bewerber erklärt dem Personalchef daraufhin, dass das arithmetische Mittel
bei Noten keine Aussagekraft habe, da Zensuren ordinal skaliert seien. Zudem
könne man schon gar nicht Diplomnoten aus verschiedenen Fachbereichen oder
gar von verschiedenen Unis miteinander vergleichen. Die Gesamtnote sei also
ein denkbar schlechtes Auswahlkriterium. Zum Schluss des Gesprächs empfiehlt
der Exstudent dem Personalchef die Lektüre einschlägiger Statistikliteratur.
Hat der Bewerber recht? Diskutieren Sie die Unterschiede zwischen Nominal-,
Ordinal- und Kardinalskala.
42
1.8
KAPITEL 1
Statistische Merkmale und Variablen
Amerikaner und Deutsche in Durchschnittswerten
USA
Deutschland
BIP pro Kopf
Arbeitseinkommen
Arbeitsstunden/Jahr
47 025 $
47 688 $
1 804
46 498 $
38 626 $
1 436
Alter
Lebenserwartung
Kinder pro Frau
36.7
78.1
2.1
43.4
79.3
1.4
3
35.1
8.6
2
25.5
12.0
TV-Konsum pro Tag
Body-Mass-Index
Alkohol Liter/Jahr
Quelle: FRANKFURTER ALLGEMEINE SONNTAGSZEITUNG 02.11.2008
a) Sind sie wirklich so viel dicker als wir oder
b) rechnen die Amerikaner das Merkmal Body-MassIndex in Pounds und Inches? Rechnen Sie um!
L ÖSUNGEN
1.2
statistische
Einheiten
Merkmalsausprägung
Merkmalstyp
Skalierung
Männer im Alter
zwischen 60 und 65
Studentische
Hilfskräfte
schwarz, braun,
blond, grau
qualitativ
nominal
8 – 12 €/Stunde
kardinal
Abiturnote in
Deutsch
Jahrgang 2000
0 – 15 Punkte
quantitativ
diskret
quantitativ
diskret
Beruf
Mitglieder der FDP
Arbeiter, Angest.,
Selbständiger
qualitativ
nominal
Kontobewegungen pro
Monat
Girokonten der
Sparkasse
Duisburg
Mitglieder der
dt. BasketballNationalmannschaft
0 – 1000 Stück
quantitativ
diskret
kardinal
1,60 m – 2,3 m
quantitativ
stetig
kardinal
Merkmal
Haarfarbe
Verdienst
Körpergröße
ordinal
1.3
Tage; 0, 1, 2, ... ; quantitativ, diskret
1.4
ca. 364
1.5
c) a = – 0.005333; b = 0.096
c = – 0.3267
~
2
d) h( x) = − 0.016 x + 0.192 x − 0.327
1.6
b) ca. 35 000
1.8
a) nein
b) ja
Kapitel 3
Summen, Produkte, Logik,
Mengen, Abbildungen
3
3.1 Summen
Definition des Summenzeichens
Für n ∈ N, q > p, p, q ∈ Z und ai ∈ R ist
n
ai = a1 + a2 + . . . + an
i=1
q
ai = ap + ap+1 + . . . + aq
i=p
Rechenregeln für Summen
Für n, k ∈ N, q > p, p, q ∈ Z, ai , bi , c ∈ R gilt:
n
n
n
n
n
n
(ai + bi ) =
ai +
bi
(ai − bi ) =
ai −
bi
i=1
n
i=1
cai = c
i=1
n
n
Additivität
i=1
Homogenität
ai
q
c = nc
ai =
i=1
n−1
ai+1 =
i=0
n+1
c = (q − p + 1)c
ai =
n
n+1
Summe über eine Konstante
ai =
n
n
ai + an+1
aj =
j=1
ai =
k
i=1
Verschiebung des Summationsindex
ai−1
i=2
i=1
i=1
30
i=1
i=p
n
i=1
i=1
i=1
i=1
i=1
n
i=1
1
ai = a1
i=1
n
0
ai : = 0
Rekursion
i=1
Unabhängigkeit von Bezeichnung des Index
ak
k=1
ai +
n
i=k+1
ai
(1 ≤ k < n)
Aufteilung in Teilsummen
3.2 Wichtige Summen und nützliche Formelnfür Summen
3.2 Wichtige Summen und nützliche Formeln
für Summen
Arithmetisches Mittel oder Mittelwert
Definition
Das arithmetische Mittel oder der Mittelwert der Zahlen x1 , x2 , . . . , xn ist
1
xi
n i=1
n
x =
3
Nützliche Rechenregeln
n
i=1
n
(xi − x ) = 0
(xi − x )2 =
i=1
1
n
Summe der Abweichungen vom Mittelwert ist Null
n
xi2 − n2x Summe der quadratischen Abweichungen vom Mittelwert
i=1
n
1 2
x − 2x
n i=1 i
n
(xi − x )2 =
i=1
Mittlere quadratische Abweichung vom Mittelwert
Arithmetische Reihe
Definition
Die Folge a1 = a, a2 , a3 , . . . heißt eine arithmetische Reihe mit der Differenz d, wenn
an = an−1 + d = a1 + (n − 1)d = a + (n − 1)d
Summenformel
Die Summe der ersten n Glieder einer arithmetischen Reihe a = a1 , a2 , a3 , . . . , an =
z mit Anfangsglied a und Schlussglied z ist
n
i=1
ai =
n−1
(a + id) = a + (a + d) + (a + 2d) + . . . + (a + [n − 1]d)
i=0
n
n(n − 1)d n
=
a + (a + [n − 1]d) =
a+z
= na +
2
2
2
=:z
31
3
SUMMEN, PRODUKTE, LOGIK, MENGEN, ABBILDUNGEN
Einige Summen spezieller arithmetischer Reihen
Für n ∈ N gilt:
n
1
i = 1 + 2 + 3 + . . . + n = n(n + 1)
2
i=1
n
i=1
n
3
Summe der Zahlen von 1 bis n
(2i − 1) = 1 + 3 + . . . + (2n − 1) = n2
Summe der ersten n ungeraden Zahlen
2i = 2 + 4 + . . . + 2n = n(n + 1)
Summe der ersten n geraden Zahlen
i=1
Summe der Quadrat- und Kubikzahlen
Für n ∈ N gilt:
n
1
i 2 = 12 + 22 + 32 + . . . + n2 = n(n + 1)(2n + 1)
6
i=1
n
i=1
n
i=1
n
i=1
n
i=1
n
(2i − 1)2 = 12 + 32 + 52 + . . . + (2n − 1)2 =
(2i)2 = 22 + 42 + 62 + . . . + (2n)2 =
i 3 = 1 3 + 2 3 + 3 3 + . . . + n3 =
1
n(4n2 − 1)
3
2
n(n + 1)(2n + 1)
3
1 2
n (n + 1)2
4
(2i − 1)3 = 13 + 33 + 53 + . . . + (2n − 1)3 = n2 (2n2 − 1)
(2i)3 = 23 + 43 + 63 + . . . + (2n)3 = 2n2 (n + 1)2
Summe der Quadrate
ungerade
gerade
Summe der Kubikzahlen
ungerade
gerade
i=1
Geometrische Reihe
Definition
Die Folge a0 , a1 , a2 , . . . heißt eine geometrische Reihe oder geometrische Folge mit
dem Quotienten k, wenn
an+1
=k
an
für alle n ∈ N0 , d.h. an+1 = an · k und an = a0 k n .
32
3.3 Doppelsummen
Summenformel
Für eine geometrische Reihe mit dem Anfangsglied a0 = a und dem Quotienten k
gilt:
n−1
ak i = a + ak + ak 2 + . . . + ak n−1 = a
i=0
1 − kn
kn − 1
=a
k−1
1−k
(k = 1)
Speziell für a0 = 1 gilt:
n
i=0
3
k n+1 − 1
ki = 1 + k + k2 + . . . + kn =
k−1
(k = 1)
Summe aufeinanderfolgender Differenzen
Für n ∈ N und ak ∈ R gilt:
n
(ak+1 − ak ) = an+1 − a1
k=1
3.3 Doppelsummen
Annahmen
Gegeben seien aij ∈ R
nung:
1 ≤ i ≤ m; 1 ≤ j ≤ n, geschrieben in rechteckiger Anorda11 a12 · · · a1n
a21 a22 · · · a2n
..
..
..
.
.
.
am1 am2 · · · amn
Zeilen- und Spaltensummen
Für die obige Anordnung ist die Zeilensumme über die i-te Zeile:
n
aij
j=1
Die Spaltensumme über die j-te Spalte ist:
m
aij
i=1
Siehe auch S. 130
33
3
SUMMEN, PRODUKTE, LOGIK, MENGEN, ABBILDUNGEN
Summe der Zeilen- oder Spaltensummen
Die Summe über alle Zeilensummen
⎛ ist ⎞
n
n
n
m
n
⎝
a1j +
a2j + . . . +
amj =
aij ⎠ =
j=1
j=1
j=1
i=1
j=1
(a11 + a12 + . . . + a1n ) + (a21 + a22 + . . . + a2n ) + . . . + (am1 + am2 + . . . + amn )
Die Summe über alle Spaltensummen
m ist m
m
m
n
ai1 +
ai2 + . . . +
ain =
aij =
3
i=1
i=1
i=1
j=1
i=1
(a11 + a21 + . . . + am1 ) + (a12 + a22 + . . . + am2 ) + . . . + (a1n + a2n + . . . + amn )
Unabhängigkeit von der Reihenfolge der Summation
Die Summe der Zeilensummen ist gleich der Summe der Spaltensummen, d.h.
n
m aij =
i=1 j=1
m
n aij
j=1 i=1
Definition einer Doppelsumme
Eine Summe der Gestalt
n
m aij heißt eine Doppelsumme.
i=1 j=1
3.4 Produkte
Definition des Produktzeichens
Für n ∈ N, q > p, p, q ∈ Z und ai ∈ R ist
n
i=1
34
ai = a1 · a2 · . . . · an
q
i=p
ai = ap · ap+1 · . . . · aq
3.5 Fakultäten und Binomialkoeffizienten
Rechenregeln für Produkte
Für n, k ∈ N, q > p, p, q ∈ Z, ai , bi , c ∈ R gilt:
n
ai
n
n
n
n
ai
i=1
(ai · bi ) =
ai ·
bi
= n
b
i=1
i=1
i=1
i=1 i
bi
Multiplikativität
i=1
n
n
(c · ai ) = c n
ai
i=1
n
i=1
q
c = cn
i=1
n
i=1
n
ai =
i=1
n−1
ai+1 =
i=0
ai =
ai =
i=1
n
c = c q−p+1
Produkt über eine Konstante
i=p
i=1
n+1
3
Homogenität vom Grad n
ai =
n
n+1
ai · an+1
i=1
n
n
j=1
k=1
n
ai ·
i=1
1
Rekursion
ai = a1
i=1
aj =
k
Verschiebung des Index
ai−1
i=2
Unabhängigkeit von Bezeichnung des Index
ak
ai
(1 ≤ k < n)
Aufteilung in Teilprodukte
i=k+1
3.5 Fakultäten und Binomialkoeffizienten
n Fakultät
Definition
Für n ∈ N ist n Fakultät definiert durch:
n! = 1·2·3·. . .·(n−1)·n =
n
i
0! = 1
i=1
Eigenschaften
(n + 1)! = n!(n + 1)
n n
√
√
n! ≈ 2n · nn · e −n = 2n ·
e
Stirlingsche Formel für große n 2 N
35
3
SUMMEN, PRODUKTE, LOGIK, MENGEN, ABBILDUNGEN
Binomialkoeffizient
Für m, k ∈ N0 ; k ≤ m ist der Binomialkoeffizient (gelesen als ,,m über k“) definiert
durch
m
m!
=
(m − k)!k!
k
Äquivalente Definition
Für k, m ∈ N mit k ≤ m gilt die äquivalente Definition
m
m · (m − 1) · . . . · (m − k + 1) m · (m − 1) · . . . · (m − k + 1)
=
=
k!
k · (k − 1) · . . . · 1
k
3
Man merke sich: Im Zähler und Nenner stehen jeweils k Faktoren natürlicher Zahlen, um 1 absteigend, beginnend bei m im Zähler und k im Nenner!
Rechenregeln für Binomialkoeffizienten
Es gelten die folgenden Regeln, die am Pascal’schen Dreieck überprüfbar sind!
0
m
m
m
m
=1
=1
=
=m
=1
0
0
1
m−1
m
m
m
=
Symmetrie
k
m−k
m+1
m
m
=
+
Additionssatz
k +1
k
k +1
m+1
m
m−1
k
=
+
+ ... +
Additionssatz
k +1
k
k
k
m+n+1
m+1
m+n
m
=
Additionstheoreme
+
+... +
n
n
0
1
n m
n
m
n m
n+m
+
+ ... +
=
0
k
1 k −1
k
0
k
m
m
m
+
+ ... +
= 2m
0
1
m
m
m
m
m
m
m
+
+
+ ... =
+
+
+ . . . = 2m−1
0
2
4
1
3
5
m
m
m
−
+ . . . + (−1)m
=0
0
1
m
2 2 2
m
m
2m
m
+
+ ... +
=
1
m
m
0
36
3.6 Aussagenlogik
Pascal’sches Dreieck
m
k
0
1
2
3
4
5
6
1
0
n
1
1
1
1
1
2
3
4
5
1
1
3
6
10
1 6 15
n
n
n
...
0
1
2
2
1
3
1
4
10
20
5
15
...
4
1
6 ...
5
3
1
6
1
n
n
n−1
n
Jede Zahl ist Summe der beiden Nachbarn links und rechts in der Zeile darüber.
Newtons Binomische Formeln
(a + b)1 = a + b
(a + b)2 = a2 + 2ab + b 2
(a + b)3 = a3 + 3a2 b + 3ab 2 + b 3
(a + b)4 = a4 + 4a3 b + 6a2 b 2 + 4ab 3 + b 4
(a + b)m = am +
m m m−1
m
m m m m−k k
a
b + ... +
ab m−1 +
b =
b
a
1
m−1
m
k
k=0
3.6 Aussagenlogik
Aussage und Aussageform
Eine Aussage ist eine Behauptung (Satz) p, der (dem) eindeutig der Wahrheitswert
wahr (W) oder falsch (F) zugeordnet werden kann.
Eine offene Aussage oder Aussageform ist eine Aussage p(x), in der eine Variable
vorkommt. Erst nach Einsetzen des Variablenwertes kann über den Wahrheitswert
entschieden werden.
37
3
SUMMEN, PRODUKTE, LOGIK, MENGEN, ABBILDUNGEN
Negation einer Aussage
Ist p eine Aussage, so ist ¬p (Nicht p, gelegentlich
auch p̄ oder ∼ p) die Negation
W falls p falsch
dieser Aussage mit den Wahrheitswerten
F falls p wahr
Verbindung zweier Aussagen
Zwischen zwei Aussagen p und q gibt es die folgenden Verbindungen oder Verknüpfungen:
3
Aussagenverbindung
p und q
p oder q
Wenn p, so q (Aus p folgt q)
p genau dann, wenn q (p äquivalent zu q)
Name
Konjunktion
Disjunktion
Implikation (Subjunktion)
Äquivalenz (Bijunktion)
Notation
p∧q
p∨q
p→q
p↔q
Sie werden durch die folgende Wahrheitstafel definiert:
p∧q p∨q p→ q p ↔q
p
q
W
W
W
W
W
W
W
F
F
W
F
F
F
W
F
W
W
F
F
F
F
F
W
W
Notation: Statt p → q bzw. p ↔ q findet man auch p ⇒ q bzw. p ⇔ q
Tautologie
Definition
Eine Tautologie (Identität oder ein aussagenlogisches Gesetz) ist eine Aussagenverbindung, die stets wahr ist.
Gesetz vom ausgeschlossenen Dritten und vom Widerspruch
Die folgenden Aussagenverbindungen sind Tautologien:
p ∨ ¬p
¬(p ∧ ¬p)
38
Gesetz vom ausgeschlossenen Dritten
Gesetz vom Widerspruch
3.6 Aussagenlogik
Tautologische Äquivalenzen (,)
¬(¬p) ⇔ p
p∨p ⇔p
Doppelte Negation
p∧p⇔ p
Idempotenz
(p ∨ q) ∨ r ⇔ p ∨ (q ∨ r) ⇔ p ∨ q ∨ r
Assoziativität
(p ∧ q) ∧ r ⇔ p ∧ (q ∧ r) ⇔ p ∧ q ∧ r
Assoziativität
((p ↔ q) ↔ r) ⇔ (p ↔ (q ↔ r)) ⇔ p ↔ q ↔ r
p∨q ⇔q∨p
p∧q ⇔ q∧p
p ∨ (q ∧ r) ⇔ (p ∨ q) ∧ (p ∨ r)
Assoziativität
(p ↔ q) ⇔ (q ↔ p)
Kommutativität
p ∧ (q ∨ r) ⇔ (p ∧ q) ∨ (p ∧ r)
¬(p → q) ⇔ (p ∧ ¬q)
3
Distributivität
Negation der Implikation
¬(p ∧ q) ⇔ ¬p ∨ ¬q
¬(p ∨ q) ⇔ ¬p ∧ ¬q
de Morgansche Regeln
(p → q) ⇔ (¬p ∨ q)
(p → q) ⇔ (¬q → ¬p)
Kontraposition
„entweder p oder q“ ⇔ [(p ∧ ¬q) ∨ (¬p ∧ q)]
p ∨ (q ∧ ¬q) ⇔ p
p ∧ (q ∨ ¬q) ⇔ p
p → (q → r) ⇔ (p ∧ q) → r
¬(p ↔ q) ⇔ (p ↔ ¬q)
(p ↔ q) ⇔ (p → q) ∧ (q → p)
(p ↔ q) ⇔ (p ∧ q) ∨ (¬p ∧ ¬q)
Tautologische Implikationen: ())
p∧q ⇒p
p∧q ⇒q
Vereinfachung
p⇒p∨q
q ⇒p∨q
Addition
¬p ⇒ (p → q)
q ⇒ (p → q)
¬(p → q) ⇒ p
¬(p → q) ⇒ ¬q
¬p ∧ (p ∨ q) ⇒ q
[(p → q) ∧ (q → r)] ⇒ (p → r)
[p ∧ (p → q)] ⇒ q
Transitivität, Kettenschluss
Abtrennungsregel, direkter Schluss
¬q ∧ (p → q) ⇒ ¬p
[p ∧ (¬q → ¬p)] ⇒ q
[(p1 ∨ p2 ) ∧ (p1 → q) ∧ (p2 → q)] ⇒ q
[(p → q) ∧ (¬p → q)] ⇒ q
Indirekter Schluss
Fallunterscheidung
Fallunterscheidung, Alternativschluss
39
3
SUMMEN, PRODUKTE, LOGIK, MENGEN, ABBILDUNGEN
Quantoren
Definition
Das Zeichen ∀ heißt der Allquantor und (∀x: p(x)) bedeutet: für alle x ist die Aussage
p(x) wahr.
Das Zeichen ∃ heißt der Existenzquantor und (∃x: p(x)) bedeutet: Es gibt (existiert)
ein x, für das p(x) wahr ist.
Rechenregeln für Quantoren
3
∀x: p(x) ⇔ ¬∃ x: ¬p(x)
∃ x: p(x) ⇔ ¬∀x: ¬p(x)
Austausch der Quantoren
∀x: p(x) ∧ q(x) ⇔ ∀x: p(x) ∧ ∀x: q(x)
Distributivgesetz
∃x: p(x) ∨ q(x) ⇔ ∃ x: p(x) ∨ ∃ x: q(x)
Distributivgesetz
∀x: (p ∨ q(x)) ⇔ p ∨ (∀x: q(x))
∀x: (p ∧ q(x)) ⇔ p ∧ (∀x: q(x))
∃ x: (p ∨ q(x)) ⇔ p ∨ (∃ x: q(x))
∃ x: (p ∧ q(x)) ⇔ p ∧ (∃ x: q(x))
∀x: p(x) → q ⇔ ∃ x: p(x) → q
p → ∀x: q(x) ⇔ ∀x: p → q(x)
p → ∃ x: q(x) ⇔ ∃x: p → q(x)
(∀x: p(x)) ∨ (∀x: q(x)) ⇒ ∀x: p(x) ∨ q(x)
(∃ x: p(x) ∧ q(x)) ⇒ (∃ x: p(x)) ∧ (∃ x: q(x))
∀x: ∀y: p(x, y) ⇔ ∀y: ∀x: p(x, y)
Kommutativgesetz
∃ x: ∃y: p(x, y) ⇔ ∃ y: ∃ x: p(x, y)
Kommutativgesetz
3.7 Mathematische Beweise
Mathematische Sätze als Implikationen
Mathematische Sätze (Theoreme) können als Implikationen P ⇒ Q formuliert werden, wobei P und Q jeweils eine Aussage oder eine Reihe von Aussagen sind. Bedeutung: Wenn P wahr ist, so ist notwendig auch Q wahr. Andere Redeweisen für
P ⇒ Q: P impliziert Q; wenn P, dann auch Q; Q ist eine Folgerung (folgt) aus P; Q,
wenn P; P nur, wenn Q oder Q ist eine Implikation von P. Besonders wichtig sind
die Formulierungen:
P ist eine hinreichende Bedingung für Q und Q ist eine notwendige Bedingung
für P.
Direkter und indirekter Beweis
Bei einem direkten Beweis zeigt man ausgehend von P, dass Q wahr ist.
40
3.8 Mengen
Bei einem indirekten Beweis nimmt man an, dass Q nicht gilt und zeigt, dass dann
auch P nicht gilt, denn∗ es gilt:
P⇒Q
ist äquivalent zu
Nicht Q ⇒ Nicht P
Logische Äquivalenz
Gilt P ⇒ Q und Q ⇒ P, so liegt eine logische Äquivalenz vor: P ⇔ Q mit den
Redeweisen: P ist äquivalent zu Q; P dann und nur dann, wenn Q; P genau dann,
wenn Q oder: P ist eine notwendige und hinreichende Bedingung für Q.
3
Mathematische oder vollständige Induktion
Soll eine Aussage A(n) für alle natürlichen Zahlen n ≥ n0 (wobei n0 meistens 0
oder 1 ist) bewiesen werden, so kann der Beweis durch vollständige Induktion
angewendet werden:
1) Induktionsanfang: Es ist zu zeigen, dass A(n0 ) wahr ist.
2) Induktionsvoraussetzung: Die Aussage A(n) sei wahr für n = k oder alle n ≤ k.
3) Induktionsschritt: Unter der Induktionsvoraussetzung ist zu zeigen, dass die
Aussage auch für die nächstfolgende Zahl n = k + 1 wahr ist.
Wenn 1) und 3) gezeigt werden können, ist A(n) für alle n ≥ n0 wahr.
3.8 Mengen
Grundlegende Definitionen
Eine Menge M ist eine Zusammenfassung von bestimmten unterscheidbaren Objekten zu einer Gesamtheit. Die Gesamtheit aller betrachteten Objekte ist die Grundmenge (Universalmenge), die mit § bezeichnet wird. Die Objekte heißen die Elemente der Menge.
a ∈ M ⇐⇒ a ist Element der Menge M .
a∈
/ M ⇐⇒ a ist nicht Element der Menge M .
Die leere Menge ∅ ist die Menge, die kein Element enthält. Zwei Mengen sind disjunkt, wenn sie kein Element gemeinsam haben.
Die Menge A ist Teilmenge von B, wenn jedes Element aus A auch in B liegt:
A ⊆ B ⇐⇒ (x ∈ A ⇒ x ∈ B)
∗
Siehe Kontraposition unter den tautologischen Äquivalenzen oder indirekter Schluss unter
den tautologischen Implikationen.
41
3
SUMMEN, PRODUKTE, LOGIK, MENGEN, ABBILDUNGEN
Die Teilmenge A ist echte Teilmenge∗ von B, wenn es ein x ∈ B gibt, das nicht in A
liegt:
A ⊂ B ⇐⇒ (A ⊆ B ∧ (∃ x ∈ B: x ∈
/ A))
Zwei Mengen A und B sind gleich, wenn jedes Element aus A in B und jedes Element
aus B auch in A liegt.
A = B ⇐⇒ (x ∈ A ⇔ x ∈ B) ⇐⇒ (A ⊆ B ∧ B ⊆ A)
Die Potenzmenge P(§) ist die Menge aller Teilmengen von §, d.h.
3
P(§) = {A|A ⊆ §}
Eine Menge kann spezifiziert (definiert) werden durch:
Auflistung aller Elemente in der Menge: M = {a, b, c, . . .}
Spezifikation einer Eigenschaft mittels einer Aussageform:
M = {x ∈ §: A(x) ist wahr}
Rechenregeln für Mengen
A⊆A
∅⊆A
Reflexivität
∀A
A ⊆ B ∧ B ⊆ C ⇒ A ⊆ C
Transitivität
Die leere Menge ist Teilmenge jeder Menge
A ⊆ B ⇐⇒ A ∪ B = B ⇐⇒ A ∩ B = A ⇐⇒ CB ⊆ CA
A=A
Reflexivität
(A = B ∧ B = C ) ⇒ A = C
A=B⇒B=A
Symmetrie
Transitivität
Definition von Verknüpfungen zweier Mengen
Zwischen zwei Mengen A und B werden die folgenden Mengenverknüpfungen
definiert:
∗
42
Gelegentlich auch nur die Notation: ⊂
3.8 Mengen
A∪B
A Vereinigung B,
Vereinigungsmenge
besteht aus allen Elementen, die zu wenigstens
einer der Mengen A und B gehören:
A ∪ B = {x: x ∈ A oder x ∈ B}
A∩B
A Durchschnitt B,
Schnittmenge
besteht aus allen Elementen, die zu A und zu B
gehören:
A ∩ B = {x: x ∈ A und x ∈ B}
A\B
A minus B
Differenzmenge,
Restmenge
besteht aus allen Elementen, die zu A, aber
nicht zu B gehören (Differenz von A und B):
A \ B = {x: x ∈ A und x ∈
/ B}
CA
A Komplement
besteht aus allen Elementen einer Grundmenge
§, die nicht zu A gehören; andere Notationen:
Ã, Ā, Ac
CA = {x: x ∈ § und x ∈
/ A} = § \ A
3
Rechenregeln für Mengenverknüpfungen
A∪A= A
A∩A =A
A∪B = B∪A
Idempotenz
A∩B =B∩A
Kommutativität
A ∪ (B ∪ C ) = (A ∪ B) ∪ C = A ∪ B ∪ C
Assoziativität
A ∩ (B ∩ C ) = (A ∩ B) ∩ C = A ∩ B ∩ C
Assoziativität
A ∪ (B ∩ C ) = (A ∪ B) ∩ (A ∪ C )
A∪∅ = A
A∩§= A
A ∪ CA = §
C∅ = §
A ∩ CA = ∅
C§ = ∅
A ∪ (A ∩ B) = A
C(A ∪ B) = CA ∩ CB
A ∩ (B ∪ C ) = (A ∩ B) ∪ (A ∩ C )
A∪§ =§
A∩∅=∅
Distributivität
Identitäten
C(CA) = A
Komplementarität
Komplement der leeren Menge und der Grundmenge
A ∩ (A ∪ B) = A
Verschmelzung, Absorptionsgesetz
C(A ∩ B) = CA ∪ CB
de Morgansche Regeln
(A \ B) ∩ B = ∅
Satz vom Widerspruch
(A \ B) ∪ B = A ∪ B
A \ B = A \ (A ∩ B) = A ∩ CB
Satz vom ausgeschlossenen Dritten
A\A = ∅
A ∪ B = (A \ B) ∪ (B \ A) ∪ (A ∩ B)
Mehrfache Verknüpfungen
Für n ∈ N ist:
n
Ai = A1 ∪ A2 ∪ . . . ∪ An = {x|∃ i ∈ {1, . . . , n}: x ∈ Ai }
i=1
n
i=1
Menge aller Elemente,
die zu mindestens einer der Mengen Ai gehören.
Ai = A1 ∩ A2 ∩ . . . ∩ An = {x|∀i ∈ {1, . . . , n}: x ∈ Ai }
Menge aller Elemente,
die zu allen Mengen Ai gehören.
43
3
SUMMEN, PRODUKTE, LOGIK, MENGEN, ABBILDUNGEN
Kreuzprodukte, grundlegende Definitionen
3
Ein geordnetes Paar (a, b) ist ein Paar von zwei Elementen, wobei die Reihenfolge
zu berücksichtigen ist.
Zwei geordnete Paare (a, b) und (c, d) sind genau dann gleich, wenn a = c und
b = d.
Die Produktmenge (Paarmenge, kartesisches Produkt, Kreuzprodukt) zweier
Mengen A und B ist die Menge aller geordneten Paare (a, b) mit a ∈ A und b ∈ B.
A × B = {(a, b): a ∈ A und b ∈ B}
Kreuzprodukt von n Mengen:
n
Ai = A1 × A2 × . . . × An = {(a1 , a2 , . . . , an )|ai ∈ Ai
i = 1, 2, . . . , n}
i=1
Die Elemente von
n
Ai = A1 × A2 × . . . × An , d.h. (a1 , a2 , . . . , an ) heißen n-Tupel
i=1
(Paare für n = 2, Tripel für n = 3). Die Reihenfolge der Elemente ist zu berücksichtigen.
n-faches Kreuzprodukt mit sich selbst:
A × A × . . . × A = An
n mal
R × R × . . . × R = Rn
n mal
Rechenregeln für Kreuzprodukte
A × (B ∪ C ) = (A × B) ∪ (A × C )
(A ∪ B) × C = (A × C ) ∪ (B × C )
A × (B ∩ C ) = (A × B) ∩ (A × C )
(A ∩ B) × C = (A × C ) ∩ (B × C )
A × (B \ C ) = (A × B) \ (A × C )
(A \ B) × C = (A × C ) \ (B × C )
(A × B) ∪ (C × D) ⊆ (A ∪ C ) × (B ∪ D)
(A × B) ∩ (C × D) = (A ∩ C ) × (B ∩ D)
A × B = ∅ ⇐⇒ A = ∅ oder B = ∅
A ⊆ C und B ⊆ D ⇒ A × B ⊆ C × D
Kardinalzahl einer Menge
Für eine Menge A mit endlich vielen Elementen heißt die mit n(A) bezeichnete
Anzahl der Elemente in A die Kardinalzahl (Mächtigkeit) von A.
44
3.9 Abbildungen, Relationen
Rechenregeln für Kardinalzahlen
Für A, B ⊆ § mit n(§) < ∞ gilt:
n(A) ≥ 0
n(A) ≤ n(§)
n(∅) = 0
n(A ∪ B) = n(A) + n(B) − n(A ∩ B)
n(§) = k
⇒
n(P(§)) = 2k
n(A ∪ B) = n(A) + n(B) ⇐⇒ A ∩ B = ∅
n(A ∪ B) = n(A \ B) + n(B \ A) + n(A ∩ B)
n(A ∩ B) ≤ n(A)
n(A ∩ B) = n(A) ⇐⇒ B ⊆ A
n(CA) = n(§) − n(A)
n(A \ B) ≤ n(A)
n(CA) + n(A) = n(§)
3
n(A \ B) = n(A) ⇐⇒ A ∩ B = ∅
n(A \ B) = 0 ⇐⇒ A ⊆ B
n(A × B) = n(A) · n(B)
n(An ) = (n(A))n
3.9 Abbildungen, Relationen
Grundlegende Definitionen
Eine Teilmenge des Kreuzprodukts M1 × M2 des Produkts zweier Mengen M1 und
M2 wird als Abbildung A (auch Relation) aus M1 in M2 bezeichnet:
A ⊆ M1 × M2
Dabei ist
DA = {x ∈ M1 |∃ y ∈ M2 : (x, y) ∈ A}
der Definitionsbereich von A,
WA = RA = {y ∈ M2 |∃ x ∈ M1 : (x, y) ∈ A}
der Wertebereich (range) von A und
A−1 = {(y, x)|(x, y) ∈ A}
die Umkehrabbildung oder inverse Abbildung zu A.
Eigenschaften von Abbildungen
A ist eine Abbildung von M1 in M2 , wenn DA = M1 , und eine Abbildung auf M2 ,
wenn WA = M2 ist.
A heißt eindeutig oder eine Funktion, wenn jedem Element x ∈ DA nur ein Element y ∈ WA zugeordnet wird.
A heißt eineindeutig oder umkehrbar eindeutig, wenn A und A−1 eindeutig sind.
Eine eindeutige Abbildung von M1 auf M2 heißt surjektiv.
45
3
SUMMEN, PRODUKTE, LOGIK, MENGEN, ABBILDUNGEN
3
Eine eindeutige Abbildung A heißt injektiv, wenn aus (x1 , y) ∈ A und (x2 , y) ∈ A
folgt, dass x1 = x2 , d.h., wenn jedes Bildelement nur einmal vorkommt, d.h., gleiche Bilder stammen von gleichen Urbildern oder verschiedene Originale liefern
verschiedene Bilder.
Eine Abbildung ist bijektiv, wenn sie injektiv und surjektiv ist, d.h., wenn sie
eine eineindeutige Abbildung von M1 auf M2 ist.
Statt (x, y) ∈ A schreibt man auch: A(x) = y, wobei x das Urbild (Original) und y
das (ein) Bild von x ist.
Binäre Relation, Definition
Eine Abbildung R aus M in M , d.h., eine Teilmenge R ⊆ M × M wird als binäre
Relation auf M bezeichnet und man schreibt:
(x, y) ∈ R ⇐⇒ xRy
(x, y) ∈
/ R ⇐⇒ x Ry
Eigenschaften von binären Relationen
Eine binäre Relation R auf M heißt
reflexiv, wenn xRx für alle x ∈ M
symmetrisch, wenn xRy ⇒ yRx für alle x, y ∈ M
transitiv, wenn xRy ∧ yRz ⇒ xRz für alle x, y, z ∈ M
irreflexiv, wenn x Rx für alle x ∈ M
antisymmetrisch, wenn x = y ∧ xRy ⇒ y Rx
vollständig, wenn x = y ⇒ xRy ∨ yRx
Spezielle Relationen
Eine Relation R auf M heißt eine
46
Äquivalenzrelation, wenn sie reflexiv, symmetrisch und transitiv ist.
Halbordnung, wenn sie reflexiv, antisymmetrisch und transitiv ist.
Verträglichkeitsrelation, wenn sie transitiv und antireflexiv ist.
Quasiordnung, wenn sie transitiv und antireflexiv ist.
Lineare Ordnung, wenn sie vollständig und eine Halbordnung ist.
Herunterladen