Statistische Testtheorie am Beispiel der Untersuchung von Punktfeldern Seminar ”Simulation und Bildanalyse mit Java” Sommersemester 2004 Paul Körbitz & Stephan Ebbeler Universität Ulm Stephan Ebbeler & Paul Körbitz – p.1/85 Übersicht Grundlagen aus der Wahrscheinlichkeitsrechnung Stephan Ebbeler & Paul Körbitz – p.2/85 Übersicht Grundlagen aus der Wahrscheinlichkeitsrechnung Univariate Punktprozesse Stephan Ebbeler & Paul Körbitz – p.2/85 Übersicht Grundlagen aus der Wahrscheinlichkeitsrechnung Univariate Punktprozesse Tests für univariate Punktprozesse Stephan Ebbeler & Paul Körbitz – p.2/85 Übersicht Grundlagen aus der Wahrscheinlichkeitsrechnung Univariate Punktprozesse Tests für univariate Punktprozesse Multivariate Punktprozesse Stephan Ebbeler & Paul Körbitz – p.2/85 Übersicht Grundlagen aus der Wahrscheinlichkeitsrechnung Univariate Punktprozesse Tests für univariate Punktprozesse Multivariate Punktprozesse Tests für multivariate Punktprozesse Stephan Ebbeler & Paul Körbitz – p.2/85 Grundlagen Wichtige Verteilungen mit zugehöriger Dichtefunktion Normalverteilung (x−µ) 1 √ fX (x)= exp(− 2σ2 2πσ 2 mit Parametern µ ∈ 2 ) für x ∈ und σ 2 >0 Stephan Ebbeler & Paul Körbitz – p.3/85 Grundlagen Wichtige Verteilungen mit zugehöriger Dichtefunktion Normalverteilung (x−µ) 1 √ fX (x)= exp(− 2σ2 2πσ 2 fX (x) = ) für x ∈ und σ 2 >0 ( λx −λ exp x! 0 , , x∈ sonst mit Parametern µ ∈ Poissonverteilung 2 mit Parameter λ > 0 Stephan Ebbeler & Paul Körbitz – p.3/85 Gleichverteilung 1 , falls a ≤ x ≤ b fX (x) = b−a 0 , sonst mit Parametern a, b ∈ , wobei a < b Stephan Ebbeler & Paul Körbitz – p.4/85 Übersicht Grundlagen aus der Wahrscheinlichkeitsrechnung Univariate Punktprozesse Tests für univariate Punktprozesse Multivariate Punktprozesse Tests für multivariate Punktprozesse Stephan Ebbeler & Paul Körbitz – p.5/85 Übersicht Grundlagen aus der Wahrscheinlichkeitsrechnung Univariate Punkfelder Definition Punktfeld Eigenschaften: Stationarität, Isotropie Beispiel: homogene Poissonfelder Palmsche Verteilung Intensitätsmaß & Leerwahrscheinlichkeit Charakteristische Funktionen (D-, J -Funktionen) Schätzer und Tests für univariate Punkfelder Multivariate Punktfelder Schätzer und Tests für multivariate Punktfelder Stephan Ebbeler & Paul Körbitz – p.6/85 Definition Punktfeld Definition Punktfeld Unter einem zufälligen Punktfeld Φ = {X1 , X2 , ...} im 2 versteht man eine Menge zufälliger Punkte Xi in der Ebene, d.h. Φ = {Xn }n∈ . Ein Punktmuster ist dann ein Ausschnitt aus einer Realisierung eines zufälligen Punktfeld, d.h., ϕ = {x1 , ..., xn } mit n ∈ . Stephan Ebbeler & Paul Körbitz – p.7/85 Eigenschaften von Punktfeldern (1) Definition Stationarität Ein Punktfeld Φ, oder seine Verteilung PΦ , heißt stationär, wenn Φ = {Xn } und Φx = {Xn + x} für alle x ∈ 2 die gleiche Verteilung haben. Also (Φ ∈ Y ) = (Φx ∈ Y ) ∀Y Dabei ist Φx eine Translation (oder eine Verschiebung) um den Vektor x, und Y eine Menge von Realisierungen. Stephan Ebbeler & Paul Körbitz – p.8/85 Eigenschaften von Punktfeldern (2) Definition Isotropie Ein Punktfeld Φ heißt isotrop, wenn Φ und rΦ für jede Rotation r um den Ursprung die gleiche Verteilung haben. Also Φ (Y ) = rΦ (rY ) ∀Y wobei rY eine Rotation aller Punkte der Mengen aus Y um r und Y eine Menge von Realisierungen ist. Definition Bewegungsinvarianz Ein Punktfeld Φ das sowohl stationär als auch isotrop ist, heißt bewegungsinvariant. Stephan Ebbeler & Paul Körbitz – p.9/85 homogene Poissonfelder Ein stationäres Poissonpunktfeld wird durch zwei Eigenschaften definiert: 1. Seien k paarweise disjunkte und beschränkte Borelmengen B1 , . . . , Bk gegeben. Dann sind die Zufallsvariablen Φ(B1 ), . . . , Φ(Bk ) unabhängig. 2. Die Anzahl der Punkte in einer belieigen beschränkten Borelmenge unterliegt einer Poissonverteilung mit dem Parameter λν(B). Die Verteilung von Φ(B) lautet somit: (λν(B))k −λν(B) e (Φ(B) = k) = k! (ν(B) < ∞, k = 0, 1, . . .) Stephan Ebbeler & Paul Körbitz – p.10/85 Abbildung homogenes Poissonfeld Poissonfelder sind ein sehr nützliches Modell, da sie die Annahme einer völlig zufälligen Verteilung der Punkte widerspiegeln. Stephan Ebbeler & Paul Körbitz – p.11/85 Intensitätsmaß Ist Φ ein Punktfeld, so heißt Λ mit Z Λ(B) = (Φ(B)) = ϕ(B)PΦ (dϕ) (B ∈ B( 2 )) das Intensitätsmaß von Φ. Das Intensitätsmaß Λ(B) steht für die erwartete Anzahl der Punkte in einer Borelmenge B . Ist das Punkfeld stationär, so ergibt sich die Darstellung: Λ(B) = λν(B) (0 ≤ λ ≤ ∞) wobei ν(B) das Lebesgue-Maß von B ist, und λ = (Φ([0, 1]2 )) die Intensität von Φ ist. Diese gibt gerade die erwartete Anzahl der Punkte pro Flächeneinheit an. Stephan Ebbeler & Paul Körbitz – p.12/85 Leerwahrscheinlichkeit Definition Leerwahrscheinlichkeit Für ein zufälliges Punktfeld Φ und eine kompakte Borelmenge B wird die Wahrscheinlichkeit θB = (Φ(B) = 0) (B ∈ B( 2 ) Leerwahrscheinlichkeit genannt. Diese gibt die Wahrscheinlichkeit an, dass in einer vorgegebenen Menge B kein einziger Punkt liegt. Stephan Ebbeler & Paul Körbitz – p.13/85 Kontaktverteilungsfunktion Definition Kontaktverteilungsfunktion Sei Φ ein zufälliges Punktfeld und B eine kompakte Borelmenge, so dass der Ursprung o in B liegt und das Legesgue-Maß ν(B) > 0 ist. Sei rB eine Ausdehnung von B um den Faktor r, d.h. rB = {rx : x ∈ B}, r ∈ R. So nennt man die Funktion HB : → [0, 1] mit HB (r) = 1 − (Φ(rB) = 0) (r ≥ 0) die Kontaktverteilungsfunktion von Φ bezüglich des strukturierenden Elementes B. Stephan Ebbeler & Paul Körbitz – p.14/85 Kontaktverteilungsfunktion (2) Ist B der Einheitskreis um den Ursprung (B = (b(o, 1)) und Φ ∈ 2 so heißt HS (r) = 1 − (Φ(b(o, r)) = 0) (r ≥ 0) die sphärischen Kontaktverteilungsfunktion. Stephan Ebbeler & Paul Körbitz – p.15/85 Berechnungen für Poissonfelder Für die m-dimensionale Verteilung paarweise disjunkter Bj mit ν(Bj ) < ∞ ergibt sich: (Φ(B1 ) = k1 , · · · , Φ(Bm ) = km ) (λν(Bm ))km (λν(B1 ))k1 ··· exp −λ = k1 ! km ! (k1 , . . . , km ≥ 0) m X i=1 ν(Bi ) ! Für das Intensitätsmaß ergibt sich entsprechend: Λ(B) = (Φ(B)) = λν(B) Stephan Ebbeler & Paul Körbitz – p.16/85 Berechnungen für Poissonfelder (2) Die Leerwahrscheinlichkeit ist (Φ(B) = 0) = e−λν(B) Für die sphärische Kontaktverteilungsfuntion gilt HS (r) = 1 − e −λπr2 (r ≥ 0) Stephan Ebbeler & Paul Körbitz – p.17/85 Palmsche Verteilung (1) Motivation Bei der Analyse von Punktfeldern ist es häufig wichtig, einen ”typischen” Punkt aus einem Punktfeld Φ zu betrachten. Intuitiv ist klar, was damit gemeint ist: Ein Punkt des Punktfeldes, der Ergebnis einer zufälligen Auswahl ist, d.h. jeder Punkt wird mit gleicher Wahrscheinlichkeit ausgewählt. Um dies mathematisch präzise definieren zu können benötigt man die Palmsche Verteilung. Zunächst soll folgende Bezeichnung eingeführt werden: (Φ ∈ Y k x) = (Φ ∈ Y |x ∈ Φ), wobei x ∈ 2 gilt und Y eine Menge von Realisierungen ist. Stephan Ebbeler & Paul Körbitz – p.18/85 Palmsche Verteilung (2) Motivation (2) Deutung: bedingte Wahrscheinlichkeit, dass in x ∈ 2 ein Ereignis stattfindet Stationäres Punktfeld: x = o Ohne weitere Anforderungen Bedingung sinnlos Bei stationärem Punktfeld Verschiebung, so dass ein xi ∈ Φ im Ursprung liegt Stephan Ebbeler & Paul Körbitz – p.19/85 Palmsche Verteilung (3) Definition Palmsche Verteilung Sei Φ ein stationäres Punktfeld mit der Intensität λ (0 < λ < ∞). Die Palmsche Verteilung Po (in o) für PΦ ist folgendermaßen definiert: Z X 1 Po (Y ) = 1Y (ϕ − x)PΦ (dϕ) λν(B) x∈ϕ∩B mit einer beliebigen beschränkten Borelmenge B mit ν(B) > 0 und mit ϕ − x = {xn − x}, wenn ϕ = {xn } Stephan Ebbeler & Paul Körbitz – p.20/85 reduzierte Palmsche Verteilung Die reduzierte Palmsche Verteilung entspricht der Palmschen Verteilung ohne Berücksichtigung des Ereignis im Ursprung: Po! (Y ) = (Φ \ {o} ∈ Y ko) Analog zur Definition der Palmschen Verteilung gilt daher: Z X 1 ! Po (Y ) = 1Y ((ϕ − x) \ {o})PΦ (dϕ) λν(B) x∈ϕ∩B Stephan Ebbeler & Paul Körbitz – p.21/85 D-Funktion und J-Funktion Sei Φ ein stationäres Punktfeld mit Intensität λ ∈ (0, ∞). Definition D-Funktion Die Funktion D : [0, ∞) → [0, 1] mit D(r) = Po (ϕ ∩ b(o, r) \ {o} 6= ∅) (r ≥ 0) heißt die Nächste-Nachbar-Abstands-Verteilungsfunktion. Definition J -Funktion Die Funktion J : [0, ∞) → [0, ∞) wird folgendermaßen definiert: 1 − D(r) J(r) = 1 − HS (r) (r ≥ 0, HS (r) < 1) Stephan Ebbeler & Paul Körbitz – p.22/85 Berechnungen für Poissonfelder (3) Es gilt D(r) = HS (r) und daher J(r) ≡ 1 (r ≥ 0) Stephan Ebbeler & Paul Körbitz – p.23/85 Übersicht Grundlagen Univariate Punkfelder Definition Punktfeld Eigenschaften: Stationarität, Isotropie Beispiel: homogene Poissonfelder Palmsche Verteilung Intensitätsmaß & Leerwahrscheinlichkeit Charakteristische Funktionen (D-, J -Funktionen) Schätzer und Tests für univariate Punkfelder Multivariate Punktfelder Schätzer und Tests für multivariate Punktfelder Stephan Ebbeler & Paul Körbitz – p.24/85 Übersicht Grundlagen Univariate Punkfelder Schätzer und Tests für univariate Punkfelder Schätzung bei Punktfeldern Grundlegende Tests Tests auf Strukturlosigkeit Modelltests bei Punktfeldern Multivariate Punktfelder Schätzer und Tests für multivariate Punktfelder Stephan Ebbeler & Paul Körbitz – p.25/85 Schätzung bei Punktfeldern Randeffekte Durch das Arbeiten mit Punktmustern in einem beschränkten Beobachtungsfenster W ergeben sich Probleme mit Randeffekten. Um diese Probleme zu vermeiden gibt es zwei verschiedene Methoden: Plus-Sampling Minus-Sampling Stephan Ebbeler & Paul Körbitz – p.26/85 Schätzung bei Punktfeldern Stephan Ebbeler & Paul Körbitz – p.27/85 Schätzung bei Punktfeldern Schätzung der Intensität Die Untersuchung der Punktintensität (d.h. die erwartete Anzahl der Punkte pro Flächeneinheit) steht gewöhnlich am Anfang der statistischen Untersuchung eines Punktfeldes. Ein Schätzer für die Intensität ist gegeben durch: n Anzahl der beobachteten Punkte = λ̂ = Fläche des Untersuchungsgebietes |W | Dieser Schätzer ist erwartungstreu, es gilt nämlich: λ|W | Φ(W ) Φ(W ) = =λ λ̂ = = |W | |W | |W | Stephan Ebbeler & Paul Körbitz – p.28/85 Schätzung bei Punktfeldern Schätzung der sphärischen Kontaktverteilungsfunktion Die sphärische Kontaktverteilungsfunktion gibt die Wahrscheinlichkeit an, dass mindestens ein Punkt in dem Kreis um den Punkt y mit Radius r liegt. Der Ansatz, das Verhältnis der Fläche aller Punkte y ∈ Φ, die einen Abstand kleiner gleich r haben und der Fläche von ganz W zu bilden, liefert einen ersten Schätzer. Um die erwähnten Randeffekte zu vermeiden, kann man diesen Schätzer beispielsweise durch Minus-Sampeling korrigieren. Man erhält dann folgenden Schätzer: S (W b(o, r)) ∩ x∈Φ b(x, r) ĤS (r) = , (r ≥ 0) |W b(o, r)| Stephan Ebbeler & Paul Körbitz – p.29/85 Schätzung bei Punktfeldern Schätzung der Nächsten-Nachbar-Abstands-Verteilungsfunktion Naheliegendes Verfahren: bei einem gegebenen Punktmuster ϕ = {x1 , . . . , xn } die Nächsten-Nachbar-Abstände (δ(x1 ), . . . , δ(xn )) berechnen und daraus eine empirische Verteilungsfunktion bilden. Man erhält den Schätzer n X 1 D̂(r) = n i=1 [0,r) (δ(xi )), (r ≥ 0). Problem: bei kleinen Beobachtungsfenstern W treten starke Randeffekte auf. Stephan Ebbeler & Paul Körbitz – p.30/85 Schätzung bei Punktfeldern Schätzung der Nächsten-Nachbar-Abstands-Verteilungsfunktion Um die o.g. Randeffekte auszugleichen wird in der Literatur der Schätzer D̂ = DλHH(r) empfohlen, wobei DH (r) = X W b(o,s) (x) (0,r] (s) [x;s] |W b(o, s)| und λ̂H = X [x;s] W b(o,s) (x) |W b(o, s)| Die Summation läuft über alle markierten Punktpaare [x; s] von Φ, wobei s(x) der Abstand von x zu seinem nächsten Nachbarn ist. Stephan Ebbeler & Paul Körbitz – p.31/85 Schätzung bei Punktfeldern Schätzung der J -Funktion Einen Schätzer für die J -Funktion erhält man, indem man die Schätzer für die sphärische Kontaktverteilungsfunktion Ĥs (r) und für die Nächste-Nachbar-Abstands-Verteilungsfunktion D̂(r) benutzt. Es ergibt sich daher 1 − ĤS (r) ˆ J(r) = 1 − D̂(r) Stephan Ebbeler & Paul Körbitz – p.32/85 Grundlegende Tests χ2 -Anpassungstest Mit diesem Test können zwei Arten von Hypothesen geprüft werden: 1. H0 : F = F0 vs. H1 : F 6= F0 . Dabei ist F0 eine hypothesische, fest vorgegebene Verteilungsfunktion. 2. H0 : F ∈ D0 vs. H1 : F 6∈ D0 . Dabei ist D0 eine Klasse von Verteilungsfunkitionen, deren Elemente mittels Parameter θ1 , . . . , θm eindeutig festgelegt werden. Im zweiten Fall kann getestet werden, ob eine Zufallsvariable normalverteilt, exponentialverteilt, usw. ist. Dabei werden die benötigten Parameter aus der Stichprobe geschätzt. Stephan Ebbeler & Paul Körbitz – p.33/85 Grundlegende Tests Ablauf des χ2 -Anpassungstest 1. Zerlegung der Wertemenge in r ≥ 2 disjunkte Intervalle: A1 = (−∞; z1 ], A2 = (z1 ; z2 ], . . . , Ar = (zr−1 ; ∞) mit z1 < z2 < . . . < zr , i = 1, . . . , r 2. Bestimmung der Anzahl der Stichprobenwerte hi , die in der Klasse Ai liegen 3. Berechnung der hypothesischen Klassenwahrscheinlichkeiten (X ∈ Ai ) = pi , i = 1, . . . , r für die Zufallsvariable X mit Verteilungsfunktion F0 r P (hi −npi )2 4. Berechnung der Testgröße T = npi i=1 Stephan Ebbeler & Paul Körbitz – p.34/85 Grundlegende Tests Ablauf des χ2 -Anpassungstest 5. Bestimmung des (1 − α)-Quantils der χ2 -Verteilung mit r − 1 − m Freiheitsgeraden. Dabei ist m die Anzahl der geschätzten Parameter 6. Ablehnung von H0 , falls T > χ2r−m−1;1−α √ Die Anzahl der Klassen r soll ungefähr n betragen. Stephan Ebbeler & Paul Körbitz – p.35/85 Tests auf Strukturlosigkeit Bei diesen Tests wird die Hypothese H0 : Φ ist ein homogenes Poissonfeld gegen H1 : Φ ist kein homogenes Poissonfeld getestet. Ein solcher Test ist die sogenannte Quadratzählmethode Bei dieser Methode geht man folgendermaßen vor: 1. Systematische Einteilung des Beobachtungsfensters W in k Gebiete mit gleich großer Fläche (z.B. Rechtecke) 2. Bestimmung der Anzahl der Punkte νi , i = 1, . . . , k in jedem Gebiet (k−1)s2ν , ν wobei sν die 3. Berechnung des Dispersionsindex I = Stichprobenstreuung der Punktanzahl in den Teilgebieten, n die Gesamtanzahl der Punkte und ν = nk = mittlere Punktanzahl je Teilgebiet ist Stephan Ebbeler & Paul Körbitz – p.36/85 Tests auf Strukturlosigkeit Quadratzählmethode 4. Ablehnung der Nullhypothese, falls I < χ2k−m−1, α bzw. 2 I > χ2k−1−m,1− α . m gibt die Anzahl der geschätzten 2 Parameter an Im ersten Ablehnungsfall hat man mit Clusterbildung zu rechnen, im zweiten Fall kann man annehmen, dass eine stärkere Regelmäßigkeit vorliegt, als das bei einem Poissonprozess typisch ist. Stephan Ebbeler & Paul Körbitz – p.37/85 Tests auf Strukturlosigkeit Quadratzählmethode Die Quadratzählmethode kann als χ2 -Anpassungstest interpretiert werden. Dazu werden die k Teilgebiete als k Klassen aufgefasst und die Nullhypothese der Gleichverteilung geprüft. Die Testgröße lautet dann: T = k X (νi − nk )2 i=1 n k = (k − 1)s2ν n k s2ν = (k − 1) = I ν Sowohl der χ2 -Anpassungstest als auch die Quadratzählmethode sind asymptotische Tests, d.h. die Testgrößen T bzw. I sind nur für genügend große Stichproben näherungsweise χ2 verteilt. Stephan Ebbeler & Paul Körbitz – p.38/85 Tests auf Strukturlosigkeit Graphisches Verfahren bei homogenem Poissonfeld J(r) ≡ 1 Berechnung der J -Funktion der Daten aus Beobachtungsfenster W Verlauf des Graphen Indiz für Modelltyp Bei starken Abweichungen zur Geraden y = 1 Hypothese der Strukturlosigkeit verwerfen Ein Verlauf der berechneten J -Funktion oberhalb von y = 1 deutet auf einen Clusterprozess hin Keine statistische Tests im klassischen Sinne! Stephan Ebbeler & Paul Körbitz – p.39/85 Modelltests für Punktprozesse Mit den folgenden Verfahren können Nullhypothesen der Art H0 : das Punktfeld entspricht einem bestimmten Modell gegen die Alternativhypothese H1 : das Punktfeld entspricht nicht dem bestimmten Modell getestet werden. Monte-Carlo-Test Bei diesem Test wird das hypothetisch zugrundeliegende Punktfeld simuliert. Aus diesen simulierten Daten muss anschliessend eine Kenngröße ∆ gebildet werden, die die Abweichung gewisser empirischer Charakteristiken einer Realisierung des Punktprozesses von den entsprechenden Modellcharakteristiken beschreibt (bspw. D- oder J -Funktion). Stephan Ebbeler & Paul Körbitz – p.40/85 Modelltests für Punktprozesse Monte-Carlo-Test Konkret geht man bei diesem Test folgendermaßen vor: ˆ der Kenngröße ∆ 1. Bestimmung des empirischen Werts ∆ für das zu analysierende Beobachtungsfenster W , z.B. ˆ = ∆ rX max i=0 (D̂(ri ) − D(ri ))2 , Hierbei ist D die theoretische (vorliegende) Nächste-Nachbar-Abstands-Verteilungsfunktion für das zu testende Modell Stephan Ebbeler & Paul Körbitz – p.41/85 Modelltests für Punktprozesse Monte-Carlo-Test 2. Simulation von k unabhängigen Punktmustern in W nach dem vorgegebenen Punktmodell. Die Anzahl der Simulationen k hängt von dem gewünschten Signifikanzniveau des Tests ab 3. Bestimmung der Kenngrößen ∆1 , . . . , ∆k für die simulierten Punktfelder ˆ ∆ 1 , . . . , ∆k 4. Bilden der Ordnungstatistik von ∆, 5. Ablehnen der Nullhypothese, falls ˆ ∈ [(k − kα + 1), k + 1] gilt. Dabei ist kα bestimmt ∆ kα durch α = k+1 Stephan Ebbeler & Paul Körbitz – p.42/85 Modelltests für Punktprozesse Probleme des Monte-Carlo-Test Nullhypothese wird erst nach Datenanalyse aufgestellt Wahl der Modellparameter, so dass sie zu den Daten passen Monte-Carlo-Test wird hypothesenfreundlicher! Wahrscheinlichkeit für Fehler 1. Art < α Ähnliche Probleme bei anderen Tests, z.B. Kolmogorov-Smirnov Stephan Ebbeler & Paul Körbitz – p.43/85 Anwendung der Quadratzählmethode (1) Man möchte die Hypothese H0 : Es liegt ein homogenes Poissonfeld vor testen. Dazu zerlegt man das Beobachtungsfenster in 100 Gebiete gleich großer Fläche. Stephan Ebbeler & Paul Körbitz – p.44/85 Anwendung der Quadratzählmethode (2) Auswertung des Bildes Eine Zählung der Punkte in jedem Feld ergibt folgende Häufigkeiten: Punkte pro Feld Anzahl Felder 0 45 1 33 2 15 3 7 Für den Dipsersionsindex ergibt sich: I= (k−1)s2ν ν̄ = 85,44 84 100 = 101.71429 Stephan Ebbeler & Paul Körbitz – p.45/85 Anwendung der Quadratzählmethode (3) Die führt zu folgenden Testentscheidungen: I α −1 2 χ99, α 2 101.71 101.71 101.71 0.1 0.05 0.01 77.05 73.36 66.51 −1 2 χ99,1− α 2 Entscheidung 123.23 128.42 138.99 H0 nicht ablehnen H0 nicht ablehnen H0 nicht ablehnen Die Hypothese H0 : Es liegt ein homogenes Poissonfeld vor kann also für keines der gewählten Signifikanzniveaus abgelehnt werden. Stephan Ebbeler & Paul Körbitz – p.46/85 Übersicht Grundlagen Univariate Punkfelder Schätzer und Tests für univariate Punkfelder Schätzung bei Punktfeldern Grundlegende Tests Tests auf Strukturlosigkeit Modelltests bei Punktfeldern Multivariate Punktfelder Schätzer und Tests für multivariate Punktfelder Stephan Ebbeler & Paul Körbitz – p.47/85 Übersicht Grundlagen aus der Wahrscheinlichkeitsrechnung Univariate Punktprozesse Tests für univariate Punktprozesse Multivariate Punktprozesse Definition Multivariates Punktfeld Eigenschaften Charakteristische Funktionen (D-,J-Funktionen) Tests für multivariate Punktprozesse Stephan Ebbeler & Paul Körbitz – p.48/85 Einleitung Als Modell wird ein multivariates Punktfeld benutzt, falls einzelne Ereignisse innerhalb eines Untersuchungsgebietes zu mehreren verschiedenen Typen gehören. Stephan Ebbeler & Paul Körbitz – p.49/85 Beispiel Bei einem Baummischbestand liegen Punktmuster aus verschiedenen Wurzelarten vor. Sind in einem zu untersuchenden Bestand ausschließlich Buchen und Fichten anzutreffen, so dient als Modell zur Analyse, ein bivariates Punktfeld. Die Punkte gehören dann entweder zum Typ B und somit zum Punktfeld ΦB oder zum Typ F und Punktfeld ΦF . Stephan Ebbeler & Paul Körbitz – p.50/85 Bivariates Punktfeld Beispielfenster für Mischbestand: Fichten (blau) und Buchen (rot) Stephan Ebbeler & Paul Körbitz – p.51/85 Multivariate Punktfelder Definition Sei M = 1, ..., m die Menge der Typen oder der Markierungen. Ψ = (Φ1 , ..., Φm ) ist ein m-Tupel aus Punktfeldern Φj ∈ d , wobei Φj nur aus Punkten des j-ten Typs besteht. Ψ heißt ein multivariates Punktfeld und die univariaten Punktfelder Φj mit 1 ≤ j ≤ m nennt man die Komponenten von Ψ. Stephan Ebbeler & Paul Körbitz – p.52/85 Eigenschaften 1. Ein multivariates Punktfeld Ψ ist stationär genau dann, wenn alle Komponenten von Ψ stationäre Punktfelder sind Stephan Ebbeler & Paul Körbitz – p.53/85 Eigenschaften 1. Ein multivariates Punktfeld Ψ ist stationär genau dann, wenn alle Komponenten von Ψ stationäre Punktfelder sind 2. Ein multivariates Punktfeld Ψ ist isotrop genau dann, wenn alle Komponenten von Ψ isotrope Punktfelder sind Stephan Ebbeler & Paul Körbitz – p.53/85 Eigenschaften 1. Ein multivariates Punktfeld Ψ ist stationär genau dann, wenn alle Komponenten von Ψ stationäre Punktfelder sind 2. Ein multivariates Punktfeld Ψ ist isotrop genau dann, wenn alle Komponenten von Ψ isotrope Punktfelder sind 3. Ein multivariates Punktfeld Ψ ist bewegungsinvariant genau dann, wenn alle Komponenten von Ψ bewegungsinvariante Punktfelder sind Stephan Ebbeler & Paul Körbitz – p.53/85 Eigenschaften Eigenschaften von stationären Punktfeldern 1. Intensität von Φj : λj = (Φj ([0, 1]d )) 2. Gesamtintensität des Punktfeldes Φ• = λ• = m P n S Φj : j=1 λj j=1 Stephan Ebbeler & Paul Körbitz – p.54/85 Sphärische Kontaktverteilungsfunktion HSi (r) = 1 − (Φi (b(0, r)) = 0) HS• (r) = 1 − (Φ• (b(0, r)) = 0) Stephan Ebbeler & Paul Körbitz – p.55/85 Sphärische Kontaktverteilungsfunktion HSi (r) = 1 − (Φi (b(0, r)) = 0) HS• (r) = 1 − (Φ• (b(0, r)) = 0) Multivariate D -Funktionen Dij (r) = P(◦,i) (ϕj ∩ b(0, r) \ {◦} 6= ∅) ist die Nächste-Nachbar-Abstands-Verteilungsfunktion von den Punkten des Types i zu den nächsten Punkten des Types j Stephan Ebbeler & Paul Körbitz – p.55/85 Sphärische Kontaktverteilungsfunktion HSi (r) = 1 − (Φi (b(0, r)) = 0) HS• (r) = 1 − (Φ• (b(0, r)) = 0) Multivariate D -Funktionen Dij (r) = P(◦,i) (ϕj ∩ b(0, r) \ {◦} 6= ∅) ist die Nächste-Nachbar-Abstands-Verteilungsfunktion von den Punkten des Types i zu den nächsten Punkten des Types j Multivariate J -Funktionen 1 − Dij (r) Jij (r) = 1 − HSj (r) (HSj (r) < 1, ∀ r ≥ 0) Stephan Ebbeler & Paul Körbitz – p.55/85 Übersicht Grundlagen aus der Wahrscheinlichkeitsrechnung Univariate Punktprozesse Tests für univariate Punktprozesse Multivariate Punktprozesse Definition Multivariates Punktfeld Eigenschaften Charakteristische Funktionen (D-, J-Funktionen) Tests für multivariate Punktprozesse Stephan Ebbeler & Paul Körbitz – p.56/85 Übersicht Grundlagen aus der Wahrscheinlichkeitsrechnung Univariate Punktprozesse Tests für univariate Punktprozesse Multivariate Punktprozesse Tests für multivariate Punktprozesse Vier-Feld-Methode Kendalls τ Unabhängigkeitstest mit Hilfe der J-Funktion Stephan Ebbeler & Paul Körbitz – p.57/85 Vier-Feld-Methode Test basiert auf dem χ2 -Unabhängigkeitstest 1. Beobachtungsfenster wird in n gleich großen Rechtecke zerlegt 2. Ermittlung folgender Kennzahlen : a = Anzahl der Rechtecke, in denen gar keine Punkte liegen b = Anzahl der Rechtecke, in denen nur die Punkte des 1.Types liegen c = Anzahl der Rechtecke, in denen nur die Punkte des 2.Types liegen d = Anzahl der Rechtecke, in denen Punkte beider Typen liegen Stephan Ebbeler & Paul Körbitz – p.58/85 Vier-Feld-Methode 3. Die Daten werden in einer 2 x 2 - Tabelle notiert : Type I abwesend präsent Summe abwesend a b a+b Type II präsent c d c+d Summe a+c b+d n 4. Teststatistik: T = n(|ad−bc|− 12 n)2 (a+b)(c+d)(a+c)(b+d) 5. Als Approximation für die Verteilung von T wird die χ2 -Verteilung mit einem Freiheitsgrad genommen Stephan Ebbeler & Paul Körbitz – p.59/85 Vier-Feld-Methode 6. Für T > χ21,1−α wird die Nullhypothese der Unabhängigkeit der beiden Typen abgelehnt Stephan Ebbeler & Paul Körbitz – p.60/85 Beispiel zur Vier-Feld-Methode Beispielfenster für Mischbestand: Fichten (blau) und Buchen (rot) Stephan Ebbeler & Paul Körbitz – p.61/85 Beispiel zur Vier-Feld-Methode Mischbestand von Fichten und Buchen mit 10x10 Rechtecken Stephan Ebbeler & Paul Körbitz – p.62/85 Beispiel zur Vier-Feld-Methode Daten in der 2 x 2 Tabelle für n=100 Type I abwesend präsent Summe abwesend 69 9 78 Type II präsent 19 3 22 Summe 88 12 100 Stephan Ebbeler & Paul Körbitz – p.63/85 Beispiel zur Vier-Feld-Methode Teststatistik: T = 100(|207−171|− 21 100)2 78∗22∗88∗12 α χ21,1−α 0,10 2,706 0,05 3,481 0,01 6,635 = 0.01082 Nullhypothese nicht abgelehnt nicht abgelehnt nicht abgelehnt Stephan Ebbeler & Paul Körbitz – p.64/85 Kendalls τ Idee: Untersuchung der Abstände zwischen den Punkten einer beliebigen Menge M und ihren nahest liegenden Punkten aus Φ1 und Φ2 . Ableitung der Unabhängigkeit der Komponenten aus der Unabhängigkeit dieser Abstände. Vorgehen: M kann aus n Gitterpunkte bestehen. 1. Zu jedem Punkt bestimmt man die Abstände a1 , ..., an zu den nächstliegenden Punkten von Φ1 und die kleinsten Abstände b1 , ...bn zu den Punkten von Φ2 . Als Ergebnis erhält man n Tupel. Stephan Ebbeler & Paul Körbitz – p.65/85 Kendalls τ 2. Gilt ai > aj und bi > bj , so heißt diese Tupelpaar ai −aj j konkordant, und es gilt abii −a > 0 ( n ). Falls c −bj bi −bj < 0 so heißt das Tupelpaar diskordant (nd ). Gilt ai = aj oder bi = bj , so wird das Paar als Bindung bezeichnet (nb ). nc + nd + nb = 12 n(n − 1) 3. Kendalls Korrelationskoeffizient τ : τ= nc −nd 1 n(n−1) 2 4. Falls gilt: τ = 1 (τ = −1) sind die Abstände positiv (negativ) korreliert. Im Falle der Unabhängigkeit ist der τ -Wert sehr nahe bei Null (d.h. Anzahl der konkordanten Paare ist fast gleich der Anzahl der diskordanten Paare ) Stephan Ebbeler & Paul Körbitz – p.66/85 Kendalls τ 5. Teststatistik : T = n c − nd 6. Die Quantile w1−α von T werden mit den Quantilen z1−α der Standard-Normalverteilung berechnet: q n(n−1)(2n+5) w1−α ∼ (n > 60) und = z1−α 18 wα = −w1−α 7. Nullhypothese wird nicht abgelehnt, falls −wα/2 ≤ T ≤ w1−α/2 Stephan Ebbeler & Paul Körbitz – p.67/85 J−Funktion Sind die Komponenten eines bivariaten Punktfeldes unabhängig, so gilt: J12 (r) ≡ 1 Die J−Funktion nimmt den Wert 1 an, wenn keine Beziehungen zwischen Φ1 und Φ2 vorliegt. (Beachte: Die Umkehrung gilt nicht) Stephan Ebbeler & Paul Körbitz – p.68/85 J−Funktion Sind die Komponenten eines bivariaten Punktfeldes unabhängig, so gilt: J12 (r) ≡ 1 Die J−Funktion nimmt den Wert 1 an, wenn keine Beziehungen zwischen Φ1 und Φ2 vorliegt. (Beachte: Die Umkehrung gilt nicht) J12 (r) > 1 : Negativer Einfluss auf das Auftreten von Punkten von Φ2 durch Punkte von Φ1 Stephan Ebbeler & Paul Körbitz – p.68/85 J−Funktion Sind die Komponenten eines bivariaten Punktfeldes unabhängig, so gilt: J12 (r) ≡ 1 Die J−Funktion nimmt den Wert 1 an, wenn keine Beziehungen zwischen Φ1 und Φ2 vorliegt. (Beachte: Die Umkehrung gilt nicht) J12 (r) > 1 : Negativer Einfluss auf das Auftreten von Punkten von Φ2 durch Punkte von Φ1 J12 (r) < 1 : Anziehung der Punkte beider Typen zueinander Stephan Ebbeler & Paul Körbitz – p.68/85 Literatur D.Stoyan, H.Stoyan: Fractals,Random Shapes and Point Fields. Methods of Geometrical Statistics, J. Wiley & Sons, Chichester, 1994 D.Stoyan, W.S. Kendall, J.Mecke: Stochastic Geometry and its Applications, J. Wiley & Sons, Chichester, 1995 S.Eckel, Statistische Analyse der Nachbarschaftsbeziehungen von Baumwurzeln anhand vorliegender Verteilungsmuster, Wissenschaftliche Arbeit, Universität Ulm, 2003 V. Idt: Geostatistische Analyse der Wurzelverteilung eines Mischbestands von Buche und Fichte, Wissenschaftliche Arbeit, Universität Ulm, 2004 Stephan Ebbeler & Paul Körbitz – p.69/85