Übersicht - Universität Ulm

Werbung
Statistische Testtheorie am Beispiel
der Untersuchung von Punktfeldern
Seminar
”Simulation und Bildanalyse mit Java”
Sommersemester 2004
Paul Körbitz & Stephan Ebbeler
Universität Ulm
Stephan Ebbeler & Paul Körbitz – p.1/85
Übersicht
Grundlagen aus der Wahrscheinlichkeitsrechnung
Stephan Ebbeler & Paul Körbitz – p.2/85
Übersicht
Grundlagen aus der Wahrscheinlichkeitsrechnung
Univariate Punktprozesse
Stephan Ebbeler & Paul Körbitz – p.2/85
Übersicht
Grundlagen aus der Wahrscheinlichkeitsrechnung
Univariate Punktprozesse
Tests für univariate Punktprozesse
Stephan Ebbeler & Paul Körbitz – p.2/85
Übersicht
Grundlagen aus der Wahrscheinlichkeitsrechnung
Univariate Punktprozesse
Tests für univariate Punktprozesse
Multivariate Punktprozesse
Stephan Ebbeler & Paul Körbitz – p.2/85
Übersicht
Grundlagen aus der Wahrscheinlichkeitsrechnung
Univariate Punktprozesse
Tests für univariate Punktprozesse
Multivariate Punktprozesse
Tests für multivariate Punktprozesse
Stephan Ebbeler & Paul Körbitz – p.2/85
Grundlagen
Wichtige Verteilungen mit zugehöriger Dichtefunktion
Normalverteilung
(x−µ)
1
√
fX (x)=
exp(− 2σ2
2πσ 2
mit Parametern µ ∈
2
) für x ∈
und σ 2 >0
Stephan Ebbeler & Paul Körbitz – p.3/85
Grundlagen
Wichtige Verteilungen mit zugehöriger Dichtefunktion
Normalverteilung
(x−µ)
1
√
fX (x)=
exp(− 2σ2
2πσ 2
fX (x) =
) für x ∈
und σ 2 >0
(
λx
−λ
exp
x!
0
,
,
x∈
sonst
mit Parametern µ ∈
Poissonverteilung
2
mit Parameter λ > 0
Stephan Ebbeler & Paul Körbitz – p.3/85
Gleichverteilung
1
, falls a ≤ x ≤ b
fX (x) =
b−a

0 , sonst
mit Parametern a, b ∈ , wobei a < b


Stephan Ebbeler & Paul Körbitz – p.4/85
Übersicht
Grundlagen aus der Wahrscheinlichkeitsrechnung
Univariate Punktprozesse
Tests für univariate Punktprozesse
Multivariate Punktprozesse
Tests für multivariate Punktprozesse
Stephan Ebbeler & Paul Körbitz – p.5/85
Übersicht
Grundlagen aus der Wahrscheinlichkeitsrechnung
Univariate Punkfelder
Definition Punktfeld
Eigenschaften: Stationarität, Isotropie
Beispiel: homogene Poissonfelder
Palmsche Verteilung
Intensitätsmaß & Leerwahrscheinlichkeit
Charakteristische Funktionen (D-, J -Funktionen)
Schätzer und Tests für univariate Punkfelder
Multivariate Punktfelder
Schätzer und Tests für multivariate Punktfelder
Stephan Ebbeler & Paul Körbitz – p.6/85
Definition Punktfeld
Definition Punktfeld
Unter einem zufälligen Punktfeld Φ = {X1 , X2 , ...} im 2
versteht man eine Menge zufälliger Punkte Xi in der Ebene,
d.h. Φ = {Xn }n∈ . Ein Punktmuster ist dann ein Ausschnitt
aus einer Realisierung eines zufälligen Punktfeld, d.h.,
ϕ = {x1 , ..., xn } mit n ∈ .
Stephan Ebbeler & Paul Körbitz – p.7/85
Eigenschaften von Punktfeldern (1)
Definition Stationarität
Ein Punktfeld Φ, oder seine Verteilung PΦ , heißt stationär,
wenn Φ = {Xn } und Φx = {Xn + x} für alle x ∈ 2 die
gleiche Verteilung haben. Also
(Φ ∈ Y ) = (Φx ∈ Y )
∀Y
Dabei ist Φx eine Translation (oder eine Verschiebung) um
den Vektor x, und Y eine Menge von Realisierungen.
Stephan Ebbeler & Paul Körbitz – p.8/85
Eigenschaften von Punktfeldern (2)
Definition Isotropie
Ein Punktfeld Φ heißt isotrop, wenn Φ und rΦ für jede
Rotation r um den Ursprung die gleiche Verteilung haben.
Also
Φ (Y )
=
rΦ (rY )
∀Y
wobei rY eine Rotation aller Punkte der Mengen aus Y um
r und Y eine Menge von Realisierungen ist.
Definition Bewegungsinvarianz
Ein Punktfeld Φ das sowohl stationär als auch isotrop ist,
heißt bewegungsinvariant.
Stephan Ebbeler & Paul Körbitz – p.9/85
homogene Poissonfelder
Ein stationäres Poissonpunktfeld wird durch zwei
Eigenschaften definiert:
1. Seien k paarweise disjunkte und beschränkte
Borelmengen B1 , . . . , Bk gegeben. Dann sind die
Zufallsvariablen Φ(B1 ), . . . , Φ(Bk ) unabhängig.
2. Die Anzahl der Punkte in einer belieigen beschränkten
Borelmenge unterliegt einer Poissonverteilung mit dem
Parameter λν(B).
Die Verteilung von Φ(B) lautet somit:
(λν(B))k −λν(B)
e
(Φ(B) = k) =
k!
(ν(B) < ∞, k = 0, 1, . . .)
Stephan Ebbeler & Paul Körbitz – p.10/85
Abbildung homogenes Poissonfeld
Poissonfelder sind ein sehr nützliches Modell, da sie die
Annahme einer völlig zufälligen Verteilung der Punkte
widerspiegeln.
Stephan Ebbeler & Paul Körbitz – p.11/85
Intensitätsmaß
Ist Φ ein Punktfeld, so heißt Λ mit
Z
Λ(B) = (Φ(B)) = ϕ(B)PΦ (dϕ)
(B ∈ B(
2
))
das Intensitätsmaß von Φ.
Das Intensitätsmaß Λ(B) steht für die erwartete Anzahl der
Punkte in einer Borelmenge B . Ist das Punkfeld stationär, so
ergibt sich die Darstellung:
Λ(B) = λν(B)
(0 ≤ λ ≤ ∞)
wobei ν(B) das Lebesgue-Maß von B ist, und
λ = (Φ([0, 1]2 )) die Intensität von Φ ist. Diese gibt gerade
die erwartete Anzahl der Punkte pro Flächeneinheit an.
Stephan Ebbeler & Paul Körbitz – p.12/85
Leerwahrscheinlichkeit
Definition Leerwahrscheinlichkeit
Für ein zufälliges Punktfeld Φ und eine kompakte
Borelmenge B wird die Wahrscheinlichkeit
θB = (Φ(B) = 0)
(B ∈ B(
2
)
Leerwahrscheinlichkeit genannt.
Diese gibt die Wahrscheinlichkeit an, dass in einer
vorgegebenen Menge B kein einziger Punkt liegt.
Stephan Ebbeler & Paul Körbitz – p.13/85
Kontaktverteilungsfunktion
Definition Kontaktverteilungsfunktion
Sei Φ ein zufälliges Punktfeld und B eine kompakte
Borelmenge, so dass der Ursprung o in B liegt und das
Legesgue-Maß ν(B) > 0 ist. Sei rB eine Ausdehnung von
B um den Faktor r, d.h. rB = {rx : x ∈ B}, r ∈ R. So nennt
man die Funktion HB : → [0, 1] mit
HB (r) = 1 − (Φ(rB) = 0)
(r ≥ 0)
die Kontaktverteilungsfunktion von Φ bezüglich des
strukturierenden Elementes B.
Stephan Ebbeler & Paul Körbitz – p.14/85
Kontaktverteilungsfunktion (2)
Ist B der Einheitskreis um den Ursprung (B = (b(o, 1)) und
Φ ∈ 2 so heißt
HS (r) = 1 − (Φ(b(o, r)) = 0)
(r ≥ 0)
die sphärischen Kontaktverteilungsfunktion.
Stephan Ebbeler & Paul Körbitz – p.15/85
Berechnungen für Poissonfelder
Für die m-dimensionale Verteilung paarweise disjunkter Bj
mit ν(Bj ) < ∞ ergibt sich:
(Φ(B1 ) = k1 , · · · , Φ(Bm ) = km )
(λν(Bm ))km
(λν(B1 ))k1
···
exp −λ
=
k1 !
km !
(k1 , . . . , km ≥ 0)
m
X
i=1
ν(Bi )
!
Für das Intensitätsmaß ergibt sich entsprechend:
Λ(B) = (Φ(B)) = λν(B)
Stephan Ebbeler & Paul Körbitz – p.16/85
Berechnungen für Poissonfelder (2)
Die Leerwahrscheinlichkeit ist
(Φ(B) = 0) = e−λν(B)
Für die sphärische Kontaktverteilungsfuntion gilt
HS (r) = 1 − e
−λπr2
(r ≥ 0)
Stephan Ebbeler & Paul Körbitz – p.17/85
Palmsche Verteilung (1)
Motivation
Bei der Analyse von Punktfeldern ist es häufig wichtig,
einen ”typischen” Punkt aus einem Punktfeld Φ zu
betrachten. Intuitiv ist klar, was damit gemeint ist: Ein Punkt
des Punktfeldes, der Ergebnis einer zufälligen Auswahl ist,
d.h. jeder Punkt wird mit gleicher Wahrscheinlichkeit
ausgewählt. Um dies mathematisch präzise definieren zu
können benötigt man die Palmsche Verteilung.
Zunächst soll folgende Bezeichnung eingeführt werden:
(Φ ∈ Y k x) = (Φ ∈ Y |x ∈ Φ),
wobei x ∈
2
gilt und Y eine Menge von Realisierungen ist.
Stephan Ebbeler & Paul Körbitz – p.18/85
Palmsche Verteilung (2)
Motivation (2)
Deutung: bedingte Wahrscheinlichkeit, dass in x ∈ 2
ein Ereignis stattfindet
Stationäres Punktfeld: x = o
Ohne weitere Anforderungen Bedingung sinnlos
Bei stationärem Punktfeld Verschiebung, so dass ein
xi ∈ Φ im Ursprung liegt
Stephan Ebbeler & Paul Körbitz – p.19/85
Palmsche Verteilung (3)
Definition Palmsche Verteilung
Sei Φ ein stationäres Punktfeld mit der Intensität λ
(0 < λ < ∞). Die Palmsche Verteilung Po (in o) für PΦ ist
folgendermaßen definiert:
Z X
1
Po (Y ) =
1Y (ϕ − x)PΦ (dϕ)
λν(B)
x∈ϕ∩B
mit einer beliebigen beschränkten Borelmenge B mit
ν(B) > 0 und mit ϕ − x = {xn − x}, wenn ϕ = {xn }
Stephan Ebbeler & Paul Körbitz – p.20/85
reduzierte Palmsche Verteilung
Die reduzierte Palmsche Verteilung entspricht der
Palmschen Verteilung ohne Berücksichtigung des Ereignis
im Ursprung:
Po! (Y ) = (Φ \ {o} ∈ Y ko)
Analog zur Definition der Palmschen Verteilung gilt daher:
Z X
1
!
Po (Y ) =
1Y ((ϕ − x) \ {o})PΦ (dϕ)
λν(B)
x∈ϕ∩B
Stephan Ebbeler & Paul Körbitz – p.21/85
D-Funktion und J-Funktion
Sei Φ ein stationäres Punktfeld mit Intensität λ ∈ (0, ∞).
Definition D-Funktion
Die Funktion D : [0, ∞) → [0, 1] mit
D(r) = Po (ϕ ∩ b(o, r) \ {o} 6= ∅)
(r ≥ 0)
heißt die Nächste-Nachbar-Abstands-Verteilungsfunktion.
Definition J -Funktion
Die Funktion J : [0, ∞) → [0, ∞) wird folgendermaßen
definiert:
1 − D(r)
J(r) =
1 − HS (r)
(r ≥ 0, HS (r) < 1)
Stephan Ebbeler & Paul Körbitz – p.22/85
Berechnungen für Poissonfelder (3)
Es gilt
D(r) = HS (r)
und daher J(r) ≡ 1 (r ≥ 0)
Stephan Ebbeler & Paul Körbitz – p.23/85
Übersicht
Grundlagen
Univariate Punkfelder
Definition Punktfeld
Eigenschaften: Stationarität, Isotropie
Beispiel: homogene Poissonfelder
Palmsche Verteilung
Intensitätsmaß & Leerwahrscheinlichkeit
Charakteristische Funktionen (D-, J -Funktionen)
Schätzer und Tests für univariate Punkfelder
Multivariate Punktfelder
Schätzer und Tests für multivariate Punktfelder
Stephan Ebbeler & Paul Körbitz – p.24/85
Übersicht
Grundlagen
Univariate Punkfelder
Schätzer und Tests für univariate Punkfelder
Schätzung bei Punktfeldern
Grundlegende Tests
Tests auf Strukturlosigkeit
Modelltests bei Punktfeldern
Multivariate Punktfelder
Schätzer und Tests für multivariate Punktfelder
Stephan Ebbeler & Paul Körbitz – p.25/85
Schätzung bei Punktfeldern
Randeffekte
Durch das Arbeiten mit Punktmustern in einem
beschränkten Beobachtungsfenster W ergeben sich
Probleme mit Randeffekten. Um diese Probleme zu
vermeiden gibt es zwei verschiedene Methoden:
Plus-Sampling
Minus-Sampling
Stephan Ebbeler & Paul Körbitz – p.26/85
Schätzung bei Punktfeldern
Stephan Ebbeler & Paul Körbitz – p.27/85
Schätzung bei Punktfeldern
Schätzung der Intensität
Die Untersuchung der Punktintensität (d.h. die erwartete
Anzahl der Punkte pro Flächeneinheit) steht gewöhnlich am
Anfang der statistischen Untersuchung eines Punktfeldes.
Ein Schätzer für die Intensität ist gegeben durch:
n
Anzahl der beobachteten Punkte
=
λ̂ =
Fläche des Untersuchungsgebietes |W |
Dieser Schätzer ist erwartungstreu, es gilt nämlich:
λ|W |
Φ(W )
Φ(W )
=
=λ
λ̂ =
=
|W |
|W |
|W |
Stephan Ebbeler & Paul Körbitz – p.28/85
Schätzung bei Punktfeldern
Schätzung der sphärischen Kontaktverteilungsfunktion
Die sphärische Kontaktverteilungsfunktion gibt die
Wahrscheinlichkeit an, dass mindestens ein Punkt in dem
Kreis um den Punkt y mit Radius r liegt. Der Ansatz, das
Verhältnis der Fläche aller Punkte y ∈ Φ, die einen Abstand
kleiner gleich r haben und der Fläche von ganz W zu bilden,
liefert einen ersten Schätzer.
Um die erwähnten Randeffekte zu vermeiden, kann man
diesen Schätzer beispielsweise durch Minus-Sampeling
korrigieren. Man erhält dann folgenden Schätzer:
S
(W b(o, r)) ∩
x∈Φ b(x, r)
ĤS (r) =
, (r ≥ 0)
|W b(o, r)|
Stephan Ebbeler & Paul Körbitz – p.29/85
Schätzung bei Punktfeldern
Schätzung der Nächsten-Nachbar-Abstands-Verteilungsfunktion
Naheliegendes Verfahren: bei einem gegebenen Punktmuster
ϕ = {x1 , . . . , xn } die Nächsten-Nachbar-Abstände
(δ(x1 ), . . . , δ(xn )) berechnen und daraus eine empirische
Verteilungsfunktion bilden.
Man erhält den Schätzer
n
X
1
D̂(r) =
n
i=1
[0,r) (δ(xi )),
(r ≥ 0).
Problem: bei kleinen Beobachtungsfenstern W treten starke
Randeffekte auf.
Stephan Ebbeler & Paul Körbitz – p.30/85
Schätzung bei Punktfeldern
Schätzung der Nächsten-Nachbar-Abstands-Verteilungsfunktion
Um die o.g. Randeffekte auszugleichen wird in der Literatur
der Schätzer D̂ = DλHH(r) empfohlen, wobei
DH (r) =
X
W b(o,s) (x) (0,r] (s)
[x;s]
|W b(o, s)|
und
λ̂H =
X
[x;s]
W b(o,s) (x)
|W b(o, s)|
Die Summation läuft über alle markierten Punktpaare [x; s]
von Φ, wobei s(x) der Abstand von x zu seinem nächsten
Nachbarn ist.
Stephan Ebbeler & Paul Körbitz – p.31/85
Schätzung bei Punktfeldern
Schätzung der J -Funktion
Einen Schätzer für die J -Funktion erhält man, indem man
die Schätzer für die sphärische Kontaktverteilungsfunktion
Ĥs (r) und für die
Nächste-Nachbar-Abstands-Verteilungsfunktion D̂(r)
benutzt. Es ergibt sich daher
1 − ĤS (r)
ˆ
J(r) =
1 − D̂(r)
Stephan Ebbeler & Paul Körbitz – p.32/85
Grundlegende Tests
χ2 -Anpassungstest
Mit diesem Test können zwei Arten von Hypothesen geprüft
werden:
1. H0 : F = F0 vs. H1 : F 6= F0 . Dabei ist F0 eine
hypothesische, fest vorgegebene Verteilungsfunktion.
2. H0 : F ∈ D0 vs. H1 : F 6∈ D0 . Dabei ist D0 eine Klasse
von Verteilungsfunkitionen, deren Elemente mittels
Parameter θ1 , . . . , θm eindeutig festgelegt werden.
Im zweiten Fall kann getestet werden, ob eine
Zufallsvariable normalverteilt, exponentialverteilt, usw. ist.
Dabei werden die benötigten Parameter aus der Stichprobe
geschätzt.
Stephan Ebbeler & Paul Körbitz – p.33/85
Grundlegende Tests
Ablauf des χ2 -Anpassungstest
1. Zerlegung der Wertemenge in r ≥ 2 disjunkte Intervalle:
A1 = (−∞; z1 ], A2 = (z1 ; z2 ], . . . , Ar = (zr−1 ; ∞) mit
z1 < z2 < . . . < zr , i = 1, . . . , r
2. Bestimmung der Anzahl der Stichprobenwerte hi , die in der
Klasse Ai liegen
3. Berechnung der hypothesischen
Klassenwahrscheinlichkeiten (X ∈ Ai ) = pi , i = 1, . . . , r
für die Zufallsvariable X mit Verteilungsfunktion F0
r
P
(hi −npi )2
4. Berechnung der Testgröße T =
npi
i=1
Stephan Ebbeler & Paul Körbitz – p.34/85
Grundlegende Tests
Ablauf des χ2 -Anpassungstest
5. Bestimmung des (1 − α)-Quantils der χ2 -Verteilung mit
r − 1 − m Freiheitsgeraden. Dabei ist m die Anzahl der
geschätzten Parameter
6. Ablehnung von H0 , falls T > χ2r−m−1;1−α
√
Die Anzahl der Klassen r soll ungefähr n betragen.
Stephan Ebbeler & Paul Körbitz – p.35/85
Tests auf Strukturlosigkeit
Bei diesen Tests wird die Hypothese H0 : Φ ist ein homogenes
Poissonfeld gegen H1 : Φ ist kein homogenes Poissonfeld getestet.
Ein solcher Test ist die sogenannte
Quadratzählmethode
Bei dieser Methode geht man folgendermaßen vor:
1. Systematische Einteilung des Beobachtungsfensters W in k
Gebiete mit gleich großer Fläche (z.B. Rechtecke)
2. Bestimmung der Anzahl der Punkte νi , i = 1, . . . , k in jedem
Gebiet
(k−1)s2ν
,
ν
wobei sν die
3. Berechnung des Dispersionsindex I =
Stichprobenstreuung der Punktanzahl in den Teilgebieten, n
die Gesamtanzahl der Punkte und ν = nk = mittlere
Punktanzahl je Teilgebiet ist
Stephan Ebbeler & Paul Körbitz – p.36/85
Tests auf Strukturlosigkeit
Quadratzählmethode
4. Ablehnung der Nullhypothese, falls I < χ2k−m−1, α bzw.
2
I > χ2k−1−m,1− α . m gibt die Anzahl der geschätzten
2
Parameter an
Im ersten Ablehnungsfall hat man mit Clusterbildung zu rechnen,
im zweiten Fall kann man annehmen, dass eine stärkere
Regelmäßigkeit vorliegt, als das bei einem Poissonprozess
typisch ist.
Stephan Ebbeler & Paul Körbitz – p.37/85
Tests auf Strukturlosigkeit
Quadratzählmethode
Die Quadratzählmethode kann als χ2 -Anpassungstest interpretiert
werden. Dazu werden die k Teilgebiete als k Klassen aufgefasst
und die Nullhypothese der Gleichverteilung geprüft. Die
Testgröße lautet dann:
T =
k
X
(νi − nk )2
i=1
n
k
=
(k − 1)s2ν
n
k
s2ν
= (k − 1) = I
ν
Sowohl der χ2 -Anpassungstest als auch die Quadratzählmethode
sind asymptotische Tests, d.h. die Testgrößen T bzw. I sind nur
für genügend große Stichproben näherungsweise χ2 verteilt.
Stephan Ebbeler & Paul Körbitz – p.38/85
Tests auf Strukturlosigkeit
Graphisches Verfahren
bei homogenem Poissonfeld J(r) ≡ 1
Berechnung der J -Funktion der Daten aus
Beobachtungsfenster W
Verlauf des Graphen Indiz für Modelltyp
Bei starken Abweichungen zur Geraden y = 1 Hypothese
der Strukturlosigkeit verwerfen
Ein Verlauf der berechneten J -Funktion oberhalb von
y = 1 deutet auf einen Clusterprozess hin
Keine statistische Tests im klassischen Sinne!
Stephan Ebbeler & Paul Körbitz – p.39/85
Modelltests für Punktprozesse
Mit den folgenden Verfahren können Nullhypothesen der Art H0 :
das Punktfeld entspricht einem bestimmten Modell gegen die
Alternativhypothese H1 : das Punktfeld entspricht nicht dem
bestimmten Modell getestet werden.
Monte-Carlo-Test
Bei diesem Test wird das hypothetisch zugrundeliegende
Punktfeld simuliert. Aus diesen simulierten Daten muss
anschliessend eine Kenngröße ∆ gebildet werden, die die
Abweichung gewisser empirischer Charakteristiken einer
Realisierung des Punktprozesses von den entsprechenden
Modellcharakteristiken beschreibt (bspw. D- oder
J -Funktion).
Stephan Ebbeler & Paul Körbitz – p.40/85
Modelltests für Punktprozesse
Monte-Carlo-Test
Konkret geht man bei diesem Test folgendermaßen vor:
ˆ der Kenngröße ∆
1. Bestimmung des empirischen Werts ∆
für das zu analysierende Beobachtungsfenster W , z.B.
ˆ =
∆
rX
max
i=0
(D̂(ri ) − D(ri ))2 ,
Hierbei ist D die theoretische (vorliegende)
Nächste-Nachbar-Abstands-Verteilungsfunktion für das
zu testende Modell
Stephan Ebbeler & Paul Körbitz – p.41/85
Modelltests für Punktprozesse
Monte-Carlo-Test
2. Simulation von k unabhängigen Punktmustern in W
nach dem vorgegebenen Punktmodell. Die Anzahl der
Simulationen k hängt von dem gewünschten
Signifikanzniveau des Tests ab
3. Bestimmung der Kenngrößen ∆1 , . . . , ∆k für die
simulierten Punktfelder
ˆ ∆ 1 , . . . , ∆k
4. Bilden der Ordnungstatistik von ∆,
5. Ablehnen der Nullhypothese, falls
ˆ ∈ [(k − kα + 1), k + 1] gilt. Dabei ist kα bestimmt
∆
kα
durch α = k+1
Stephan Ebbeler & Paul Körbitz – p.42/85
Modelltests für Punktprozesse
Probleme des Monte-Carlo-Test
Nullhypothese wird erst nach Datenanalyse aufgestellt
Wahl der Modellparameter, so dass sie zu den Daten
passen
Monte-Carlo-Test wird hypothesenfreundlicher!
Wahrscheinlichkeit für Fehler 1. Art < α
Ähnliche Probleme bei anderen Tests, z.B.
Kolmogorov-Smirnov
Stephan Ebbeler & Paul Körbitz – p.43/85
Anwendung der Quadratzählmethode (1)
Man möchte die Hypothese H0 : Es liegt ein homogenes Poissonfeld vor testen. Dazu zerlegt man das Beobachtungsfenster in 100
Gebiete gleich großer Fläche.
Stephan Ebbeler & Paul Körbitz – p.44/85
Anwendung der Quadratzählmethode (2)
Auswertung des Bildes
Eine Zählung der Punkte in jedem Feld ergibt folgende
Häufigkeiten:
Punkte pro Feld Anzahl Felder
0
45
1
33
2
15
3
7
Für den Dipsersionsindex ergibt sich:
I=
(k−1)s2ν
ν̄
=
85,44
84
100
= 101.71429
Stephan Ebbeler & Paul Körbitz – p.45/85
Anwendung der Quadratzählmethode (3)
Die führt zu folgenden Testentscheidungen:
I
α
−1
2
χ99, α
2
101.71
101.71
101.71
0.1
0.05
0.01
77.05
73.36
66.51
−1
2
χ99,1− α
2
Entscheidung
123.23
128.42
138.99
H0 nicht ablehnen
H0 nicht ablehnen
H0 nicht ablehnen
Die Hypothese H0 : Es liegt ein homogenes Poissonfeld vor
kann also für keines der gewählten Signifikanzniveaus
abgelehnt werden.
Stephan Ebbeler & Paul Körbitz – p.46/85
Übersicht
Grundlagen
Univariate Punkfelder
Schätzer und Tests für univariate Punkfelder
Schätzung bei Punktfeldern
Grundlegende Tests
Tests auf Strukturlosigkeit
Modelltests bei Punktfeldern
Multivariate Punktfelder
Schätzer und Tests für multivariate Punktfelder
Stephan Ebbeler & Paul Körbitz – p.47/85
Übersicht
Grundlagen aus der Wahrscheinlichkeitsrechnung
Univariate Punktprozesse
Tests für univariate Punktprozesse
Multivariate Punktprozesse
Definition Multivariates Punktfeld
Eigenschaften
Charakteristische Funktionen (D-,J-Funktionen)
Tests für multivariate Punktprozesse
Stephan Ebbeler & Paul Körbitz – p.48/85
Einleitung
Als Modell wird ein multivariates Punktfeld benutzt, falls einzelne Ereignisse innerhalb eines Untersuchungsgebietes zu mehreren
verschiedenen Typen gehören.
Stephan Ebbeler & Paul Körbitz – p.49/85
Beispiel
Bei einem Baummischbestand liegen Punktmuster aus verschiedenen Wurzelarten vor. Sind in einem zu untersuchenden Bestand
ausschließlich Buchen und Fichten anzutreffen, so dient als Modell zur Analyse, ein bivariates Punktfeld. Die Punkte gehören
dann entweder zum Typ B und somit zum Punktfeld ΦB oder zum
Typ F und Punktfeld ΦF .
Stephan Ebbeler & Paul Körbitz – p.50/85
Bivariates Punktfeld
Beispielfenster für Mischbestand: Fichten (blau) und Buchen (rot)
Stephan Ebbeler & Paul Körbitz – p.51/85
Multivariate Punktfelder
Definition
Sei M = 1, ..., m die Menge der Typen oder der
Markierungen. Ψ = (Φ1 , ..., Φm ) ist ein m-Tupel aus
Punktfeldern Φj ∈ d , wobei Φj nur aus Punkten des j-ten
Typs besteht. Ψ heißt ein multivariates Punktfeld und die
univariaten Punktfelder Φj mit 1 ≤ j ≤ m nennt man die
Komponenten von Ψ.
Stephan Ebbeler & Paul Körbitz – p.52/85
Eigenschaften
1. Ein multivariates Punktfeld Ψ ist stationär genau dann, wenn
alle Komponenten von Ψ stationäre Punktfelder sind
Stephan Ebbeler & Paul Körbitz – p.53/85
Eigenschaften
1. Ein multivariates Punktfeld Ψ ist stationär genau dann, wenn
alle Komponenten von Ψ stationäre Punktfelder sind
2. Ein multivariates Punktfeld Ψ ist isotrop genau dann, wenn
alle Komponenten von Ψ isotrope Punktfelder sind
Stephan Ebbeler & Paul Körbitz – p.53/85
Eigenschaften
1. Ein multivariates Punktfeld Ψ ist stationär genau dann, wenn
alle Komponenten von Ψ stationäre Punktfelder sind
2. Ein multivariates Punktfeld Ψ ist isotrop genau dann, wenn
alle Komponenten von Ψ isotrope Punktfelder sind
3. Ein multivariates Punktfeld Ψ ist bewegungsinvariant genau
dann, wenn alle Komponenten von Ψ bewegungsinvariante
Punktfelder sind
Stephan Ebbeler & Paul Körbitz – p.53/85
Eigenschaften
Eigenschaften von stationären Punktfeldern
1. Intensität von Φj :
λj = (Φj ([0, 1]d ))
2. Gesamtintensität des Punktfeldes Φ• =
λ• =
m
P
n
S
Φj :
j=1
λj
j=1
Stephan Ebbeler & Paul Körbitz – p.54/85
Sphärische Kontaktverteilungsfunktion
HSi (r) = 1 − (Φi (b(0, r)) = 0)
HS• (r) = 1 − (Φ• (b(0, r)) = 0)
Stephan Ebbeler & Paul Körbitz – p.55/85
Sphärische Kontaktverteilungsfunktion
HSi (r) = 1 − (Φi (b(0, r)) = 0)
HS• (r) = 1 − (Φ• (b(0, r)) = 0)
Multivariate D -Funktionen
Dij (r) = P(◦,i) (ϕj ∩ b(0, r) \ {◦} 6= ∅) ist die
Nächste-Nachbar-Abstands-Verteilungsfunktion von den
Punkten des Types i zu den nächsten Punkten des Types j
Stephan Ebbeler & Paul Körbitz – p.55/85
Sphärische Kontaktverteilungsfunktion
HSi (r) = 1 − (Φi (b(0, r)) = 0)
HS• (r) = 1 − (Φ• (b(0, r)) = 0)
Multivariate D -Funktionen
Dij (r) = P(◦,i) (ϕj ∩ b(0, r) \ {◦} 6= ∅) ist die
Nächste-Nachbar-Abstands-Verteilungsfunktion von den
Punkten des Types i zu den nächsten Punkten des Types j
Multivariate J -Funktionen
1 − Dij (r)
Jij (r) =
1 − HSj (r)
(HSj (r) < 1, ∀ r ≥ 0)
Stephan Ebbeler & Paul Körbitz – p.55/85
Übersicht
Grundlagen aus der Wahrscheinlichkeitsrechnung
Univariate Punktprozesse
Tests für univariate Punktprozesse
Multivariate Punktprozesse
Definition Multivariates Punktfeld
Eigenschaften
Charakteristische Funktionen (D-, J-Funktionen)
Tests für multivariate Punktprozesse
Stephan Ebbeler & Paul Körbitz – p.56/85
Übersicht
Grundlagen aus der Wahrscheinlichkeitsrechnung
Univariate Punktprozesse
Tests für univariate Punktprozesse
Multivariate Punktprozesse
Tests für multivariate Punktprozesse
Vier-Feld-Methode
Kendalls τ
Unabhängigkeitstest mit Hilfe der J-Funktion
Stephan Ebbeler & Paul Körbitz – p.57/85
Vier-Feld-Methode
Test basiert auf dem χ2 -Unabhängigkeitstest
1. Beobachtungsfenster wird in n gleich großen Rechtecke
zerlegt
2. Ermittlung folgender Kennzahlen :
a = Anzahl der Rechtecke, in denen gar keine Punkte
liegen
b = Anzahl der Rechtecke, in denen nur die Punkte des
1.Types liegen
c = Anzahl der Rechtecke, in denen nur die Punkte des
2.Types liegen
d = Anzahl der Rechtecke, in denen Punkte beider Typen
liegen
Stephan Ebbeler & Paul Körbitz – p.58/85
Vier-Feld-Methode
3. Die Daten werden in einer 2 x 2 - Tabelle notiert :
Type I
abwesend präsent Summe
abwesend
a
b
a+b
Type II präsent
c
d
c+d
Summe
a+c
b+d
n
4. Teststatistik:
T =
n(|ad−bc|− 12 n)2
(a+b)(c+d)(a+c)(b+d)
5. Als Approximation für die Verteilung von T wird die
χ2 -Verteilung mit einem Freiheitsgrad genommen
Stephan Ebbeler & Paul Körbitz – p.59/85
Vier-Feld-Methode
6. Für T > χ21,1−α wird die Nullhypothese der Unabhängigkeit
der beiden Typen abgelehnt
Stephan Ebbeler & Paul Körbitz – p.60/85
Beispiel zur Vier-Feld-Methode
Beispielfenster für Mischbestand: Fichten (blau) und Buchen (rot)
Stephan Ebbeler & Paul Körbitz – p.61/85
Beispiel zur Vier-Feld-Methode
Mischbestand von Fichten und Buchen mit 10x10 Rechtecken
Stephan Ebbeler & Paul Körbitz – p.62/85
Beispiel zur Vier-Feld-Methode
Daten in der 2 x 2 Tabelle für n=100
Type I
abwesend präsent Summe
abwesend
69
9
78
Type II präsent
19
3
22
Summe
88
12
100
Stephan Ebbeler & Paul Körbitz – p.63/85
Beispiel zur Vier-Feld-Methode
Teststatistik: T =
100(|207−171|− 21 100)2
78∗22∗88∗12
α
χ21,1−α
0,10 2,706
0,05 3,481
0,01 6,635
= 0.01082
Nullhypothese
nicht abgelehnt
nicht abgelehnt
nicht abgelehnt
Stephan Ebbeler & Paul Körbitz – p.64/85
Kendalls τ
Idee:
Untersuchung der Abstände zwischen den Punkten einer
beliebigen Menge M und ihren nahest liegenden Punkten
aus Φ1 und Φ2 . Ableitung der Unabhängigkeit der
Komponenten aus der Unabhängigkeit dieser Abstände.
Vorgehen:
M kann aus n Gitterpunkte bestehen.
1. Zu jedem Punkt bestimmt man die Abstände a1 , ..., an zu
den nächstliegenden Punkten von Φ1 und die kleinsten
Abstände b1 , ...bn zu den Punkten von Φ2 . Als Ergebnis
erhält man n Tupel.
Stephan Ebbeler & Paul Körbitz – p.65/85
Kendalls τ
2. Gilt ai > aj und bi > bj , so heißt diese Tupelpaar
ai −aj
j
konkordant, und es gilt abii −a
>
0
(
n
).
Falls
c
−bj
bi −bj < 0 so
heißt das Tupelpaar diskordant (nd ). Gilt ai = aj oder
bi = bj , so wird das Paar als Bindung bezeichnet (nb ).
nc + nd + nb = 12 n(n − 1)
3. Kendalls Korrelationskoeffizient τ :
τ=
nc −nd
1
n(n−1)
2
4. Falls gilt: τ = 1 (τ = −1) sind die Abstände positiv
(negativ) korreliert.
Im Falle der Unabhängigkeit ist der τ -Wert sehr nahe bei
Null (d.h. Anzahl der konkordanten Paare ist fast gleich der
Anzahl der diskordanten Paare )
Stephan Ebbeler & Paul Körbitz – p.66/85
Kendalls τ
5. Teststatistik :
T = n c − nd
6. Die Quantile w1−α von T werden mit den Quantilen z1−α
der Standard-Normalverteilung berechnet:
q
n(n−1)(2n+5)
w1−α ∼
(n > 60) und
= z1−α
18
wα = −w1−α
7. Nullhypothese wird nicht abgelehnt, falls
−wα/2 ≤ T ≤ w1−α/2
Stephan Ebbeler & Paul Körbitz – p.67/85
J−Funktion
Sind die Komponenten eines bivariaten Punktfeldes
unabhängig, so gilt:
J12 (r) ≡ 1
Die J−Funktion nimmt den Wert 1 an, wenn keine
Beziehungen zwischen Φ1 und Φ2 vorliegt.
(Beachte: Die Umkehrung gilt nicht)
Stephan Ebbeler & Paul Körbitz – p.68/85
J−Funktion
Sind die Komponenten eines bivariaten Punktfeldes
unabhängig, so gilt:
J12 (r) ≡ 1
Die J−Funktion nimmt den Wert 1 an, wenn keine
Beziehungen zwischen Φ1 und Φ2 vorliegt.
(Beachte: Die Umkehrung gilt nicht)
J12 (r) > 1 : Negativer Einfluss auf das Auftreten von
Punkten von Φ2 durch Punkte von Φ1
Stephan Ebbeler & Paul Körbitz – p.68/85
J−Funktion
Sind die Komponenten eines bivariaten Punktfeldes
unabhängig, so gilt:
J12 (r) ≡ 1
Die J−Funktion nimmt den Wert 1 an, wenn keine
Beziehungen zwischen Φ1 und Φ2 vorliegt.
(Beachte: Die Umkehrung gilt nicht)
J12 (r) > 1 : Negativer Einfluss auf das Auftreten von
Punkten von Φ2 durch Punkte von Φ1
J12 (r) < 1 : Anziehung der Punkte beider Typen zueinander
Stephan Ebbeler & Paul Körbitz – p.68/85
Literatur
D.Stoyan, H.Stoyan: Fractals,Random Shapes and Point
Fields. Methods of Geometrical Statistics, J. Wiley & Sons,
Chichester, 1994
D.Stoyan, W.S. Kendall, J.Mecke: Stochastic Geometry and
its Applications, J. Wiley & Sons, Chichester, 1995
S.Eckel, Statistische Analyse der
Nachbarschaftsbeziehungen von Baumwurzeln anhand
vorliegender Verteilungsmuster, Wissenschaftliche Arbeit,
Universität Ulm, 2003
V. Idt: Geostatistische Analyse der Wurzelverteilung eines
Mischbestands von Buche und Fichte, Wissenschaftliche
Arbeit, Universität Ulm, 2004
Stephan Ebbeler & Paul Körbitz – p.69/85
Herunterladen