4.3 Konstruktion strukturverträglicher Relationen Abbildungen 31

Werbung
4.3 Konstruktion strukturverträglicher Relationen
Abbildungen
zwei Relationen gegeben, die translationsinvariant bezüglich K sind, d.h., es gilt
∀v, w ∈ V, ∀u ∈ K :
v ≤+ w =⇒ v + u ≤+ w + u & v ≤+ w =⇒ v + u ≤+ w + u.
Bemerkungen:
ˆ ≤+ ist die größte Teilrelation von ≤, die translationsinvariant bezüglich K ist.
ˆ ≤+ ist die kleinste Erweiterung von ≤, die translationsinvariant bezüglich K ist.
ˆ ≤+ ist eine Ordnungsrelation, ≤+ ist nicht immer transitiv.
ˆ Die Abbildung ≤ 7→ ≤+ ist ein Hüllenoperator.
ˆ Die Abbildung ≤ 7→ ≤+ ist ein Kernoperator, d.h., eine monotone, idempotente und intensive8
Abbildung.
Beispiele:
Hier ist V wieder die Menge aller rellwertigen Zufallsvariablen auf einem Messraum (Ω, F) und außerdem sei K = V .
a) ≤Ω + = (≤Ω )+ =≤Ω , da ≤Ω bereits translationsinvariant bezüglich K = V war.
b) ≤SD(1) + =≤Ω∗ , wobei X ≤Ω∗ Y : ⇐⇒ P(X ≤ Y ) = 1.
c) ≤SD(1)
8
+
=? (später!)
Eine Abbildung Φ : 2V ×V −→ 2V ×V heißt intensiv, falls für alle R ∈ 2V ×V gilt Φ(R) ⊆ R.
31
Messabbildungen und Relationen
Nachfolgend seien einige (absoulte) Streuungsordnungen, die teilweise schon eingeführt wurden, sowie einige übliche und unübliche Streuungsmaße
tabellarisch aufgelistet. Diese werden später gemeinsam in einem formalen Kontext betrachtet. (Die Beschreibungen sind eher informell und nicht als
exakte Definitionen zu verstehen.)
(absolute) Streuungsordnungen für reelwertige Zufallsvariablen
Relation
Dispersionsordnung
Expansionsordnung
freie
Expansionsordnung
ordnungsbasierte Streuungsordnung
32
ordnungsund
erwartungswertbasierte
Streuungsordnung
natürliche Ordnung
Transferrelation
Idee
X ≤DISP Y falls es eine expansive, monotone Abbildung Φ
gibt, die X auf Y ( in Verteilung“) abbildet.
”
X ≤EXP Y falls es eine expansive (nicht notwendig monotone) Abbildung Φ gibt, die X auf Y abbildet.
X ≤EXP.F REE Y falls |Xi − Xj | ≤SD(1) |Yi − Yj | für stochastisch unabhängige Paare Xi , Xj bzw. Yi , Yj .
X ≤OV AR Y falls die kleinen Werte von Y kleiner sind (im
Sinne stochastischer Dominanz erster Ordnung) als die kleinen Werte von X und die großen Werte von Y größer sind
als die großen Werte von X.
X ≤OV AR.M EAN Y falls die kleinen Werte von Y kleiner sind
(im Sinne stochastischer Dominanz erster Ordnung) als die
kleinen Werte von X und die großen Werte von Y größer
sind als die großen Werte von X.
X ≤N AT Y falls es eine von X unabhängige Zufallsvariable
ε mit X + ε = Y gibt.
X ≤T RAN S Y falls es einen Transfer T mit Erwartungswert
0 von kleineren Werten von X zu größeren Werten von X
d
gibt, so dass T (X) = Y gilt.
Bemerkungen
X ≤EXP.F REE Y falls es eine expansive9 Abbildung Φ gibt, die |Xi − Xj | auf |Yi − Yj | abbildet.
Kleine Werte von X (bzw. Y ) sind hier Werte z
mit FX (z) ≤ 0.5 (bzw. FY (z) ≤ 0.5).
Kleine Werte von X (bzw. Y ) sind hier Werte
kleinergleich E(X) (bzw. E(Y )).
4.3 Konstruktion strukturverträglicher Relationen
4.3.1
Abbildungen
Maß
Definition
Varianz (VAR)
erwartete quadratische
Abweichung
V AR(X) = E (X − E(X))2
Erwartungswert:
V AR(X) = E(X 2 ) − (E(X))2 = 12 E (Xi − Xj )2 , wobei Xi , Xj unabhängige Kopien von X seien.
ADIST
erwarteter Abstand von unabhängigen Paaren: ADIST (X) =
E (|Xi − Xj |). (Auch unter dem Namen Gini’s mean difference bekannt)
erwarteter Abstand zum Erwartungswert: ADA(X) = E(|X −
E(X)|)
Median des Abstandes zum Median (median absolute deviation
from median): M AD = M EDIAN (|X − M EDIAN (X)|)
erwartete Abstand zum Median: ADM (X) = E(|X −
M EDIAN (X)|)
Median der Abweichung zum Erartungswert: M DA(X) =
M EDIAN (|X − E(X)|)
Quantil der Abstände von unabhängigen Paaren: Qn (X) =
qα (|Xi − Xj |)
Median des Median-Abstandes von Xi zu Xj“, genauer: Sn (X) =
”
M EDIANi {M EDIAN (|Xi − Xj |)}
Interquartilsabstand: IQR = q0.75 (X) − q0.25 (X)
ADIST (X) = E(X)·Gini(X), ADIST ist Linearform
in |X − M EDIAN (X)|
ADA
MAD
ADM
MDA
33
Qn
Sn
IQR
Bemerkungen
vom
ADA(X) = E(X) · Ricci-Schutz(X) (= E(X) ·
Robin.Hood(X))
4.3 Konstruktion strukturverträglicher Relationen
(absolute) Streuungsmaße für reelwertige Zufallsvariablen
Abbildungen
4.3 Konstruktion strukturverträglicher Relationen
4.3.2
Abbildungen
Der Begriffsverband von Relationen und homomorphen Abbildungen
Sei (G, M, I) mit
ˆ G ⊆ RF . . . Menge von Messabbildungen von einer Menge F von Zufallsvariablen in die reellen
Zahlen,
ˆ M ⊆ 2F×F . . . Menge von binären Relationen auf F,
ˆ I . . . Homomorphierelation: (f, R) ∈ I : ⇐⇒ Messabbildung f ist homomorph bezüglich Relation R, d.h., es gilt ∀X, Y ∈ F : XRY =⇒ f (X) ≤ f (Y ).
Fragen: Wie sehen die Begriffsumfänge und Inhalte dieses Begriffsverbands aus?
Wie können diese interpretiert werden?
Initiale Relation
Definition 4.4
Sei X eine Menge, J eine Indexmenge und F := {fj : X −→ (Yj , Rj )} | j ∈ J} eine Klasse von
Abbildungen in die homogenen Inzidenzstrukturen (Yj , Rj ). Die Relation
RF :=
\
Rfj
j∈J
mit
Rfj = {(x, y) ∈ X 2 | fj (x)Rj fj (y)}
heißt Initiale Relation bezüglich F und das Paar (X, RF ) heißt initiale Inzidenzstruktur bezüglich F .
Satz 4.5
Die initiale Relation RF ist die größte Relation, für die alle Abbildungen fi aus F Homomorphismen
sind.
Satz 4.6
Für eine Klasse F von Abbildungen in geordnete Mengen ist die initiale Relation eine Präordnung.
Satz 4.7
Sei S ⊆ G eine Menge von Messabbildungen. Dann ist der von S erzeugte Begiffsinhalt S 0 gegeben
durch die initiale Relation RS via
S 0 = {R | R ∈ M, R ⊆ RS }.
Bemerkung 4.1. In diesem Zusammenhang kann ein Begriffsinhalt bzw. die initiale Relation interpretiert werden als das größte relationale Konstrukt, das alle Messabbildungen aus S gemeinsam messen.
(Natürlich wird hier nur nur auf ordnunggstheoretischer Ebene gemessen, es wird nur die Ordnungsstuktur von R im Bildbereich der Messabbildungen betrachtet.)
Satz 4.8
Sei T ⊆ M eine Menge von Relationen auf F. Dann gilt für den Begriffsumfang T 0 von rellwertigen
Messabbildungen folgende Abgeschlossenheitseigenschaft:
f ∈ T 0 &g ∈ T 0 , λ, µ ∈ R≥0 : λf + µg ∈ G =⇒ λf + µg ∈ T 0 .
34
4.3 Konstruktion strukturverträglicher Relationen
Abbildungen
Kontext und Begriffsverband von Variabilitätsrelationen und -maßen
Beispielhaft sei nun ein Begriffsverband von ausgewählten (absoluten) Variabilitätsrelationen und maßen illustriert:
VAR
ADIST
ADA
MAD
ADM
MDA
Qn
Sn
IQR
DISP
X
X
X
X
X
EXP
X
X
X
X
X
X
X
X
EXP.FREE
X
X
OVAR
X
OVAR.MEAN
X
(X)
NAT
X
X
X
(X)
X
X
X
X
(X)
TRANS
X
X
X
X
X
X
X
X
X
35
Index
Äquivalenzklassen, 7
Äquivalenzrelation, 3
Möbiusinversion, 19
Merkmalsimplikation, 14
antisymmetrisch, 3
Auswertungsfunktional, 3
Nachbarschaftsrelation, 4
Nachbereich, 7
natürliche Ordnungsrelation, 23
natürliche Relation, 22
Netzwerke/Graphentheorie, 2
Begriffsextension, 10
Begriffsinhalt, 10
Begriffsintention, 10
Begriffsumfang, 10
BTL-Modell, 2
disjunkt, 7
Dispersionsordnung, 26
duale Inzidenzstruktur, 2
duales Paar, 3
exhaustiv, 7
Expansionsordnung, 27
Faktorordnung, 15
Faktorraum, 7
Formale Begriffsanalyse, 2
formaler Begriff, 10
formaler Kontext, 10
freie Expansionsordnung, 27
Geometrie, 2
geordnete Menge, 3
Hassegraph, 4
Hauptsatz der Statistik, 19
homogene, 3
Homomorphismus, 29
Implikationsbasis, 14
Infimum, 8
initiale Inzidenzstruktur, 34
Initiale Relation, 34
inversionsinvariant, 29
Inzidenzstruktur, 1
Isomorphismus, 29
Konklusion, 14
lageredundant, 29
lineare Ordnung, 3
lokationsfaktorisierbar, 29
Lorenz-größer, 27, 28
Lorenzfunktion, 27
Möbiusinverse, 19
obere Schranke, 8
Ordnungdimension, 6
ordnungsbasierte Streuungsordnung, 28
Ordnungsrelation, 3
positiv streckungsinvariant, 29
positiv translationsinvariant, 29
positiver Kegel, 24
prägeordnete Menge, 3
Prämisse, 14
Präordnung, 3
quasigeordnete Menge, 3
Quasiordnung, 3
Rasch-Modell, 2
reflexiv, 3
Relation, 2
skalenfaktorisierbar, 29
skalenredundant, 29
starker Homomorphismus, 29
stochastische Dominanz, 16
streckungsinvariant, 29
strukturerhaltende Abbildung, 29
strukturreflektierend, 29
Supremum, 8
symmetrisch, 3, 29
total, 3
totale, 3
transitiv, 3
translationsinvariant, 29
untere Schranke, 8
Unterhalbmenge (downset), 17
Ununterscheidbarkeitsrelation, 3
Vapnik-Chervonenkis-Theorie, 21
verallgemeinerte Lorenzfunktion, 28
verallgemeinerte Lorenzordnung, 28
Verband, 8
vollständiger Verband, 8
Vorbereich, 7
36
Literatur∗
[1]
Bastide, Y. ; Taouil, R. ; Pasquier, N. ; Stumme, G. ; Lakhal, L. : Mining frequent patterns
with counting inference. In: ACM SIGKDD Explorations Newsletter 2 (2000), Nr. 2, S. 66–75
[2]
Bickel, P. J. ; Lehmann, E. L.: Descriptive statistics for nonparametric models. III. Dispersion.
Springer, 2012
[3]
Bickel, P. ; Lehmann, E. L.: Descriptive statistics for nonparametric models IV. Spread. In:
Selected Works of EL Lehmann. Springer, 2012, S. 519–526
[4]
Borg, I. ; Braun, M. ; Häder, M. : Arbeitswerte in Ost- und Westdeutschland : unterschiedliche
Gewichte, aber gleiche Struktur. In: ZUMA Nachrichten 17 (1993), Nr. 33, 64-82. http://
nbn-resolving.de/urn:nbn:de:0168-ssoar-209129
[5]
Davey, B. A. ; Priestley, H. A.: Introduction to lattices and order. Cambridge university press,
2002
[6]
Ellermeier, W. ; Faulhammer, G. : Empirical evaluation of axioms fundamental to Steven’s
ratio-scaling approach: I. Loudness production. In: Perception & Psychophysics 62 (2000), Nr. 8,
S. 1505–1511
[7]
Fechner, G. T.: Elemente der Psychophysik. Breitkopf und Härtel, 1860
[8]
Ganter, B. : Formale Begriffsanalyse. In: Wissenschaftliche Zeitschrift der Technischen Universität Dresden 45 (1996), Nr. 6, S. 8–13
[9]
Ganter, B. : Diskrete Mathematik: Geordnete Mengen. Springer, 2013
[10] Gerstenberger, C. ; Vogel, D. : On the efficiency of Gini’s mean difference. In: arXiv preprint
arXiv:1405.5027 (2014)
[11] Guigues, J.-L. ; Duquenne, V. : Familles minimales d’implications informatives résultant d’un
tableau de données binaires. In: Mathématiques et Sciences humaines 95 (1986), S. 5–18
[12] Kiefer, J. ; Wolfowitz, J. : On the deviations of the empiric distribution function of vector
chance variables. In: Transactions of the American Mathematical Society (1958), S. 173–186
[13] Kleiber, C. : Halbordnungen von Einkommensverteilungen. Vandenhoeck & Ruprecht, 2000 (47)
[14] Massart, P. : The tight constant in the Dvoretzky-Kiefer-Wolfowitz inequality. In: The Annals
of Probability (1990), S. 1269–1283
[15] Narens, L. : Abstract measurement theory. MIT Press, 1985
[16] Norberg, T. : Existence theorems for measures on continous posets, with applications to random
set theory. In: Mathematica Scandinavica 64 (1989), S. 15–51
[17] Saint-Mont, U. : Statistik im Forschungsprozess. In: Eine Philosophie der Statistik als Baustein
einer integrativen Wissenschaftstheorie, Heidelberg ua (2011)
[18] Stumme, G. : Efficient data mining based on formal concept analysis. In: Database and Expert
Systems Applications Springer, 2002, S. 534–546
[19] Stumme, G. ; Taouil, R. ; Bastide, Y. ; Pasquier, N. ; Lakhal, L. : Computing iceberg
concept lattices with TITANIC. In: Data & knowledge engineering 42 (2002), Nr. 2, S. 189–222
[20] Tarp, F. ; Østerdal, L. P.: Multivariate discrete first order stochastic dominance. 2007. –
Forschungsbericht
LITERATUR∗
LITERATUR∗
[21] Tukey, J. W.: A survey of sampling from contaminated distributions. In: Contributions to
probability and statistics 39 (1960), S. 448–485
[22] Vapnik, V. N. ; Chervonenkis, A. Y.: On the uniform convergence of relative frequencies of
events to their probabilities. In: Theory of Probability & Its Applications 16 (1971), Nr. 2, S.
264–280
[23] Wille, R. : Concept lattices and conceptual knowledge systems. In: Computers & Mathematics
with Applications 23 (1992), Nr. 6–9, 493–515. http://dx.doi.org/10.1016/0898-1221(92)
90120-7. – DOI 10.1016/0898–1221(92)90120–7. – ISSN 0898–1221
[24] Wille, R. : Restructuring lattice theory: an approach based on hierarchies of concepts. Springer,
2009
[25] Wolff, K. E. ; Gabler, S. ; Borg, I. : Formale Begriffsanalyse von Arbeitswerten in Ost- und
Westdeutschland. In: ZUMA Nachrichten 18 (1994), Nr. 34, 69-82. http://nbn-resolving.de/
urn:nbn:de:0168-ssoar-209069
[26] Zwicker, E. ; Fastl, H. ; Frater, H. : Psychoacoustics, Facts and Models, volume 22 of
Springer Series of Information Sciences. 1999
∗
Diese Literaturliste enthält weitaus mehr Inhalt, als in der Veranstaltung behandelt werden kann.
Auf einige Referenzen wird nur in Randbemerkungen eingegangen.
38
LITERATUR∗
LITERATUR∗
Internetquellen, die eventuell nützlich sein könnten:
Einführung in die Armuts- bzw. Disparitätsmessung:
http://von-der-lippe.org/dokumente/Armut.pdf
Probleme bei der Disparitätsmessung:
http://von-der-lippe.org/dokumente/dispari.pdf
Java-Implementieung ConExp zur Formalen Begriffsanalyse:
http://conexp.sourceforge.net/
39
A NOTATION
A
Notation
N := {0, 1, 2, . . .}
N+
2Ω
A
1A
C[a, b]
idT
BA
Ψ◦Φ
≤SD(n)
≤L
≤GL
↓ x := {y | y ≤ x}
↓ S := {y | ∃x ∈ S : y ≤ x}
O(V )
l
⊥
>
W
xt
t∈T
V
xt
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge der natürlichen Zahlen
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge der positiven natürlichen Zahlen
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Menge aller Teilmengen der Menge Ω
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Komplement der Menge A
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Indikatorfunktion der Menge A
. . . . . . Menge aller stetigen, reellwertigen Funktionen auf dem Intervall [a, b]
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . identische Abbildung auf der Menge T
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge aller Abbildungen von A nach B
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Komposition der Abbildungen Φ und Ψ
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . stochastische Dominanz n-ter Ordnung
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lorenzordnung
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . verallgemeinerte Lorenzordnung
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vorbereich des Elements x bezüglich ≤
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vorbereich der Menge S bezüglich ≤
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge aller Unterhalbmengen von V
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Nachbarschaftsrelation zur Relation ≤
. . . . . . . . . . . . . . . . . . . . . . . . . . . kleinstes Element eines vollständigen Verbandes
. . . . . . . . . . . . . . . . . . . . . . . . . . . . größtes Element eines vollständigen Verbandes
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Supremum der Menge {xt | t ∈ T }
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Infimum der Menge {xt | t ∈ T }
t∈T
FX , F
F̂x , F̂
Fn
FX−1
P̂x , P̂
Pn
#T
co (T )
A+z
∀
∃
&
v⊇≤
(x)+ := max(0, x)
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Verteilungfunktion der Zufallsvariablen X
. . . . . . . . . . . . . . . . . . . . . . . . empirische Verteilungsfunktion des Datenvektors x
. . . . . . . . . . . . . . . . . . empirische Verteilungsfunktion der ersten n Datenpunkte
eines i.i.d.-samples
. . . . . . . . . . . . . . . . . . Pseudoinverse zur Verteilungsfunktion FX definiert durch
FX−1 : R −→ [0, 1] : t 7→ sup{x | FX (x) ≤ t}
. . . . . . . . . . . . . . . . . . . empirisches Wahrscheinlichkeitsmaß zum Datenvektor x
. . . . . . . . . . . . . empirisches Wahrscheinlichkeitsmaß der ersten n Datenpunkte
eines i.i.d.-samples
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anzahl der Elemente der Menge T
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . konvexe Hülle der Menge T
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . Komplexnotation für A + z := {a + z | a ∈ A}
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Allquantor
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Existenzquantor
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . logisches und
Die Relation v enthält die Relationd ≤, d.h., es gilt (x, y) ∈≤=⇒ (x, y) ∈v
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Positivteil der reellen Zahl x
40
Herunterladen