4.3 Konstruktion strukturverträglicher Relationen Abbildungen zwei Relationen gegeben, die translationsinvariant bezüglich K sind, d.h., es gilt ∀v, w ∈ V, ∀u ∈ K : v ≤+ w =⇒ v + u ≤+ w + u & v ≤+ w =⇒ v + u ≤+ w + u. Bemerkungen: ≤+ ist die größte Teilrelation von ≤, die translationsinvariant bezüglich K ist. ≤+ ist die kleinste Erweiterung von ≤, die translationsinvariant bezüglich K ist. ≤+ ist eine Ordnungsrelation, ≤+ ist nicht immer transitiv. Die Abbildung ≤ 7→ ≤+ ist ein Hüllenoperator. Die Abbildung ≤ 7→ ≤+ ist ein Kernoperator, d.h., eine monotone, idempotente und intensive8 Abbildung. Beispiele: Hier ist V wieder die Menge aller rellwertigen Zufallsvariablen auf einem Messraum (Ω, F) und außerdem sei K = V . a) ≤Ω + = (≤Ω )+ =≤Ω , da ≤Ω bereits translationsinvariant bezüglich K = V war. b) ≤SD(1) + =≤Ω∗ , wobei X ≤Ω∗ Y : ⇐⇒ P(X ≤ Y ) = 1. c) ≤SD(1) 8 + =? (später!) Eine Abbildung Φ : 2V ×V −→ 2V ×V heißt intensiv, falls für alle R ∈ 2V ×V gilt Φ(R) ⊆ R. 31 Messabbildungen und Relationen Nachfolgend seien einige (absoulte) Streuungsordnungen, die teilweise schon eingeführt wurden, sowie einige übliche und unübliche Streuungsmaße tabellarisch aufgelistet. Diese werden später gemeinsam in einem formalen Kontext betrachtet. (Die Beschreibungen sind eher informell und nicht als exakte Definitionen zu verstehen.) (absolute) Streuungsordnungen für reelwertige Zufallsvariablen Relation Dispersionsordnung Expansionsordnung freie Expansionsordnung ordnungsbasierte Streuungsordnung 32 ordnungsund erwartungswertbasierte Streuungsordnung natürliche Ordnung Transferrelation Idee X ≤DISP Y falls es eine expansive, monotone Abbildung Φ gibt, die X auf Y ( in Verteilung“) abbildet. ” X ≤EXP Y falls es eine expansive (nicht notwendig monotone) Abbildung Φ gibt, die X auf Y abbildet. X ≤EXP.F REE Y falls |Xi − Xj | ≤SD(1) |Yi − Yj | für stochastisch unabhängige Paare Xi , Xj bzw. Yi , Yj . X ≤OV AR Y falls die kleinen Werte von Y kleiner sind (im Sinne stochastischer Dominanz erster Ordnung) als die kleinen Werte von X und die großen Werte von Y größer sind als die großen Werte von X. X ≤OV AR.M EAN Y falls die kleinen Werte von Y kleiner sind (im Sinne stochastischer Dominanz erster Ordnung) als die kleinen Werte von X und die großen Werte von Y größer sind als die großen Werte von X. X ≤N AT Y falls es eine von X unabhängige Zufallsvariable ε mit X + ε = Y gibt. X ≤T RAN S Y falls es einen Transfer T mit Erwartungswert 0 von kleineren Werten von X zu größeren Werten von X d gibt, so dass T (X) = Y gilt. Bemerkungen X ≤EXP.F REE Y falls es eine expansive9 Abbildung Φ gibt, die |Xi − Xj | auf |Yi − Yj | abbildet. Kleine Werte von X (bzw. Y ) sind hier Werte z mit FX (z) ≤ 0.5 (bzw. FY (z) ≤ 0.5). Kleine Werte von X (bzw. Y ) sind hier Werte kleinergleich E(X) (bzw. E(Y )). 4.3 Konstruktion strukturverträglicher Relationen 4.3.1 Abbildungen Maß Definition Varianz (VAR) erwartete quadratische Abweichung V AR(X) = E (X − E(X))2 Erwartungswert: V AR(X) = E(X 2 ) − (E(X))2 = 12 E (Xi − Xj )2 , wobei Xi , Xj unabhängige Kopien von X seien. ADIST erwarteter Abstand von unabhängigen Paaren: ADIST (X) = E (|Xi − Xj |). (Auch unter dem Namen Gini’s mean difference bekannt) erwarteter Abstand zum Erwartungswert: ADA(X) = E(|X − E(X)|) Median des Abstandes zum Median (median absolute deviation from median): M AD = M EDIAN (|X − M EDIAN (X)|) erwartete Abstand zum Median: ADM (X) = E(|X − M EDIAN (X)|) Median der Abweichung zum Erartungswert: M DA(X) = M EDIAN (|X − E(X)|) Quantil der Abstände von unabhängigen Paaren: Qn (X) = qα (|Xi − Xj |) Median des Median-Abstandes von Xi zu Xj“, genauer: Sn (X) = ” M EDIANi {M EDIAN (|Xi − Xj |)} Interquartilsabstand: IQR = q0.75 (X) − q0.25 (X) ADIST (X) = E(X)·Gini(X), ADIST ist Linearform in |X − M EDIAN (X)| ADA MAD ADM MDA 33 Qn Sn IQR Bemerkungen vom ADA(X) = E(X) · Ricci-Schutz(X) (= E(X) · Robin.Hood(X)) 4.3 Konstruktion strukturverträglicher Relationen (absolute) Streuungsmaße für reelwertige Zufallsvariablen Abbildungen 4.3 Konstruktion strukturverträglicher Relationen 4.3.2 Abbildungen Der Begriffsverband von Relationen und homomorphen Abbildungen Sei (G, M, I) mit G ⊆ RF . . . Menge von Messabbildungen von einer Menge F von Zufallsvariablen in die reellen Zahlen, M ⊆ 2F×F . . . Menge von binären Relationen auf F, I . . . Homomorphierelation: (f, R) ∈ I : ⇐⇒ Messabbildung f ist homomorph bezüglich Relation R, d.h., es gilt ∀X, Y ∈ F : XRY =⇒ f (X) ≤ f (Y ). Fragen: Wie sehen die Begriffsumfänge und Inhalte dieses Begriffsverbands aus? Wie können diese interpretiert werden? Initiale Relation Definition 4.4 Sei X eine Menge, J eine Indexmenge und F := {fj : X −→ (Yj , Rj )} | j ∈ J} eine Klasse von Abbildungen in die homogenen Inzidenzstrukturen (Yj , Rj ). Die Relation RF := \ Rfj j∈J mit Rfj = {(x, y) ∈ X 2 | fj (x)Rj fj (y)} heißt Initiale Relation bezüglich F und das Paar (X, RF ) heißt initiale Inzidenzstruktur bezüglich F . Satz 4.5 Die initiale Relation RF ist die größte Relation, für die alle Abbildungen fi aus F Homomorphismen sind. Satz 4.6 Für eine Klasse F von Abbildungen in geordnete Mengen ist die initiale Relation eine Präordnung. Satz 4.7 Sei S ⊆ G eine Menge von Messabbildungen. Dann ist der von S erzeugte Begiffsinhalt S 0 gegeben durch die initiale Relation RS via S 0 = {R | R ∈ M, R ⊆ RS }. Bemerkung 4.1. In diesem Zusammenhang kann ein Begriffsinhalt bzw. die initiale Relation interpretiert werden als das größte relationale Konstrukt, das alle Messabbildungen aus S gemeinsam messen. (Natürlich wird hier nur nur auf ordnunggstheoretischer Ebene gemessen, es wird nur die Ordnungsstuktur von R im Bildbereich der Messabbildungen betrachtet.) Satz 4.8 Sei T ⊆ M eine Menge von Relationen auf F. Dann gilt für den Begriffsumfang T 0 von rellwertigen Messabbildungen folgende Abgeschlossenheitseigenschaft: f ∈ T 0 &g ∈ T 0 , λ, µ ∈ R≥0 : λf + µg ∈ G =⇒ λf + µg ∈ T 0 . 34 4.3 Konstruktion strukturverträglicher Relationen Abbildungen Kontext und Begriffsverband von Variabilitätsrelationen und -maßen Beispielhaft sei nun ein Begriffsverband von ausgewählten (absoluten) Variabilitätsrelationen und maßen illustriert: VAR ADIST ADA MAD ADM MDA Qn Sn IQR DISP X X X X X EXP X X X X X X X X EXP.FREE X X OVAR X OVAR.MEAN X (X) NAT X X X (X) X X X X (X) TRANS X X X X X X X X X 35 Index Äquivalenzklassen, 7 Äquivalenzrelation, 3 Möbiusinversion, 19 Merkmalsimplikation, 14 antisymmetrisch, 3 Auswertungsfunktional, 3 Nachbarschaftsrelation, 4 Nachbereich, 7 natürliche Ordnungsrelation, 23 natürliche Relation, 22 Netzwerke/Graphentheorie, 2 Begriffsextension, 10 Begriffsinhalt, 10 Begriffsintention, 10 Begriffsumfang, 10 BTL-Modell, 2 disjunkt, 7 Dispersionsordnung, 26 duale Inzidenzstruktur, 2 duales Paar, 3 exhaustiv, 7 Expansionsordnung, 27 Faktorordnung, 15 Faktorraum, 7 Formale Begriffsanalyse, 2 formaler Begriff, 10 formaler Kontext, 10 freie Expansionsordnung, 27 Geometrie, 2 geordnete Menge, 3 Hassegraph, 4 Hauptsatz der Statistik, 19 homogene, 3 Homomorphismus, 29 Implikationsbasis, 14 Infimum, 8 initiale Inzidenzstruktur, 34 Initiale Relation, 34 inversionsinvariant, 29 Inzidenzstruktur, 1 Isomorphismus, 29 Konklusion, 14 lageredundant, 29 lineare Ordnung, 3 lokationsfaktorisierbar, 29 Lorenz-größer, 27, 28 Lorenzfunktion, 27 Möbiusinverse, 19 obere Schranke, 8 Ordnungdimension, 6 ordnungsbasierte Streuungsordnung, 28 Ordnungsrelation, 3 positiv streckungsinvariant, 29 positiv translationsinvariant, 29 positiver Kegel, 24 prägeordnete Menge, 3 Prämisse, 14 Präordnung, 3 quasigeordnete Menge, 3 Quasiordnung, 3 Rasch-Modell, 2 reflexiv, 3 Relation, 2 skalenfaktorisierbar, 29 skalenredundant, 29 starker Homomorphismus, 29 stochastische Dominanz, 16 streckungsinvariant, 29 strukturerhaltende Abbildung, 29 strukturreflektierend, 29 Supremum, 8 symmetrisch, 3, 29 total, 3 totale, 3 transitiv, 3 translationsinvariant, 29 untere Schranke, 8 Unterhalbmenge (downset), 17 Ununterscheidbarkeitsrelation, 3 Vapnik-Chervonenkis-Theorie, 21 verallgemeinerte Lorenzfunktion, 28 verallgemeinerte Lorenzordnung, 28 Verband, 8 vollständiger Verband, 8 Vorbereich, 7 36 Literatur∗ [1] Bastide, Y. ; Taouil, R. ; Pasquier, N. ; Stumme, G. ; Lakhal, L. : Mining frequent patterns with counting inference. In: ACM SIGKDD Explorations Newsletter 2 (2000), Nr. 2, S. 66–75 [2] Bickel, P. J. ; Lehmann, E. L.: Descriptive statistics for nonparametric models. III. Dispersion. Springer, 2012 [3] Bickel, P. ; Lehmann, E. L.: Descriptive statistics for nonparametric models IV. Spread. In: Selected Works of EL Lehmann. Springer, 2012, S. 519–526 [4] Borg, I. ; Braun, M. ; Häder, M. : Arbeitswerte in Ost- und Westdeutschland : unterschiedliche Gewichte, aber gleiche Struktur. In: ZUMA Nachrichten 17 (1993), Nr. 33, 64-82. http:// nbn-resolving.de/urn:nbn:de:0168-ssoar-209129 [5] Davey, B. A. ; Priestley, H. A.: Introduction to lattices and order. Cambridge university press, 2002 [6] Ellermeier, W. ; Faulhammer, G. : Empirical evaluation of axioms fundamental to Steven’s ratio-scaling approach: I. Loudness production. In: Perception & Psychophysics 62 (2000), Nr. 8, S. 1505–1511 [7] Fechner, G. T.: Elemente der Psychophysik. Breitkopf und Härtel, 1860 [8] Ganter, B. : Formale Begriffsanalyse. In: Wissenschaftliche Zeitschrift der Technischen Universität Dresden 45 (1996), Nr. 6, S. 8–13 [9] Ganter, B. : Diskrete Mathematik: Geordnete Mengen. Springer, 2013 [10] Gerstenberger, C. ; Vogel, D. : On the efficiency of Gini’s mean difference. In: arXiv preprint arXiv:1405.5027 (2014) [11] Guigues, J.-L. ; Duquenne, V. : Familles minimales d’implications informatives résultant d’un tableau de données binaires. In: Mathématiques et Sciences humaines 95 (1986), S. 5–18 [12] Kiefer, J. ; Wolfowitz, J. : On the deviations of the empiric distribution function of vector chance variables. In: Transactions of the American Mathematical Society (1958), S. 173–186 [13] Kleiber, C. : Halbordnungen von Einkommensverteilungen. Vandenhoeck & Ruprecht, 2000 (47) [14] Massart, P. : The tight constant in the Dvoretzky-Kiefer-Wolfowitz inequality. In: The Annals of Probability (1990), S. 1269–1283 [15] Narens, L. : Abstract measurement theory. MIT Press, 1985 [16] Norberg, T. : Existence theorems for measures on continous posets, with applications to random set theory. In: Mathematica Scandinavica 64 (1989), S. 15–51 [17] Saint-Mont, U. : Statistik im Forschungsprozess. In: Eine Philosophie der Statistik als Baustein einer integrativen Wissenschaftstheorie, Heidelberg ua (2011) [18] Stumme, G. : Efficient data mining based on formal concept analysis. In: Database and Expert Systems Applications Springer, 2002, S. 534–546 [19] Stumme, G. ; Taouil, R. ; Bastide, Y. ; Pasquier, N. ; Lakhal, L. : Computing iceberg concept lattices with TITANIC. In: Data & knowledge engineering 42 (2002), Nr. 2, S. 189–222 [20] Tarp, F. ; Østerdal, L. P.: Multivariate discrete first order stochastic dominance. 2007. – Forschungsbericht LITERATUR∗ LITERATUR∗ [21] Tukey, J. W.: A survey of sampling from contaminated distributions. In: Contributions to probability and statistics 39 (1960), S. 448–485 [22] Vapnik, V. N. ; Chervonenkis, A. Y.: On the uniform convergence of relative frequencies of events to their probabilities. In: Theory of Probability & Its Applications 16 (1971), Nr. 2, S. 264–280 [23] Wille, R. : Concept lattices and conceptual knowledge systems. In: Computers & Mathematics with Applications 23 (1992), Nr. 6–9, 493–515. http://dx.doi.org/10.1016/0898-1221(92) 90120-7. – DOI 10.1016/0898–1221(92)90120–7. – ISSN 0898–1221 [24] Wille, R. : Restructuring lattice theory: an approach based on hierarchies of concepts. Springer, 2009 [25] Wolff, K. E. ; Gabler, S. ; Borg, I. : Formale Begriffsanalyse von Arbeitswerten in Ost- und Westdeutschland. In: ZUMA Nachrichten 18 (1994), Nr. 34, 69-82. http://nbn-resolving.de/ urn:nbn:de:0168-ssoar-209069 [26] Zwicker, E. ; Fastl, H. ; Frater, H. : Psychoacoustics, Facts and Models, volume 22 of Springer Series of Information Sciences. 1999 ∗ Diese Literaturliste enthält weitaus mehr Inhalt, als in der Veranstaltung behandelt werden kann. Auf einige Referenzen wird nur in Randbemerkungen eingegangen. 38 LITERATUR∗ LITERATUR∗ Internetquellen, die eventuell nützlich sein könnten: Einführung in die Armuts- bzw. Disparitätsmessung: http://von-der-lippe.org/dokumente/Armut.pdf Probleme bei der Disparitätsmessung: http://von-der-lippe.org/dokumente/dispari.pdf Java-Implementieung ConExp zur Formalen Begriffsanalyse: http://conexp.sourceforge.net/ 39 A NOTATION A Notation N := {0, 1, 2, . . .} N+ 2Ω A 1A C[a, b] idT BA Ψ◦Φ ≤SD(n) ≤L ≤GL ↓ x := {y | y ≤ x} ↓ S := {y | ∃x ∈ S : y ≤ x} O(V ) l ⊥ > W xt t∈T V xt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge der natürlichen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge der positiven natürlichen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Menge aller Teilmengen der Menge Ω . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Komplement der Menge A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Indikatorfunktion der Menge A . . . . . . Menge aller stetigen, reellwertigen Funktionen auf dem Intervall [a, b] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . identische Abbildung auf der Menge T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge aller Abbildungen von A nach B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Komposition der Abbildungen Φ und Ψ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . stochastische Dominanz n-ter Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lorenzordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . verallgemeinerte Lorenzordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vorbereich des Elements x bezüglich ≤ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vorbereich der Menge S bezüglich ≤ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge aller Unterhalbmengen von V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Nachbarschaftsrelation zur Relation ≤ . . . . . . . . . . . . . . . . . . . . . . . . . . . kleinstes Element eines vollständigen Verbandes . . . . . . . . . . . . . . . . . . . . . . . . . . . . größtes Element eines vollständigen Verbandes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Supremum der Menge {xt | t ∈ T } . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Infimum der Menge {xt | t ∈ T } t∈T FX , F F̂x , F̂ Fn FX−1 P̂x , P̂ Pn #T co (T ) A+z ∀ ∃ & v⊇≤ (x)+ := max(0, x) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Verteilungfunktion der Zufallsvariablen X . . . . . . . . . . . . . . . . . . . . . . . . empirische Verteilungsfunktion des Datenvektors x . . . . . . . . . . . . . . . . . . empirische Verteilungsfunktion der ersten n Datenpunkte eines i.i.d.-samples . . . . . . . . . . . . . . . . . . Pseudoinverse zur Verteilungsfunktion FX definiert durch FX−1 : R −→ [0, 1] : t 7→ sup{x | FX (x) ≤ t} . . . . . . . . . . . . . . . . . . . empirisches Wahrscheinlichkeitsmaß zum Datenvektor x . . . . . . . . . . . . . empirisches Wahrscheinlichkeitsmaß der ersten n Datenpunkte eines i.i.d.-samples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anzahl der Elemente der Menge T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . konvexe Hülle der Menge T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Komplexnotation für A + z := {a + z | a ∈ A} . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Allquantor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Existenzquantor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . logisches und Die Relation v enthält die Relationd ≤, d.h., es gilt (x, y) ∈≤=⇒ (x, y) ∈v . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Positivteil der reellen Zahl x 40