Last modified by Helmut Nagy on 2010/05/03 19:40

Show last authors
1 == Verwendung mathematischer und statistischer Verfahren ==
2
3 {{box cssClass="toc"}}{{toc start="5" /}}{{/box}}
4
5 Grenzen statistischer Analyse:
6
7 * Ermöglicht keine absolut gültigen, umfassenden und überzeitlichen Erkenntnisse.
8 * Ergebnisse sind immer nur vorläufiger Art, genau begrenzt und relativiert durch die zugrunde gelegten mathematischen Prämissen.
9
10 Statistische Analyse ermöglicht:
11
12 * Einblick in die Konformität von Ideologien, Werthaltungen und Leitideen
13 * Kann Erkenntnis und den Nachweise der Unrichtigkeit dieser vorher als selbstverständlich geltenden Überzeugungen erbringen.
14
15 ===== Mathematische Ansätze =====
16
17 ====== Wahrscheinlichkeitstheorie ======
18
19 Wenn das Eintreten bestimmter Ereignisse oder Beziehungen zwischen gewissen Größen nicht mehr deterministisch (genau und eindeutig bestimmbar) ist, spricht man von stochastischen (zufälligen) Beziehungen und Ereignissen.
20
21 Klassischer Wahrscheinlichkeitsbegriff: Wahscheinlichkeit = Anzahl der interessierenden Ereignisse/Anzahl aller möglichen Ereignisse
22
23 Statistischer Wahrscheinlichkeitsbegriff: Wahrscheinlichkeit = Häufigkeit des Auftretens eines Ereignisses/ Häufigkeit des Auftretens aller Ereignisse
24
25 ====== Matrizenrechnung ======
26
27 ====== Funktionen ======
28
29 Funktionstypen:
30
31 * linear
32 * polynominal, exponentionell
33 * Normalverteilung
34
35 ====== Spieltheorie ======
36
37 Methode die nahezu ausschließlich auf auf gesellschaftliche Probleme Zugeschnitten ist. Taugliches Mittel bei der Beschreibung strategisch sozialer Problemstellungen sowie zur Erforschung des Entscheidungsverhaltens in Kleingruppen und bei Untersuchungen über Dezentralisierung oder Machtverteilung. Auf soziale, politische und ökonomische Fragestellungen anwendbar.
38
39 ===== Statistik in der Sozialforschung =====
40
41 ====== Einteilung der Statistik ======
42
43 * beschreibende Statistik oder deskriptive Statistik
44 Liefert Zusammenfassung und Darstellung der Beobachtungsdaten mithilfe von beschreibenden Maßzahlen und graphischen Darstellungen. Unterscheidung:
45 ** Beschreibung einzelner messbarer Beobachtungsdaten (Verhältniszahlen, Prozentwerte ...)
46 ** Beschreibung des Zusammenhangs mehrerer Merkmale (Messreihen, Aufzählungen ...)
47 Richtung, Größe und Struktur des Zusammenhangs durch Meßzahlen ausgedrückt (Korrelationskoeffizienten, Regressionsgrade ...)
48 * schließende Statistik oder analytische Statistik
49 Ermöglicht objektive Überprüfung von Hypothesen. Beschreibende Kennwerte und Charakteristika der Stichprobe sollen Aussagen über entsprechende Werte der Grundgesamtheit erlauben.
50
51 ====== Statistische Merkmale und Messniveau ======
52
53 Statistische Begriffe
54
55 * //Grundgesamtheit//: Alle Elemente der Untersuchungseinheit
56 z.B. alle Studenten an Hochschulen
57 * //Untersuchungseinheit//: "Ein Element aus der Menge der untersuchten Gegenstände/Objekte/Subjekte" (!Achtung Eigendefinition!)
58 z.B. Untersuchung der Leistung der Studierenden an Hochschulen -> Untersuchungseinheit: einzelner Student
59 * //Merkmal//: "Eigenschaften den Untersuchungseinheit" (!Achtung Eigendefinition!)
60 z.B. Geschlecht, Leistung, Beruf der Eltern ...
61 ** qualitative Merkmale (z.B. Geschlecht, Beruf der Eltern)
62 ** quantitative Merkmale (z.B. Alter, Noten)
63 * //Merkmalsausprägung//: Messung d.h. Quantifizierung oder Qualifizierung der Merkmale
64 * //Stichprobe//: zufällige Auswahl aus Grundgesamtheit der Untersuchungseinheit
65 z.B. untersuchte Teilmenge von Studenten
66
67 Messniveau/Skalierung
68
69 * Nominal-Skalen
70 Unterschiedliche Zahlen kennzeichnen nur unterschiedliche Klassen (1 = männlich, 2 = weiblich, genaus 6 = männlich, 3 = weiblich möglich)
71 * Ordinal-/Rang-Skalen
72 Zahlenzuordnung spiegelt Rangordnung der Klassen (z.B. sozialer Rang der Eltern)
73 * Intervall-Skalen
74 Differenz zwischen Merkmalsausprägungen geben Unterschied zwischen Klassen an (z.B. Notenabstände)
75 * Ratio-Skalen
76 Zusätzlich zur Differenz zwischen Merkmalsausprägungen existiert ein absoluter Nullpunkt (z.B. Alter, Einkommen)
77
78 Man sollte sich immer bewusst sein welches Messniveau (Skalennivau) die Daten haben. Am häufigsten Ordinal-Skalen und Intervall-Skalen.
79
80 Weiter Unterscheidung:
81
82 * diskretes Merkmal
83 nur ganzzahlige oder anders abgestufte Ausprägung (z.B. Alter, Noten)
84 * stetiges Merkmal
85 beliebig fein und genau messbar (z.B. Länge, Zeit, Gewicht)
86
87 ===== Beschreibende Statistik =====
88
89 ====== Darstellung von Häufigkeiten ======
90
91 Darstellungmöglichkeiten von Kategorienhäufigkeiten (z.B. Bruttoeinkommen)
92
93 * Histogramm (Darstellung diskreter Variablen)
94 * Polygon (Darstellung stetiger Variablen)
95 Linienzug durch die Punkte die durch Kategorienmitte und Kategorienhäufigkeit bestimmt sind -> Bild der Verteilungsform von Daten.
96 * Kreisdiagramm (Darstellung nominalskalierter Daten)
97
98 ====== Statistische Meßzahlen ======
99
100 Zentrale Tendenz oder Mittelwert
101
102 * Modus (Modalwert)
103 Kategorienmitte der Kategorie mit der größten Kategorienhäufigkeit (für kontinuierliche Variablen keine sinnvolle Meßzahl)
104 * Median
105 Häufigkeitsverteilung in zwei gleich große Hälften (über/unter Medien gleich viele Beobachtungswerte)
106 * arithmetisches Mittel (Durchschnitt)
107 Für Nominaldaten kein Sinnvoller Wert
108
109 Streuungsmaße
110
111 * Standardabweichung (Streuung)
112 durchschnittliche Abweichung
113
114 ====== Korrelation und Regression ======
115
116 Zur gleichzeitigen Betrachtung und Analyse der Zusammenhänge von mehreren Merkmalen.
117
118 Korrelation:
119
120 * negativ korreliert (große x-Werte, kleine y-Werte)
121 * positiv korreliert (große x-Werte, große y-Werte)
122 * Korrelationskoeffizient (r): Maßzahl für die Eindeutigkeit des linearen Zusammenhangs.
123 Um so kleiner, je geringer der lineare Zusammenhang, keine Aussage über kausale Zusammenhänge (Stärke, Richtung)
124
125 Regression:
126
127 Bei hohen Korrelationskoeffizienten können Meßzahlen mit Hilfe der Regressionsanalyse an eine Gerade (Regressionsgerade) angenähert werden.
128
129 ====== Theoretische Häuffigkeitsverteilung ======
130
131 * Normalverteilung
132 Empirische Häufigkeitsverteilungen können oft durch Normalverteilungen gut angenähert werden. Bedeutung: Approximation für empirische Verteilungen, grundlegende theoretische Verteilung in abschließender Statistik.
133
134 ===== Stichproben =====
135
136 Vollerhebung von Grundgesamtheiten für empirische Sozialforschung zu langwierig/teuer (Ausnahmen: z.B. Volkszählung) -> Stichproben. Problem: Stichprobenauswahl.
137
138 ====== Stichprobenarten ======
139
140 Zufallsstichprobe:
141
142 * einfache Zufallsstichprobe
143 Jede Untersuchungseinheit hat gleiche Chance einbezogen zu werden. Nur wenn Grundgesamtheit homogen. Je größer Stichprobe, desto bedeutungsloser werden Abweichungen.
144 * geschichtete Zufallsstichprobe
145 Heterogene Grundgesamtheit -> Setzt sich aus verschiedenen Teilmengen (Schichten zusammen) -> Zufallsstichprobe pro Schicht.
146 * Klumpenstichprobe
147 "Klumben" nebeneinander liegender Elemente (z.B. räumlich) werden einbezogen (z.B. Bewohner eines Häuserblocks, auch Flächenstichprobe)
148 * Mehrstufige Stichprobe
149 Kombination mehrerer Verfahren. z.B. Klumpenstichprobe -> Auswahl der Flächen, Zufallsstichprobe -> Auswahl der Einheiten
150
151 Systematische Stichproben:
152
153 * Quotenverfahren
154 Aufteilung der Grundgesamtheit in Quoten (z.B. Geschlecht, Alter). Ermittlung des Anteils an der Grundgesamtheit der Quote. Stichprobe nach Prozentanteil auf Quoten verteilt. Innerhalb der Quoten freie Wahl der Untersuchungseinheiten. Gültigkeit nicht mehr wahrscheinlichkeitstheoretisch begründbar (keine Zufallswahl).
155 * Systematische Auswahl
156 Voraussetzung: Untersuchungseinheiten bereits in Karteien, Listen erfasst. z.B. jeder i-te für Stichprobe ausgewählt. Genauigkeit abhängig vom Aufbau der Grundgesamtheit.
157
158 ====== Systematische Fehlerquellen ======
159
160 * Keine Messwerte für bestimmte Untersuchungseinheiten (z.B. nicht angetroffen)
161 Wird vernachlässigt, wenn die verbleibende Stichprobengröße als groß genug erachtet wird.
162 * Stichprobe wir nur aus Teil der Grundgesamtheit gewählt (z.B. Telefonbuch als Basis - nur Telefonbesitzer)
163 * unwissenschaftliche Auswahl von Sitchproben aufs "Geratewohl" (z.B. Befragung zw. 10-11 am Bahnhof vorbeikommender Passanten)
164
165 Auswirkungen möglicher Verfälschungen noch nicht genügend erforscht.
166
167 ====== Bestimmung der Stichprobengröße ======
168
169 Welche Stichprobengröße ist notwendig? -> Abhängig von der notwendigen Genauigkeit der Untersuchungsergebnisse.
170
171 ===== Prüfung von Hypothesen =====
172
173 Arten von Hypothesen:
174
175 * Hypothesen über die Verteilung der Merkmalsausprägung in der Grundgesamtheit
176 Entspricht einer Normalverteilung
177 * Unterschiedlichkeitshypothesen
178 Prüfung anhand der statistischen Kennwerte der Stichprobe
179 * Zusammenhanghypothesen
180 Prüfung mithilfe der Korrelations- bzw. Regressionsrechnung
181
182 ====== Hypothesentest ======
183
184 Formulierte Hypothese -> Alternativhypothese (H,,1,,) -> inhaltlich logische komplementär Hypothese -> Nullhypothese (H,,0,,)
185
186 Nullhypothese ist Basis von Hypothesenprüfungen. Prüfung liefert im Normalfall Irrtumswahrscheinlichkeit für fälschliche Annahme oder Ablehnung der Alternativhypothese.
187
188 Ergebnisse mit Irrtumswahrscheinlichkeit kleiner 5% -> signifikant, kleiner 1% -> stark signifikant
189
190 ====== x^^2^^-Test (Chi-Quadrat-Test) ======
191
192 Prüfmethode für Hypothesen über bestimmte Verteilungsannahmen. Über die Differenzen zwischen den jeweils erwarteten, theoretischen Häufigkeiten und den tatsächlichen empirischen Häufigkeiten wird eine Meßzahl x^^2^^ berechnet.
193
194 ===== Varianzanalyse und multivariate Methoden =====
195
196 * varianzanalytische Methoden
197 Wie lässt sich die Variabilität (Varianz) eines abhängigen Merkmals durch den Einfluss einer oder mehrerer unabhängiger Variablen erklären?
198 * multivariate Methoden
199 Es können mehrere abhängige und unabhängige Variablen in die statistische Analyse eingehen. (Faktorenanalyse)