Verwendung mathematischer und statistischer Verfahren
Verwendung mathematischer und statistischer Verfahren
Grenzen statistischer Analyse:
- Ermöglicht keine absolut gültigen, umfassenden und überzeitlichen Erkenntnisse.
- Ergebnisse sind immer nur vorläufiger Art, genau begrenzt und relativiert durch die zugrunde gelegten mathematischen Prämissen.
Statistische Analyse ermöglicht:
- Einblick in die Konformität von Ideologien, Werthaltungen und Leitideen
- Kann Erkenntnis und den Nachweise der Unrichtigkeit dieser vorher als selbstverständlich geltenden Überzeugungen erbringen.
Mathematische Ansätze
Wahrscheinlichkeitstheorie
Wenn das Eintreten bestimmter Ereignisse oder Beziehungen zwischen gewissen Größen nicht mehr deterministisch (genau und eindeutig bestimmbar) ist, spricht man von stochastischen (zufälligen) Beziehungen und Ereignissen.
Klassischer Wahrscheinlichkeitsbegriff: Wahscheinlichkeit = Anzahl der interessierenden Ereignisse/Anzahl aller möglichen Ereignisse
Statistischer Wahrscheinlichkeitsbegriff: Wahrscheinlichkeit = Häufigkeit des Auftretens eines Ereignisses/ Häufigkeit des Auftretens aller Ereignisse
Matrizenrechnung
Funktionen
Funktionstypen:
- linear
- polynominal, exponentionell
- Normalverteilung
Spieltheorie
Methode die nahezu ausschließlich auf auf gesellschaftliche Probleme Zugeschnitten ist. Taugliches Mittel bei der Beschreibung strategisch sozialer Problemstellungen sowie zur Erforschung des Entscheidungsverhaltens in Kleingruppen und bei Untersuchungen über Dezentralisierung oder Machtverteilung. Auf soziale, politische und ökonomische Fragestellungen anwendbar.
Statistik in der Sozialforschung
Einteilung der Statistik
- beschreibende Statistik oder deskriptive Statistik
Liefert Zusammenfassung und Darstellung der Beobachtungsdaten mithilfe von beschreibenden Maßzahlen und graphischen Darstellungen. Unterscheidung:- Beschreibung einzelner messbarer Beobachtungsdaten (Verhältniszahlen, Prozentwerte ...)
- Beschreibung des Zusammenhangs mehrerer Merkmale (Messreihen, Aufzählungen ...)
Richtung, Größe und Struktur des Zusammenhangs durch Meßzahlen ausgedrückt (Korrelationskoeffizienten, Regressionsgrade ...)
- schließende Statistik oder analytische Statistik
Ermöglicht objektive Überprüfung von Hypothesen. Beschreibende Kennwerte und Charakteristika der Stichprobe sollen Aussagen über entsprechende Werte der Grundgesamtheit erlauben.
Statistische Merkmale und Messniveau
Statistische Begriffe
- Grundgesamtheit: Alle Elemente der Untersuchungseinheit
z.B. alle Studenten an Hochschulen - Untersuchungseinheit: "Ein Element aus der Menge der untersuchten Gegenstände/Objekte/Subjekte" (!Achtung Eigendefinition!)
z.B. Untersuchung der Leistung der Studierenden an Hochschulen -> Untersuchungseinheit: einzelner Student - Merkmal: "Eigenschaften den Untersuchungseinheit" (!Achtung Eigendefinition!)
z.B. Geschlecht, Leistung, Beruf der Eltern ...- qualitative Merkmale (z.B. Geschlecht, Beruf der Eltern)
- quantitative Merkmale (z.B. Alter, Noten)
- Merkmalsausprägung: Messung d.h. Quantifizierung oder Qualifizierung der Merkmale
- Stichprobe: zufällige Auswahl aus Grundgesamtheit der Untersuchungseinheit
z.B. untersuchte Teilmenge von Studenten
Messniveau/Skalierung
- Nominal-Skalen
Unterschiedliche Zahlen kennzeichnen nur unterschiedliche Klassen (1 = männlich, 2 = weiblich, genaus 6 = männlich, 3 = weiblich möglich) - Ordinal-/Rang-Skalen
Zahlenzuordnung spiegelt Rangordnung der Klassen (z.B. sozialer Rang der Eltern) - Intervall-Skalen
Differenz zwischen Merkmalsausprägungen geben Unterschied zwischen Klassen an (z.B. Notenabstände) - Ratio-Skalen
Zusätzlich zur Differenz zwischen Merkmalsausprägungen existiert ein absoluter Nullpunkt (z.B. Alter, Einkommen)
Man sollte sich immer bewusst sein welches Messniveau (Skalennivau) die Daten haben. Am häufigsten Ordinal-Skalen und Intervall-Skalen.
Weiter Unterscheidung:
- diskretes Merkmal
nur ganzzahlige oder anders abgestufte Ausprägung (z.B. Alter, Noten) - stetiges Merkmal
beliebig fein und genau messbar (z.B. Länge, Zeit, Gewicht)
Beschreibende Statistik
Darstellung von Häufigkeiten
Darstellungmöglichkeiten von Kategorienhäufigkeiten (z.B. Bruttoeinkommen)
- Histogramm (Darstellung diskreter Variablen)
- Polygon (Darstellung stetiger Variablen)
Linienzug durch die Punkte die durch Kategorienmitte und Kategorienhäufigkeit bestimmt sind -> Bild der Verteilungsform von Daten. - Kreisdiagramm (Darstellung nominalskalierter Daten)
Statistische Meßzahlen
Zentrale Tendenz oder Mittelwert
- Modus (Modalwert)
Kategorienmitte der Kategorie mit der größten Kategorienhäufigkeit (für kontinuierliche Variablen keine sinnvolle Meßzahl) - Median
Häufigkeitsverteilung in zwei gleich große Hälften (über/unter Medien gleich viele Beobachtungswerte) - arithmetisches Mittel (Durchschnitt)
Für Nominaldaten kein Sinnvoller Wert
Streuungsmaße
- Standardabweichung (Streuung)
durchschnittliche Abweichung
Korrelation und Regression
Zur gleichzeitigen Betrachtung und Analyse der Zusammenhänge von mehreren Merkmalen.
Korrelation:
- negativ korreliert (große x-Werte, kleine y-Werte)
- positiv korreliert (große x-Werte, große y-Werte)
- Korrelationskoeffizient (r): Maßzahl für die Eindeutigkeit des linearen Zusammenhangs.
Um so kleiner, je geringer der lineare Zusammenhang, keine Aussage über kausale Zusammenhänge (Stärke, Richtung)
Regression:
Bei hohen Korrelationskoeffizienten können Meßzahlen mit Hilfe der Regressionsanalyse an eine Gerade (Regressionsgerade) angenähert werden.
Theoretische Häuffigkeitsverteilung
- Normalverteilung
Empirische Häufigkeitsverteilungen können oft durch Normalverteilungen gut angenähert werden. Bedeutung: Approximation für empirische Verteilungen, grundlegende theoretische Verteilung in abschließender Statistik.
Stichproben
Vollerhebung von Grundgesamtheiten für empirische Sozialforschung zu langwierig/teuer (Ausnahmen: z.B. Volkszählung) -> Stichproben. Problem: Stichprobenauswahl.
Stichprobenarten
Zufallsstichprobe:
- einfache Zufallsstichprobe
Jede Untersuchungseinheit hat gleiche Chance einbezogen zu werden. Nur wenn Grundgesamtheit homogen. Je größer Stichprobe, desto bedeutungsloser werden Abweichungen. - geschichtete Zufallsstichprobe
Heterogene Grundgesamtheit -> Setzt sich aus verschiedenen Teilmengen (Schichten zusammen) -> Zufallsstichprobe pro Schicht. - Klumpenstichprobe
"Klumben" nebeneinander liegender Elemente (z.B. räumlich) werden einbezogen (z.B. Bewohner eines Häuserblocks, auch Flächenstichprobe) - Mehrstufige Stichprobe
Kombination mehrerer Verfahren. z.B. Klumpenstichprobe -> Auswahl der Flächen, Zufallsstichprobe -> Auswahl der Einheiten
Systematische Stichproben:
- Quotenverfahren
Aufteilung der Grundgesamtheit in Quoten (z.B. Geschlecht, Alter). Ermittlung des Anteils an der Grundgesamtheit der Quote. Stichprobe nach Prozentanteil auf Quoten verteilt. Innerhalb der Quoten freie Wahl der Untersuchungseinheiten. Gültigkeit nicht mehr wahrscheinlichkeitstheoretisch begründbar (keine Zufallswahl). - Systematische Auswahl
Voraussetzung: Untersuchungseinheiten bereits in Karteien, Listen erfasst. z.B. jeder i-te für Stichprobe ausgewählt. Genauigkeit abhängig vom Aufbau der Grundgesamtheit.
Systematische Fehlerquellen
- Keine Messwerte für bestimmte Untersuchungseinheiten (z.B. nicht angetroffen)
Wird vernachlässigt, wenn die verbleibende Stichprobengröße als groß genug erachtet wird. - Stichprobe wir nur aus Teil der Grundgesamtheit gewählt (z.B. Telefonbuch als Basis - nur Telefonbesitzer)
- unwissenschaftliche Auswahl von Sitchproben aufs "Geratewohl" (z.B. Befragung zw. 10-11 am Bahnhof vorbeikommender Passanten)
Auswirkungen möglicher Verfälschungen noch nicht genügend erforscht.
Bestimmung der Stichprobengröße
Welche Stichprobengröße ist notwendig? -> Abhängig von der notwendigen Genauigkeit der Untersuchungsergebnisse.
Prüfung von Hypothesen
Arten von Hypothesen:
- Hypothesen über die Verteilung der Merkmalsausprägung in der Grundgesamtheit
Entspricht einer Normalverteilung - Unterschiedlichkeitshypothesen
Prüfung anhand der statistischen Kennwerte der Stichprobe - Zusammenhanghypothesen
Prüfung mithilfe der Korrelations- bzw. Regressionsrechnung
Hypothesentest
Formulierte Hypothese -> Alternativhypothese (H1) -> inhaltlich logische komplementär Hypothese -> Nullhypothese (H0)
Nullhypothese ist Basis von Hypothesenprüfungen. Prüfung liefert im Normalfall Irrtumswahrscheinlichkeit für fälschliche Annahme oder Ablehnung der Alternativhypothese.
Ergebnisse mit Irrtumswahrscheinlichkeit kleiner 5% -> signifikant, kleiner 1% -> stark signifikant
x2-Test (Chi-Quadrat-Test)
Prüfmethode für Hypothesen über bestimmte Verteilungsannahmen. Über die Differenzen zwischen den jeweils erwarteten, theoretischen Häufigkeiten und den tatsächlichen empirischen Häufigkeiten wird eine Meßzahl x2 berechnet.
Varianzanalyse und multivariate Methoden
- varianzanalytische Methoden
Wie lässt sich die Variabilität (Varianz) eines abhängigen Merkmals durch den Einfluss einer oder mehrerer unabhängiger Variablen erklären? - multivariate Methoden
Es können mehrere abhängige und unabhängige Variablen in die statistische Analyse eingehen. (Faktorenanalyse)