Verwendung mathematischer und statistischer Verfahren

Last modified by Helmut Nagy on 2010/05/03 19:40

Verwendung mathematischer und statistischer Verfahren

Grenzen statistischer Analyse:

  • Ermöglicht keine absolut gültigen, umfassenden und überzeitlichen Erkenntnisse.
  • Ergebnisse sind immer nur vorläufiger Art, genau begrenzt und relativiert durch die zugrunde gelegten mathematischen Prämissen.

Statistische Analyse ermöglicht:

  • Einblick in die Konformität von Ideologien, Werthaltungen und Leitideen
  • Kann Erkenntnis und den Nachweise der Unrichtigkeit dieser vorher als selbstverständlich geltenden Überzeugungen erbringen.
Mathematische Ansätze
Wahrscheinlichkeitstheorie

Wenn das Eintreten bestimmter Ereignisse oder Beziehungen zwischen gewissen Größen nicht mehr deterministisch (genau und eindeutig bestimmbar) ist, spricht man von stochastischen (zufälligen) Beziehungen und Ereignissen.

Klassischer Wahrscheinlichkeitsbegriff: Wahscheinlichkeit = Anzahl der interessierenden Ereignisse/Anzahl aller möglichen Ereignisse

Statistischer Wahrscheinlichkeitsbegriff: Wahrscheinlichkeit = Häufigkeit des Auftretens eines Ereignisses/ Häufigkeit des Auftretens aller Ereignisse

Matrizenrechnung
Funktionen

Funktionstypen:

  • linear
  • polynominal, exponentionell
  • Normalverteilung
Spieltheorie

Methode die nahezu ausschließlich auf auf gesellschaftliche Probleme Zugeschnitten ist. Taugliches Mittel bei der Beschreibung strategisch sozialer Problemstellungen sowie zur Erforschung des Entscheidungsverhaltens in Kleingruppen und bei Untersuchungen über Dezentralisierung oder Machtverteilung. Auf soziale, politische und ökonomische Fragestellungen anwendbar.

Statistik in der Sozialforschung
Einteilung der Statistik
  • beschreibende Statistik oder deskriptive Statistik
    Liefert Zusammenfassung und Darstellung der Beobachtungsdaten mithilfe von beschreibenden Maßzahlen und graphischen Darstellungen. Unterscheidung:
    • Beschreibung einzelner messbarer Beobachtungsdaten (Verhältniszahlen, Prozentwerte ...)
    • Beschreibung des Zusammenhangs mehrerer Merkmale (Messreihen, Aufzählungen ...)
      Richtung, Größe und Struktur des Zusammenhangs durch Meßzahlen ausgedrückt (Korrelationskoeffizienten, Regressionsgrade ...)
  • schließende Statistik oder analytische Statistik
    Ermöglicht objektive Überprüfung von Hypothesen. Beschreibende Kennwerte und Charakteristika der Stichprobe sollen Aussagen über entsprechende Werte der Grundgesamtheit erlauben.
Statistische Merkmale und Messniveau

Statistische Begriffe

  • Grundgesamtheit: Alle Elemente der Untersuchungseinheit
    z.B. alle Studenten an Hochschulen
  • Untersuchungseinheit: "Ein Element aus der Menge der untersuchten Gegenstände/Objekte/Subjekte" (!Achtung Eigendefinition!)
    z.B. Untersuchung der Leistung der Studierenden an Hochschulen -> Untersuchungseinheit: einzelner Student
  • Merkmal: "Eigenschaften den Untersuchungseinheit" (!Achtung Eigendefinition!)
    z.B. Geschlecht, Leistung, Beruf der Eltern ...
    • qualitative Merkmale (z.B. Geschlecht, Beruf der Eltern)
    • quantitative Merkmale (z.B. Alter, Noten)
  • Merkmalsausprägung: Messung d.h. Quantifizierung oder Qualifizierung der Merkmale
  • Stichprobe: zufällige Auswahl aus Grundgesamtheit der Untersuchungseinheit
    z.B. untersuchte Teilmenge von Studenten

Messniveau/Skalierung

  • Nominal-Skalen
    Unterschiedliche Zahlen kennzeichnen nur unterschiedliche Klassen (1 = männlich, 2 = weiblich, genaus 6 = männlich, 3 = weiblich möglich)
  • Ordinal-/Rang-Skalen
    Zahlenzuordnung spiegelt Rangordnung der Klassen (z.B. sozialer Rang der Eltern)
  • Intervall-Skalen
    Differenz zwischen Merkmalsausprägungen geben Unterschied zwischen Klassen an (z.B. Notenabstände)
  • Ratio-Skalen
    Zusätzlich zur Differenz zwischen Merkmalsausprägungen existiert ein absoluter Nullpunkt (z.B. Alter, Einkommen)

Man sollte sich immer bewusst sein welches Messniveau (Skalennivau) die Daten haben. Am häufigsten Ordinal-Skalen und Intervall-Skalen.

Weiter Unterscheidung:

  • diskretes Merkmal
    nur ganzzahlige oder anders abgestufte Ausprägung (z.B. Alter, Noten)
  • stetiges Merkmal
    beliebig fein und genau messbar (z.B. Länge, Zeit, Gewicht)
Beschreibende Statistik
Darstellung von Häufigkeiten

Darstellungmöglichkeiten von Kategorienhäufigkeiten (z.B. Bruttoeinkommen)

  • Histogramm (Darstellung diskreter Variablen)
  • Polygon (Darstellung stetiger Variablen)
    Linienzug durch die Punkte die durch Kategorienmitte und Kategorienhäufigkeit bestimmt sind -> Bild der Verteilungsform von Daten.
  • Kreisdiagramm (Darstellung nominalskalierter Daten)
Statistische Meßzahlen

Zentrale Tendenz oder Mittelwert

  • Modus (Modalwert)
    Kategorienmitte der Kategorie mit der größten Kategorienhäufigkeit (für kontinuierliche Variablen keine sinnvolle Meßzahl)
  • Median
    Häufigkeitsverteilung in zwei gleich große Hälften (über/unter Medien gleich viele Beobachtungswerte)
  • arithmetisches Mittel (Durchschnitt)
    Für Nominaldaten kein Sinnvoller Wert

Streuungsmaße

  • Standardabweichung (Streuung)
    durchschnittliche Abweichung
Korrelation und Regression

Zur gleichzeitigen Betrachtung und Analyse der Zusammenhänge von mehreren Merkmalen.

Korrelation:

  • negativ korreliert (große x-Werte, kleine y-Werte)
  • positiv korreliert (große x-Werte, große y-Werte)
  • Korrelationskoeffizient (r): Maßzahl für die Eindeutigkeit des linearen Zusammenhangs.
    Um so kleiner, je geringer der lineare Zusammenhang, keine Aussage über kausale Zusammenhänge (Stärke, Richtung)

Regression:

Bei hohen Korrelationskoeffizienten können Meßzahlen mit Hilfe der Regressionsanalyse an eine Gerade (Regressionsgerade) angenähert werden.

Theoretische Häuffigkeitsverteilung
  • Normalverteilung
    Empirische Häufigkeitsverteilungen können oft durch Normalverteilungen gut angenähert werden. Bedeutung: Approximation für empirische Verteilungen, grundlegende theoretische Verteilung in abschließender Statistik.
Stichproben

Vollerhebung von Grundgesamtheiten für empirische Sozialforschung zu langwierig/teuer (Ausnahmen: z.B. Volkszählung) -> Stichproben. Problem: Stichprobenauswahl.

Stichprobenarten

Zufallsstichprobe:

  • einfache Zufallsstichprobe
    Jede Untersuchungseinheit hat gleiche Chance einbezogen zu werden. Nur wenn Grundgesamtheit homogen. Je größer Stichprobe, desto bedeutungsloser werden Abweichungen.
  • geschichtete Zufallsstichprobe
    Heterogene Grundgesamtheit -> Setzt sich aus verschiedenen Teilmengen (Schichten zusammen) -> Zufallsstichprobe pro Schicht.
  • Klumpenstichprobe
    "Klumben" nebeneinander liegender Elemente (z.B. räumlich) werden einbezogen (z.B. Bewohner eines Häuserblocks, auch Flächenstichprobe)
  • Mehrstufige Stichprobe
    Kombination mehrerer Verfahren. z.B. Klumpenstichprobe -> Auswahl der Flächen, Zufallsstichprobe -> Auswahl der Einheiten

Systematische Stichproben:

  • Quotenverfahren
    Aufteilung der Grundgesamtheit in Quoten (z.B. Geschlecht, Alter). Ermittlung des Anteils an der Grundgesamtheit der Quote. Stichprobe nach Prozentanteil auf Quoten verteilt. Innerhalb der Quoten freie Wahl der Untersuchungseinheiten. Gültigkeit nicht mehr wahrscheinlichkeitstheoretisch begründbar (keine Zufallswahl).
  • Systematische Auswahl
    Voraussetzung: Untersuchungseinheiten bereits in Karteien, Listen erfasst. z.B. jeder i-te für Stichprobe ausgewählt. Genauigkeit abhängig vom Aufbau der Grundgesamtheit.
Systematische Fehlerquellen
  • Keine Messwerte für bestimmte Untersuchungseinheiten (z.B. nicht angetroffen)
    Wird vernachlässigt, wenn die verbleibende Stichprobengröße als groß genug erachtet wird.
  • Stichprobe wir nur aus Teil der Grundgesamtheit gewählt (z.B. Telefonbuch als Basis - nur Telefonbesitzer)
  • unwissenschaftliche Auswahl von Sitchproben aufs "Geratewohl" (z.B. Befragung zw. 10-11 am Bahnhof vorbeikommender Passanten)

Auswirkungen möglicher Verfälschungen noch nicht genügend erforscht.

Bestimmung der Stichprobengröße

Welche Stichprobengröße ist notwendig? -> Abhängig von der notwendigen Genauigkeit der Untersuchungsergebnisse.

Prüfung von Hypothesen

Arten von Hypothesen:

  • Hypothesen über die Verteilung der Merkmalsausprägung in der Grundgesamtheit
    Entspricht einer Normalverteilung
  • Unterschiedlichkeitshypothesen
    Prüfung anhand der statistischen Kennwerte der Stichprobe
  • Zusammenhanghypothesen
    Prüfung mithilfe der Korrelations- bzw. Regressionsrechnung
Hypothesentest

Formulierte Hypothese -> Alternativhypothese (H1) -> inhaltlich logische komplementär Hypothese -> Nullhypothese (H0)

Nullhypothese ist Basis von Hypothesenprüfungen. Prüfung liefert im Normalfall Irrtumswahrscheinlichkeit für fälschliche Annahme oder Ablehnung der Alternativhypothese.

Ergebnisse mit Irrtumswahrscheinlichkeit kleiner 5% -> signifikant, kleiner 1% -> stark signifikant

x2-Test (Chi-Quadrat-Test)

Prüfmethode für Hypothesen über bestimmte Verteilungsannahmen. Über die Differenzen zwischen den jeweils erwarteten, theoretischen Häufigkeiten und den tatsächlichen empirischen Häufigkeiten wird eine Meßzahl x2 berechnet.

Varianzanalyse und multivariate Methoden
  • varianzanalytische Methoden
    Wie lässt sich die Variabilität (Varianz) eines abhängigen Merkmals durch den Einfluss einer oder mehrerer unabhängiger Variablen erklären?
  • multivariate Methoden
    Es können mehrere abhängige und unabhängige Variablen in die statistische Analyse eingehen. (Faktorenanalyse)