Benutzerspezifische Werkzeuge
Sie sind hier: Startseite Lexikon Technologische und methodische Grundlagen Statistik

Statistik

Ausgehend von Anmerkungen zum Begriff Statistik und seiner Geschichte werden zentrale Teilgebiete der statistischen Methodenlehre umrissen. Dabei wird insbesondere auf praktische Fragen der empirischen Datenanalyse eingegangen.

Historische Anmerkungen

Die etymologischen Wurzeln des Begriffes "Statistik" finden sich im neulateinischen "statistica, statisticum" (den Staat und seinen Status betreffend), und im ital. "statista" (Staatsmann, Politiker). Seit dem 18. Jh. (vgl. Sinclair (1754-1835), Achenwall (1749-1835)) wurde der Begriff ‚Statistik‘ für die Sammlung und Auswertung von Daten benutzt. Heute lassen sich zwei Bedeutungen im Gebrauch des Begriffes Statistik unterscheiden: zum einen (insbesondere in der Fachsprache) die Wissenschaft von der Entwicklung und Anwendung empirischer Methoden zur Analyse von Massendaten in Natur und Gesellschaft, zum anderen (insbesondere umgangssprachlich) die Ergebnisse dieser Analysen und deren Präsentation in Form von Tabellen, Graphiken und Kennziffern (Maßzahlen, Statistiken).

Definition

"Dabei sind empirische Ergebnisse von großer Wichtigkeit, um Zusammenhänge zu verstehen, Theorien zu generieren, Hypothesen zu testen oder Meinungsbilder zu gewinnen."
[DAGStat-Bulletin 2008, Nr. 1, S. 5].

Die Statistik liefert Verfahren der quantitativen empirischen Analyse und wird in vielen wissenschaftlichen Disziplinen als Methode eingesetzt. "Dabei sind empirische Ergebnisse von großer Wichtigkeit, um Zusammenhänge zu verstehen, Theorien zu generieren, Hypothesen zu testen oder Meinungsbilder zu gewinnen." [DAGStat-Bulletin 2008, Nr. 1, S. 5]. Die Statistik befasst sich im Einzelnen mit Verfahren zu Datenerhebungen, der Aufbereitung und Darstellung der Daten zum Zwecke der Informationsgewinnung, der Datenanalyse unter Verwendung stochastischer Modelle und unter Berücksichtigung der spezifischen datengenerierenden Prozesse sowie mit der Interpretation der empirischen Analysen zur Entwicklung von Handlungsempfehlungen in Entscheidungssituationen, zur Überprüfung von Hypothesen und für Prognosen. Statistische Untersuchungen umfassen folglich Projektplanung, Modellierung, Datenerhebung, Datenaufbereitung, Analyse, Interpretation und Dokumentation. 

Teilgebiete

Wie viele andere wissenschaftliche Disziplinen hat sich die Statistik im Laufe der Jahre immer weiter ausdifferenziert. Wichtige Teilgebiete der modernen Statistik sind: Deskriptive (beschreibende) Statistik, Explorative (hypothesen-entdeckende) Statistik, Induktive (schließende) Statistik und weitere inferenzstatistische Methoden, Statistische Entscheidungstheorie, Rechnergestützte Statistik (Computational Statistics), Data Mining.

Deskriptive Statistik

Die deskriptive Statistik befasst sich mit der Aufbereitung und Beschreibung der Daten. Dazu gehören Fragen der Kodierung, der problemadäquaten Variablendefinitionen, der Identifikation von Messfehlern und Ausreißerwerten sowie die Behandlung fehlender Werte, die Informationsverdichtung in Form von Tabellen, Graphiken und Maßzahlen unter Berücksichtigung der Variablentypen. Als Datenquellen kommen Erhebungen der amtlichen und der nichtamtlichen Statistik oder eigene Erhebungen in Form von Umfragen, Beobachtungen oder Experimenten in Betracht. In neuerer Zeit hat die Bedeutung von Internetquellen sowie von Geschäfts- und Abrechnungsdaten für die angewandte Statistik ständig zugenommen. Allerdings bleiben dabei häufig Fragen nach der Seriosität der Datenproduzenten und der Datenqualität (Repräsentativität, Objektivität, Validität und Reliabilität) offen. In diesem Zusammenhang hat auch die Bedeutung großer, komplexer, wenig strukturierter Datensätze an Bedeutung gewonnen, für die eigene statistische Auswertungsmethoden erforderlich wurden. Werden alle für eine Fragestellung relevanten Objekte erfasst, spricht man von Vollerhebung. Kostengründe sprechen aber häufig für Teilerhebungen.

Induktive Statistik und weitere statistische Inferenzmethoden

Mit der Frage, wie sich aufgrund von Informationen aus Teilerhebungen Aussagen für die insgesamt interessierende Grundgesamtheit gewinnen lassen, beschäftigt sich die induktive Statistik Durch die Benutzung spezieller wahrscheinlichkeitstheoretischer Modelle und statistischer Methoden der Schätz- und Testtheorie lassen sich entsprechende Aussagen treffen, die mit Unsicherheit behaftet sind, deren Unsicherheit aber abgeschätzt und quantifiziert werden kann. Mit Hilfe explorativer Methoden, dazu gehören im weitesten Sinne auch Methoden des Data Mining, sollen in großen Datensätzen unter intensiver Nutzung spezifischer Software und Computerunterstützung Muster und Regelmäßigkeiten, Regeln und Zusammenhänge zwischen Objekten und/oder Variablen aufgedeckt und für weitere wissenschaftliche Untersuchungen bereitgestellt werden. Während die induktive Statistik hauptsächlich modellorientiert und hypothesen-überprüfend vorgeht, zählen die meisten explorativen Methoden zu den datenorientierten hypothesen-erzeugenden Verfahren. Eine strikte Trennung dieser Vorgehensweisen ist aber in der Praxis wenig hilfreich, "Lernen aus Daten" ist schließlich das Ziel statistischen Arbeitens in allen Fachdisziplinen. Dabei muss auch den Besonderheiten der Fragestellungen und der Datenbeschaffenheit jeweils Rechnung getragen werden. Entsprechende Spezialisierungen führten zu Teildisziplinen wie Ökonometrie (Statistische Datenanalyse in der Ökonomik) oder Biometrie (Statistische Methoden der Biologie). Hinsichtlich der Datenstrukturen sind auch Querschnitts-, Längsschnitt- und Paneldatenanalysen zu unterscheiden, die ebenfalls zu entsprechenden Spezialisierungen in der statistischen Arbeit führten. Nach wie vor sind auch Grundlagenfragen der statistischen Inferenz, der Modellierung und der Messung von Unsicherheit und Risiko sowie die Unterscheidung von Korrelations- und Kausalitätsbeziehungen Gegenstand lebhafter Kontroversen innerhalb der Statistik.

Literatur

Achenwall, Gottfried: Statsverfassung der heutigen vornehmsten europäischen Reiche und Völker im Grundrisse. Göttingen 1749.

Anderson, David R. et al.: Statistics for Business and Economics. Cengage Learning 2006.

Bamberg, Günter ; Baur, Franz ; Krapp, Michael: Statistik. 17. Auflage. Oldenbourg 2012.

Bortz, Jürgen; Schuster, Christof: Statistik für Human- und Sozialwissenschaftler. 7. Auflage. Springer 2010.

Fahrmeir, Ludwig ; Künstler, Rita ; Pigeot, Iris ; Tutz, Gerhard: Statistik. Der Weg zur Datenanalyse. 7., überarbeitete Auflage. Springer 2012.

Hartung, Joachim; Elpelt, Bärbel ; Klösener, Karl-Heinz: Statistik. Lehr- und Handbuch der angewandten Statistik. 15. Auflage. Oldenbourg 2009.

Schira, Josef: Statistische Methoden der VWL und BWL. Theorie und Praxis. 4. Auflage. Pearson 2012.

Schwarze, Jochen: Grundlagen der Statistik. Band 1: Beschreibende Verfahren. 12. Auflage. nwb Verlag 2014.

Schwarze, Jochen: Grundlagen der Statistik. Band 2: Wahrscheinlichkeitsrechnung und induktive Statistik. 10. Auflage. nwb Verlag 2013.

 

Autoren


 

Prof. Dr. Manfred Kraft, Universität Paderborn, Lehrstuhl für Ökonometrie und Statistik, Warburger Str. 100, 33098 Paderborn

Autoreninfo


 

Dr. Sonja Lück, Universität Paderborn, Fakultät für Wirtschaftswissenschaften, Statistik und Quantitative Methoden der Empirischen Wirtschaftsforschung, Warburger Str. 100, 33098 Paderborn

Autoreninfo


Zuletzt bearbeitet: 22.11.2016 15:24
Letzter Abruf: 22.11.2017 17:50
Artikelaktionen