Statistik und Ökonometrie

Ich biete Ihnen statistische Auswertungen (Kennzahlen, Diagramme, Signifikanztests) und ökonometrische Untersuchungen (multiple lineare Regression).

Meine Leistungen sind besonders gut für Sie geeignet, wenn Sie für eine anwendungsorientierte betriebswirtschaftliche Dissertation Datenanalysen benötigen,

  • die hohen Ansprüchen genügen,
  • die zugleich einfach gehalten sind und
  • den Standards Ihres Fachgebiets entsprechen.

Bei anspruchsvollen Projekten sind inhaltliche und methodische Überlegungen eng miteinander verbunden:

Einerseits müssen Sie bei Ihren inhaltlichen Überlegungen berücksichtigen, welche Fragen Sie anhand der für Sie verfügbaren Daten klären können. In Ihre inhaltlichen Überlegungen fließt somit ein, welche statistischen und ökonometrischen Methoden Sie kennen.

Andererseits haben Sie häufig die Möglichkeit, eine Frage auf unterschiedliche Weise zu untersuchen. Sie müssen daher einschätzen, ob die von Ihnen bevorzugten Untersuchungsmethoden für Ihre Fragen angemessen sind.

Datenanalysen für betriebswirtschaftliche Dissertationen erfordern somit auch Kenntnisse der betriebswirtschaftlichen Fachliteratur. Vieles lässt sich nur durch einen Vergleich einschätzen: Mit welchen Methoden sind ähnliche Themen behandelt worden?

Ich kann Datenanalysen zu betriebswirtschaftlichen Themen ausführlich erläutern und kommentieren.

Ich habe seit 1997 sehr viele empirische Untersuchungen zu betriebswirtschaftlichen Themen gelesen. Ich kann daher zum Beispiel auch Fragebögen für empirische Studien erstellen, Vorschläge zur Untersuchungsmethodik unterbreiten oder die gewählte Vorgehensweise anhand von Fachliteratur begründen. Dies sind Aufgaben, die ich in den vergangenen Jahren mehrfach übernommen habe.

Sie erhalten meine Arbeitsergebnisse als dynamische Anwendung in Form einer Excel-Arbeitsmappe.

Ich arbeite überall dort mit Excel, wo dies sinnvoll ist. Leistungen für die der Einsatz von Excel unwirtschaftlich wäre, würde ich, falls gewünscht, zukaufen. Dies gilt für Clusteranalysen und für Hauptkomponentenanalysen.

Eine dynamische Anwendung in Form einer Excel-Arbeitsmappe hat folgende Eigenschaften:

Wenn Sie Ihre Daten nachträglich ändern, ergänzen oder bereinigen aktualisiert Excel die gesamte Arbeitsmappe.

In einem derartigen Fall

  • korrigiert Excel sämtliche Berechnungen,
  • erstellt alle Diagramme neu und
  • wiederholt alle statistischen Prüfungen.

Ich kann meine Arbeitsergebnisse so in ein Word-Dokument (.docx) einbinden, dass Word das Textdokument ebenfalls dynamisch anpasst.

Beispiel:

Ich habe in das Word-Dokument eine Excel-Tabelle mit sieben Zeilen eingebunden. Weil Sie Ihre Ausgangsdaten nachträglich ändern, erweitert Excel die auf Ihren Daten basierende Tabelle um drei Zeilen. Word macht das Gleiche; die in Word angezeigte Tabelle hat jetzt drei neue Zeilen.

Vorteile von dynamischen Anwendungen

1. Sie sparen Geld, wenn Sie die Auswertung wiederholen oder modifizieren wollen

Die Erhebung oder Beschaffung von statistischen Daten ist meistens mit großem Aufwand verbunden. Es macht daher Sinn, zunächst nur wenige Daten zu erheben und auszuwerten. Auf diese Weise merken Sie frühzeitig, ob Sie auf dem richtigen Weg sind.

  • Wenn die Zwischenergebnisse Ihren Vorstellungen entsprechen beschaffen Sie weitere Daten. In diesem Fall kopieren Sie die zusätzlichen Daten in Ihre Excel-Arbeitsmappe (an die hierfür vorgesehene Stelle); die erneute Auswertung ist dann fertig.
  • Wenn Sie Nachbesserungsbedarf sehen, zum Beispiel weil in Ihrem Fragebogen eine wichtige Frage fehlt, reichen in der Regel punktuelle Anpassungen der Excel-Arbeitsmappe. Auch in diesem Fall wäre eine erneute Auswertung sehr einfach.

2. Sie können Ihre Daten auch nachträglich bereinigen, ohne die Auswertung wiederholen zu müssen

Daten können unbrauchbar sein. Beispiele sind Dubletten, unsinnige Antworten von Befragungsteilnehmern oder unvollständige Datensätze.

Zu den Pflichtaufgaben gehört daher eine Bereinigung des Datenmaterials, die jedoch nicht immer auf Anhieb gelingt, weil hierfür sehr viel Konzentration erforderlich ist. Wenn Sie Pech haben erkennen Sie unbrauchbare Daten erst, nachdem Sie die komplette Auswertung erhalten haben und unplausibel wirkende Ergebnisse hinterfragen.

In einem derartigen Fall könnten Sie Ihre Daten nachträglich bereinigen und hätten dann - wegen der dynamischen Anpassung - automatisch eine korrigierte Auswertung.

3. Der Fehlanreiz, aus Kostengründen auf Nachbesserungen zu verzichten entfällt weitgehend

Stellen Sie sich vor, Ihre Daten sind komplett ausgewertet. Sie kontrollieren die Ergebnisse und bemerken einen Fehler, den Sie nur durch eine erneute Auswertung Ihrer Daten beseitigen können. Ich habe derartiges bereits mehrfach erlebt: Ein Kunde hat seine Daten mit SPSS auswerten lassen, der Kunde oder ich bemerken Fehler und der Kunde beschließt, sämtliche Fehler zu ignorieren, weil eine erneute SPSS-Auswertung zu teuer wäre.

Zum Vergleich:

  • Durch traditionelle Auswertungen, zum Beispiel mit SPSS, SAS oder R, erhalten Sie Zahlenwerte und statische Diagramme. Die Ergebnisse von traditionellen Auswertungen bleiben daher unverändert, wenn Sie Ihre Ausgangsdaten nachträglich ändern.
  • Durch dynamische Auswertungen in Form von Excel-Arbeitsmappen erhalten Sie Programmcode in Form von Excel-Funktionen und Zellverknüpfungen. Der Programmcode bewirkt eine automatische Anpassung aller Berechnungen, Diagramme und Tabellen.

Der von mir erstellte Programmcode ist einfach gehalten und leicht verständlich. Punktuelle Änderungen, zum Beispiel eine Modifikation der Auswertungsmethodik, sind daher leicht zu implementieren.

Sie können Ihre Datenanalyse so oft wiederholen oder modifizieren lassen, bis Sie mit den Ergebnissen wirklich zufrieden sind; die hierdurch entstehenden Mehrkosten bleiben gering.

4. Sie haben allerbeste Kontrollmöglichkeiten

Auswertungen in Form von Excel-Arbeitsmappen sind transparent:

  • Sie erhalten eine klar strukturierte Arbeitsmappe, die mit einem Inhaltsverzeichnis beginnt (mit Links zu den angegebenen Gliederungspunkten, bei Bedarf mit kurzen Erläuterungen).
  • Auf dem zweiten Arbeitsblatt finden Sie Ihre Daten und gegebenenfalls Parameter, die Sie hier ändern können. Zu den Parametern gehört zum Beispiel die für Signifikanztests erforderliche Irrtumswahrscheinlichkeit.
  • Die in den folgenden Arbeitsblättern enthaltenen Auswertungen basieren auf dem zweiten Arbeitsblatt. Änderungen der Daten und Parameter des zweiten Arbeitsblatts sind daher für die komplette Arbeitsmappe wirksam.

Sie können auf jedem Arbeitsblatt sehen, was ich gemacht habe und wie meine Ergebnisse zustande gekommen sind. Sämtliche Berechnungen sind kurz erläutert, immer mit präzisen Angaben.

5. Weitere Vorteile

Weil meine Leistungen transparent sind, können Sie anhand meiner Arbeitsmappen lernen, die betreffenden Auswertungen selber zu übernehmen, zumal ich Ihnen Fragen dazu beantworten würde und bei Bedarf auch technischen Support leiste (für den Umgang mit Excel).

Eine Kontrolle meiner Arbeitsergebnisse könnte für Sie auch deshalb interessant sein, weil Sie für die von mir implementierte dynamische Anpassung zahlreiche Verwendungsmöglichkeiten finden. Ich habe zum Beispiel meine Buchführung auf diese Weise automatisiert.

Excel oder SPSS?

Meine Arbeitsmappen sind auf Excel 2010 zugeschnitten. Excel 2010 rechnet genauer als Excel 2007, was sich bei Signifikanztests bemerkbar machen kann (außerdem beim Einsatz von Solver). Trotzdem können Sie meine Arbeitsmappen auch mit Excel 2007 verwenden.

1. Einfache Mittelwertvergleiche

Beispiel: Sie sehen anhand Ihrer Daten, dass sich für zwei Stichproben die Mittelwerte deutlich unterscheiden. Sie wollen jetzt wissen, ob die beobachtete Mittelwertdifferenz auch für die beiden Grundgesamtheiten gilt (und daher statistisch signifikant ist).

Im Normalfall lösen Sie diese Aufgabe mit einem t-Test, je nach Datenmaterial entweder für unabhängige oder verbundene (abhängige) Stichproben.

Ich betrachte den t-Test für unabhängige Stichproben:

Mit SPSS wählen Sie die Option »T-Test bei unabhängigen Stichproben« und geben an, was Sie berechnen wollen. Sie erhalten dann die Ergebnisse.

Im Ausgabefenster von SPSS sehen Sie unter anderem, dass SPSS getestet hat, ob zwischen den beiden Gruppen Varianzgleichheit besteht. SPSS informiert Sie über das Ergebnis in Form eines Signifikanzniveaus.

Trotzdem führt SPSS den t-Test zweimal durch: einmal für den Fall der Varianzgleichheit und einmal für den Fall der Varianzungleichheit. Dies ist sinnvoll.

An den Ergebnissen fällt auf:

1. Die von SPSS ausgegebenen Werte sind nur verständlich, wenn Sie sich vorher mit der Software beschäftigt haben. Sie müssen sich für einen der beiden t-Tests entscheiden und die für Sie maßgeblichen Werte interpretieren. Dies wird nicht nur durch fehlende Erläuterungen erschwert, sondern auch durch überflüssige Angaben.

2. Sie können die von SPSS ausgegebenen Werte als Datei speichern. Auf die von mir beschriebene dynamische Anpassung müssen Sie mit SPSS jedoch verzichten: Mit SPSS müssen Sie den t-Test wiederholen, wenn Sie Ihre Ausgangsdaten nachträglich ändern, ergänzen oder bereinigen.

3. Sie können die von SPSS ausgegebenen Werte per Zwischenablage in ein Word-Dokument einfügen, was für die von mir beschriebene dynamische Anpassung jedoch unzureichend ist. Excel hat gegenüber SPSS den Vorteil, dass Word den Excel-Namensmanager unterstützt und ich im Excel-Namensmanager auch flexible Bereiche definieren kann, das heißt Bereiche, deren Größe von Excel dynamisch angepasst wird.

Ich beschreibe jetzt meine Vorgehensweise:

  • Zuerst öffne ich meine Arbeitsmappe Templates.xlsx und kopiere das Template für den gewünschten t-Test
  • Anschließend öffne ich die Arbeitsmappe mit Ihren Daten und kopiere den Inhalt der Zwischenablage an die gewünschte Stelle
  • Danach schreibe ich in die hierfür vorgesehenen Zellen, auf welche Daten sich der Mittelwertvergleich beziehen soll
  • Zum Abschluss trage ich ein, in welcher Zelle der Arbeitsmappe die Irrtumswahrscheinlichkeit festgelegt wird

Die gesamte Auswertung ist jetzt fertig.

Schritt eins, zwei und vier sind leicht. Schritt drei ist etwas schwerer, weil ich für die gewünschte dynamische Anpassung flexible Angaben machen muss.

Sie erhalten Folgendes:

Im ersten Abschnitt sehen Sie, welche Daten und welche Modellannahmen verwendet werden. Sie sehen hier auch die Irrtumswahrscheinlichkeit, die Sie auf dem zweiten Blatt der Arbeitsmappe ändern können (Voreinstellung: 0,05).

Im zweiten Abschnitt finden Sie einen t-Test für den Fall der Varianzgleichheit und einen t-Test für den Fall der Varianzungleichheit (Heteroskedastizität). Beide Tests sind erläutert.

Sie sehen im zweiten Abschnitt zunächst die Nullhypothese und die Alternativhypothese. Dies ist wichtig, weil Sie mit t-Tests unterschiedliche Hypothesen testen können.

Für jeden der beiden t-Tests erhalten Sie das Signifikanzniveau und einen Text, der Sie darüber informiert, ob die Nullhypothese abgelehnt werden soll oder nicht. Sie finden im zweiten Abschnitt auch ergänzende Angaben, insbesondere die Freiheitsgrade (df).

Im dritten Abschnitt finden Sie einen Test auf Varianzgleichheit, ebenfalls mit präzisen Angaben. Sie finden hier auch Hinweise zur Aussagekraft des Tests.

Im vierten Abschnitt sind die Ergebnisse zusammengefasst.

Sie können alle Zwischenschritte, die zu den beschriebenen Ergebnissen geführt haben, leicht nachvollziehen. Sie sehen immer, mit welchen Excel-Funktionen ich gearbeitet habe und wie die einzelnen Berechnungen miteinander verknüpft sind.

Ein großer Vorteil von Templates sind die Variationsmöglichkeiten:

Ich habe zum Beispiel die Kompatibilität mit Excel 2007 durch eine separate Excel-2007-Spalte sichergestellt. Ich habe mit wenig Aufwand aus meinem Template für die Nullhypothese »beide Mittelwerte sind gleich« ein neues Template erstellt, mit dem ich Nullhypothesen wie »Mittelwert eins minus Mittelwert zwei ist mindestens gleich zehn« testen kann.

Die mit meiner Vorgehensweise verbundene Transparenz erleichtert Ihnen nicht nur die Kontrolle meiner Arbeitsergebnisse - Sie sehen auch, wie einfach vieles geht.

SPSS ist dagegen eine Black Box: Sie geben Daten ein, bedienen die Software und erhalten Ergebnisse. Wie SPSS die Ergebnisse im Einzelnen berechnet hat, bleibt offen.

2. Explorative Datenanalyse

Eine explorative Datenanalyse zielt darauf ab, Ihre Vorgehensweise zu klären.

Stellen Sie sich vor, Sie haben Daten beschafft und konkrete Vorstellungen, was Sie mit Ihren Daten belegen wollen. Trotzdem kann es sein, dass Ihre Daten auch Zusammenhänge belegen, an die Sie bisher nicht gedacht haben. Außerdem besteht häufig die Möglichkeit, Ihre Daten auf unterschiedliche Weise auszuwerten.

Oftmals ist es daher das Beste, zunächst mit Ihren Daten zu experimentieren: Tabellen und Grafiken erstellen, gegebenenfalls Trendlinien zeichnen und Kennzahlen berechnen - immer mit dem Ziel, sich einen Überblick zu verschaffen und zu erkennen, was Ihre Daten hergeben und was genauer untersucht werden sollte.

Die explorative Datenanalyse wird in vielen Statistik-Büchern vernachlässigt. Zu den Ausnahmen gehört das Lehrbuch von Guerrero, der sehr ausführlich erläutert, wie Sie mit einfachen Methoden viele Hinweise für weitere Untersuchungen erhalten (Hector Guerrero: Excel Data Analysis, Berlin, Heidelberg, 2010, Seite 55-175).

Guerrero zeigt, dass Excel für die explorative Datenanalyse sehr gut geeignet ist. Dies gilt sicherlich auch für SPSS.

Excel wird häufig unterschätzt.

Wenig bekannt ist zum Beispiel das für die explorative Datenanalyse interessante Add-In PowerPivot für Excel 2010 (kostenlos erhältlich auf der Microsoft-Website). PowerPivot kann sehr große Datensätze verarbeiten (zum Beispiel acht Millionen Daten auf einmal) und ermöglicht Auswertungen, bei denen mehrere getrennt vorliegende Datensätze zusammengeführt werden sollen.

PowerPivot verleiht Excel 2010 nach Angaben von Microsoft »unmatched computational power« (www.powerpivot.com, aufgesucht am 21. Oktober 2011).

3. Multiple Regressionsanalyse

Beispiel: Sie planen eine lineare Regressionsanalyse mit drei bis fünf unabhängigen Variablen. Sie wollen zunächst nur wissen, ob eine sehr einfache Regressionsgleichung mit vier unabhängigen Variablen zu akzeptablen Ergebnissen führt.

Sie können diese Aufgabe sicherlich mit SPSS lösen, indem Sie das gewünschte Verfahren auswählen und im Steuerungsfenster für die lineare Regression die erforderlichen Angaben machen.

Mit Excel arbeite ich folgendermaßen:

  • Ich kopiere die für die Regressionsanalyse erforderlichen Daten auf ein neues Arbeitsblatt und stelle sicher, dass die dynamische Anpassung erhalten bleibt
  • Danach öffne ich meine Arbeitsmappe Templates.xlsx und kopiere das Template für die gewünschte Regressionsanalyse
  • Jetzt kopiere ich den Inhalt der Zwischenablage in das neue Arbeitsblatt (normalerweise rechts neben den Daten)
  • Ich schreibe die Namen der für die Regressionsanalyse verwendeten Variablen in die hierfür im Template vorgesehenen Felder
  • Ich führe die RGP-Funktion aus, und zwar an der im Template markierten Stelle (liefert unter anderem die Schätzwerte für die Regressionskoeffizienten)
  • Anschließend ergänze ich die im ersten Schritt erstellte Tabelle um eine Spalte für die Residuen und schreibe einmal die Berechnungsformel
  • Zum Abschluss trage ich ein, in welcher Zelle der Arbeitsmappe die Irrtumswahrscheinlichkeit festgelegt wird

Die beschriebenen Arbeitsschritte sind leicht, wenn Sie die verwendeten Arbeitstechniken kennen.

Mein Template liefert die folgenden Angaben:

  • Schätzwerte für die Regressionskoeffizienten
  • standardisierte Schätzwerte für die Regressionskoeffizienten (Beta-Werte)
  • die Standardfehler der geschätzten Regressionskoeffizienten
  • Konfidenzintervalle für die Regressionskoeffizienten
  • für jeden Regressionskoeffizienten das Ergebnis eines t-Tests
  • das Ergebnis eines globalen F-Tests
  • das Bestimmtheitsmaß
  • das adjustierte Bestimmtheitsmaß und die hieraus abgeleiteten Kennzahlen Toleranz und VIF
  • den Standardfehler der Regression
  • den Durbin-Watson-Koeffizienten

Ich zweifle daran, ob Sie die beschriebenen Ergebnisse mit SPSS schneller erhalten als mit einem Excel-Template. Mit SPSS können Sie Zeit sparen, wenn das betreffende Verfahren in SPSS implementiert ist und bei mir nicht.

Beim Einsatz von SPSS können Sie nicht sehen, wie die berechneten Zahlen zustande gekommen sind. Es wäre denkbar, dass SPSS falsch bedient wurde, die SPSS-Auswertung daher fehlerhaft ist und Sie trotzdem keine Möglichkeit haben, dies anhand der gelieferten Ergebnisse zu erkennen.

Bei der von mir verwendeten Methode mit Excel-Arbeitsmappen haben Sie sehr viel bessere Kontrollmöglichkeiten. Zum Beispiel ergibt sich aus der Formel im Feld mit dem Zahlenwert, wie ich den Durbin-Watson-Koeffizienten ermittelt habe. Sie könnten die Definition des Durbin-Watson-Koeffizienten im Internet nachlesen und prüfen, ob meine Berechnungsformel hiermit übereinstimmt.

Für eine Plausibilitätskontrolle brauchen Sie keine speziellen Statistikkenntnisse; Sie müssten sich nur etwas Zeit nehmen und bereit sein, einfache Excel-Formeln nachzuvollziehen. Viele Berechnungen könnten Sie auch mit dem in Excel verfügbaren Analyse-Toolpack kontrollieren.

Es wäre leicht, das beschriebene Template um zusätzliche Angaben zu erweitern, zum Beispiel um Elastizitäten oder die Gütemaße AIC und SIC. Ich habe dies nicht getan, weil die in meinem Template berücksichtigten Kennzahlen für eine erste Beurteilung der Regressionsgleichung völlig ausreichend sind.

Weitergehende Auswertungen würde ich nur empfehlen, wenn ich hierfür einen vernünftigen Grund sehe. Zum Beispiel würde ich bei einem schlecht ausgefallenen t-Test (Koeffizient nicht signifikant) eine Prüfung auf Multikollinearität in Betracht ziehen.

 

Leistungsübersicht (Statistik und Ökonometrie)

Sie können der folgenden Aufstellung entnehmen, welche Leistungen ich zurzeit als Teil meines Standardrepertoires betrachte.

Statistik:

  • Deskriptive Auswertungen von Zeitreihen- und Querschnittsdaten
  • Diagramme, zum Beispiel Histogramme, Scatterplots, Diagramme mit Trendlinien oder zusätzlichen Vergleichswerten aus anderen Datensätzen
  • Kennzahlen, zum Beispiel Median oder mittlerer Quartilsabstand
  • Korrelationskoeffizient nach Pearson mit Signifikanztest und Scatterplot zur Prüfung auf einen möglicherweise bestehenden nichtlinearen Zusammenhang
  • Korrelationskoeffizient nach Spearman mit Signifikanztest
  • Chi-Quadrat-Unabhängigkeitstest
  • Konfidenzintervalle
  • Mittelwertvergleiche zwischen zwei Grundgesamtheiten
  • Einfaktorielle ANOVA (Mittelwertvergleiche zwischen mehr als zwei Grundgesamtheiten)
  • Mehrfaktorielle ANOVA: siehe Ökonometrie, Punkt vier
  • Einfache lineare Regression, durch grafische Darstellungen ergänzt

Ökonometrie:

  • Multiple lineare Regression (Methode der kleinsten Quadrate) mit den üblichen Kennzahlen und Tests (siehe oben, »Excel oder SPSS?«, Beispiel drei)
  • Regressionsgleichungen mit transformierten Variablen, zum Beispiel um abnehmende Grenzerträge zu modellieren
  • Regressionsanalysen mit qualitativen Variablen
  • Multiple lineare Regression zur Behandlung von Fragestellungen der mehrfaktoriellen ANOVA
  • F-Tests für zusammengesetzte Hypothesen
  • Falls anwendbar: Durbin-Watson-Test auf Autokorrelation, bei Bedarf zusätzliche Erläuterungen anhand von Scatterplots
  • LM-Test (Breusch-Godfrey Serial Correlation Lagrange Multiplier Test)
  • Einschätzung der Prognosequalität von Regressionsgleichungen anhand von Ex-post-Prognosen
  • Residuen-Histogramm mit Jarque-Bera-Test auf Normalverteilung
  • Prüfung auf Multikollinearität
  • Untersuchung der Residuenplots auf Heteroskedastizität
  • White-Test auf Homoskedastizität
  • Chow-Test auf Strukturbruch