.webp)
Deskriptive Statistik für deine Bachelorarbeit: Mittelwert, Median und Co. verständlich erklärt
.webp)
Das Ghostwriter Expertenteam
.webp)
May 4, 2026
.webp)
7
Min. Lesezeit

Deskriptive Statistik – der Schritt, den viele überspringen wollen
Viele Studierende wollen in ihrer Bachelorarbeit möglichst schnell zu den „interessanten" Ergebnissen kommen – zu Korrelationen, Gruppenvergleichen, Regressionen. Die deskriptive Statistik wird dabei als notwendiges Übel behandelt, das man schnell abhakt. Das ist ein Fehler. Deskriptive Statistik ist nicht die Vorstufe zur eigentlichen Analyse – sie ist ein eigenständiger, unverzichtbarer Teil der Auswertung. Sie beschreibt, was in den Daten steckt. Und wer seine Daten nicht beschreibt, bevor er sie analysiert, bemerkt oft nicht, wenn etwas grundlegend nicht stimmt.
Was deskriptive Statistik leistet – und was nicht
Deskriptive Statistik beschreibt vorhandene Daten. Sie macht aus einer Tabelle mit hundert Zahlenwerten eine handvoll aussagekräftiger Kennzahlen – und damit verständlich, wie die Daten verteilt sind, wo ihre Mitte liegt und wie stark sie streuen. Was sie nicht leistet: Aussagen über Zusammenhänge, Ursachen oder Verallgemeinerungen auf eine größere Population. Dafür braucht es inferenzstatistische Verfahren. Der Unterschied zwischen deskriptiver und inferenzieller Statistik muss im Methodenteil klar sein – und in der Auswertung konsequent eingehalten werden.
Lagemaße: Wo liegt die Mitte der Daten?
Mittelwert
Der Mittelwert – auch arithmetisches Mittel – ist die bekannteste Kennzahl der deskriptiven Statistik. Er wird berechnet, indem alle Werte addiert und durch die Anzahl der Fälle geteilt werden. Der Mittelwert ist intuitiv verständlich und gut interpretierbar – aber er hat eine wichtige Schwäche: Er reagiert sensibel auf Ausreißer. Ein einzelner extrem hoher oder tiefer Wert kann den Mittelwert erheblich verzerren. Wer das Monatseinkommen einer Gruppe beschreibt, in der eine Person ein Vielfaches der anderen verdient, bekommt einen Mittelwert, der die typische Situation in der Gruppe nicht mehr sinnvoll abbildet. Der Mittelwert ist nur bei intervall- oder ratioskalierten Daten ohne starke Ausreißer das richtige Lagemaß.
Median
Der Median ist der mittlere Wert einer nach Größe sortierten Reihe – genau die Hälfte der Werte liegt über ihm, die andere Hälfte darunter. Anders als der Mittelwert reagiert der Median kaum auf Ausreißer. Genau deshalb ist er bei schiefen Verteilungen oder Daten mit extremen Einzelwerten oft das aussagekräftigere Lagemaß. Einkommen, Immobilienpreise oder Reaktionszeiten werden in der Forschung häufig durch den Median beschrieben – nicht den Mittelwert. Der Median ist ab Ordinalniveau anwendbar.
Modus
Der Modus ist der am häufigsten vorkommende Wert in einem Datensatz. Er ist das einzige Lagemaß, das auf allen Skalenniveaus sinnvoll ist – auch auf Nominalniveau. Bei metrischen Daten hat der Modus meist wenig Aussagekraft, bei kategorialen Daten ist er dagegen oft die einzig sinnvolle Lagemaßzahl. Wenn in einer Befragung die meisten Teilnehmenden einen bestimmten Studiengang angeben, ist das der Modus – und er beschreibt die häufigste Kategorie, ohne dass ein Mittelwert oder Median berechnet werden könnte.
Streuungsmaße: Wie weit liegen die Werte auseinander?
Varianz und Standardabweichung
Lagemaße allein beschreiben nie das vollständige Bild. Zwei Gruppen können denselben Mittelwert haben und trotzdem völlig unterschiedlich verteilt sein. Die Standardabweichung gibt an, wie stark die einzelnen Werte im Durchschnitt vom Mittelwert abweichen. Eine kleine Standardabweichung bedeutet, dass die Werte eng um den Mittelwert gestreut sind. Eine große Standardabweichung zeigt, dass die Werte weit auseinanderliegen. Die Varianz ist das Quadrat der Standardabweichung – sie wird in der Berechnung gebraucht, ist aber in der Interpretation weniger anschaulich als die Standardabweichung. Beide Maße sind nur bei intervall- und ratioskalierten Daten sinnvoll.
Spannweite
Die Spannweite ist die einfachste Form der Streuungsbeschreibung: Sie gibt den Abstand zwischen dem kleinsten und dem größten Wert an. Sie ist schnell berechnet und leicht verständlich – aber sehr anfällig für Ausreißer. Ein einziger extremer Wert kann die Spannweite erheblich vergrößern, ohne dass das für die typische Verteilung der Daten aussagekräftig ist.
Interquartilsabstand
Der Interquartilsabstand beschreibt die Breite der mittleren fünfzig Prozent der Daten – also den Bereich zwischen dem 25. und dem 75. Perzentil. Er ist robuster gegenüber Ausreißern als die Spannweite und wird häufig in Kombination mit dem Median berichtet. Wer den Median als Lagemaß wählt, sollte den Interquartilsabstand als passendes Streuungsmaß ergänzen.
Häufigkeiten und Verteilungen
Absolute und relative Häufigkeiten
Häufigkeiten sind die grundlegendste Form der deskriptiven Statistik – und bei Nominalvariablen oft die einzige sinnvolle Möglichkeit, Daten zu beschreiben. Absolute Häufigkeiten geben an, wie oft ein bestimmter Wert vorkommt. Relative Häufigkeiten – also Prozentwerte – machen Verteilungen vergleichbar, auch wenn die Stichprobengrößen unterschiedlich sind. In Bachelorarbeiten werden Häufigkeiten typischerweise für die Beschreibung der Stichprobe verwendet: Wie viele Befragte sind männlich, weiblich, divers? Wie viele gehören welcher Altersgruppe an? Welcher Studiengang ist am häufigsten vertreten?
Normalverteilung – und warum sie so wichtig ist
Die Normalverteilung ist in der quantitativen Forschung von zentraler Bedeutung, weil viele parametrische Tests – t-Test, ANOVA, Pearson-Korrelation – voraussetzen, dass die Daten annähernd normalverteilt sind. Eine normalverteilte Variable hat eine glockenförmige, symmetrische Verteilung, bei der Mittelwert, Median und Modus zusammenfallen. Ob die eigenen Daten normalverteilt sind, kann visuell über ein Histogramm oder einen Q-Q-Plot geprüft werden – oder statistisch mit dem Shapiro-Wilk-Test bei kleineren Stichproben beziehungsweise dem Kolmogorov-Smirnov-Test bei größeren. Das Ergebnis dieser Prüfung muss im Methodenteil berichtet werden, weil es die Wahl der nachfolgenden Tests begründet.
Deskriptive Statistik richtig berichten
Was in die Arbeit gehört
In einer Bachelorarbeit wird die deskriptive Statistik in der Regel in zwei Schritten berichtet. Erstens die Beschreibung der Stichprobe – Häufigkeiten und Prozentwerte für demografische Variablen. Zweitens die Beschreibung der zentralen Untersuchungsvariablen – Mittelwert und Standardabweichung bei metrischen Variablen, Median und Interquartilsabstand bei schiefen Verteilungen, Häufigkeiten bei kategorialen Variablen. Tabellen und Abbildungen können die Darstellung unterstützen – müssen aber im Fließtext explizit aufgegriffen und erläutert werden.
Häufige Fehler beim Berichten
Mittelwert und Standardabweichung werden für ordinalskalierte Daten berechnet und berichtet, ohne dass das begründet wird. Die Normalverteilung wird nicht geprüft, obwohl parametrische Tests eingesetzt werden. Deskriptive Kennzahlen werden in Tabellen präsentiert, aber im Text nicht interpretiert. Und Streuungsmaße fehlen ganz, obwohl ein Mittelwert ohne Angabe der Streuung kaum aussagekräftig ist.
Welche Software eignet sich für deskriptive Statistik?
SPSS ist an deutschen Hochschulen das am weitesten verbreitete Statistikprogramm und bietet alle deskriptiven Analysen über eine grafische Oberfläche – ohne Programmierkenntnisse. R ist mächtiger und flexibler, erfordert aber eine Einarbeitungszeit. JASP ist eine kostenlose Alternative mit grafischer Oberfläche, die auf R basiert und für Einsteiger gut geeignet ist. Excel kann für einfache deskriptive Auswertungen ausreichen, ist aber für komplexere Analysen und die Anforderungen wissenschaftlicher Arbeiten nur begrenzt geeignet. Welches Tool verwendet wird, muss im Methodenteil benannt werden.
Wann professionelle Unterstützung sinnvoll ist
Deskriptive Statistik wirkt auf den ersten Blick überschaubar – wird aber dann komplex, wenn viele Variablen auf unterschiedlichen Skalenniveaus vorliegen, wenn die Verteilung der Daten unklar ist oder wenn die Ergebnisse korrekt in den Fließtext eingebettet werden müssen. Wer bei der Auswertung unsicher ist oder merkt, dass Skalenniveaus und gewählte Kennzahlen nicht zusammenpassen, kann mit professioneller Unterstützung durch Fachexperten – wie sie dein-ghostwriter.de anbietet – methodische Fehler frühzeitig vermeiden.
Fazit
Deskriptive Statistik ist kein Aufwärmen vor der eigentlichen Analyse – sie ist ein eigenständiger, unverzichtbarer Teil jeder quantitativen Bachelorarbeit. Wer seine Daten sorgfältig beschreibt, die richtigen Kennzahlen für das jeweilige Skalenniveau wählt und die Ergebnisse klar berichtet, legt damit die Grundlage für eine Auswertung, die methodisch trägt.
Wer seine Daten nicht beschreibt, bevor er sie analysiert, analysiert im Dunkeln.

































































