.webp)
Stichprobengröße berechnen: So weißt du, wie viele Teilnehmer deine Studie braucht
.webp)
Das Ghostwriter Expertenteam
.webp)
June 29, 2026
.webp)
8
Min. Lesezeit

Eine Entscheidung, die vor der Erhebung fallen muss
Wie viele Personen brauche ich für meine Studie? Diese Frage stellen sich fast alle Studierenden, die eine quantitative Bachelorarbeit schreiben – und die meisten beantworten sie falsch. Entweder intuitiv: „Fünfzig klingt gut." Oder pragmatisch: „Ich nehme, was ich bekommen kann." Beides ist methodisch nicht ausreichend. Die Stichprobengröße ist keine Schätzfrage und keine Ressourcenfrage – sie ist eine wissenschaftliche Entscheidung, die aus der Forschungsfrage, dem erwarteten Effekt und dem gewählten statistischen Verfahren folgt. Wer das versteht, plant die Erhebung besser – und hat im Methodenteil eine belastbare Begründung.
Warum die Stichprobengröße so entscheidend ist
Die Stichprobengröße beeinflusst direkt, ob eine Studie in der Lage ist, einen vorhandenen Effekt zu entdecken. Diesen Zusammenhang beschreibt das Konzept der statistischen Power. Eine Studie mit zu kleiner Stichprobe hat zu wenig Power – sie übersieht echte Effekte, weil das Signal im statistischen Rauschen untergeht. Das Ergebnis: ein nicht signifikantes Ergebnis, das fälschlicherweise als Beleg für das Fehlen eines Effekts interpretiert wird. Ein sogenannter Fehler zweiter Art – oder Beta-Fehler.
Umgekehrt ist eine zu große Stichprobe nicht automatisch besser. Sie erhöht die statistische Power so weit, dass auch trivial kleine Effekte signifikant werden – Effekte, die zwar statistisch nachweisbar, aber praktisch bedeutungslos sind. Wer mit zehntausend Befragten eine Korrelation von r = 0,03 signifikant macht, hat einen statistisch echten, aber inhaltlich irrelevanten Befund produziert.
Die richtige Stichprobengröße ist weder möglichst groß noch möglichst klein – sie ist angemessen für die Fragestellung, den erwarteten Effekt und das statistische Verfahren.
Die vier Parameter der Stichprobenplanung
Die Berechnung der Stichprobengröße basiert auf vier Parametern, die in einem direkten mathematischen Zusammenhang stehen. Wenn drei dieser Parameter bekannt sind, lässt sich der vierte berechnen.
Signifikanzniveau Alpha
Das Signifikanzniveau legt fest, wie groß die Wahrscheinlichkeit eines Fehlers erster Art sein darf – also wie wahrscheinlich es ist, einen Effekt zu finden, der in Wirklichkeit nicht existiert. In den Sozialwissenschaften ist Alpha = 0,05 der Standard. Das bedeutet: Mit einer Wahrscheinlichkeit von fünf Prozent wird ein Effekt als signifikant ausgewiesen, obwohl keiner vorhanden ist. Strengere Forschung setzt Alpha = 0,01 oder sogar 0,001.
Statistische Power
Die Power ist die Wahrscheinlichkeit, einen tatsächlich vorhandenen Effekt zu entdecken – also einen Fehler zweiter Art zu vermeiden. Der Standard in den Sozialwissenschaften ist eine Power von 0,80 – das bedeutet, dass die Studie mit achtzig Prozent Wahrscheinlichkeit einen vorhandenen Effekt findet. Für klinische oder sicherheitskritische Forschung wird häufig eine Power von 0,90 oder höher gefordert.
Effektgröße
Die Effektgröße beschreibt, wie stark der erwartete Effekt ist – wie groß ein Unterschied, wie stark eine Korrelation oder wie gut ein Modell erklärt. Sie ist der Parameter, der am schwierigsten vorab zu bestimmen ist. In der Praxis gibt es drei Wege: die Schätzung auf Basis vergleichbarer Studien in der Literatur, die Verwendung konventioneller Richtwerte nach Jacob Cohen oder eine eigene Vorabschätzung auf Basis inhaltlicher Überlegungen.
Die bekanntesten Effektgrößenmaße sind Cohens d für Mittelwertvergleiche, Pearsons r für Korrelationen und f² für Regressionen. Jacob Cohen hat für alle drei Maße Richtwerte definiert: klein, mittel und groß. Ein kleiner Effekt ist schwerer zu entdecken und erfordert eine größere Stichprobe als ein großer Effekt.
Stichprobengröße
Der Parameter, der berechnet werden soll – und der direkt aus den anderen drei folgt. Je kleiner der Effekt, der entdeckt werden soll, je strenger das Signifikanzniveau und je höher die geforderte Power, desto größer muss die Stichprobe sein.
Praktische Tools zur Stichprobenberechnung
Die mathematische Berechnung der Stichprobengröße erfordert keine manuellen Formeln – dafür gibt es spezialisierte Software.
G*Power
GPower ist das Standardtool für Stichprobenberechnungen in den Sozialwissenschaften – kostenlos, für Windows und macOS verfügbar, und methodisch in der Forschungsliteratur etabliert. Es unterstützt eine Vielzahl von Verfahren: t-Tests, Varianzanalysen, Korrelationen, Regressionen, Chi-Quadrat-Tests und viele mehr. Die Bedienung ist nach kurzer Einarbeitung intuitiv: Verfahren auswählen, Alpha, Power und Effektgröße eingeben – und GPower berechnet die erforderliche Stichprobengröße.
G*Power kann auch rückwärts gerechnet werden: Wenn die geplante Stichprobengröße feststeht, berechnet das Programm die resultierende Power – was hilft einzuschätzen, wie aussagekräftig die Studie bei dieser Stichprobengröße sein wird.
Online-Rechner
Für einfachere Berechnungen gibt es zuverlässige Online-Rechner. Der Sample Size Calculator von ClinCalc, der Rechner von EPITOOLS oder der integrierte Rechner in JASP sind gut zugänglich und für Standardverfahren ausreichend.
SPSS und R
SPSS enthält keine direkte Stichprobenberechnungsfunktion – aber über das Modul SamplePower ist sie verfügbar. R bietet über das Paket pwr vollständige Stichprobenberechnungen für alle gängigen Verfahren.
Stichprobengröße nach Verfahren
Die erforderliche Stichprobengröße variiert stark je nach statistischem Verfahren.
t-Test für unabhängige Stichproben
Für einen t-Test, der einen mittleren Effekt (d = 0,5) bei Alpha = 0,05 und Power = 0,80 nachweisen soll, werden etwa 64 Fälle pro Gruppe benötigt – also insgesamt 128 Fälle. Für einen kleinen Effekt (d = 0,2) steigt der Bedarf auf etwa 197 Fälle pro Gruppe. Das zeigt, warum Studien mit kleinen erwarteten Effekten so aufwendig sind.
Pearson-Korrelation
Für eine Korrelationsanalyse mit einem mittleren Effekt (r = 0,30) bei Alpha = 0,05 und Power = 0,80 werden etwa 84 Fälle benötigt. Für einen kleinen Effekt (r = 0,10) steigt der Bedarf auf etwa 782 Fälle – ein Wert, der im Rahmen einer Bachelorarbeit kaum erreichbar ist. Das ist ein wichtiger Hinweis auf die Grenzen von Korrelationsstudien mit kleinen Stichproben.
Multiple Regression
Bei der multiplen Regression hängt der Stichprobenbedarf von der Anzahl der Prädiktoren ab. Als grobe Faustregel gilt: mindestens zehn bis zwanzig Fälle pro Prädiktor. Bei fünf Prädiktoren sind das mindestens fünfzig bis hundert Fälle. Eine genauere Berechnung über G*Power mit dem f²-Effektgrößenmaß ist methodisch vorzuziehen.
Chi-Quadrat-Test
Für einen Chi-Quadrat-Test hängt die Stichprobengröße vom Effektmaß w und der Anzahl der Freiheitsgrade ab. Als Orientierung: Für einen mittleren Effekt (w = 0,30) bei Alpha = 0,05 und Power = 0,80 in einer Vierfeldertafel werden etwa 133 Fälle benötigt.
Effektgrößen aus der Literatur schätzen
Die methodisch sauberste Basis für die Wahl der Effektgröße ist die bestehende Forschungsliteratur. Wenn vergleichbare Studien vorliegen, die ähnliche Zusammenhänge untersucht haben, können deren berichtete Effektgrößen als Schätzung verwendet werden. Das sollte im Methodenteil explizit begründet werden: „Auf Basis der Metaanalyse von [Autor, Jahr] wurde für diesen Zusammenhang eine mittlere Effektgröße von d = 0,45 erwartet."
Wenn keine vergleichbaren Studien vorliegen, ist die Verwendung der konventionellen Cohen-Richtwerte die zweitbeste Option. Dabei gilt jedoch: Die konservativen Richtwerte – also der Ansatz mit einem kleinen Effekt – führen zu größeren, sichereren Stichproben. Wer mit einem mittleren Effekt rechnet und der tatsächliche Effekt ist kleiner, hat zu wenig Power.
Stichprobenplanung für qualitative Forschung
In der qualitativen Forschung gibt es keine formale Stichprobenberechnung – weil qualitative Methoden nicht auf statistischer Repräsentativität beruhen. Die Leitfrage ist nicht „Wie viele Fälle brauche ich, um einen Effekt zu entdecken?", sondern „Wie viele Fälle brauche ich, um das Phänomen vollständig zu verstehen?"
Das Prinzip der theoretischen Sättigung ist hier das zentrale Konzept: Daten werden erhoben, bis neue Fälle keine wesentlich neuen Erkenntnisse mehr liefern. In der Praxis bedeutet das für leitfadengestützte Experteninterviews in Bachelorarbeiten typischerweise sechs bis fünfzehn Interviews – je nach Homogenität der Zielgruppe und Tiefe der Fragestellung.
Was im Methodenteil begründet werden muss: nicht eine berechnete Zahl, sondern das Prinzip der Fallauswahl und die Begründung, warum diese Auswahl für die Forschungsfrage geeignet ist.
Was im Methodenteil stehen muss
Die Stichprobenplanung gehört vollständig in den Methodenteil dokumentiert. Dazu gehören: das verwendete Tool zur Berechnung, die gewählten Parameter – Alpha, Power, Effektgröße –, die Begründung für die gewählte Effektgröße und die berechnete Mindeststichprobengröße. Außerdem: die tatsächlich erreichte Stichprobengröße und – falls sie von der Mindestgröße abweicht – eine Einschätzung der resultierenden Power.
Beispiel für eine korrekte Dokumentation: „Die Stichprobengröße wurde mit G*Power 3.1 berechnet. Auf Basis eines erwarteten mittleren Effekts (d = 0,50, nach Cohen, 1988), eines Signifikanzniveaus von α = 0,05 und einer angestrebten Power von 1 - β = 0,80 ergab sich eine Mindestgröße von n = 128 (64 pro Gruppe). Die tatsächlich realisierte Stichprobe umfasst n = 142 Fälle, was einer tatsächlichen Power von 0,84 entspricht."
Diese Dokumentation ist methodisch präzise, vollständig und für Prüfer nachvollziehbar.
Häufige Fehler bei der Stichprobenplanung
Die Stichprobengröße wird nicht begründet – einfach angenommen, dass die verfügbare Zahl ausreicht. Die Effektgröße wird ohne Bezug zur Literatur gewählt – „mittel" ohne Begründung ist keine wissenschaftliche Entscheidung. Die erzielte Power wird nicht berichtet, obwohl die tatsächliche Stichprobe von der geplanten abweicht. Und bei qualitativen Arbeiten wird versucht, eine quantitative Stichprobenlogik anzuwenden – statt theoretische Sättigung und gezieltes Sampling als Begründung zu nutzen.
Wann professionelle Unterstützung sinnvoll ist
Wer bei der Stichprobenplanung unsicher ist, welche Effektgröße realistisch ist, wie G*Power bedient wird oder wie die Stichprobenplanung im Methodenteil dokumentiert werden muss, kann mit gezielter Unterstützung durch Fachexperten wie dein-ghostwriter.de methodisch sauber vorgehen – bevor die Erhebung beginnt, nicht danach.
Fazit
Die Stichprobengröße ist keine Schätzung und keine Ressourcenfrage – sie ist eine methodische Entscheidung, die aus der Forschungsfrage, dem erwarteten Effekt und dem gewählten Verfahren folgt. Wer sie mit G*Power berechnet, begründet und im Methodenteil dokumentiert, legt damit die Grundlage für eine Studie, deren Ergebnisse methodisch belastbar sind.
Eine Studie mit falscher Stichprobengröße beantwortet die Forschungsfrage nicht – sie gibt nur vor, es zu tun.

































































