Illustration eines braunen Lederbuches mit goldener Umrandung und goldener Federzeichnung auf dem Einband.

Akademisch

Kodierung und Kategorienbildung: So wertest du qualitative Daten systematisch aus

Ein lächelndes junges Mädchen mit braunen Haaren im Freien, das eine rosa Jacke trägt.

Das Ghostwriter Expertenteam

Kalender mit Montag bis Sonntag Spalten und hervorgehobenen Tagen 8 bis 14 im April.

June 15, 2026

Runde weiße Wanduhr mit schwarzen Zahlen und schwarzen Zeigern, die 2:15 Uhr anzeigen.

Min. Lesezeit

Home Ratgeber

Kodierung und Kategorienbildung: So wertest du qualitative Daten systematisch aus

Warum Kodierung der kritischste Schritt der qualitativen Auswertung ist

Wer qualitative Interviews geführt, transkribiert und die Texte vor sich liegen hat, steht vor der eigentlichen methodischen Aufgabe: der Auswertung. Und genau hier trennt sich sauberes qualitatives Arbeiten von unsauberem. Die Kodierung – das systematische Erschließen des Datenmaterials durch Kategorien – ist der Schritt, der aus einem Stapel Interviewtexten wissenschaftliche Ergebnisse macht. Wer diesen Schritt intuitiv und unstrukturiert angeht, produziert Befunde, die nicht nachvollziehbar sind und einer methodischen Prüfung nicht standhalten. Wer ihn systematisch angeht, legt die Grundlage für Ergebnisse, die wirklich tragen.

Was Kodierung bedeutet

Kodieren bedeutet, Textstellen im Datenmaterial Kategorien oder Codes zuzuordnen. Eine Textstelle kann ein einzelner Satz sein, ein Absatz oder ein längerer Abschnitt – je nach Forschungsfrage und Kodiereinheit. Der Code ist eine Bezeichnung, die den Inhalt der Textstelle auf einem höheren Abstraktionsniveau beschreibt. Mehrere ähnliche Textstellen, die denselben Code erhalten, bilden zusammen eine Kategorie.

Das Ergebnis der Kodierung ist ein Kategoriensystem – eine strukturierte Übersicht aller Kategorien mit zugeordneten Textstellen, Definitionen und Kodierregeln. Dieses System ist das Herzstück der qualitativen Auswertung und die Grundlage für alle weiteren Interpretationsschritte.

Deduktive und induktive Kategorienbildung

Bevor die erste Textstelle kodiert wird, muss eine grundlegende methodische Entscheidung getroffen werden: Werden die Kategorien deduktiv aus der Theorie abgeleitet, induktiv aus dem Material entwickelt – oder in einer Kombination beider Ansätze?

Deduktive Kategorienbildung

Bei der deduktiven Kategorienbildung werden die Kategorien vor der Auswertung festgelegt – auf Basis des theoretischen Rahmens, der Forschungsfrage oder vorangegangener Literatur. Das Datenmaterial wird dann systematisch nach diesen vordefinierten Kategorien durchsucht und kodiert.

Der Vorteil: Das Kategoriensystem ist theoretisch verankert, die Auswertung folgt einer klaren Struktur, und die Verbindung zwischen Theorie und Empirie ist explizit. Der Nachteil: Inhalte im Datenmaterial, die über die vorab definierten Kategorien hinausgehen, werden möglicherweise übersehen – weil das Kodierrahmen sie nicht erfasst.

Deduktive Kategorienbildung eignet sich besonders, wenn eine gut etablierte theoretische Grundlage vorhanden ist und die Forschungsfrage darauf abzielt, bestehende Konzepte in einem neuen Kontext zu überprüfen.

Induktive Kategorienbildung

Bei der induktiven Kategorienbildung entstehen die Kategorien direkt aus dem Datenmaterial heraus. Der Forschende geht ohne vordefinierte Kategorien in die Auswertung und lässt sich von den Texten leiten: Was sind die zentralen Themen, Muster und Bedeutungen in diesem Material? Aus diesen Beobachtungen entstehen schrittweise Kategorien, die sich mit jedem weiteren kodierten Textabschnitt weiterentwickeln und präzisieren.

Der Vorteil: Das Kategoriensystem ist eng am Material, unerwartete Inhalte können aufgenommen werden, und die Auswertung ist offen für das, was das Datenmaterial tatsächlich enthält. Der Nachteil: Der Prozess ist zeitaufwendiger, weniger strukturiert und erfordert mehr methodische Erfahrung, um ein konsistentes System zu entwickeln.

Induktive Kategorienbildung eignet sich besonders für explorative Fragestellungen, bei denen das Ziel ist, ein Phänomen von Grund auf zu verstehen, statt es an einer bestehenden Theorie zu messen.

Kombination beider Ansätze

In der Praxis ist eine Kombination beider Ansätze am häufigsten – und in der Regel auch methodisch am überzeugendsten. Ein theoriebasiertes Grundgerüst an Hauptkategorien wird deduktiv entwickelt, während Subkategorien und neue thematische Aspekte induktiv aus dem Material ergänzt werden. Diese Kombination ermöglicht theoretische Verankerung und offene Empirie gleichzeitig. Wichtig: Im Methodenteil muss klar begründet werden, welche Kategorien deduktiv und welche induktiv entstanden sind – und warum.

Das Kategoriensystem aufbauen

Ein vollständiges Kategoriensystem besteht aus mehr als einer Liste von Kategorienbezeichnungen. Jede Kategorie braucht drei Bestandteile, die zusammen das sogenannte Codebuch bilden.

Kategoriendefinition

Die Definition beschreibt präzise, was unter dieser Kategorie verstanden wird – welche Inhalte hineingehören und welche nicht. Eine vage Definition führt zu inkonsistenter Kodierung. Beispiel: Die Kategorie „Zeitdruck" könnte definiert werden als „Alle Textstellen, in denen Interviewte beschreiben, dass mangelnde Zeit die Qualität ihrer Arbeit beeinflusst oder beeinflusst hat – direkt oder indirekt." Eine solche Definition ist klar genug, um konsistent angewendet zu werden.

Ankerbeispiel

Das Ankerbeispiel ist eine konkrete Textstelle aus dem Datenmaterial, die typisch für diese Kategorie ist. Es dient als Referenzpunkt: Wenn bei einer neuen Textstelle unklar ist, ob sie zur Kategorie gehört, wird sie mit dem Ankerbeispiel verglichen.

Kodierregel

Die Kodierregel beschreibt, wie bei Grenzfällen entschieden wird – also wenn eine Textstelle potenziell zu zwei verschiedenen Kategorien gehören könnte. Klare Abgrenzungsregeln zwischen ähnlichen Kategorien sind entscheidend für die Konsistenz des gesamten Kategoriensystems.

Der Kodierungsprozess Schritt für Schritt

Schritt 1: Materialdurchsicht und Probekodierung

Bevor das gesamte Material kodiert wird, empfiehlt sich eine erste Durchsicht ohne Kodierung. Das gibt einen Überblick über die Bandbreite der Inhalte und hilft, realistische Kategorien zu antizipieren. Anschließend wird eine Probekodierung mit einem Teil des Materials durchgeführt – einem oder zwei Interviews –, um das Kategoriensystem zu testen und zu überarbeiten.

Schritt 2: Erstkodierung des gesamten Materials

Das gesamte Datenmaterial wird systematisch von Anfang bis Ende durchgearbeitet. Jede relevante Textstelle wird einer Kategorie zugeordnet. Textstellen, die keiner der vorhandenen Kategorien entsprechen, erhalten eine neue Kategorie – oder werden als nicht relevant markiert, wenn sie für die Forschungsfrage keine Relevanz haben.

Wichtig: Während der Kodierung sollten keine parallelen Interpretationsarbeiten stattfinden. Die Kodierung ist zunächst ein deskriptiver Schritt – was steht hier? – nicht ein interpretativer – was bedeutet das? Die Interpretation kommt nach der Kodierung.

Schritt 3: Überarbeitung des Kategoriensystems

Nach der Erstkodierung wird das Kategoriensystem überarbeitet. Welche Kategorien überschneiden sich? Welche sind zu breit und müssen aufgeteilt werden? Welche sind zu eng und können zusammengeführt werden? Haben sich neue Kategorien gebildet, die in das Grundgerüst integriert werden müssen? Diese Überarbeitung ist kein Zeichen methodischer Schwäche – sie ist methodisch ausdrücklich vorgesehen und sollte im Methodenteil dokumentiert werden.

Schritt 4: Zweitkodierung und Intercoder-Reliabilität

Nach der Überarbeitung des Kategoriensystems wird idealerweise eine Zweitkodierung durchgeführt – entweder durch eine zweite Person oder durch denselben Forschenden nach einem zeitlichen Abstand. Die Übereinstimmung beider Kodierungen wird gemessen, häufig mit dem Cohens Kappa-Koeffizienten. Ein Wert über 0,7 gilt als akzeptable Übereinstimmung. Bei geringerer Übereinstimmung muss das Kategoriensystem weiter präzisiert werden.

In Bachelorarbeiten ist eine Zweitkodierung durch eine zweite Person nicht immer möglich – aber die Selbstkodierung nach einem zeitlichen Abstand ist eine wertvolle Alternative, die methodisch im Methodenteil begründet werden kann.

Schritt 5: Auswertung der kodierten Textstellen

Nun werden alle Textstellen pro Kategorie zusammengeführt und analysiert. Was sagen die Textstellen in dieser Kategorie? Welche Gemeinsamkeiten, welche Unterschiede gibt es? Welche Muster werden sichtbar? Diese Analyse ist der Übergang von der deskriptiven Kodierung zur interpretativen Auswertung – und der Schritt, der die wissenschaftlichen Ergebnisse produziert.

Kategorienebenen und Hierarchien

Ein gut entwickeltes Kategoriensystem ist nicht flach, sondern hierarchisch strukturiert. Hauptkategorien erfassen übergeordnete thematische Bereiche. Subkategorien differenzieren innerhalb dieser Bereiche. Diese Hierarchie macht das System übersichtlicher und ermöglicht differenziertere Auswertungen.

Beispiel: Die Hauptkategorie „Arbeitsbedingungen" könnte die Subkategorien „Zeitdruck", „fehlende Ressourcen" und „mangelnde Unterstützung" enthalten. Jede Subkategorie erhält eine eigene Definition, ein eigenes Ankerbeispiel und eine eigene Abgrenzungsregel.

Häufige Fehler bei der Kodierung

Das Kategoriensystem wird nicht dokumentiert – keine Definitionen, keine Ankerbeispiele, keine Abgrenzungsregeln. Das macht die Auswertung nicht reproduzierbar und ist ein schwerer methodischer Fehler. Kategorien überschneiden sich inhaltlich, sodass dieselbe Textstelle konsistent mehreren Kategorien zugeordnet werden könnte – ohne dass klar ist, welche die richtige ist. Die Kodierung und die Interpretation werden nicht klar getrennt: Bereits beim Kodieren werden Schlussfolgerungen gezogen, die erst nach der vollständigen Kodierung gezogen werden sollten. Und das Kategoriensystem wird nach der ersten Kodierung nicht überarbeitet – obwohl die Probekodierung fast immer Anpassungsbedarf zeigt.

Software für die qualitative Auswertung

Qualitative Daten lassen sich manuell in Word oder Excel kodieren – was bei kleinen Datensätzen funktioniert, bei größeren aber schnell unübersichtlich wird. Spezialisierte Software erleichtert die Arbeit erheblich. MAXQDA ist das in der deutschsprachigen Wissenschaft meistgenutzte Programm für qualitative Datenanalyse – mit Funktionen für Kodierung, Memoschreiben, Visualisierungen und Teamarbeit. Atlas.ti bietet ähnliche Funktionen und ist besonders in internationalen Forschungskontexten verbreitet. NVivo ist eine weitere verbreitete Option. Alle drei Programme bieten Studentenlizenzen an und werden an vielen Hochschulen unterstützt.

Wann professionelle Unterstützung sinnvoll ist

Kodierung und Kategorienbildung sind der methodisch komplexeste Teil der qualitativen Auswertung – weil sie gleichzeitig theoretisches Wissen, systematisches Vorgehen und interpretatives Urteilsvermögen verlangen. Wer beim Aufbau des Kategoriensystems unsicher ist, ob die Kategorien trennscharf genug sind, oder wer bei der Dokumentation des Auswertungsprozesses nicht weiß, was hineingehört, kann mit gezielter Unterstützung durch Fachexperten wie dein-ghostwriter.de methodisch sauber vorgehen.

Fazit

Kodierung und Kategorienbildung sind das methodische Herzstück qualitativer Forschung. Wer ein klares Kategoriensystem entwickelt, es sorgfältig dokumentiert und den Auswertungsprozess transparent hält, legt die Grundlage für Ergebnisse, die wissenschaftlich belastbar sind – und einer kritischen Prüfung standhalten.

Ein gutes Kategoriensystem entsteht nicht beim ersten Durchgang – sondern durch konsequente Überarbeitung.

Zurück zum Ratgeber

Starte jetzt deine Anfrage

Unverbindlich und diskret – erhalte innerhalb von 24 Stunden dein persönliches Angebot.

Diskrete Anfrage senden

WhatsApp Kontakt

Kodierung und Kategorienbildung: So wertest du qualitative Daten systematisch aus

Warum Kodierung der kritischste Schritt der qualitativen Auswertung ist

Was Kodierung bedeutet

Deduktive und induktive Kategorienbildung

Deduktive Kategorienbildung

Induktive Kategorienbildung

Kombination beider Ansätze

Das Kategoriensystem aufbauen

Kategoriendefinition

Ankerbeispiel

Kodierregel

Der Kodierungsprozess Schritt für Schritt

Schritt 1: Materialdurchsicht und Probekodierung

Schritt 2: Erstkodierung des gesamten Materials

Schritt 3: Überarbeitung des Kategoriensystems

Schritt 4: Zweitkodierung und Intercoder-Reliabilität

Schritt 5: Auswertung der kodierten Textstellen

Kategorienebenen und Hierarchien

Häufige Fehler bei der Kodierung

Software für die qualitative Auswertung

Wann professionelle Unterstützung sinnvoll ist

Fazit

Starte jetzt deine Anfrage

Leistungen

Fachbereiche

Standorte

Unternehmen