Skip to content
Fill 1
Blog
5 Min. Lesezeit
19 Jan 2023

Transkriptionsregeln: Erweiterte- und einfache Transkription

Topics
Automatische Transkription
Manuelle Transkription

Der Interviewprozess benötigt viel Aufmerksamkeit. Abgesehen von dem Stellen guter Fragen und den Proben des Interviews, sollte man ein gutes Audiogerät für die Aufnahme des Interviews verwenden und eine gute Gesprächsatmosphäre setzen. Auch das nachträgliche Transkribieren des gehaltenen Interviews ist von enormer Wichtigkeit. 

Die Transkription sollten immer nach bestimmten Transkriptionsregeln durchgeführt werden. Diese dienen nicht nur der Vereinfachung, sondern auch der Einheitlichkeit Ihrer Transkripte. Inzwischen gibt es auch Transkriptionsprogramme, die Sie unterstützen, richtig zu transkribieren und Ihnen dabei helfen, viel Zeit zu sparen. In diesem Beitrag erfahren Sie alles, was Sie über Transkriptionsregeln wissen müssen, um Ihre Interviews oder ähnliche Audioinhalte effizient und einwandfrei zu transkribieren. 

Behandelte Themen

Lesen Sie den gesamten Beitrag oder gehen Sie zu der für Sie relevanten Sektion mit nur einem Klick!

1. Was ist Transkription?

Transkription ist die Umwandlung einer Audio- oder Videoaufnahme in eine schriftliche Form. Meistens geht es dabei um Gespräche, Interviews oder schriftliche Dokumente. Erinnerungen an Gespräche sind oft ungenau. Der Zweck einer Transkription ist es, die Vergänglichkeit mündlicher Aussagen zu beseitigen und mit einem Transkript schriftlich festzuhalten. So kann es für spätere Analysen verwendet werden. Das Gesagte soll genau und umfassend zusammengefasst werden, um dem Leser ein klares Verständnis des Gesprächs zu geben. Ein Übermaß an Details und Informationen macht eine Transkription allerdings schwer lesbar, weshalb auch Vereinfachungen des Gesagten hilfreich sein können. Um das richtige Maß an Genauigkeit und Verständlichkeit zu erlangen, gibt es bestimmte Transkriptionsregeln, an die Sie sich halten können. 

Umfragebericht: Stand der digitalen Barrierefreiheit in der Hochschulbildung in Deutschland

Zwischen August 2020 und Januar 2021 hat Amberscript 350 Studenten von 175 Universitäten in 15 Ländern in Europa befragt. Von diesen waren 103 Befragte von 69 Hochschulen in Deutschland.

2. Was sind Transkriptionsregeln?

Transkriptionen werden im wissenschaftlichen Rahmen immer nach bestimmten Transkriptionsregeln angefertigt. Transkriptionsregeln sind Richtlinien, die bestimmen, wie das Gesprochene verschriftlicht werden muss. Besonders wichtig sind diese Regeln für wissenschaftliche Interviews. Transkriptionsregeln vereinfachen die Transkription und gewährleisten die Einheitlichkeit Ihrer Transkripte. Bei der Transkription kann zwischen wörtlicher und lautsprachlicher Transkription unterschieden werden. Diese Arten der Transkription können wiederum einem bestimmten Transkriptionssystem zugeordnet werden. Wörtliche Transkriptionen fallen unter die Kategorie der einfachen Transkriptionssysteme, und lautsprachliche Transkriptionen zählen zu den komplexeren Transkriptionssystemen. 

Im Deutschen wird sich meist an die Transkriptionsregeln von Dresing und Pehl gehalten. Andere Transkriptionsregeln die gerne genutzt werden sind:

  • GAT
  • Transkriptionsregeln nach Jefferson
  • Transkriptionsregeln nach Dittmar
  • HIAT 

Umwandlung von Audio und
Video in Text und Untertitel

  • Hochpräziser Service auf Anfrage
  • Wettbewerbsfähige Preise mit schnellstem Ergebnis dank AI
  • Einfaches Hochladen, Bearbeiten und Exportieren von Untertiteln und Transkripten

3. Der Unterscheid zwischen wörtlicher und lautsprachlicher Transkription

3.1 Wörtliche Transkription

Die wörtliche Transkription wird dem einfachen Transkriptionssystem zugeordnet. Bei wörtlicher Transkription werden Audioinhalte so vereinfacht wie möglich transkribiert. Beispielsweise werden Füllwörter wie „Äh“ und “Ehm”, Stotterer oder Wortwiederholungen “geglättet” und aus dem Transkript entfernt. Außerdem werden Dialekte und Akzente ins Hochdeutsch übersetzt und so einheitlich gut lesbar dargestellt. Regeln aus dem einfachen Transkriptionssystem konzentrieren sich also eher auf den Inhalt des tatsächlich Gesagten.

Wörtliche Transkription
Wortverschleifungen werden an das Schriftdeutsch angepasst. „So ‘n Auto“ wird zu „so ein Auto“ und „samma“ wird zu „sag mal“.
Dialekte werden möglichst wortgenau ins Hochdeutsche übersetzt.
Stottern wird ausgelassen, abgebrochene Wörter werden ignoriert. Wortdoppelungen werden nur verschriftlicht, wenn sie als Stilmittel genutzt werden, um etwas zu betonen: „Es war sehr, sehr dringend.“
Halbe Sätze werden mit einem Abbruchzeichen „/“ gekennzeichnet.
Hinweisende Hörsignale wie „hm, ja, aha, genau“, werden nur transkribiert, wenn sie als direkte Antwort auf eine Frage genannt werden.
Pausen ab ca. 3 Sekunden werden durch ( …) markiert.
Jeder Sprecherbeitrag erhält eigene Absätze.
Emotionale, nonverbale Äußerungen, wie Lachen oder Seufzen, werden beim Einsatz in Klammern notiert.
Unverständliche Wörter werden mit „(unv.)“ gekennzeichnet.
Die interviewende Person wird durch ein „I:“, die befragte Person durch ein „B:“ gekennzeichnet. Bei mehreren Interviewpartnern wird dem Kürzel „B“ eine entsprechende Kennnummer oder ein Name zugeordnet („B1:“, „Anna:“).

*angelehnt an Darstellung aus Praxisbuch: Interview, Transkription & Analyse (8.Auflage) von Dresing & Pehl (2018, pp. 21-22)

3.2 Lautsprachliche Transkription

Die lautsprachliche Transkription ist unterm Strich die komplexere und zeitintensivere Variante und gehört demnach auch dem  komplexen Transkriptionssystem an. Anders als bei der wörtlichen Transkription, werden bei der lautsprachlichen Transkription die sprachlichen Besonderheiten mit verschriftlicht. Gesprächspausen werden notiert, Stotterter und Wiederholungen aufgezeichnet und Akzente berücksichtigt. Sie eignet sich also eher für Forschungen, die latente Strukturen hinter dem Gesagten erfassen wollen. 

Lautsprachliche Transkription
Wort- und Satzabbrüche werden mit „/“ markiert: „Ich habe mir aber Ge/ Sorgen gemacht.“
Wortdoppelungen werden immer notiert.
Pausen werden je nach Länge durch Auslassungspunkte in Klammern markiert. „(.)“ steht für circa eine Sekunde, „(..)“ für circa zwei Sekunden, „(…)“ für circa drei Sekunden und „(Zahl)“ für mehr als drei Sekunden.
Alle hinweisende Hörsignale („hm, ja, aha, ähm“ etc.) werden transkribiert.
Nach der Partikel „hm“ wird eine Beschreibung der Betonung in Klammern festgehalten. Zu nutzen sind: bejahend, verneinend, nachdenkend, fragend, wohlfühlend, z.B. „hm (bejahend)“
Sprecherüberlappungen werden immer mit „//“ gekennzeichnet.
Mehrere Fülllaute hintereinander werden ohne Satzzeichen dazwischen getippt (z.B. „ähm ähm ähm also da sind wir …“).

*angelehnt an Darstellung aus Praxisbuch: Interview, Transkription & Analyse (8. Auflage) von Dresing & Pehl (2018, p. 23)

3.3 Wann wird welche Art der Transkription bevorzugt?

Für welche Art der Transkription Sie sich entscheiden, hängt ganz von dem späteren Nutzen des Transkripts ab. Hier sind einige wichtige Fragen, die Sie sich im Voraus stellen und beantworten sollten: Wofür schreiben Sie das Transkript, für welche Art von Analyse benötigen Sie es später? Was genau wollen Sie herausfinden? Ist es wichtig, besondere Akzente zu erkennen, oder soll ein Dialekt auch berücksichtigt werden? Während in der Verhaltensforschung lautsprachliche Transkriptionen bevorzugt werden, bedienen sich normale Protokollierungen eher an wörtlichen Transkriptionen. Die folgende Tabelle zeigt auf, in welchen Bereichen welche Art der Transkription gewöhnlicherweise Anwendung findet. 

Beispiele der Brereiche in welchen die verschiedenen Arten der Transkriptionen Anwendung finden

4. Transkription nach Dresing & Pehl

Dresing & Pehl haben Regeln für zwei Arten der Transkription entwickelt – Die einfache Transkription und die erweiterte Transkription. Im Folgenden werden die zwei Arten der Transkription näher erläutert. 

4.1 Einfache Transkription nach Dresing & Pehl 

Bei der einfachen Transkription nach Dresing & Pehl wird wörtlich transkribiert und nicht lautsprachlich. Diese Art der Transkription wird auch als ‘Inhaltlich-semantische Transkription’ oder ‘geglättete Transkription’ bezeichnet. Alle zuvor genannten Aspekte zur wörtlichen Transkription finden hier Anklang. Resultat: Grammatikalisch korrektes Transkript, mit gutem Lesefluss. Dialekte werden möglichst genau an die Schriftsprache angenähert. Das soll sicherstellen, dass die Kernaussagen, die in einem Gespräch vorkommen, hervorgehoben und leserlich gemacht werden.

4.2 Erweiterte Transkription nach Dresing & Pehl 

Bei der erweiterten Transkription nach Dresing & Pehl wird lautsprachlich, zusammenfassend transkribiert. Diese Art der Transkription wird auch als ‘Erweiterte inhaltlich-semantische Transkription’ bezeichnet. Jedes gesprochene Wort wird aufgeschrieben und eine solche Abschrift scheint auf den ersten Blick etwas merkwürdig auszusehen. Alle Äußerungen der Sprecher:innen werden festgehalten. Dazu zählen: Wortverkürzungen, Wortwiederholungen, Stottern etc. Ein solches Transkript gewährt einen detaillierten, nicht nur semantischen Einblick in Inhalte. Ziel ist es, eine möglichst exakte Darstellung des Gesprochenen inklusive des dazugehörigen Kontextes zu bekommen.

4.3 Beispiele der einfachen und erweiterten Transkription nach Dresing & Pehl 

Um diese zwei Arten zu veranschaulichen, folgt ein Beispiele zu je erweiterter und einfacher Transkriptionsform:

Beispiel von erweiterte Transkription und einfacher Transkription nach Dresing und Pehl

5. Automatische Transkription mit Amberscript

Wie Sie sehen, ist das selbstständige transkribieren nicht nur wegen des enormen Zeitaufwandes mühsam. Die Transkriptionsregeln gleichmäßig anzuwenden kann verwirrend sein und viel Aufwand benötigen. Automatische Transkriptionssoftware wie Amberscript können hier Abhilfe schaffen und Sie bei der Transkription Ihrer Interviews unterstützen. 

Die von Amberscript bereitgestellte automatische Transkriptionssoftware kann ein erweitertes Transkriptionsformat generieren. Die Software hört die hochgeladene Audio Datei ab, erkennt die gesprochenen Wörter und wandelt diese schnell und zuverlässig in ein Textformat um. Dies wird durch den Einsatz moderner Spracherkennungstechnologie ermöglicht. Den generierten Entwurf des Transkriptes können Sie in einem Online-Text-Editor begutachten. Wenn das Ergebnis noch nicht zu 100% Ihren Vorstellungen entspricht, können Sie die gewünschten Änderungen in diesem Editor ganz einfach vornehmen.

So benutzen Sie unsere Amberscript Plattform

Amberscript Anleitung: So transkribieren Sie Ihre Audio- und Videoinhalte

Zur Anleitung

Sollten Sie keine Zeit oder Lust haben, diese Änderungen selbst vorzunehmen, können Sie diese Aufgabe an eine:n unserer erfahrenen Schreibkräfte abgeben. Bei unseren professionellen Dienstleistungen können Sie zwischen den beiden Transkriptionsarten wählen. Im “Einfachen Transkriptionsformat“ glätten unsere Schreibkräfte alles was zur Lesefreundlichkeit beiträgt, inklusive der Übertragung von Schweizerdeutsch und andere alemannische Dialekte in Schriftdeutsch. 

Vorteile

Transkribieren mit Amberscript ist:

Schnell

Bearbeiten Sie Ihren eigenen Text innerhalb weniger Minuten oder überlassen Sie die Arbeit unseren erfahrenen Schreibkräften.

Precise
Akkurat

Unsere erfahrenen Schreibkräfte und sorgfältige Qualitätskontrollen sorgen für 100% Genauigkeit Ihrer Transkriptionen und Untertitel.

Einfach

Dank einer Vielzahl an Integrationen und API Schnittstellen, können Sie Ihre Arbeitsabläufe vollständig automatisieren.

Sicher
Sicher

Ihre Daten sind in sicheren Händen. Wir arbeiten DSGVO-Konform + ISO27001 & ISO9001 zertifiziert.

Frau an Laptop am Transkribieren
Dies könnte Sie auch interessieren

Interview Transkription

Erhalten Sie mehr Informationen darüber, wie Sie Ihre Interviews ganz einfach automatisch transkribieren lassen können.

Zur Interview Transkription

Häufig gestellte Fragen

  • Was ist der Unterschied zwischen „Einfacher Transkription“ und „Erweiterter Transkription“?

    Eine einfache (oder „geglättete“) Transkriptions enthält keine Stotterer, Satzabbrüche, sowie „ähh“ und „uhm“. Resultat: Grammatikalisch korrektes Transkript, mit gutem Lesefluss. Bei einer erweiteten (oder „verbatim“) Transkription wird alles aus der Tonaufnahme festgehalten. Resultat: Genaues Transkript, der Tonaufnahme sehr nahe, mit nonverbalen Aspekten. Möchten Sie mehr über die Unterschiede und Arten der Transkription erfahren? Schauen Sie gerne in unseren Blogvorbei!

  • Was ist eine Transkription?

    Bei einer Transkription wird Gesprochenes oder Audio in ein Textformat konvertiert. Videos werden mit Untertiteln versehen, während ein Transkript nur aus Text besteht.

  • Was ist Digitale Barrierefreiheit?

    Digitale Barrierefreiheit bedeutet, dass eine Website, eine App oder ein elektronisches Dokument leicht zu navigieren sind.
    Der Inhalt ist einem breiten Spektrum an Benutzern zugänglich, einschließlich Personen
    mit visueller, auditiver, motorischer oder kognitiver Behinderung.

  • Welche Sprachen sind verfügbar?

    Der automatische Transkriptionsservice ist derzeit für 39 Sprachen verfügbar. Der manuelle Transkriptionsservice ist zurzeit mittels Upload in 15 Sprachen verfügbar. Sollten Sie eine manuelle Transkription in einer anderen Sprache benötigen, können uns jederzeit eine Anfrage senden.

  • Wie lange dauert es, meine Dateien in Text umzuwandeln?

    Unsere hochmoderne Spracherkennung liefert Ergebnisse in weniger als einer Stunde (abhängig von der Größe der Datei kann dies auch nur wenige Minuten dauern). Laden Sie einfach Ihre Audiodatei in unser System hoch, und wir benachrichtigen Sie, sobald die Datei fertig ist! Wenn Sie mehr über die Bearbeitungszeit von unserem manuellen Transkriptionsservice erfahren möchten, klicken Sie hier.

Unsere Software ermöglicht das Erstellen von Text und Untertiteln aus Video oder Audio.

* Hochladen einer Audio- oder Videodatei
* Automatische oder manuelle Sprachausgabe in Text
* Bearbeiten und Exportieren von Text oder Untertiteln