Skip to content
Blog
4 Min. Lesezeit
19 Jan 2023

Effiziente und exzellente Untertitel erstellen? Probiere unsere KI-gestützte Untertitellösung

Topics
Automatische Untertitel

Untertitel sind von entscheidender Bedeutung, um Medieninhalte zugänglicher zu machen und die Benutzerfreundlichkeit im Allgemeinen zu verbessern. In erster Linie ermöglichen sie Gehörlosen oder/und Schwerhörigen Menschen Inhalte zu konsumieren. Außerdem verbessern sie das Verständnis von Eigennamen, Fremdwörtern und normaler Sprache bei starken Akzenten oder Hintergrundgeräuschen. Außerdem können Autoren ihre Reichweite durch übersetzte Untertitel vergrößern. Mehr über die Vorteile von Untertiteln erfahren Sie hier.

Besprochene Themen

1. Die Erstellung von Untertiteln aus Audio

Die Erstellung von Untertiteln ist jedoch nicht trivial und muss bestimmten Regeln folgen, die ihre Lesbarkeit verbessern. Es gibt Beschränkungen für die Anzahl der Zeichen in einer Untertitelzeile: die Anzahl der Zeilen in einem Untertitelrahmen, die Dauer des Untertitelrahmens und die Positionierung von Zeilenumbrüchen innerhalb eines Untertitelrahmens.

Die Regeln für Untertitel können je nach Anbieter variieren. Zum Beispiel haben BBC und Netflix leicht unterschiedliche Richtlinien. Es wird empfohlen, Zeilenumbrüche so einzufügen, dass sie an natürlichen Stellen vorkommen. Ein Zeilenumbruch zwischen einem Artikel und einem Substantiv (z. B. das + Buch, ein + Baum) oder einem Pronomen und einem Verb (z. B. er + läuft, sie + spielen gerne) stört den Lesefluss. Zeilenumbrüche nach Satzzeichen wie Komma und Punkt sind gut, da sie natürliche Pausen anzeigen. Daher müssen bei der Erstellung von Untertiteln die Zeilenumbrüche sorgfältig eingefügt werden, während auch alle anderen Einschränkungen zu beachten sind.

Hier sind einige Beispiele von ungelungenen Zeilenumbrüchen (links) und gelungenen Zeilenumbrüchen (rechts)

Examples of subtitle alignment
Some examples of bad line breaks (left) and good line breaks (right) in a subtitle.

2. Untertitel erstellen ist nicht immer einfach

Traditionell wird die Untertitelung manuell von Menschen durchgeführt. Die automatische Spracherkennung (ASR), die zu den Angeboten von Amberscript gehört, unterstützt die Ersteller von Untertiteln durch die automatische Umwandlung von Sprache in Text. In diesem Fall werden die Fehler im ASR-Transkript zunächst manuell korrigiert damit der Transkript perfekt ist. Anschließend werden die Transkripte verwendet, um die Untertitel zu erstellen. Dieser Prozess ist mühsam und erfordert viel manuelle Arbeit, um den Untertitelregeln zu entsprechen. Daher nimmt die Untertitelung viel mehr Zeit in Anspruch und kostet mehr Geld als eine einfache Transkription.

Automatische oder manuelle Untertitel von Amberscript

Mit der zunehmenden Menge an Medieninhalten ist auch die Nachfrage nach Untertiteln enorm gestiegen. Bei Amberscript bedeutet eine Zunahme der Untertitelungsaufträge angesichts der begrenzten Anzahl von Untertitlern eine Zunahme der Durchlaufzeiten. Wir wollten daher den menschlichen Aufwand bei der Untertitelung durch die automatische Formatierung von Untertiteln verringern.

Während die anderen Regeln automatisiert erfüllt werden können, deuten die Regeln für den Zeilenumbruch von Untertiteln darauf hin, dass sie sich auf linguistische Merkmale des Textes stützen sollten. Daher haben wir einen Ansatz entwickelt, der auf Deep Learning und natürlicher Sprachverarbeitung (NLP) basiert. Wir haben Modelle trainiert, um automatisch die beste Position zum Einfügen eines Zeilenumbruchs zu bestimmen, wobei wir hochwertige Untertitel als Trainingsdaten verwendet haben.

3. Neue Arbeitsweise für Untertitelausrichtung

  • Unsere Modelle sind darauf trainiert, exakt ausgerichtete Untertitel in 13 verschiedenen Sprachen zu liefern: Niederländisch, Deutsch, Englisch, Schwedisch, Finnisch, Norwegisch, Dänisch, Französisch, Spanisch, Italienisch, Portugiesisch, Polnisch und Rumänisch.
  • Anstatt alle Regeln für Zeilenumbrüche fest zu kodieren, haben wir die Modelle so trainiert, dass sie lernen, anhand der von Menschen erstellten Untertitel zu erkennen, wann ein Zeilenumbruch eingefügt werden muss. Unser endgültiger Algorithmus zur Formatierung von Untertiteln nutzt diese Modelle für Zeilenumbrüche und erfüllt gleichzeitig alle anderen Bedingungen.
  • Der Algorithmus arbeitet schnell und erzeugt formatierte Untertitel für die meisten Dateien in nur wenigen Sekunden! Für eine 12-stündige Datei werden zum Beispiel weniger als zwei Minuten benötigt.

Eine wichtige Voraussetzung für die automatische Formatierung von Untertiteln ist die Anpassung der Sprache an den entsprechenden Text. ASR-Transkripte werden häufig bearbeitet, um fehlende Wörter hinzuzufügen und falsche Wörter zu entfernen/zu bearbeiten. Nachdem ein Transkript bearbeitet und fertiggestellt wurde, müssen wir die Wörter an den entsprechenden Sprachsegmenten neu ausrichten, damit die Zeitstempel auf Wortebene korrekt sind. Wir haben einen automatischen Algorithmus zur „Forced Alignment“ entwickelt, der diesen Schritt durchführen kann. Derzeit unterstützen wir das Forced Alignment in drei Sprachen – Niederländisch, Deutsch und Englisch – und werden in Zukunft weitere Sprachen hinzufügen.

Die Kombination aus ASR und automatischer Untertitelformatierung ermöglicht es uns, Untertitel viel schneller als bisher anzubieten. Das Endergebnis ist sehr genau. Darüber hinaus können die Nutzer entscheiden, ob die generierten Untertitel den BBC- oder Netflix-Standards entsprechen sollen.

Außerdem bedeutet der geringere Aufwand für die Erstellung von Untertiteln, dass wir Untertitel auch zu geringeren Kosten anbieten können. Dies bringt uns näher an unser Ziel: Audio barrierefrei zu gestalten!

Fügen Sie Ihren Videos automatisch Untertitel hinzu

  • Automatische Spracherkennung und -anpassung spart Stunden an Arbeitszeit
  • Einfaches Hochladen, Suchen, Bearbeiten und Exportieren oder Anschließen eines Streams
  • Konkurrenzfähige Preise und schnellste Bearbeitung

Interesting topics