Skip to content
Blog
7 Min. Lesezeit
7 Apr 2023

3 Wege, wie automatische Spracherkennung (ASR) die digitale Integration fördern kann

Topics
Automatische Transkription

In der EU wurde die Richtlinie über die digitale Eingliederung von Websites und mobilen Anwendungen öffentlicher Stellen (EU2016/2102) in Kraft gesetzt. Diese Richtlinie verlangt von öffentlichen Organisationen, dass sie inklusiver werden, indem sie all ihre öffentlich veröffentlichten Inhalte für Menschen mit Behinderungen zugänglich machen. Diese Gruppe umfasst etwa 50 bis 75 Millionen Bürger und macht 10 bis 15 % der Gesamtbevölkerung in den 27 EU-Mitgliedstaaten aus. Was kann die automatisierte Spracherkennung dazu beitragen?

Was ist ASR?

Automatisierte Spracherkennung (ASR) ist eine Technologie, die es Computern ermöglicht, gesprochene Sprache zu erkennen und zu interpretieren. Dabei werden gesprochene Wörter in geschriebenen Text umgewandelt, der dann von Maschinen analysiert, gespeichert und verarbeitet werden kann. ASR wird häufig in Sprachassistenten, Transkriptionssoftware und Sprache-zu-Text-Tools eingesetzt.

Was ist digitale Integration?

Digitale Inklusion hingegen bezieht sich auf den Prozess, der sicherstellt, dass alle Menschen, unabhängig von ihrem Hintergrund oder ihren Lebensumständen, gleichberechtigten Zugang zu digitalen Technologien und Dienstleistungen haben. Dazu gehören der Internetzugang, die digitale Kompetenz und die Fähigkeiten, die zur effektiven Nutzung digitaler Werkzeuge erforderlich sind.

Wie passen diese beiden Konzepte zusammen?

ASR ist für die digitale Eingliederung von Bedeutung, weil es das Potenzial hat, Barrieren abzubauen und die Zugänglichkeit für Menschen zu verbessern, die sonst von digitalen Technologien ausgeschlossen wären. Durch die Umwandlung von gesprochenen Wörtern in geschriebenen Text kann ASR digitale Inhalte und Dienste für Menschen mit Hörbehinderungen, Sprachbarrieren oder anderen Behinderungen besser zugänglich machen.

Die Herausforderung der digitalen Barrierefreiheit

Die digitale Welt hat die Art und Weise, wie wir leben, arbeiten und kommunizieren, revolutioniert. Für Millionen von Menschen mit Behinderungen ist der Zugang zur digitalen Welt jedoch nicht immer eine einfache Aufgabe. Die digitale Zugänglichkeit bezieht sich auf das Ausmaß, in dem digitale Technologie, einschließlich Software, Websites und Anwendungen, für alle Menschen zugänglich ist, unabhängig von ihren Fähigkeiten. Trotz der Fortschritte in den letzten Jahren stellen viele Websites und Anwendungen für Menschen mit Behinderungen immer noch erhebliche Zugangsbarrieren dar, die ihre Teilhabe an der digitalen Gesellschaft behindern.

Das Problem der digitalen Zugänglichkeit hat weitreichende Folgen für den Einzelnen und die Gesellschaft als Ganzes. Für Menschen mit Behinderungen kann es den Zugang zu Informationen, Bildungs- und Beschäftigungsmöglichkeiten einschränken und ihre Lebensqualität insgesamt mindern. Außerdem wird dadurch eine Kultur der Ausgrenzung aufrechterhalten, in der Menschen mit Behinderungen weiter an den Rand gedrängt und von der Mehrheitsgesellschaft isoliert werden.

Drei Wege, wie ASR die digitale Inklusion fördern kann

Die Technologie der automatischen Spracherkennung hat das Potenzial, Barrieren für die digitale Integration abzubauen und eine zugänglichere und integrativere digitale Welt zu schaffen. Hier sind drei Möglichkeiten, wie ASR die digitale Inklusion fördern kann:

Verbesserung der Zugänglichkeit für Menschen mit Behinderungen: 

ASR-Technologie kann ein unglaublich leistungsfähiges Werkzeug für gehörlose oder schwerhörige Menschen sowie für Menschen mit eingeschränkter Mobilität sein. Durch die Bereitstellung von Untertiteln für Audio- und Videoinhalte in Echtzeit kann die ASR-Technologie den Zugang zu digitalen Medien für Menschen erleichtern, die Schwierigkeiten haben, zu hören oder dem Inhalt zu folgen. Ebenso können Menschen mit eingeschränkter Mobilität mit Hilfe von ASR-Sprachbefehlen digitale Geräte steuern und leichter auf digitale Dienste zugreifen, was ihnen ein unabhängigeres Leben ermöglicht.

Ermöglichung des Zugangs für Menschen mit geringen Lese- und Schreibkenntnissen: 

Für Menschen mit geringen Lese- und Schreibkenntnissen können digitale Inhalte und Dienste unglaublich schwer zugänglich und navigierbar sein. Die ASR-Technologie kann jedoch dazu beitragen, diese Lücke zu schließen, indem sie es den Nutzern ermöglicht, mit digitalen Geräten und Diensten über ihre Stimme zu interagieren. Dies kann besonders für Menschen hilfreich sein, die Schwierigkeiten mit dem Lesen oder Schreiben haben, da sie so das Internet nutzen und leichter auf digitale Ressourcen zugreifen können.

Überwindung der digitalen Spaltung für Nicht-Muttersprachler:innen: 

In vielen Regionen und Ländern ist die vorherrschende Sprache im Internet und bei den digitalen Diensten nicht unbedingt dieselbe wie die von den Einwohnern gesprochene Hauptsprache. Dies kann ein erhebliches Hindernis für die digitale Integration darstellen, da es für Nicht-Muttersprachler schwierig sein kann, auf digitale Inhalte und Dienste zuzugreifen und sie zu verstehen. Die ASR-Technologie kann jedoch dazu beitragen, diese Kluft zu überbrücken, indem sie Übersetzungs- und Transkriptionsdienste in Echtzeit bereitstellt. Indem sie es den Nutzern ermöglicht, mit digitalen Geräten und Diensten in ihrer eigenen Sprache zu interagieren, kann ASR Nicht-Muttersprachlern den Zugang zu digitalen Ressourcen und eine bessere Teilhabe an der digitalen Welt ermöglichen.

Fallstudien und Beispiele

Universität Jena

An der Universität Jena wurde die ASR-Technologie eingesetzt, um die digitale Zugänglichkeit zu fördern, indem Vorlesungen und akademische Inhalte für Studierende mit Hörbehinderungen zugänglicher gemacht wurden. Die Universität nutzte die ASR-Technologie von Amberscript zur automatischen Transkription von Vorlesungen und zur Erstellung von Untertiteln für Videos, wodurch die Inhalte für Studierende, die Schwierigkeiten haben, dem gesprochenen Inhalt zu folgen, leichter zugänglich wurden.

Diese Lösung ermöglichte Studierenden mit Hörbehinderungen einen gleichberechtigten Zugang zu akademischen Inhalten, so dass sie in vollem Umfang an Vorlesungen und Diskussionen teilnehmen konnten. Sie trug auch dazu bei, Lernbarrieren abzubauen und die Inklusion innerhalb der Universitätsgemeinschaft zu fördern.

Durch den Einsatz der ASR-Technologie konnte die Universität Jena die digitale Zugänglichkeit verbessern und eine integrativere Lernumgebung für alle Studierenden schaffen.

Telekommunikationsunternehmen Orange

In dieser Fallstudie hat ASR durch die Bereitstellung präziser und effizienter Transkriptionsdienste zur Förderung der digitalen Zugänglichkeit für ein weltweites Publikum beigetragen. Orange, ein weltweit tätiges Telekommunikationsunternehmen, musste Untertitel und Transkripte für seine digitalen Inhalte erstellen, um diese für Menschen mit Hörbehinderungen oder in anderen Sprachen zugänglich zu machen.

Mit der ASR-Technologie von Amberscript konnte Orange schnell und einfach Untertitel und Transkripte für seine Inhalte erstellen. Dadurch wurden die Inhalte für ein breiteres Publikum zugänglicher und inklusiver, auch für Gehörlose, Schwerhörige oder Menschen, die andere Sprachen sprechen.

Die ASR-Technologie half Orange auch, Zeit und Ressourcen zu sparen, da der Transkriptionsprozess automatisiert und der Bedarf an manueller Arbeit reduziert werden konnte. Auf diese Weise konnte Orange Inhalte effizienter und effektiver produzieren, ohne dabei auf Genauigkeit und Qualität verzichten zu müssen.

Cheflix

ASR trug im Rahmen der Partnerschaft zwischen Cheflix und Amberscript zur Förderung der digitalen Zugänglichkeit bei, indem es genaue und effiziente Untertitel für die Kochvideos von Cheflix bereitstellte. Die durch die ASR-Technologie erzeugten Untertitel machen die Videos für gehörlose und schwerhörige Menschen zugänglich, aber auch für diejenigen, die es vorziehen, Videos mit Untertiteln zu sehen.

Die ASR-Technologie ermöglicht es Cheflix außerdem, seine Inhalte in mehreren Sprachen anzubieten, so dass sie für ein breiteres Publikum zugänglich sind, unabhängig von dessen Muttersprache. Dies fördert die digitale Integration, da Sprachbarrieren beseitigt werden und mehr Menschen Zugang zu den Inhalten erhalten.

Darüber hinaus zeigt der Einsatz der ASR-Technologie in dieser Partnerschaft, wie Technologie genutzt werden kann, um zugänglichere und inklusivere digitale Erlebnisse zu schaffen und damit letztlich eine größere Integration und Zugänglichkeit für alle Menschen in der Gesellschaft zu fördern.

Herausforderungen bei ASR

Die automatische Spracherkennung (ASR) hat in den letzten Jahren große Fortschritte gemacht, aber es gibt immer noch eine Reihe von Herausforderungen und Einschränkungen, die es zu bewältigen gilt. Hier sind einige der wichtigsten Herausforderungen und Einschränkungen:

  • Genauigkeit: Trotz der Fortschritte in der ASR-Technologie bleibt die Genauigkeit eine große Herausforderung. ASR-Software kann Probleme haben, Sprache in lauten Umgebungen oder bei mehreren Sprechern genau zu transkribieren. Dies kann für Menschen, die auf ASR angewiesen sind, den Zugang zu digitalen Inhalten oder die Kommunikation mit anderen erschweren.
  • Dialekte und Akzente: ASR kann Schwierigkeiten haben, verschiedene Dialekte und Akzente zu erkennen, insbesondere solche, die weniger verbreitet sind. Dies kann ein erhebliches Hindernis für Personen darstellen, die mit nicht standardmäßigen Akzenten oder Dialekten sprechen.
  • Begrenzte Sprachunterstützung: ASR-Software ist oft auf bestimmte Sprachen oder Dialekte beschränkt, was für Menschen, die Minderheitensprachen oder -dialekte sprechen, eine große Herausforderung darstellen kann.
  • Begrenzte Anpassungsmöglichkeiten: ASR-Software lässt sich unter Umständen nicht an bestimmte Branchen oder Anwendungsfälle anpassen, was ihren Nutzen in bestimmten Kontexten einschränken kann.

Amberscript: die beste Wahl

Amberscript verfügt über mehrere Funktionen, die dazu beitragen, einige Herausforderungen und Einschränkungen der ASR-Technologie zu überwinden. Neben Transkriptions– und Untertitelungsdiensten bietet das Unternehmen auch Audiodeskription, Übersetzungen und Synchronisation an.

  • Mehrsprachige Unterstützung: Amberscript kann Audiodaten in mehr als 39 Sprachen transkribieren, was zur Überwindung von Sprachbarrieren beiträgt.
  • Genauigkeit: Amberscript verwendet fortschrittliche Algorithmen, um hohe Genauigkeitsraten bei der Sprache-zu-Text-Transkription zu erreichen. Außerdem bietet es einen interaktiven Editor, mit dem Benutzer ihre Transkriptionen überprüfen und bearbeiten können, um die Genauigkeit weiter zu verbessern. Für besondere Anlässe mit bestimmten Akzenten und Dialekten bietet Ammberscript einen professionellen Service an, der das Korrekturlesen durch muttersprachliche Experten nutzt. 
  • Anpassungen: Amberscript ermöglicht es Benutzern, Spracherkennungsfunktionen in ihre Software zu integrieren, indem sie Amberscripts Audio-zu-Text-API verwenden. Es ist möglich, sich mit generischen Modellen zu verbinden oder sogar mit diesen zusammenzuarbeiten, um eine maßgeschneiderte Spracherkennung für Ihren speziellen Anwendungsfall zu erstellen. Benutzer können die Software auch auf bestimmte Stimmen oder Akzente trainieren, was die Genauigkeit noch weiter verbessern kann.

Transkriptionen und Untertitel mit Amberscript in drei einfachen Schritten

Präzise Transkriptionen in kürzester Zeit

Die Untertitelung Ihres Inhalts war noch nie so einfach

Interesting topics