{"id":18049,"date":"2020-02-21T00:00:00","date_gmt":"2020-02-21T00:00:00","guid":{"rendered":"https:\/\/localhost:10083\/unkategorisiert\/how-speech-to-text-works-de\/"},"modified":"2023-05-08T17:45:11","modified_gmt":"2023-05-08T15:45:11","slug":"spracherkennungssoftwaere-erklaert","status":"publish","type":"post","link":"https:\/\/www.amberscript.com\/de\/blog\/spracherkennungssoftwaere-erklaert\/","title":{"rendered":"Wie funktioniert eine Spracherkennungs-Software?"},"content":{"rendered":"\n<p>Mit der Einf\u00fchrung und Etablierung von Smart Home Devices wie Alexa, Cortana, Siri und Google Assistant, hat die Spracherkennung definitiv an neuem Wert gewonnen. Statt Befehle einzutippen, k\u00f6nnen wir unsere smarten Wohnzimmer-Erfindungen ganz bequem per Sprache steuern.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Inhaltsverzeichnis<\/strong><\/h2>\n\n\n\n<ol class=\"wp-block-list\" type=\"1\">\n<li><span style=\"text-decoration: underline;\"><a href=\"#was-ist-der-aktuelle-stand-von-spracherkennung\">Was ist der aktuelle Stand von Spracherkennung?<\/a><\/span><\/li>\n\n\n\n<li><span style=\"text-decoration: underline;\"><a href=\"#wie-wird-speech-to-text-software-in-verschiedenen-branchen-eingesetzt\">Wie wird Speech-to-Text-Software in verschiedenen Branchen eingesetzt?<\/a><\/span><\/li>\n\n\n\n<li><span style=\"text-decoration: underline;\"><a href=\"#wie-funktioniert-ein-automatisches-spracherkennungsprogramm\">Wie funktioniert ein automatisches Spracherkennungsprogramm?<\/a><\/span><\/li>\n\n\n\n<li><span style=\"text-decoration: underline;\"><a href=\"#sind-alle-spracherkennungstools-gleich\">Sind alle Spracherkennungstools gleich?<\/a><\/span><\/li>\n\n\n\n<li><span style=\"text-decoration: underline;\"><a href=\"#was-macht-amberscripts-speech-to-text-engine-so-einzigartig\">Was macht Amberscript&#8217;s Speech to Text Engine so einzigartig?<\/a><\/span><\/li>\n\n\n\n<li><span style=\"text-decoration: underline;\"><a href=\"#nat\u00fcrliches-sprachverst\u00e4ndnis-der-n\u00e4chste-meilenstein-der-spracherkennung\">Nat\u00fcrliches Sprachverst\u00e4ndnis \u2013 Der n\u00e4chste Meilenstein der Spracherkennung<\/a><\/span><\/li>\n<\/ol>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"was-ist-der-aktuelle-stand-von-spracherkennung\"><strong>Was ist der aktuelle Stand von Spracherkennung?<\/strong><\/h2>\n\n\n\n<p>Die Fortschritte im Bereich der Spracherkennung sind beeindruckend und haben unser Leben und unsere Arbeitsweise revolutioniert. Was fr\u00fcher als unm\u00f6glich galt, ist heute zur Gewohnheit geworden.<\/p>\n\n\n\n<p>Dank der neuesten Technologien stehen uns heute zahlreiche kostenlose Spracherkennungsprogramme zur Verf\u00fcgung, die in immer mehr Bereichen eingesetzt werden k\u00f6nnen. Von der Gesundheitsbranche \u00fcber den Kundenservice bis hin zur qualitativen Forschung und dem Journalismus &#8211; die Umwandlung von gesprochener Sprache in Text hat in all diesen Branchen das Potenzial, den Spielverlauf grundlegend zu ver\u00e4ndern.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Warum brauchen wir Speech-to-Text Software?<\/strong><\/h3>\n\n\n\n<h4 class=\"wp-block-heading\"><strong>Sie verk\u00fcrzt die Zeit f\u00fcr die Transkription von Inhalten<\/strong><\/h4>\n\n\n\n<p>Viele Anwendungsbereiche verlangen qualitativ hochwertige Transkripte. Die Technologie hinter Spracherkennung entwickelt sich rasend schnell und macht es somit schneller, g\u00fcnstiger und bequemer als manuelle Transkription.<\/p>\n\n\n\n<p>Obwohl die Technologie noch nicht and die menschliche Qualit\u00e4t rankommt, kann teilweise eine Genauigkeit von bis zu 95% erreicht werden. Transkription war sonst immer unglaublich zeitaufwendig und arbeitsintensiv, w\u00e4hrend sich heutzutage die manuelle Arbeit in Grenzen h\u00e4lt und sich auf einige wenige Anpassungen beschr\u00e4nkt.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\"><strong>Software f\u00fcr die Spracherkennung macht Audio zug\u00e4nglich&nbsp;<\/strong><\/h4>\n\n\n\n<p>Warum erf\u00e4hrt automatische Spracherkennung zurzeit einen derartigen Boom in Europa? Die Antwort ist recht simpel \u2013 digitale Barrierefreiheit. Wie die neue <a href=\"https:\/\/eur-lex.europa.eu\/legal-content\/EN\/TXT\/HTML\/?uri=CELEX:32016L2102&amp;from=EN\" target=\"_blank\" rel=\"noopener\">EU Richtlinie 2016\/2102 <\/a>besagt, m\u00fcssen alle \u00f6ffentlichen Stellen daf\u00fcr sorgen, dass alle Menschen Zugang zu den bereitgestellten Informationen hat. F\u00fcr Podcasts, Videos und Tonaufnahmen m\u00fcssen entweder Untertitel oder Transkripte zur Verf\u00fcgung gestellt werden, um die Inhalte auch f\u00fcr taube und h\u00f6rgesch\u00e4digte Menschen zug\u00e4nglich zu machen.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"wie-wird-speech-to-text-software-in-verschiedenen-branchen-eingesetzt\"><strong>Wie wird Speech-to-Text-Software in verschiedenen Branchen eingesetzt?<\/strong><\/h2>\n\n\n\n<p>Die Technologie der Spracherkennung ist nicht mehr nur eine Annehmlichkeit f\u00fcr den Alltag, sondern wird auch in wichtigen Branchen wie Marketing, Banken und Gesundheitswesen eingesetzt. Spracherkennungsanwendungen ver\u00e4ndern die Art und Weise, wie Menschen arbeiten, indem sie einfache Aufgaben effizienter machen und komplexe Aufgaben erm\u00f6glichen.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Analyse von Kundenanrufen<\/strong><\/h3>\n\n\n\n<p>Die automatische Transkription hilft Ihnen, Kundengespr\u00e4che zu verstehen, sodass Sie bei Bedarf die Kundenbetreuung optimieren k\u00f6nnen. Dieser Service macht auch Ihr Kundendienstteam produktiver.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Untertitelung von Medien und Sendungen&nbsp;<\/strong><\/h3>\n\n\n\n<p>Software zur Umwandlung von Sprache in Text hilft bei der Erstellung von Untertiteln f\u00fcr Videos, damit diese auch von geh\u00f6rlosen oder schwerh\u00f6rigen Menschen angesehen werden k\u00f6nnen. Durch das Hinzuf\u00fcgen von Untertiteln zu Videos werden diese einem breiteren Publikum zug\u00e4nglich gemacht.&nbsp;<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Gesundheitswesen<\/strong><\/h3>\n\n\n\n<p>Mit der Transkription k\u00f6nnen medizinische Fachkr\u00e4fte klinische Gespr\u00e4che in elektronischen Krankenakten aufzeichnen, um sie schnell und einfach zu analysieren. Im Gesundheitswesen tr\u00e4gt dieses Verfahren auch zur Effizienzsteigerung bei, da es einen sofortigen Zugriff auf Informationen und die Eingabe von Daten erm\u00f6glicht.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Recht<\/strong><\/h3>\n\n\n\n<p>Speech-to-Text-Software hilft bei der juristischen Transkription, d. h. beim automatischen Schreiben oder Abtippen von oft langen juristischen Dokumenten aus einer Audio- und\/oder Videoaufnahme. Dabei werden die aufgezeichneten Informationen in ein schriftliches Format umgewandelt, das leicht zu handhaben ist.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Bildung<\/strong><\/h3>\n\n\n\n<p>Die Verwendung von Sprache in Text kann f\u00fcr Student:innen eine vorteilhafte M\u00f6glichkeit sein, Notizen zu machen und mit ihren Vorlesungen zu interagieren. Durch die M\u00f6glichkeit, wichtige Teile der Vorlesung hervorzuheben und zu unterstreichen, k\u00f6nnen sie die Informationen vor Pr\u00fcfungen leicht noch einmal durchgehen und wiederholen. Auch geh\u00f6rlose oder schwerh\u00f6rige Studierende finden diese Software hilfreich, da sie Online-Kurse oder -Seminare untertitelt.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"wie-funktioniert-ein-automatisches-spracherkennungsprogramm\"><strong>Wie funktioniert ein automatisches Spracherkennungsprogramm?<\/strong><\/h2>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Das akustische und linguistische Modell<\/strong><\/h3>\n\n\n\n<p>Der Kern der automatischen Transkription ist die automatische Spracherkennungssoftware. Ganz grob gesagt, bestehen solche Systeme aus akustischen und linguistischen Komponenten, die entweder auf einem oder mehreren Computern laufen.<\/p>\n\n\n\n<p>Die akustische Komponente ist daf\u00fcr verantwortlich, die Audiospur einer Datei in eine Sequenz von akustischen Einheiten umzuwandeln \u2013 ganz viele kleine Tonspuren. Hast du schonmal eine Klangwelle \u201egesehen\u201c? Diese Wellen entstehen durch analogen Ton oder Vibrationen, die beim Sprechen erzeugt werden \u2013 welche dann in digitale Signale umgewandelt werden, sodass sie von der Software analysiert werden k\u00f6nnen. Danach werden die akustischen Einheiten zu bereits existierenden \u201ePhonemen\u201c zusammengef\u00fcgt \u2013 das sind die T\u00f6ne, die wir dazu benutzen, um uns mit unserer Sprache auszudr\u00fccken.<\/p>\n\n\n\n<p>Danach ist die linguistische Komponente daf\u00fcr verantwortlich, diese Sequenzen aus akustischen Einheiten in Worte und S\u00e4tze zu \u201everwandeln\u201c. Es gibt viele Worte, die \u00e4hnlich klingen, aber etwas ganz anderes bedeuten, wie zum Beispiel Schiff und schief.<\/p>\n\n\n\n<p>Die linguistische Komponente analysiert alle vorliegenden Worte und deren Zusammenhang, um die Wahrscheinlichkeit einzusch\u00e4tzen, welches Wort als n\u00e4chstes kommen k\u00f6nnte. Bei Expert:innen ist dies unter \u201e<a href=\"https:\/\/medium.com\/@postsanjay\/hidden-markov-models-simplified-c3f58728caab\" target=\"_blank\" rel=\"noopener\"><strong>Hidden Markov Models<\/strong><\/a>\u2018\u2018 bekannt, jene weit verbreitet sind und in jeder Spracherkennungssoftware verwendet werden. So kann die Spracherkennung Teile von Sprach- und Wortendungen bestimmen (mit sich unterscheidender Erfolgsquote).<\/p>\n\n\n\n<h4 class=\"wp-block-heading\"><strong>Ein Beispiel<\/strong><\/h4>\n\n\n\n<p><mark style=\"background-color:#abb8c3\" class=\"has-inline-color\">Man kann das auch ganz einfach im echten Leben ausprobieren, dann hinter jeder Sprachanwendung, wie zum Beispiel Google Translate, verstecken sich Sprachmodelle. Man kann einfach irgendein Wort, das mehrere Bedeutungen hat, hineinsprechen und dann einen Zusammenhang angeben (indem man einen Satz bildet) \u2013 so erh\u00e4lt man meist eine deutlich genauere Transkription und \u00dcbersetzung.<\/mark><\/p>\n\n\n\n<p>Bis eine automatische Spracherkennung einsatzf\u00e4hig ist, m\u00fcssen je nach Anwendungsbereich verschiedene Komponenten trainiert werden. Sowohl der akustische Teil, also <strong>wie<\/strong> gesprochen und aufgenommen wird, als auch der linguistische Teil, also <strong>was<\/strong> gesagt wird, sind entscheidend f\u00fcr die Genauigkeit und die Qualit\u00e4t des Transkripts.<\/p>\n\n\n\n<p id=\"infografik\">Hier bei Amberscript entwickeln und verbessern wir unsere akustischen und linguistischen Komponenten immer weiter, um unsere Spracherkennungssoftware so weit wie m\u00f6glich zu perfektionieren.<\/p>\n\n\n<div class=\"wp-block-image\"><div class=\"image-block-wrapper\">\n<figure class=\"aligncenter size-large is-resized\"><img decoding=\"async\" src=\"https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Speech-recognition-software-Amberscript-de-509x720.jpeg\" alt=\"\" class=\"wp-image-35135\" width=\"382\" height=\"540\" srcset=\"https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Speech-recognition-software-Amberscript-de-509x720.jpeg 509w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Speech-recognition-software-Amberscript-de-339x480.jpeg 339w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Speech-recognition-software-Amberscript-de-768x1086.jpeg 768w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Speech-recognition-software-Amberscript-de-1086x1536.jpeg 1086w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Speech-recognition-software-Amberscript-de-1448x2048.jpeg 1448w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Speech-recognition-software-Amberscript-de.jpeg 1587w\" sizes=\"(max-width: 382px) 100vw, 382px\" \/><\/figure>\n<\/div><\/div>\n\n\n<h3 class=\"wp-block-heading\"><strong>Was ist ein sprecherabh\u00e4ngiges Speech-to-Text-Modell?<\/strong><\/h3>\n\n\n\n<p>Es gibt auch noch so etwas wie das \u201eSpeaker Model\u201c. Spracherkennungssoftwares k\u00f6nnen entweder <strong>sprecherabh\u00e4ngig<\/strong> oder <strong>-unabh\u00e4ngig<\/strong> sein.<\/p>\n\n\n\n<p>Sprecherabh\u00e4ngige Modelle sind auf eine bestimmte Stimme trainiert, wie zum Beispiel die Sprache-zu-Text-L\u00f6sung von Dragon. Man kann auch Siri, Google oder Cortana darauf trainieren, nur die eigene Stimme zu erkennen (mit anderen Worten: einen Sprachassistenten sprecherabh\u00e4ngig machen).<\/p>\n\n\n\n<p>Daraus ergibt sich meist eine h\u00f6here Genauigkeit f\u00fcr einzelne Anwendungsbereiche, braucht allerdings Zeit bis das Modell die eine spezifische Sprache versteht. Au\u00dferdem ist das sprecherabh\u00e4ngige Modell nicht sonderlich felxibel und kann nicht verl\u00e4sslich in unterschiedlichen Umfeldern oder mit verschiedenen Einstellungen genutzt werden.<\/p>\n\n\n\n<p>Sie haben es wahrscheinlich schon geahnt \u2013 sprecherunabh\u00e4ngige Modelle k\u00f6nnen ohne Training viele verschiedene Stimmen erkennen. Genau diese Art von <strong><a href=\"https:\/\/www.amberscript.com\/en\/speech-to-text\/\">Modell<\/a> <\/strong>kommt in der Amberscript Software zum Einsatz.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"sind-alle-spracherkennungstools-gleich\"><strong>Sind alle Spracherkennungstools gleich?<\/strong><\/h2>\n\n\n\n<p>Nein! Viele verschiedene Spracherkennungstools dienen ganz unterschiedlichen Zwecken. Manche sind f\u00fcr einfache, repetitive Zwecke entwickelt, andere sind sehr fortschrittlich. Lass uns einen Blick auf die unterschiedlichen Level der Spracherkennung werfen.<\/p>\n\n\n\n<p>1) Hast du jemals eine Servicehotline angerufen und wurdest von einer Computerstimme dazu aufgefordert, deine Handynummer anzugeben? Dahinter steckt das einfachste Spracherkennungstool, das mit <strong>Musterabgleichen (pattern-matching)<\/strong> arbeitet aber ein limitiertes Vokabular hat \u2013 nichtsdestotrotz erf\u00fcllt es seinen Zweck.<\/p>\n\n\n\n<p>2) Das n\u00e4chste Level der Spracherkennung involviert <strong>statistische Analysen und Modelle<em> <\/em><\/strong>(wie zum Beispiel Hidden Markov Models) \u2013 worauf wir bereits weiter oben eingegangen sind.<\/p>\n\n\n\n<p>3) Das Erkennen von<strong><em> <\/em>Dialekten und Akzenten<\/strong>. Sprache ist ein komplexes Gebilde, das jeden Menschen ein wenig anders sprechen l\u00e4sst. Eine Vielzahl von alemannischen Dialekten wie Schweizerdeutsch, \u00f6sterreichisches Deutsch usw.  macht das Modell zus\u00e4tzlich komplex. Das Sammeln verschiedenartiger Daten kann diese Komplexit\u00e4t jedoch erheblich reduzieren. <\/p>\n\n\n\n<p>4) Das ultimative Level der Spracherkennung basiert auf <strong>k\u00fcnstlichen neuronalen Netzwerken<\/strong>, kurz KNN, was es erm\u00f6glicht dass eine solche Spracherkennung dazu in der Lage ist, stetig zu lernen und sich selber zu optimieren. Googles, Microsofts und auch unsere Spracherkennung basiert auf maschinellem Lernen.<\/p>\n\n\n\n<p>\u2013 <strong>Homonym<\/strong>e (Teekesselchen) sind W\u00f6rter, die sich genau gleich anh\u00f6ren, aber eine ganz unterschiedliche Bedeutung haben und anders geschrieben werden. Um hier das richtige Wort zu treffen, ist es wichtig, den Zusammenhang zu kennen. Trotz modernster Spracherkennungssoftwares die auf k\u00fcnstlicher Intelligenz basieren, ist es dennoch schwierig jeden einzelnen Kontext richtig zu interpretieren.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"was-macht-amberscripts-speech-to-text-engine-so-einzigartig\"><strong>Was macht Amberscript&#8217;s Speech to Text Engine so einzigartig?<\/strong><\/h2>\n\n\n\n<p>Unsere Software erreicht sch\u00e4tzungsweise bis zu 95% Genauigkeit \u2013 so eine Qualit\u00e4t gab es bisher noch nicht auf dem niederl\u00e4ndischen Markt. Hier erf\u00e4hrst du, woher diese un\u00fcbertroffene Leistung kommt:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Softwareentwicklung<\/strong>. Wir sind sehr stolz auf unser Team bestehend aus talentierten und hochqualifizierten Sprachwissenschaftlern, die ein ausgefeiltes Sprachmodell entwickelt haben, das sich immer weiter ausbauen l\u00e4sst.<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Gro\u00dfe Mengen an Trainingsdaten<\/strong>. Sprache-zu-Text-Software basiert auf maschinellem Lernen. Mit anderen Worten \u2013 je mehr Daten du dem System zuf\u00fchrst, desto besser wird es! Wir haben Terabytes an Daten gesammelt und zugef\u00fchrt, um ein solches Qualit\u00e4tsniveau zu erreichen.<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Ausgewogener Datensatz<\/strong>. Um unseren Algorithmus zu perfektionieren, haben wir verschiedene Arten an Daten verwendet. Unsere Spezialisten haben daf\u00fcr gesorgt, m\u00f6glichst heterogene Trainingsdaten zu sammeln und zu verwenden: m\u00e4nnliche und weibliche Stimmen, verschiedene Stimmlagen, sowie verschiedene Akzente und Dialekte etc.<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Verschiedene Szenarien<\/strong>. Wir haben unser Modell in den verschiedensten akustischen Umgebungen getestet, um eine verl\u00e4ssliche und stabile Leistung unter unterschiedlichen Aufnahmebedingungen garantieren zu k\u00f6nnen.<\/li>\n<\/ul>\n\n\n<div class=\"wp-block-image\"><div class=\"image-block-wrapper\">\n<figure class=\"aligncenter size-large is-resized\"><img decoding=\"async\" src=\"https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Amberscript-high-accuracy-infographic-de-509x720.jpeg\" alt=\"\" class=\"wp-image-35147\" width=\"382\" height=\"540\" srcset=\"https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Amberscript-high-accuracy-infographic-de-509x720.jpeg 509w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Amberscript-high-accuracy-infographic-de-339x480.jpeg 339w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Amberscript-high-accuracy-infographic-de-768x1086.jpeg 768w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Amberscript-high-accuracy-infographic-de-1086x1536.jpeg 1086w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Amberscript-high-accuracy-infographic-de.jpeg 1414w\" sizes=\"(max-width: 382px) 100vw, 382px\" \/><\/figure>\n<\/div><\/div>\n\n\n<h2 class=\"wp-block-heading\" id=\"nat\u00fcrliches-sprachverst\u00e4ndnis-der-n\u00e4chste-meilenstein-der-spracherkennung\"><strong>Nat\u00fcrliches Sprachverst\u00e4ndnis \u2013 Der n\u00e4chste Meilenstein der Spracherkennung<\/strong><\/h2>\n\n\n\n<p>Lasst uns \u00fcber den n\u00e4chsten gro\u00dfen Schritt f\u00fcr die gesamte Industrie sprechen: <a href=\"https:\/\/en.wikipedia.org\/wiki\/Natural-language_understanding\" target=\"_blank\" rel=\"noopener\">Nat\u00fcrliches Sprachverst\u00e4ndnis (NLU)<\/a>. NLU ist ein Bereich der k\u00fcnstlichen Intelligenz, der erforscht, wie Maschinen menschliche Sprache verstehen und interpretieren kann. Nat\u00fcrliches Sprachverst\u00e4ndnis erm\u00f6glicht es der Spracherkennung nicht nur, menschliche Sprache zu transkribieren, sondern auch die tats\u00e4chliche Bedeutung der Worte zu verstehen. Anders gesagt: Das Hinzuf\u00fcgen von NLU-Algorhythmen zu einer Sprache-zu-Text-Software kommt dem Hinzuf\u00fcgen eines Gehirns gleich.<\/p>\n\n\n\n<p>Die nat\u00fcrliche Spracherkennung steht der gr\u00f6\u00dften Herausforderungen der Spracherkennung gegen\u00fcber: das Verstehen und Arbeiten mit einzigartigen und unbekannten Kontexten.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Was kann man mit nat\u00fcrlichem Sprachverst\u00e4ndnis machen?<\/strong><\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Maschinelle \u00dcbersetzung<\/strong>. Diese wird bereits bei Skype genutzt \u2013 man kann in einer Sprache sprechen und diese gesprochene Sprache wird dann automatisch in Text auf einer anderen Sprache transkribiert. Das ist wie die n\u00e4chste Generation von Google Translate. Und alleine diese Funktion hat enormes Potential \u2013 man muss sich nur einmal vorstellen, wie viel einfacher es wird, mit Menschen zu kommunizieren, die eine andere Sprache sprechen.<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Zusammenfassungen<\/strong>. Wir leben in einer Welt voller Daten \u2013 es grenzt sogar schon fast an einer Reiz\u00fcberflutung. Man stellt sich vor, man hat immer direkt die Zusammenfassung eines Artikels, eines Essays oder eine Email zur Hand.<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Kategorisierung von Inhalten<\/strong>. \u00c4hnlich wie beim vorherigen Punkt, k\u00f6nnen Inhalte in verschiedene Themenbereiche und Kategorien eingeordnet werden. Suchmaschinen wie Google oder Youtube nutzen diese Funktion bereits.<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Analyse von Emotionen<\/strong>. Diese Technik zielt auf die Wahrnehmung und Sichtweise von Menschen ab \u2013 durch die systematische Analyse von Blogeintr\u00e4gen, Bewertungen und Tweets. Diese Funktion wird schon von einigen Unternehmen genutzt, vor allem denjenigen, die auf Social Media aktiv sind.<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Plagiatspr\u00fcfung<\/strong>. Einfache Plagiatstools k\u00f6nnen nur pr\u00fcfen, ob Inhalte abgeschrieben sind oder nicht. Weiter fortgeschrittene Software, wie zum Beispiel Turnitin, kann sogar erkennen, ob der gleiche Inhalt einfach nur umformuliert wurde, was die Plagiatspr\u00fcfung um einiges genauer macht.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Status quo: Wo wird NLU heutzutage bereits verwendet?<\/strong><\/h3>\n\n\n\n<p>Es gibt viele Bereiche, in denen NLU (als Teildisziplin der nat\u00fcrlichen Sprachverarbeitung) bereits eine gro\u00dfe Rolle spielt. Im Folgenden findest du einige Beispiele:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li>Social-Media Analyse<\/li>\n\n\n\n<li>Psychologische Forschung<\/li>\n\n\n\n<li>Spam-Mail-Erkennung<\/li>\n\n\n\n<li>Sprachanalyse in Callcentern<\/li>\n\n\n\n<li>Und sogar\u2026beim L\u00f6sen von Verbrechen<\/li>\n<\/ol>\n\n\n<div class=\"wp-block-image\"><div class=\"image-block-wrapper\">\n<figure class=\"aligncenter size-large is-resized\"><img decoding=\"async\" src=\"https:\/\/www.amberscript.com\/wp-content\/uploads\/2023\/04\/NLU-720x720.png\" alt=\"\" class=\"wp-image-80065\" width=\"540\" height=\"540\" srcset=\"https:\/\/www.amberscript.com\/wp-content\/uploads\/2023\/04\/NLU-720x720.png 720w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2023\/04\/NLU-480x480.png 480w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2023\/04\/NLU-150x150.png 150w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2023\/04\/NLU-768x768.png 768w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2023\/04\/NLU-120x120.png 120w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2023\/04\/NLU-144x144.png 144w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2023\/04\/NLU.png 1200w\" sizes=\"(max-width: 540px) 100vw, 540px\" \/><\/figure>\n<\/div><\/div>\n\n\n<h3 class=\"wp-block-heading\"><strong>Was kommt als n\u00e4chstes?<\/strong><\/h3>\n\n\n\n<p>Wir arbeiten zurzeit an der Integration von NLU in unser System, um unsere Spracherkennungssoftware noch schlauer zu machen und die Anwendungsbereiche noch mehr auszuweiten.<\/p>\n\n\n\n<p>Wir hoffen, wir konnten die helfen, die faszinierende Welt der Spracherkennung etwas besser kennenzulernen! <\/p>\n\n\n\n","protected":false},"excerpt":{"rendered":"<p><b>Spracherkennungssoftware: Einfach erkl\u00e4rt<\/b><\/p>\n<p>Mit Alexa, Cortana und Siri hat Spracherkennung das Schreiben Teilweise ersetzt. Aber wie genau funktioniert das? Antworten findest du hier.<\/p>\n","protected":false},"author":70,"featured_media":74308,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"inline_featured_image":false,"footnotes":""},"categories":[144],"tags":[153,163],"class_list":["post-18049","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-blog","tag-automatische-transkription","tag-automatische-untertitel"],"acf":{"text":"","link":"","questions":""},"_links":{"self":[{"href":"https:\/\/www.amberscript.com\/de\/wp-json\/wp\/v2\/posts\/18049","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.amberscript.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.amberscript.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.amberscript.com\/de\/wp-json\/wp\/v2\/users\/70"}],"replies":[{"embeddable":true,"href":"https:\/\/www.amberscript.com\/de\/wp-json\/wp\/v2\/comments?post=18049"}],"version-history":[{"count":0,"href":"https:\/\/www.amberscript.com\/de\/wp-json\/wp\/v2\/posts\/18049\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.amberscript.com\/de\/wp-json\/wp\/v2\/media\/74308"}],"wp:attachment":[{"href":"https:\/\/www.amberscript.com\/de\/wp-json\/wp\/v2\/media?parent=18049"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.amberscript.com\/de\/wp-json\/wp\/v2\/categories?post=18049"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.amberscript.com\/de\/wp-json\/wp\/v2\/tags?post=18049"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}