{"id":20513,"date":"2020-02-21T00:00:00","date_gmt":"2020-02-21T00:00:00","guid":{"rendered":"https:\/\/localhost:10083\/sin-categorizar\/how-does-speech-to-text-software-work-es\/"},"modified":"2023-05-08T17:43:54","modified_gmt":"2023-05-08T15:43:54","slug":"como-funciona-el-reconocimiento-de-voz-para-transcribir-un-audio","status":"publish","type":"post","link":"https:\/\/www.amberscript.com\/es\/blog\/como-funciona-el-reconocimiento-de-voz-para-transcribir-un-audio\/","title":{"rendered":"\u00bfC\u00f3mo funciona el reconocimiento de voz para transcribir un audio?"},"content":{"rendered":"\n<p><em>Con la introducci\u00f3n del habla a los programas de texto como Alexa, Cortana, Siri y el asistente de Google, el reconocimiento de voz comenz\u00f3 a sustituir a la mecanograf\u00eda como una forma de interactuar con nuestros dispositivos digitales.<\/em><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">\u00bfEn qu\u00e9 estado se encuentra actualmente la tecnolog\u00eda del reconocimiento de voz?<\/h2>\n\n\n\n<p>Los recientes avances tecnol\u00f3gicos en el \u00e1rea del reconocimiento del habla no s\u00f3lo hicieron nuestra vida m\u00e1s c\u00f3moda y nuestro flujo de trabajo m\u00e1s productivo, sino que tambi\u00e9n abrieron oportunidades, que se consideraban \u00abmilagrosas\u00bb en aquellos tiempos.<\/p>\n\n\n\n<p>El software encargado de transcribir audio a texto tiene una gran variedad de aplicaciones, y la lista sigue creciendo cada a\u00f1o. La atenci\u00f3n sanitaria, la mejora del servicio al cliente, la investigaci\u00f3n cualitativa, el periodismo, son s\u00f3lo algunas de las industrias en las que la conversi\u00f3n de voz a texto ya se ha convertido en un importante recurso.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">\u00bfPara qu\u00e9 necesitamos la transcripci\u00f3n autom\u00e1tica?<\/h2>\n\n\n\n<p>Los profesionales de diversas \u00e1reas necesitan transcripciones de alta calidad para realizar sus actividades laborales. La tecnolog\u00eda que subyace al reconocimiento de voz avanza a un ritmo r\u00e1pido, lo que lo hace m\u00e1s r\u00e1pido, m\u00e1s barato y m\u00e1s conveniente que la transcripci\u00f3n manual.<\/p>\n\n\n\n<p>Aunque la tecnolog\u00eda a\u00fan no ha alcanzado el rendimiento humano, la precisi\u00f3n del software puede llegar al 95%. Los servicios de transcripci\u00f3n sol\u00edan consumir mucho tiempo y mano de obra, mientras que ahora la participaci\u00f3n humana en este proceso se limita a hacer peque\u00f1os ajustes.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Una raz\u00f3n m\u00e1s \u2013 Accesibilidad Digital<\/h2>\n\n\n\n<p>\u00bfPor qu\u00e9 el reconocimiento autom\u00e1tico del habla est\u00e1 actualmente en auge aqu\u00ed en Europa? La respuesta es bastante simple: la accesibilidad digital. Como se describe en la&nbsp;<a href=\"https:\/\/eur-lex.europa.eu\/legal-content\/EN\/TXT\/HTML\/?uri=CELEX:32016L2102&amp;from=EN\" target=\"_blank\" rel=\"noopener\">Directiva de la UE 2016\/2102<\/a>, los gobiernos deben tomar medidas para asegurar que todos tengan el mismo acceso a la informaci\u00f3n. Los podcasts, videos y grabaciones de audio deben ser suministrados con subt\u00edtulos o transcripciones para que sean accesibles a las personas con discapacidades auditivas.<\/p>\n\n\n<div class=\"wp-block-image\"><div class=\"image-block-wrapper\">\n<figure class=\"aligncenter size-large is-resized\"><img decoding=\"async\" src=\"https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/deaf-icon-720x720.png\" alt=\"\" class=\"wp-image-35014\" width=\"400\" title=\"Software para transcribir audio a texto\" srcset=\"https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/deaf-icon-720x720.png 720w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/deaf-icon-480x480.png 480w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/deaf-icon-150x150.png 150w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/deaf-icon-120x120.png 120w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/deaf-icon.png 734w\" sizes=\"(max-width: 720px) 100vw, 720px\" \/><\/figure>\n<\/div><\/div>\n\n\n<h2 class=\"wp-block-heading\">\u00bfC\u00f3mo funciona el reconocimiento de voz autom\u00e1tico?<\/h2>\n\n\n\n<p><em>P.D. \u2013 si es demasiado para leer en este momento, si\u00e9ntete libre de saltar a la infograf\u00eda resumida al final de esta p\u00e1gina.<\/em><\/p>\n\n\n\n<p>El n\u00facleo de un servicio de transcripci\u00f3n autom\u00e1tica es el sistema de reconocimiento autom\u00e1tico del habla. En resumen, estos sistemas est\u00e1n compuestos por componentes ac\u00fasticos y ling\u00fc\u00edsticos que funcionan en uno o varios ordenadores.<\/p>\n\n\n\n<p>El componente ac\u00fastico es responsable de convertir el audio de tu archivo en una secuencia de unidades ac\u00fasticas \u2013 muestras de sonido s\u00faper peque\u00f1as. \u00bfHas visto alguna vez una forma de onda del sonido? Eso es lo que llamamos sonido anal\u00f3gico o vibraciones que creas cuando hablas \u2013 se convierten en se\u00f1ales digitales, para que el software pueda analizarlas. Luego, las unidades ac\u00fasticas mencionadas se emparejan con los&nbsp;<a href=\"https:\/\/www.voxforge.org\/home\/docs\/faq\/faq\/what-is-an-acoustic-model\" target=\"_blank\" rel=\"noopener\">\u00abfonemas\u00bb<\/a>&nbsp;existentes \u2013 esos son los sonidos que usamos en nuestro lenguaje para formar expresiones significativas.<\/p>\n\n\n\n<p>A partir de entonces, el componente ling\u00fc\u00edstico se encarga de convertir esta secuencia de unidades ac\u00fasticas en palabras, frases y p\u00e1rrafos. Hay muchas palabras que suenan similares, pero que significan cosas completamente diferentes, como \u00abbotar\u00bb y \u00abvotar\u00bb.<\/p>\n\n\n\n<p>El componente ling\u00fc\u00edstico analiza todas las palabras precedentes y su relaci\u00f3n para estimar la probabilidad de qu\u00e9 palabra debe usarse a continuaci\u00f3n. Los geeks los llaman&nbsp;<a href=\"https:\/\/medium.com\/@postsanjay\/hidden-markov-models-simplified-c3f58728caab\" target=\"_blank\" rel=\"noopener\">\u00abModelos de Markov ocultos\u00bb<\/a>&nbsp;\u2013 son ampliamente utilizados en todos los programas de reconocimiento de voz. As\u00ed es como los motores de reconocimiento de voz son capaces de determinar las partes de la oraci\u00f3n y las terminaciones de las palabras.<\/p>\n\n\n\n<p><strong>Ejemplo: ellos escuchan un podcast.<\/strong>&nbsp;Aunque el sonido \u00abn\u00bb de la palabra \u00abescuchan\u00bb apenas se pronuncia, el componente ling\u00fc\u00edstico puede determinar que la palabra se escriba con \u00abn\u00bb, porque fue precedida por \u00abellos\u00bb.<\/p>\n\n\n\n<p>Puedes probarlo f\u00e1cilmente en la vida real, como cualquier otra aplicaci\u00f3n de voz, Google Translate tiene modelos de lenguaje detr\u00e1s de \u00e9l. Puedes escribir con la voz una palabra al azar que tenga varios significados, y luego proporcionarle al traductor un contexto (poniendo una palabra en una oraci\u00f3n) \u2013 es muy probable que veas una transcripci\u00f3n y traducci\u00f3n m\u00e1s precisa.<\/p>\n\n\n\n<p>Antes de poder utilizar un servicio de transcripci\u00f3n autom\u00e1tica, estos componentes deben estar debidamente capacitados para comprender un idioma espec\u00edfico. Tanto la parte ac\u00fastica de su contenido, es decir, c\u00f3mo se est\u00e1 hablando y grabando, como la parte ling\u00fc\u00edstica, es decir, lo que se est\u00e1 diciendo, son fundamentales para la precisi\u00f3n resultante de la transcripci\u00f3n.<\/p>\n\n\n\n<p>Aqu\u00ed en Amberscript, estamos constantemente mejorando nuestros componentes ac\u00fasticos y ling\u00fc\u00edsticos para perfeccionar nuestro motor de reconocimiento de voz.<\/p>\n\n\n<div class=\"wp-block-image\"><div class=\"image-block-wrapper\">\n<figure class=\"aligncenter size-large\"><img decoding=\"async\" width=\"509\" height=\"720\" src=\"https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Speech-recognition-software-Amberscript-509x720.jpeg\" alt=\"\" class=\"wp-image-35026\" title=\"reconocimiento de voz\" srcset=\"https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Speech-recognition-software-Amberscript-509x720.jpeg 509w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Speech-recognition-software-Amberscript-339x480.jpeg 339w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Speech-recognition-software-Amberscript-768x1086.jpeg 768w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Speech-recognition-software-Amberscript-1086x1536.jpeg 1086w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Speech-recognition-software-Amberscript-1448x2048.jpeg 1448w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/Speech-recognition-software-Amberscript.jpeg 1587w\" sizes=\"(max-width: 509px) 100vw, 509px\" \/><\/figure>\n<\/div><\/div>\n\n\n<h2 class=\"wp-block-heading\">Sorpresa\u2026 \u00a1Hay un modelo m\u00e1s!<\/h2>\n\n\n\n<p>Tambi\u00e9n hay algo llamado&nbsp;<a href=\"https:\/\/speechangel.com\/2016\/05\/04\/difference-speaker-dependent-speaker-independent-recognition-software\/\" target=\"_blank\" rel=\"noopener\">\u00abmodelo del interlocutor\u00bb<\/a>. El software de reconocimiento de voz puede ser&nbsp;<strong>dependiente o independiente del hablante.<\/strong><\/p>\n\n\n\n<p>El modelo dependiente del interlocutor est\u00e1 entrenado para una voz en particular, como la soluci\u00f3n de voz a texto de Dragon. Tambi\u00e9n puedes entrenar a Siri, Google y Cortana para que s\u00f3lo reconozcan tu propia voz (en otras palabras, haces que el asistente de voz sea dependiente del interlocutor).<\/p>\n\n\n\n<p>Por lo general, aporta una mayor precisi\u00f3n para un caso de uso particular, pero requiere tiempo para entrenar al modelo a entender tu voz. Adem\u00e1s, el modelo dependiente del hablante no es flexible y no se puede utilizar de manera fiable en algunos entornos, como las conferencias.<\/p>\n\n\n\n<p>Probablemente lo has adivinado \u2013 el modelo independiente de los interlocutores puede reconocer muchas voces diferentes sin ning\u00fan tipo de entrenamiento. Eso es lo que usamos actualmente en nuestro software en Amberscript.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">\u00bfSon todas las herramientas de reconocimiento de voz iguales?<\/h2>\n\n\n\n<p>\u00a1No! Hay muchas herramientas dedicadas a transcribir audio a texto que sirven para diferentes prop\u00f3sitos. Algunas de ellas est\u00e1n dise\u00f1adas para tareas simples y repetitivas, otras son incre\u00edblemente avanzadas. Veamos los&nbsp;<a href=\"https:\/\/www.semanticscholar.org\/paper\/A-Review-on-Different-Approaches-for-Speech-System-Saksamudre-Shrishrimal\/9554b35ff019944109cd164a209bdec8065028d3\" target=\"_blank\" rel=\"noopener\">diferentes niveles de reconocimiento de voz.<\/a><\/p>\n\n\n\n<p>1) \u00bfLlamaste alguna vez a una compa\u00f1\u00eda, y luego el robot de voz te pidi\u00f3 que dejaras tu n\u00famero de tel\u00e9fono? Es la herramienta de reconocimiento de voz m\u00e1s simple, que trabaja en la<strong>&nbsp;coincidencia de patrones<\/strong>, tiene un vocabulario limitado, pero hace el trabajo (en este caso, entender los d\u00edgitos).<\/p>\n\n\n\n<p>3) El \u00faltimo nivel de reconocimiento del habla se basa en&nbsp;<strong>redes neuronales artificiales<\/strong>, b\u00e1sicamente le da al motor la posibilidad de aprender y mejorar. El motor de Google, Microsoft y el nuestro est\u00e1 impulsado por el aprendizaje autom\u00e1tico.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Software de discurso a texto. Expectativas vs. Realidad<\/h2>\n\n\n\n<p>Aunque en la \u00faltima d\u00e9cada la tecnolog\u00eda de reconocimiento de voz ha avanzado a un ritmo muy r\u00e1pido, el software de voz a texto sigue planteando una serie de retos. Las limitaciones actuales del software de voz a texto son:<\/p>\n\n\n\n<p><strong>-Condiciones de grabaci\u00f3n.<\/strong>&nbsp;El rendimiento de la transcripci\u00f3n humana y automatizada depende en gran medida de las condiciones de grabaci\u00f3n. El software de reconocimiento de voz todav\u00eda lucha por interpretar el habla en un ambiente ruidoso o cuando muchas personas hablan al mismo tiempo.<\/p>\n\n\n\n<p><em>P.D. \u2013 consulta nuestro post&nbsp;<\/em><a href=\"https:\/\/www.amberscript.com\/es\/blog\/mejorar-calidad-audio-y-transcripcion\/\"><em>\u00ab<\/em>C\u00f3mo mejorar la calidad de audio y optimizar la transcripci\u00f3n\u00bb<\/a>&nbsp;<em>para aprender algunos consejos pr\u00e1cticos que mejorar\u00e1n la calidad de tu transcripci\u00f3n autom\u00e1tica.<\/em><\/p>\n\n\n\n<p><strong>-Reconociendo ciertos dialectos y acentos.<\/strong>&nbsp;El lenguaje es una estructura compleja, y todos hablan de una manera ligeramente diferente. Una multitud de dialectos y acentos crean una complejidad adicional para el modelo. Sin embargo, esta complejidad puede ser manejada reuniendo diferentes tipos de datos.<\/p>\n\n\n\n<p><strong>-Entendiendo los hom\u00f3nimos.<\/strong>&nbsp;Los hom\u00f3nimos son palabras que suenan igual, pero difieren en significado y ortograf\u00eda. Por ejemplo, \u00abola\u00bb (onda en el agua) y \u00abhola\u00bb (saludo). La elecci\u00f3n de la opci\u00f3n correcta requiere la comprensi\u00f3n del contexto. Aunque los modernos motores de voz a texto est\u00e1n impulsados por la IA, interpretar el contexto \u00fanico de manera correcta sigue siendo dif\u00edcil para las m\u00e1quinas.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">\u00bfQu\u00e9 hace que el motor de Amberscript sea tan preciso?<\/h2>\n\n\n\n<p>Se estima que nuestro motor alcanza una precisi\u00f3n de hasta el 95% \u2013 este nivel de calidad era previamente desconocido para el mercado holand\u00e9s. Estar\u00edamos m\u00e1s que contentos de compartir, de donde viene este rendimiento sin igual:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Arquitectura y modelado inteligente.<\/strong>&nbsp;Estamos orgullosos de trabajar con un equipo de talentosos cient\u00edficos del habla que desarrollaron un sofisticado modelo de lenguaje, que est\u00e1 abierto a la mejora continua.<\/li>\n\n\n\n<li><strong>Grandes cantidades de material de entrenamiento.<\/strong>&nbsp;El software de voz a texto se basa en el aprendizaje autom\u00e1tico. En otras palabras, cuantos m\u00e1s datos alimentes el sistema, mejor funcionar\u00e1. Hemos recogido terabytes de datos en el camino para llegar a un nivel de calidad tan alto.<\/li>\n\n\n\n<li><strong>Datos equilibrados.<\/strong>&nbsp;Con el fin de perfeccionar nuestro algoritmo, utilizamos varios tipos de datos. Nuestros especialistas obtuvieron un tama\u00f1o de muestra suficiente para ambos g\u00e9neros, as\u00ed como diferentes acentos y tonos de voz.<\/li>\n\n\n\n<li><strong>Exploraci\u00f3n de escenarios.<\/strong>&nbsp;Hemos probado nuestro modelo en varias condiciones ac\u00fasticas para asegurar un rendimiento estable en diferentes escenarios de grabaci\u00f3n.<\/li>\n<\/ul>\n\n\n<div class=\"wp-block-image\"><div class=\"image-block-wrapper\">\n<figure class=\"aligncenter size-large\"><img decoding=\"async\" width=\"509\" height=\"720\" src=\"https:\/\/www.amberscript.com\/wp-content\/uploads\/2019\/07\/Amberscript-high-accuracy-infographic-509x720.jpeg\" alt=\"Infographic explaining why Amberscript is highly accurate\" class=\"wp-image-35050\" title=\"como-usamos-la-comprension-del-lenguaje-natural\" srcset=\"https:\/\/www.amberscript.com\/wp-content\/uploads\/2019\/07\/Amberscript-high-accuracy-infographic-509x720.jpeg 509w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2019\/07\/Amberscript-high-accuracy-infographic-339x480.jpeg 339w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2019\/07\/Amberscript-high-accuracy-infographic-768x1086.jpeg 768w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2019\/07\/Amberscript-high-accuracy-infographic-1086x1536.jpeg 1086w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2019\/07\/Amberscript-high-accuracy-infographic.jpeg 1414w\" sizes=\"(max-width: 509px) 100vw, 509px\" \/><\/figure>\n<\/div><\/div>\n\n\n<h2 class=\"wp-block-heading\">Comprensi\u00f3n del Lenguaje Natural \u2013 El pr\u00f3ximo gran tema en el reconocimiento de voz<\/h2>\n\n\n\n<p>Discutamos el pr\u00f3ximo gran paso adelante para toda la industria, que es \u2013 la&nbsp;<a href=\"https:\/\/en.wikipedia.org\/wiki\/Natural-language_understanding\" target=\"_blank\" rel=\"noopener\">Comprensi\u00f3n del Lenguaje Natural&nbsp;<\/a>(o CLN). Es una rama de la Inteligencia Artificial, que explora c\u00f3mo las m\u00e1quinas pueden entender e interpretar el lenguaje humano. La Comprensi\u00f3n del Lenguaje Natural permite que la tecnolog\u00eda de reconocimiento de voz no s\u00f3lo transcriba el lenguaje humano, sino que tambi\u00e9n entienda el significado que hay detr\u00e1s de \u00e9l. En otras palabras, a\u00f1adir algoritmos de CLN es como a\u00f1adir un cerebro a un convertidor de voz a texto.<\/p>\n\n\n\n<p>La CLN pretende afrontar el reto m\u00e1s dif\u00edcil del reconocimiento de voz: comprender y trabajar con un contexto \u00fanico.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">\u00bfQu\u00e9 puedes hacer con la Comprensi\u00f3n del Lenguaje Natural?<\/h3>\n\n\n\n<p><strong>-Traducci\u00f3n a m\u00e1quina<\/strong>. Eso es algo que ya se est\u00e1 usando en Skype. Hablas en un idioma, y tu voz se transcribe autom\u00e1ticamente a un texto en otro idioma. Puedes tratarlo como el siguiente nivel de Google Translate. Esto por s\u00ed solo tiene un enorme potencial \u2013 s\u00f3lo imagina lo f\u00e1cil que se vuelve comunicarse con personas que no hablan tu idioma.<\/p>\n\n\n\n<p><strong>-Resumen de documentos.<\/strong>&nbsp;Vivimos en un mundo lleno de datos. Tal vez, hay demasiada informaci\u00f3n ah\u00ed fuera. Imagina tener un resumen instant\u00e1neo de un art\u00edculo, ensayo o un correo electr\u00f3nico.<\/p>\n\n\n\n<p><strong>-Categorizaci\u00f3n del contenido.<\/strong>&nbsp;Al igual que en el punto anterior, el contenido puede ser reducido a temas o t\u00f3picos distintivos. Esta caracter\u00edstica ya est\u00e1 implementada en los motores de b\u00fasqueda, como Google y YouTube.<\/p>\n\n\n\n<p><strong>-An\u00e1lisis de los sentimientos.<\/strong>&nbsp;Esta t\u00e9cnica tiene como objetivo identificar las percepciones y opiniones humanas a trav\u00e9s de un an\u00e1lisis sistem\u00e1tico de blogs, rese\u00f1as o incluso tweets. Esta pr\u00e1ctica ya se aplica en muchas empresas, en particular las que trabajan en los medios de comunicaci\u00f3n social.<\/p>\n\n\n\n<p>\u00a1S\u00ed, nos dirigimos hacia all\u00ed! No sabemos si vamos a terminar en un mundo lleno de robots amistosos o en el de Matrix, pero las m\u00e1quinas ya pueden entender las emociones humanas b\u00e1sicas.<\/p>\n\n\n\n<p><strong>-Detecci\u00f3n de plagio.<\/strong>&nbsp;Las herramientas de plagio simples s\u00f3lo comprueban si un contenido es una copia directa. Un software avanzado como Turnitin ya puede detectar si el mismo contenido fue parafraseado, haciendo la detecci\u00f3n del plagio mucho m\u00e1s precisa.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">\u00bfD\u00f3nde se aplica la CLN en estos d\u00edas?<\/h2>\n\n\n\n<p><a href=\"https:\/\/medium.com\/@datamonsters\/artificial-neural-networks-in-natural-language-processing-bcf62aa9151a\" target=\"_blank\" rel=\"noopener\">Hay muchas disciplinas e<\/a>n las que la CLN (como un subconjunto del Procesamiento del Lenguaje Natural) ya juega un papel importante. He aqu\u00ed algunos ejemplos:<\/p>\n\n\n<div class=\"wp-block-image\"><div class=\"image-block-wrapper\">\n<figure class=\"aligncenter size-large\"><img decoding=\"async\" width=\"576\" height=\"720\" src=\"https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/NLU-poster-576x720.jpeg\" alt=\"\" class=\"wp-image-35065\" title=\"Como se usa\" srcset=\"https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/NLU-poster-576x720.jpeg 576w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/NLU-poster-384x480.jpeg 384w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/NLU-poster-768x960.jpeg 768w, https:\/\/www.amberscript.com\/wp-content\/uploads\/2021\/06\/NLU-poster.jpeg 800w\" sizes=\"(max-width: 576px) 100vw, 576px\" \/><\/figure>\n<\/div><\/div>\n\n\n<ol class=\"wp-block-list\">\n<li>An\u00e1lisis de los medios sociales<\/li>\n\n\n\n<li>Investigaci\u00f3n en psicolog\u00eda<\/li>\n\n\n\n<li>Detecci\u00f3n de correo electr\u00f3nico no deseado<\/li>\n\n\n\n<li>Usar lel an\u00e1lisis del dictado en los centros de llamadas<\/li>\n\n\n\n<li>Incluso\u2026 resolviendo cr\u00edmenes<\/li>\n<\/ol>\n\n\n\n<h2 class=\"wp-block-heading\">\u00bfQu\u00e9 es lo pr\u00f3ximo??<\/h2>\n\n\n\n<p>Actualmente estamos integrando los algoritmos de la CLN en nuestros sistemas para hacer que nuestro software de reconocimiento de voz sea a\u00fan m\u00e1s inteligente y aplicable en una gama m\u00e1s amplia de aplicaciones.<\/p>\n\n\n\n<p>\u00a1Esperamos que ahora est\u00e9 un poco m\u00e1s familiarizado con el fascinante campo del reconocimiento de voz! Si\u00e9ntase libre de mirar&nbsp;<a href=\"https:\/\/www.amberscript.com\/es\/blog\/\">nuestro blog<\/a> para m\u00e1s lecturas interesantes como esta!<\/p>\n","protected":false},"excerpt":{"rendered":"<p><b>\u00bfC\u00f3mo funciona el reconocimiento de voz?<\/b><\/p>\n<p>El software de voz a texto y los dictados de voz utilizan la tecnolog\u00eda de reconocimiento de voz para transcribir el discurso en texto en pantalla.<\/p>\n","protected":false},"author":70,"featured_media":74311,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"inline_featured_image":false,"footnotes":""},"categories":[148],"tags":[201,155],"class_list":["post-20513","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-blog","tag-subtitulos-automaticos","tag-transcripcion-automatica"],"acf":{"text":"","link":"","questions":""},"_links":{"self":[{"href":"https:\/\/www.amberscript.com\/es\/wp-json\/wp\/v2\/posts\/20513","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.amberscript.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.amberscript.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.amberscript.com\/es\/wp-json\/wp\/v2\/users\/70"}],"replies":[{"embeddable":true,"href":"https:\/\/www.amberscript.com\/es\/wp-json\/wp\/v2\/comments?post=20513"}],"version-history":[{"count":0,"href":"https:\/\/www.amberscript.com\/es\/wp-json\/wp\/v2\/posts\/20513\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.amberscript.com\/es\/wp-json\/wp\/v2\/media\/74311"}],"wp:attachment":[{"href":"https:\/\/www.amberscript.com\/es\/wp-json\/wp\/v2\/media?parent=20513"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.amberscript.com\/es\/wp-json\/wp\/v2\/categories?post=20513"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.amberscript.com\/es\/wp-json\/wp\/v2\/tags?post=20513"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}