Skip to content
Blog
5 minutos de lectura
9 Jun 2023

Modelo de puntuación neerlandés

Topics
Transcripción Automática

Aspectos gramaticales como el gerundio, las preposiciones y las reglas gramaticales básicas desempeñan un papel importante en la mayoría de las lenguas conocidas. ¿Ha pensado alguna vez que la puntuación también desempeña un papel fundamental?
La puntuación es importante en el lenguaje. Implica la disposición correcta de pequeños signos, a veces apenas perceptibles, en los lugares adecuados para indicar la longitud exacta y el significado de la frase.
En el siguiente texto analizaremos más de cerca el modelo de puntuación que hemos desarrollado para nuestro modelo de reconocimiento de voz en neerlandés.

El papel de la puntuación en el lenguaje

La puntuación es parte integral del texto escrito y contribuye a hacerlo inteligible y coherente. La ausencia de signos de puntuación dificulta la legibilidad y puede hacer incomprensibles los textos. Además, los signos de puntuación reducen la ambigüedad. Consideremos este ejemplo en el que una coma puede alterar por completo el significado de una frase:

«La mayoría de las veces los viajeros se preocupan por su equipaje»

vs

«La mayoría de las veces, los viajeros se preocupan por su equipaje»

La falta de puntuación también puede dar lugar a frases incómodas, como en este ejemplo clásico:

«Encuentro inspiración en cocinar mi familia y mi perro»

Puntuación en la conversión de voz a texto

Por eso, los sistemas de voz a texto deben incluir signos de puntuación cuando producen una transcripción. Sin embargo, los sistemas típicos de reconocimiento automático del habla (ASR) no emiten signos de puntuación, ya que no tienen forma hablada. Además, la transcripción generada se compone sólo de palabras en minúsculas, lo que dificulta su comprensión. Una transcripción correctamente puntuada también ayuda a la generación automática de subtítulos para vídeos.

Este problema puede resolverse incorporando un modelo de puntuación independiente que pueda añadir puntuación automáticamente a la salida de un modelo ASR. Puede plantearse como un problema de procesamiento del lenguaje natural (PLN) en el que el objetivo es predecir el signo de puntuación (o su ausencia) de cada palabra de una transcripción.

Modelos lingüísticos

El aprendizaje profundo ha experimentado un enorme progreso en los últimos años, impulsado por el aumento de la potencia de cálculo. El campo de la PNL fue tomado por asalto por la introducción de BERT en 2018. Desarrollado por Google AI, BERT es un gran modelo de lenguaje basado en la arquitectura de transformadores. Fue promocionado como el momento ImageNet de NLP, en referencia a cómo ImageNet dirigió el progreso en el aprendizaje de representación a partir de imágenes en el campo de la visión por ordenador. BERT supone una notable mejora con respecto a modelos anteriores de representación del lenguaje como GloVe embeddings y representaciones contextuales como ELMo.

Para una explicación intuitiva de cómo funciona BERT, consulte esta excelente entrada de blog de Jay Alammar. En términos sencillos, se entrena con textos en bruto de forma autosupervisada, es decir, sin anotaciones humanas. En concreto, se entrena en dos tareas: el modelado del lenguaje enmascarado y la predicción de la siguiente frase. Al final del entrenamiento, se dice que el modelo está «preentrenado» y captura la semántica del lenguaje con sus representaciones de palabras y frases. Un BERT preentrenado se puede afinar en una tarea de PLN posterior. En el momento de su publicación, BERT obtuvo los mejores resultados en una serie de tareas de PLN, como la inferencia del lenguaje natural (NLI), la respuesta a preguntas, etc.

Modelo de puntuación en Amberscript

En Amberscript desarrollamos modelos ASR personalizados, uno de ellos para el neerlandés. Como ya se ha indicado, las transcripciones producidas por el modelo carecen de signos de puntuación. En la actualidad, no existen modelos de puntuación de código abierto específicos para el neerlandés. Por lo tanto, desarrollamos un modelo de puntuación basado en BERT para añadir automáticamente los siguientes signos de puntuación: signo de interrogación, punto, signo de exclamación, coma, dos puntos y punto y coma. Otros signos de puntuación que aparecen en pares, como las comillas y los paréntesis, son mucho más difíciles de determinar basándose únicamente en el texto.

Transforma tu audio y

vídeo en texto y subtítulos

  • Servicio de alta precisión bajo demanda
  • Precios competitivos con el plazo de entrega más rápido mediante IA
  • Cargue, busque, edite y exporte con facilidad.

Proceso

El proceso ASR consta de tres componentes principales: el modelo ASR, que produce texto en minúsculas; un módulo de posprocesamiento, que escribe en mayúsculas las entidades con nombre (nombres de personas, lugares, etc.), desnormaliza los números, corrige la ortografía, etc.; y, por último, un modelo de puntuación, que añade los signos de puntuación necesarios.

Demo

Para mostrar el modelo de puntuación en acción, podemos tomar este ejemplo del modelo ASR:

nog een laatste een likje verf zodat de attracties er piekfijn uitzien hier is alles bijna klaar om weer open te kunnen je merkt dat het nu weer begint te kriebelen eigenlijk bij ons alle monteurs zijn weer bezig de groendienst is weer bezig het park mooi te maken de schoonmaakdienst is alles weer aan het schoonmaken dus we zijn er echt gereed een maken om straks weer de poorten te openen

El resultado de aplicar el post-proceso y el modelo de puntuación es el siguiente:

Nog een laatste: een likje verf, zodat de attracties er piekfijn uitzien. Hier is alles bijna klaar om weer open te kunnen. Je merkt dat het nu weer begint te kriebelen eigenlijk bij ons. Alle monteurs zijn weer bezig. De groendienst is weer bezig het park mooi te maken. De schoonmaakdienst is alles weer aan het schoonmaken, dus we zijn er echt gereed een maken om straks weer de poorten te openen.

Observe que la primera salida del modelo ASR es difícil de leer, mientras que la transcripción final después de añadir los signos de puntuación es más natural.

Puntuación incluida en las transcripciones de Amberscript

Si busca una transcripción limpia y precisa, que incluya la puntuación adecuada, debería probar a utilizar un servicio de transcripción automática de Amberscript.
Ofrecemos opciones de transcripción rápidas, precisas y asequibles que sin duda mejorarán sus flujos de trabajo.
Además, si necesita la transcripción más precisa, debería probar la transcripción manual de Amberscript. Nuestros expertos lingüísticos son hablantes nativos y crean textos de la máxima precisión en lectura limpia (texto hecho más legible) o literal (todas las palabras escritas exactamente como se dicen).

Interesting topics