Skip to content
Blog
4 minutos de lectura
31 Ago 2021

¿Quieres que tus subtítulos tengan buena pinta? Pruebe nuestra nueva solución de alineación basada en IA

Topics
Subtítulos Automáticos

Los subtítulos son cruciales para hacer más accesibles los contenidos de los medios de comunicación y para mejorar la facilidad de uso en general. En primer lugar, permiten a las personas sordas o con problemas de audición consumir el contenido. Además, mejora la comprensión de los nombres propios, las palabras extranjeras y el habla en presencia de acentos fuertes o ruidos de fondo. También permite a los creadores de contenidos ampliar su alcance mediante subtítulos traducidos. Puede leer más sobre las ventajas del subtitulado aquí.

Crear subtítulos a partir del audio

Sin embargo, la creación de subtítulos no es trivial y debe seguir ciertas reglas que mejoren su lectura. Existen limitaciones en cuanto al número de caracteres de una línea de subtítulos, el número de líneas de subtítulos, la duración de subtítulos y el posicionamiento de los saltos de línea dentro de subtítulos.

Las reglas de subtitulado pueden variar entre las diferentes entidades. Por ejemplo, BBC y Netflix tienen pautas ligeramente diferentes. Se recomienda insertar los saltos de línea de forma que se produzcan en puntos naturales. Por ejemplo, insertar un salto de línea entre un artículo y un sustantivo (por ejemplo, el + libro, un + árbol) o un pronombre y un verbo (por ejemplo, él + corre, a ellos + les gusta jugar) perjudica la fluidez de la lectura. Los saltos de línea tras los signos de puntuación, como la coma y el punto, son buenos porque indican pausas naturales. Por lo tanto, la creación de subtítulos implica una cuidadosa inserción de saltos de línea al tiempo que se respetan todas las demás restricciones.

Examples of subtitle alignment
Some examples of bad line breaks (left) and good line breaks (right) in a subtitle.

Hacer subtítulos no siempre es fácil

Tradicionalmente, la subtitulación la realizan manualmente los humanos. El reconocimiento automático del habla (ASR), que es una de las ofertas de Amberscript, ayuda a los creadores de subtítulos convirtiendo automáticamente el habla en texto. En este caso, primero se corrigen manualmente los errores de la transcripción del ASR para que sea perfecta. A continuación, los subtituladores utilizan la transcripción para generar los subtítulos. Este proceso es complicado y supone un gran esfuerzo manual para intentar respetar las normas de los subtítulos. En consecuencia, el subtitulado lleva mucho más tiempo y cuesta más dinero que una simple transcripción.

Subtítulos automáticos o manuales con Amberscript

Con la ampliación del contenido de los medios de comunicación, la demanda de subtitulado ha aumentado notablemente. En Amberscript, el aumento de los trabajos de subtitulado supone un incremento de los plazos de entrega dado el limitado número de subtituladores. Por lo tanto, hemos querido reducir el esfuerzo humano en el subtitulado formateando automáticamente los subtítulos.

Mientras que las demás reglas pueden cumplirse automáticamente, las reglas de los subtítulos relativas a los saltos de línea indican que deben basarse en características lingüísticas del texto. Por ello, diseñamos un enfoque basado en el aprendizaje profundo y el procesamiento del lenguaje natural. Entrenamos modelos para determinar automáticamente la mejor posición para insertar un salto de línea, utilizando subtítulos de alta calidad como datos de entrenamiento.

Nuevos flujos de trabajo para la alineación de subtítulos

Nuestros modelos están entrenados para ofrecer subtítulos alineados con precisión en 13 idiomas diferentes: holandés, alemán, inglés, sueco, finlandés, noruego, danés, francés, español, italiano, portugués, polaco y rumano. En lugar de codificar todas las reglas relativas a los saltos de línea, entrenamos a los modelos para que aprendieran a determinar cuándo insertar un salto de línea a partir de subtítulos generados por humanos. Nuestro algoritmo final de formato de subtítulos utiliza estos modelos para los saltos de línea y cumple con todas las demás restricciones. El algoritmo también se ejecuta rápidamente, produciendo subtítulos formateados en sólo unos segundos para la mayoría de los archivos. Un archivo de 12 horas, por ejemplo, requiere menos de dos minutos.

Un requisito importante para el formato automático de los subtítulos es la alineación del habla con el texto correspondiente. Las transcripciones de ASR suelen editarse para añadir palabras que faltan y eliminar/editar palabras incorrectas. Una vez editada y terminada la transcripción, habría que volver a alinear las palabras con los segmentos de habla correspondientes para que las marcas de tiempo sean precisas. Hemos creado un algoritmo de alineación forzada automática que puede realizar este paso. En la actualidad, el algoritmo de alineación forzada está disponible en tres idiomas: alemán, inglés y neerlandés.

La combinación de ASR y el formateo automático de los subtítulos nos permite ofrecerlos mucho más rápido que antes. El resultado final es muy preciso. Además, los usuarios pueden decidir si los subtítulos generados deben cumplir los estándares de BBC o de Netflix.

Además, el menor compromiso de los subtituladores significa que también podemos ofrecer subtítulos a un coste reducido. Creemos que eso nos acerca un poco más a nuestra misión de hacer accesible todo el audio.

Añade subtítulos a tu vídeo automáticamente

  • El reconocimiento y la alineación automáticos del habla ahorran horas de subtitulado
  • Carga, busca, edita y exporta con facilidad
  • Precios competitivos con el plazo de entrega más rápido

Interesting topics