A tecnologia de reconhecimento de voz (ASR) é uma poderosa aliada da inclusão digital. A LBI, (Lei Brasileira de Inclusão), entrou em vigor em 2016 com o intuito de exigir acessibilidade do conteúdo nos sites dos governos e de empresas. A existência dessa lei não garante, no entanto, que essas normas estejam sendo seguidas. Um estudo do governo brasileiro identificou que 98% dos sites governamentais não estão seguindo a normativa de acessibilidade. O Brasil tem 10,7 milhões de pessoas com deficiência auditiva para as quais a maioria do conteúdo disponível online nao esta acessivel.
É preciso esclarecer que legendas não tornam o vídeo acessível para todo esse grupo já que, principalmente para pessoas que nasceram com deficiência auditiva, a língua brasileira de sinais é a sua língua materna. As legendas e transcrições funcionam para aqueles que, além de libras entendem o Português, ou seja, são bilíngues. Para o segmento que entende português, as legendas e transcrições são uma ferramenta valiosa para consumir conteúdo. E é aí que a tecnologia ASR pode ajudar.
Tecnologias como as de texto para voz podem ajudar pessoa com deficiência visual a navegar websites facilmente e digerir conteúdo usando os seus sentidos auditivos e “escutando” o que está escrito nos sites.
Já o inverso, tecnologias de voz para texto, pode ajudar organizações a deixar o conteúdo acessível para pessoas com deficiências auditivas. A tecnologia de reconhecimento automático de fala alcançou um nível de precisão tão alto que pode agilizar imensamente o processo de geração de transcrições e legendas para conteúdos de áudio e vídeo.
1. Gerando transcrições automáticas com o uso de ASR
Para áudios de alta qualidade como podcasts ou cursos profissionais online, o reconhecimento automático de fala alcançar um nivel altissimo de precisão. Em alguns casos, a precisão é alta o suficiente para criar transcrições totalmente automáticas mantendo a essência do que foi dito. Software de voz para texto podem criar uma transcrição em poucos minutos.
Comparado ao trabalho manual (que leva cerca de 5 a 8 vezes a duração do próprio áudio), uma transcrição gerada automaticamente fica pronta em uma fração daquele tempo.
Transcrição é a maneira mais eficiente em termos de custo para criar peças para pessoas com deficiência auditiva. Ao invés de escutar o podcast, pessoas surdas podem simplesmente ler a transcrição. Além disso, a transcrição ajuda a mostrar seu conteúdo nos resultados de busca do Google. 🙂
2. Criando legendas para video usando ASR
Reconhecimento automático de voz também pode apoiar a criação de legendas para conteúdo de vídeo. Carregando um arquivo de vídeo na Amberscript, você recebe legendas geradas automaticamente em instantes. No editor online, você pode editar legendas, ajustar marcas de tempo, e descarregar os arquivos em formato SRT para ser facilmente adicionado ao seu reprodutor de vídeo.
Automatizando partes do processo de criação de legendas, você pode tornar o conteúdo mais acessível de uma maneira muito mais rápida.
Vídeos com boas legendas dão as pessoas com deficiência auditiva a possibilidade de colocar o conteúdo em contexto com o movimento da imagem. O espectador pode ver não apenas quem está falando mas entender o que foi dito em que contexto.
3. Terceirizando a geração de conteúdo digitalmente acessível para profissionais
Oferecer conteúdo de áudio e vídeo acessível pode ser um desafio operacional para empresas já que custa tempo e esforço. Caso você não tenha a capacidade operacional de criar conteúdo inclusivo, terceiros podem ajudar a gerar transcrições, criar legendas e assegurar que os padrões da WCAG 2.0 ( Diretrizes de Acessibilidade para Conteúdo Web) sejam atendidos. Além de atender as normas de acessibilidade, você também pode aumentar o alcance do seu conteúdo online.