Skip to content
Étude de Cas
3 minute read
14 Fév 2022

SkyHigh TV automatise l’enregistrement des rushes grâce à la technologie de reconnaissance vocale

Topics
Sous-titres automatiques

SkyHigh TV est l’une des principales sociétés de production des Pays-Bas et produit des programmes télévisés pour les diffuseurs commerciaux et publics. La société produit principalement des émissions de télé-réalité, des feuilleton-documentaires et des documentaires.

En quoi consiste la collecte d’informations ? Et pourquoi cela prend-il autant de temps ?

L’objectif principal de toute production est de trouver la meilleure histoire possible. Une partie cruciale de ce processus de découverte est l’enregistrement des séquences vidéos brutes (également appelées “rushes”). Les enregistreurs et les transcripteurs ont généralement pour tâche de passer en revue l’ensemble des séquences vidéos brutes afin de transcrire les conversations et de marquer les scènes pour le montage final. Par définition, il y a toujours plus de vidéos enregistrées que ce qui est utilisé pour le montage final.

C’est la tâche du réalisateur ou du producteur du montage de finaliser un montage final à partir de centaines d’heures de vidéos. Afin d’accélérer ce processus, on fait appel à des enregistreurs et à des transcripteurs qui saisissent tous les fragments appropriés avec les horodatages correspondants.

“Normalement, nous utilisons des personnes qui retranscrivent toutes les conversations du contenu vidéo. Pour une interview de deux heures, un enregistreur prend généralement jusqu’à 10 heures. Cela représente presque une journée et demie de travail”, explique Sanne, productrice chez SkyHigh TV.

En outre, c’est un défi opérationnel que de gérer les spotters, souvent des étudiants ou des stagiaires. Si un lot entier de 10 heures de matériel doit être enregistré, 3 à 4 personnes sont mises au travail, qui doivent respecter les délais et effectuer le repérage selon certaines normes. “Cette ‘gestion des personnes’ prend bien sûr beaucoup de temps”, explique Sanne.

Les scripts sont ensuite chargés dans les logiciels Avid ou Premiere afin que les monteurs et les réalisateurs puissent accéder rapidement à une sélection du matériel vidéo approprié.

Skyhigh TV a récemment commencé à travailler avec Amberscript pour automatiser le processus autant que possible.

Transformez vos audio et
vos vidéos en texte et en sous-titres

  • Service à la demande de haute précision
  • Des prix compétitifs et des délais d’exécution rapides grâce à l’intelligence artificielle.
  • Téléchargez, recherchez, modifiez et exportez en toute simplicité.

Amberscript automatise la quasi-totalité du processus

SkyHigh TV utilise Amberscript pour faire transcrire des vidéos par reconnaissance vocale automatique (RVA). Le flux de travail change. Après la production, le contenu vidéo est chargé au sein de la plateforme d’Amberscript et les producteurs reçoivent une transcription complète en quelques minutes seulement. Amberscript distingue automatiquement les locuteurs et chaque mot est horodaté.

Pour retranscrire une interview de deux heures, les loggers ont maintenant besoin d’environ 20 minutes. Ensuite, il faut parfois procéder à quelques ajustements, car la reconnaissance vocale ne fonctionne pas à 100%.

“Pour les enregistrements de bonne qualité, comme les interviews, cela fonctionne incroyablement bien. Je pense que beaucoup de nos équipes ne peuvent plus envisager de travailler sans Amberscript – nous économisons littéralement des centaines d’heures de travail. Les stagiaires sont bien sûr très heureux et nos producteurs ont beaucoup plus de temps à leur disposition. C’est un énorme soulagement de passer moins de temps à distribuer des fichiers vidéo à différentes personnes et à surveiller les délais. Au final, c’est du temps que nous pouvons désormais utiliser pour créer des programmes télévisés de grande qualité.”

Outre SkyHigh TV, Amberscript fournit également des services au cinéaste Rogier Kappers. Pour en savoir plus, cliquez ici !

Nos services vous permettent de créer du texte et des sous-titres à partir de fichiers audio ou vidéo.

* Téléchargement de fichiers audio ou vidéo
* Conversion automatique ou manuelle de la parole en texte
* Edition et exportation de texte ou de sous-titres