Skip to content
API & Modèles personnalisés

L'API de conversion de la parole en texte la plus précise

  • Des modèles de Reconnaissance Vocale Automatique personnalisés
  • Facile à intégrer dans votre logiciel et des prix jusqu’à 10 fois plus bas que l’auto-téléchargement
  • API spécialisées pour des appels téléphoniques, des textes perfectionnés manuellement et des audios ou vidéos transcrits en temps réel

Demandez un devis Demandez un devis Demandez une clé API
L'API de conversion de la parole en texte la plus précise
L'API de conversion de la parole en texte la plus précise
Approuvé par plus d’un million d’utilisateurs

                            Company Webcast

                            

                            Landtag_MV_Logo

                            

                            KalturaLogo

                            

                            Amazon logo

                            
Ce que nous faisons
Permettez à votre logiciel de transformer la parole en texte en utilisant les API de nos modèles génériques, ou faites construire par nos soins un modèle personnalisé de la parole en texte

Intégration de l’API et coûts

Voulez-vous avoir un aperçu de vos conversations téléphoniques ? Voulez-vous sous-titrer vos vidéos à grande échelle ? Ou voulez-vous indexer vos archives vidéo ? Nous vous proposons la solution la plus adaptée.

Vous pouvez facilement automatiser les flux de travail et transcrire de grandes quantités d’audio et de vidéo en utilisant notre API de parole en texte. Notre API est très simple. Elle transfère les fichiers audio ou vidéo vers notre serveur de Reconnaissance Vocale Automatique et renvoie la transcription dans le format souhaité.

Les prix de notre API de reconnaissance vocale automatique sont jusqu’à 10 fois inférieurs à ceux du téléchargement de vos fichiers audio et vidéo. Notre équipe vous contactera pour vous expliquer notre structure de prix. L’essai de notre API est gratuit.

Demandez une clé API
Integration
Comment ça marche

Intégration de l’API

Notre API est disponible dans plus de 80 langues. Nous prenons en charge l’audio à double canal, le boîtier, la ponctuation automatique, les distinctions d’interlocuteurs, l’horodatage et tous les formats de fichiers audio/vidéo.

Veuillez nous contacter pour connaître nos API spécialisées pour les appels téléphoniques, les textes perfectionnés par des professionnels et l’audio ou la vidéo en temps réel.

Contactez-nous
Rapide

Délais de livraisons rapides pour tous vos fichiers

Precise
Précis

Permet un flux précis d’audio en texte

secure
Sécurisé

Sécurité et confidentialité conformes à la RGPD

Formats Supportés

Nous rendons l’audio accessible

XML / JSON

Inclure des informations telles que l’heure de début et de fin par mot, les indices de confiance, les indications de questions, la ponctuation (…)

.doc / .txt:

Possibilité d’exporter avec ou sans horodatage et changement de locuteur

.SRT / VTT / EBU-STL:

Idéal pour créer des sous-titres automatisés. Les paramètres de l’apparence des sous-titres peuvent être déterminés individuellement

Permettez à l’audio-en-texte de circuler avec précision

Intégrez facilement l’API de conversion de la parole en texte

Notre matrice

Nous sommes plus performants

Reconnu par des milliers de développeurs, de startups et d’entreprises de premier plan.
comme étant plus performants que nos concurrents

TooltipFeaturesGoogle VideoGoogle DefaultAWS TranscribeAmberscript
info Des tests indépendants dans les médias (section actualité) ont montré que Amberscript a la meilleure précision des trois. Veuillez utiliser notre Taux d’Erreur de Mot, un outil de mesure pour comparer par vous-même. Précision Bonne Pauvre Moyenne Très bonne
info Amélioration de la précision tous les 6-12 mois 6-12 mois 6-12 mois 6 semaines
info Les prix Amberscript varient en fonction de la personnalisation requise et de l’utilisation par mois. Prix $2.19/HR $1.44/HR $1.44/HR $0.50 à $9/HR
info Temps d’intégration 3-4 jours 3-4 jours 3-4 jours 1-2 heures
info Amberscript prend en charge l’arabe, bulgare, catalan, danois, néerlandais, anglais, finnois, français, allemand, grec, hindi, hongrois, italien, japonais, coréen, lituanien, norvégien, polonais, portugais, roumain, russe, espagnol, turc et suédois Langues prises en charge 35 + 35 + 9 84
info Distinction des locuteurs Oui Oui Oui Oui
info Tous les mots prononcés ont un horodatage. Horodatage Oui Oui Oui Oui
info L’indice de confiance indique l’algorithme. Indice de confiance Oui Oui Oui Oui
info Ponctuation Oui Oui Oui Oui
info Les IA d’Amberscript peuvent être intégrées à votre logiciel pour transcrire ou sous-titrer en temps réel. Veuillez nous contacter pour en savoir plus. Assistance en temps réel Oui Oui Oui Oui
info Veuillez nous contacter pour discuter des possibilités d’un modèle personnalisé pour la plus grande précision possible. Modèles personnalisés Non Non Non Oui
info Amberscript supporte les formats MP3, MP4, WAV, M4A, M4V, MOV, WMA, AAC, OPUS, FLAC et MPG et peut activer d’autres formats de fichiers sur demande. Tous formats audio/vidéo acceptés Non Non Non Oui
info Retranscrits les données depuis GCP Buckets seulement GCP Buckets seulement S3 Buckets seulement Partout
info L’API Amberscript peut vous fournir les principaux mots-clés de chaque fichier Extraction des mots-clés Non Non Non Oui
info L’API Amberscript peut être utilisée pour les sous-titres en recevant les fichiers en SRT, VTT ou EBU-STL, y compris le formatage avancé des sous-titres Exportation au format SRT/VTT/EBU-STL Non Non Non Oui
info Nos transcripteurs perfectionnent les textes de l’ASR avec une précision de plus de 99 %. Les prix diffèrent selon la langue. Option de perfectionnement par des professionnels Non Non Non Oui
info Les serveurs Amberscript sont situés en Europe occidentale et aucune de vos données ne quittera l’UE Emplacement des serveurs USA USA USA Europe Occidentale
info Amberscript a le niveau de sécurité et de confidentialité conforme au RGPD et supprime vos données immédiatement après leur traitement. Confidentialité/Suppression des données Non Non Non Oui
info Nous sommes toujours prêts à vous aider en cas de besoin ! Assistance gratuite 24h/24 et 7j/7 Non Non Non Oui
Features
Google Video
Google Default
AWS Transcribe
Amberscript
info
Précision
Bonne
Pauvre
Moyenne
Très bonne
Amélioration de la précision tous les
6-12 mois
6-12 mois
6-12 mois
6 semaines
info
Prix
$2.19/HR
$1.44/HR
$1.44/HR
$0.50 à $9/HR
Temps d’intégration
3-4 jours
3-4 jours
3-4 jours
1-2 heures
info
Langues prises en charge
35 +
35 +
9
84
Distinction des locuteurs
Oui
Oui
Oui
Oui
info
Horodatage
Oui
Oui
Oui
Oui
info
Indice de confiance
Oui
Oui
Oui
Oui
Ponctuation
Oui
Oui
Oui
Oui
info
Assistance en temps réel
Oui
Oui
Oui
Oui
info
Modèles personnalisés
Non
Non
Non
Oui
info
Tous formats audio/vidéo acceptés
Non
Non
Non
Oui
Retranscrits les données depuis
GCP Buckets seulement
GCP Buckets seulement
S3 Buckets seulement
Partout
info
Extraction des mots-clés
Non
Non
Non
Oui
info
Exportation au format SRT/VTT/EBU-STL
Non
Non
Non
Oui
info
Option de perfectionnement par des professionnels
Non
Non
Non
Oui
info
Emplacement des serveurs
USA
USA
USA
Europe Occidentale
info
Confidentialité/Suppression des données
Non
Non
Non
Oui
info
Assistance gratuite 24h/24 et 7j/7
Non
Non
Non
Oui

Comparé par la force relative

Comment ça marche

Modèles de reconnaissance vocale personnalisés

Nous combinons les dernières connaissances mondiales en matière de technologie, de langues et de sciences afin de développer des modèles linguistiques spécifiques aux clients pour des cas d’utilisation particuliers. Nous le faisons en exploitant des ensembles de données existants ou en créant un nouvel ensemble de données à partir de zéro. Notre objectif est de créer des modèles linguistiques qui sont entièrement adaptés à l’utilisation du langage dans votre organisation.

Personnalisation

La personnalisation améliore la reconnaissance vocale pour :

Des accents différents

Un environnement acoustique

Adaptation du vocabulaire pour reconnaître les noms de produits, les termes spéciaux, les abréviations

Adaptation aux termes d’un domaine spécifique comme la politique, la santé, la physique, la technologie ou d’autres domaines

Demandez une démo
Êtes-vous intéressé par

Un modèle de reconnaissance vocale personnalisé ?

  • La plus haute précision possible
  • Reconnaît les mots et les nuances critiques qu’ont vos utilisateurs
  • Noms de produits, noms de campagnes et autres terminologies spécifiques
  • Adapté aux accents, au discours téléphoniques et à d’autres facteurs qui influencent la qualité du son
Demandez une démo

Utilisateurs satisfaits

Rencontrez nos

HVA (Amsterdam University of Applied Sciences) – Lire l’étude de cas

Notre groupe de recherche mène beaucoup d’entretiens. Auparavant, nous travaillons avec notre propre groupe de transcripteurs. Je suis heureux que maintenant nos entretiens soient transcrits en un seul et même endroit, cela nous fait gagner beaucoup de temps pour tout organiser.

L. Van den Berg – Enseignant-chercheur à la Hogeschool van Amsterdam