¿Qué tan preciso es el reconocimiento de voz?
Nuestro software de reconocimiento de voz puede ofrecer el mayor nivel de precisión del mercado. Para aumentar la precisión, puedes solicitar un motor personalizado, que incluya términos, acentos o vocabulario específicos. Para obtener más información, ponte en contacto con nosotros aquí.
¿Añadís marcas de tiempo?
Sí, nuestro software añade automáticamente marcas de tiempo, que puedes editar si lo deseas en un editor en línea.
¿Es posible entrenar el reconocimiento de voz en un vocabulario específico?
Sí, y ayudará a que el software de reconocimiento de voz sea más preciso. Para más información, contáctanos aquí.
¿Existen limitaciones en la cantidad de archivos que puedo subir?
No, puede subir tantos archivos como así lo desees.
¿Cómo reconoce el software los diferentes interlocutores y los momentos en los que hablan?
Son empleadas varias técnicas para el reconocimiento del interlocutor y del tiempo; nuestras soluciones estándar incluyen la diarización por vector x o la diarización de 2 canales.
¿Ofrecéis servicios de transcripción de archivos pregrabados?
Sí, nuestros servicios de transcripción pueden ser usados para muchos formatos de audio y video grabados.
Ofrecemos servicios de transcripción automática y manual, así como servicios de subtitulado automáticos y manuales.
¿Ofrecéis servicios de transcripción en tiempo real?
Sí, proporcionamos servicios de transcripción y subtitulado en tiempo real con frecuencia en una variedad de casos de uso. Para más información, ponte en contacto con nuestro equipo de ventas aquí.
¿Ofrecéis servicios de transcripción on-premise?
Tenemos un servicio on-premise, que se despliega en casos de gran volumen personalizados Puedes comunicarte con [email protected] para obtener más información.
¿Ofrecéis servicios de transcripción en la nube?
Sí, nuestros servicios se ofrecen en la nube.
¿Se admite la transcripción multicanal?
No, nuestra API estándar no admite la transcripción multicanal, pero ponte en contacto con nuestro equipo de ventas para encontrar la solución perfecta para tu caso ya que tenemos acceso a esta tecnología.
¿Qué frecuencia de muestreo necesito en mis archivos de audio?
Puedes utilizar cualquier frecuencia de muestreo. Sin embargo, la calidad de la transcripción automática depende en gran medida de la calidad del audio. Los modelos de Amberscript se entrenan en una variedad de archivos de audio con diferentes frecuencias de muestreo, que incluyen 8 Hz o 16 Hz para que el reconocimiento de voz sea lo más robusto posible.
¿Puede detectar automáticamente el idioma de un archivo de audio?
No, nuestra API estándar no admite la detección de idiomas. Por favor, ponte en contacto con nuestro equipo de ventas aquí para encontrar la solución perfecta para tu situación, ya que tenemos acceso a esta tecnología.
¿Qué formatos de audio son compatibles?
La API de voz a texto admite los siguientes formatos para los archivos de audio: MP3, MP4, WAV, M4A, M4V, MOV, WMA, AAC, OPUS, FLAC y MPG. Si necesitas un formato de archivo diferente, por favor contáctanos aquí.
¿Qué idiomas están disponibless?
Nuestra API admite los siguientes idiomas: inglés, alemán, neerlandés, francés, español, italiano, portugués, danés, sueco, finlandés y noruego.
¿Cuál es el precio?
El precio de nuestra API de voz a texto depende del caso de uso. Para más información, ponte en contacto con nuestro equipo de ventas aquí.
¿Dónde puedo encontrar documentación de la API?
La documentación de la API se puede encontrar aquí.
¿Cómo se pueden personalizar los modelos ASR?
Nuestros científicos del habla pueden entrenar los modelos ASR para que reconozcan vocabulario,
términos o jergas específicas y así aumentar la precisión de forma significativa.
Para obtener más información sobre nuestras soluciones personalizadas, ponte en contacto con nuestro equipo de ventas aquí.
¿Cómo puedo obtener la API de Amberscript?
Puedes solicitar una clave API completando este formulario.