Aggiungete i segnatempo?
Sì, il nostro software aggiunge automaticamente i segnatempo, che possono essere modificati, se lo desideri, nell’editor online.
È possibile addestrare il riconoscimento vocale su un vocabolario specifico?
Sì, questo contribuirà a rendere il software di riconoscimento vocale ancora più accurato. Per maggiori informazioni, contattaci qui.
C’è un numero massimo di file che posso essere caricati?
No, puoi caricare tutti i file che desideri.
Quanto è accurato il riconoscimento vocale?
Il nostro software di riconoscimento vocale ha il più alto livello di accuratezza sul mercato. Per una accuratezza ancora più elevata, richiedi una personalizzazione che includa specifici termini, accenti o lessici. Per scoprire di più, contattaci qui.
In che modo il software riconosce i diversi interlocutori e tempi in cui parlano?
Vengono utilizzate diverse tecniche per il riconoscimento degli interlocutori e del tempo, le nostre soluzioni standard includono la diarizzazione del vettore x o la diarizzazione a 2 canali.
Offrite servizi di trascrizione di file preregistrati?
“Sì, i nostri servizi di trascrizione possono essere utilizzati per molti formati audio e video registrati.
Offriamo servizi di trascrizione automatica e manuale, nonché servizi di sottotitolazione e sottotitoli automatici e manuali.
Offrite servizi di trascrizione in tempo reale?
Sì, offriamo regolarmente servizi di trascrizione e sottotitolaggio in tempo reale per vari casi d’uso. Per maggiori informazioni, contatta il nostro team commerciale qui.
Offrite servizi di trascrizione on-premise?
Offriamo il servizio on-premise, che viene implementato in casi personalizzati ad alto volume. Si prega di contattare [email protected] per saperne di più.
Offrite servizi di trascrizione cloud?
Sì, i nostri servizi sono offerti sul cloud.
La trascrizione multicanale è supportata?
No, la nostra API non supporta la trascrizione multicanale. Per trovare la soluzione giusta per te, contatta il nostro team commerciale qui.
Di quale frequenza di campionamento ho bisogno per i miei file audio?
Puoi caricare qualsiasi frequenza di campionamento. Tuttavia, la qualità della trascrizione automatica dipende in larga misura dalla qualità dell’audio. I modelli di Amberscript sono addestrati su una varietà di file audio con diverse frequenze di campionamento tra cui 8 Hz o 16 Hz per rendere il riconoscimento vocale il più robusto possibile.
Riuscite a rilevare automaticamente la lingua di un file audio?
No, la nostra API non riconosce la lingua. Per trovare la soluzione giusta per te, contatta il nostro team commerciale qui.
Quali formati di file audio sono supportati?
La nostra speech-to-text API supporta i seguenti formati audio: MP3, MP4, WAV, M4A, M4V. MOV, WMA, AAC, OPUS, FLAC e MPG. Per richiedere un formato diverso, contattaci qui.
Quali lingue sono supportate?
La nostra API supporta le seguenti lingue: inglese, tedesco, olandese, francese, spagnolo, italiano, portoghese, danese, svedese, finlandese e norvegese.
Quanto costa?
Il prezzo della nostra speech-to-text API dipende dal caso d’uso. Per maggiori informazioni, contatta il nostro team commerciale qui.
Dove posso trovare la documentazione API?
La documentazione API può essere trovata qui.
Come possono essere personalizzati i modelli ASR?
I nostri linguisti sviluppano i modelli di riconoscimento vocale automatico con lessici,
terminologie e gerghi specifici, aumentando l’accuratezza.
Per scoprire le nostre soluzioni personalizzate, contatta il nostro team commerciale qui.
Come posso ottenere l’API di Amberscript?
Puoi richiedere una chiave API compilando questo modulo.