Skip to content
API & anpassade modeller

Det mest exakta tal-till-text API:et

  • Anpassade ASR modeller anpassade efter dina behov
  • Lätt att integrera i din programvara. Priser upp till 10x lägre än självuppladdning
  • Specialiserade API:er för telefonsamtal, texter fulländade av människor och ljud eller video i realtid

Testa det gratis Testa det gratis Börja här
Det mest exakta tal-till-text API:et
Det mest exakta tal-till-text API:et
Älskad av över en halv miljon kunder

Company Webcast

Landtag_MV_Logo

KalturaLogo

Amazon logo
Vad vi gör
Möjliggör för din programvara att omvandla tal till text genom att använda API:er av våra generiska modeller eller få en tal till text modell byggd av oss.

API-integration och kostnad

Vill du få insikter i dina telefonsamtal? Vill du undertexta videor i stor skala? Eller vill du indexera ditt videoarkiv? Vi levererar lösningen med högst precision.

Du kan enkelt automatisera arbetsflöden och transkribera stora mängder ljud och video genom att använda vårt tal-till-text API. Vårt API är ganska enkel. Den överför ljud eller videofiler till vår ASR-server och returnerar transkriptionen i önskat format.

Priserna för vår automatiska taligenkännings-API är upp till 10x lägre än om du själv skulle ladda upp din ljud eller videofil. Vårt team kommer kontakta dig för att förklara vår prisstruktur. Det är gratis att testa vår API.

Begär API-nyckel
Integration
Hur det fungerar

API Integration

Vårt API är tillgängligt på mer än 35 språk. Vi stödjer ljud med dubbla kanaler, automatisk interpunktion och casing, talar-etiketter, tidsstämplar och alla ljud/video- filformat.

Vänligen kontakta oss för våra specialiserade API:er för telefonsamtal, texter fulländade av människor och ljud eller video i realtid.

Kontakta oss
Snabb

Snabb handläggningstid för alla dina filer

Precise
Precision

Möjliggör ett flöde av ljud-till-data med precision

secure
Säker

GDPR kompatibel sekretess och säkerhet

Format som stöds

Vi förstärker språkets kraft genom att göra det tillgängligt.

XML / JSON

Inkluderar information som start och sluttid per ord, konfidenspoäng, frågeangivelser, skiljetecken (…)

.doc / .txt:

Möjligt att exportera med eller utan tidsstämplar och urskiljning av talare.

.SRT / VTT / EBU-STL:

Perfekt för att skapa automatiska undertexter. Inställningar för utseendet på undertexterna kan bestämmas enskilt.

Möjliggör ett ljud-till-data flöde med precision

Integrera tal-till-text API med lätthet

Vår matris

Vi presterar bäst

Erkända av tusentals utvecklare, startups och topp-företag som den tjänst som presterar bäst

FunktionerGoogle VideoGoogle DefaultAWS TranscribeAmberscript
info Precision Bra Dålig OK Utmärkt
info Precisions-uppdateringar var 6-12 månad 6-12 månad 6-12 månad 6 vecka
info Pris $2.19/tim $1.44/tim $1.44/tim $0.50 – $9/tim
info Tid att integrera 3-4 dagar 3-4 dagar 3-4 dagar 1-2 timmar
info Språk som stöds 35 + 35 + 9 25+
info Talarurskiljning ja ja ja ja
info Tidsstämplar för ord ja ja ja ja
info Confidence score ja ja ja ja
info Interpunktion ja ja ja ja
info Live support ja ja ja ja
info Anpassade modeller nej nej nej ja
info Alla format accepterade nej nej nej ja
info Transkribera data från Endast GCP Buckets Endast GCP Buckets Endast S3 Buckets Var som helst ifrån
info Extrahering av nyckelord nej nej nej ja
info Exportera SRT/VTT/EBU-STL nej nej nej ja
info Human perfected option nej nej nej ja
info Servern lokaliserad USA USA USA Västeruopa
info Data integritet nej nej nej ja
info Gratis 24/7 support nej nej no ja
Funktioner
Google Video
Google Default
AWS Transcribe
Amberscript
info Precision
Bra
Dålig
OK
Utmärkt
info Precisions-uppdateringar var
6-12 månad
6-12 månad
6-12 månad
6 vecka
info Pris
$2.19/tim
$1.44/tim
$1.44/tim
$0.50 – $9/tim
info Tid att integrera
3-4 dagar
3-4 dagar
3-4 dagar
1-2 timmar
info Språk som stöds
35 +
35 +
9
25+
info Talarurskiljning
ja
ja
ja
ja
info Tidsstämplar för ord
ja
ja
ja
ja
info Confidence score
ja
ja
ja
ja
info Interpunktion
ja
ja
ja
ja
info Live support
ja
ja
ja
ja
info Anpassade modeller
nej
nej
nej
ja
info Alla format accepterade
nej
nej
nej
ja
info Transkribera data från
Endast GCP Buckets
Endast GCP Buckets
Endast S3 Buckets
Var som helst ifrån
info Extrahering av nyckelord
nej
nej
nej
ja
info Exportera SRT/VTT/EBU-STL
nej
nej
nej
ja
info Human perfected option
nej
nej
nej
ja
info Servern lokaliserad
USA
USA
USA
Västeruopa
info Data integritet
nej
nej
nej
ja
info Gratis 24/7 support
nej
nej
no
ja

Hur det fungerar

Anpassade taligenkännings modeller

Vi kombinerar världens senaste kunskaper inom teknik, språk och vetenskap för att utveckla kundspecifika språkmodeller för distinkta användningsfall. Vi gör det genom att utnyttja befintliga datauppsättningar eller genom att skapa en ny datauppsättning från början. Vårt mål är att skapa språkmodeller som är helt anpassade till språkanvändningen i din organisation.

Anpassning

Anpassning förbättrar taligenkänningen för:

Olika accenter

Akustisk miljö

Anpassning av ordförrådet för att känna igen produktnamn, särskilda termer och förkortningar

Anpassning till domänspecifika språk som politik, hälso-och sjukvård, fysik, teknik eller andra domäner

Begär en demo
Are you interested in

Är du intresserad av anpassade taligenkänningsmodeller?

  • Högsta möjliga kvalitet
  • Känner igen kritiska ord och nyanser som dina användare har
  • Produktnamn, kampanjnamn och annan specifik terminologi
  • Skräddarsydd för accenter, telefontal och andra faktorer som påverkar ljudkvaliteten
Begär en demo

Nöjda användare

Möt våra

HVA (Amsterdams universitet för tillämpad vetenskap) – Läs fallstudie

Vår forskningsgrupp genomför många intervjuer. Tidigare arbetade vi med en egen pool av transkriberare.
Jag är glad att alla våra intervjuer nu transkriberas på ett och samma ställe, det sparar mycket tid att ordna allting.

L. Van den Berg – Föreläsare och forskare vid Hogeschool van Amsterdam

Amberscript har fått ett nytt utseende!

Vi hoppas att du gillar vår nya look.