Převod zanechaných hlasových zpráv na text

Odeslat odpověď


Odpověď na tuto otázku je nutná pro rozlišení automatizovaných pokusů o registraci.

BBCode je vypnutý
Smajlíci jsou vypnutí

Přehled tématu
   

Rozšířit náhled Přehled tématu: Převod zanechaných hlasových zpráv na text

Převod zanechaných hlasových zpráv na text

od xsouku04 » stř 17. pro 2025 16:30:34

Dobrý den,
Když vám někdo zanechá hlasovou zprávu, přijde vám email s tou hlasovou zprávou v příloze.

Nyní nově bude k této hlasové zprávě přiložena i její textová podoba. Pro převod používáme google API.  Jsou tam dva jazykové modely V1 a V2.
Vypadá to, že V2 je většinou lepší, ale někdy je přesnější V1. Nyní posíláme přepisy obou modelů, ale časem budeme posílat jen ten co se osvědčí jako lepší. Naprostá většina drobných chyb nemá na srozumitelnost a pochopení významu textu vliv.
V plánu je, aby tato služba byla pro naše zákazníky zdarma. Je možné, že přidáme omezení na maximální délku, kde by se prováděl přepis třeba jen na první minutu + např. posledních 30 vteřin. Jiná možnost je delší nahrávky zpoplatnit částkou řádově 0,15 Kč/min. 

Proč je přepis nahrávek důležitý?  Text lze přečíst zpravidla rychleji, než poslechnout nahrávku.  Lze se tak ve více vzkazech snadněji orientovat a případně v nich vyhledávat. Zanechaný vzkaz si lze snadněji archivovat např. do poznámky. Čtení neruší a ve spoustě situací je pohodlnější.

Možné důvody proč tohle nepoužívat? Převod na text dělá nyní google. Ten může nahrávku použít k dalšímu zdokonalování služby. Pokoušeli jsme se tohle za příplatek vypnout, ale  vypadá to, že pro češtinu to vypnout nelze. Pokud si nepřejete převod na text provádět, napište nám. Dáme váš email na blacklist a emaily vám budou chodit bez přepisu jako doposud. 

Od 18.12.2025 je to již funkční.
 
Na převod nahrávky do textu máme též vyzkoušené API služby deepgram.com, která je dražší a pro češtinu s horšími výsledky oproti google. Tuhle chceme použít jen jako záložní. Otestovánu máme i službu Whisper, kde je možné převádět nahrávku na text lokálně. Výsledky jsou také dobré. Jen k tomu zatím nemáme grafickou kartu v serverovně. 
 
 
 
 

Nahoru