Počítač dovede mluvit srozumitelněji než většina lidí.

Podrobnější technické novinky a vůbec novinky a postřehy z VoIP.
Uživatelský avatar
xsouku04
Administrátor
Příspěvky: 8137
Registrován: pát 15. říj 2010 11:11:44
Bydliště: Brno
Kontaktovat uživatele:

Počítač dovede mluvit srozumitelněji než většina lidí.

Příspěvek od xsouku04 »

Počítačových hlasů mluvících česky existuje celá řada (a ještě některé zde ). Některé znějí spíše jak robot, a aby jim člověk rozuměl, musí se soustředit. Ty nejlepší ale připomínají hlasatele v televizi nebo rozhlase.
No a pak je spousta hlasů něco mezi.

Nahrát totiž opravdu profesionálně znějící hlášky pro IVR (hlasové menu) není úplně triviální. Nejde ani tak o to si najít klidné místo a správně seřídit citlivost mikrofonu, ale spíše jde o to, že mluvit profesionálně jak hlasatel nedovede prostě každý.
Pokud si k tomu najmeme někoho externího, nejen že to stojí extra peníze, ale ztrácíme tak možnost dělat rychlé změny textu podle situace.

Dobrý může být kompromis, kdy si texty odladíte s plechovou hubou, až jste si jisti, že to nebude potřeba měnit, necháte si nahrát profi hlášky od profesionála (nebo někoho, kdo má na to vlohy - nutně to opravdový profesionál být nemusí). Plechová huba se může hodit pro případ rychlých změn, nebo měnícího se obsahu.

Existuje nějaký svobodný software pro Linux?

Proč je to důležité? Protože Odorik běží na linuxu, a pokud by něco takového existovalo, můžeme to velmi rychle přidat zdarma do funkcí Odoriku.

Ano, existuje. Nejznámější je Festival, espeak, flite a další. Všechny ale mají jedno společné. Bohužel všechny hlasy, co jsou k volně k dispozici a podporují češtinu, připomínají spíše robota než člověka. Pokud se nezajímáte o Linux, doporučuji řádky níže přeskočit.

Volně k dispozici je zdařilejší SVox PicoTTS, který lze nainstalovat na ubuntu a debian (u debianu je nutné mít přidaný repozitář non-free) balíček libttspico-utils.

Příklady použití pod Linuxem:

Kód: Vybrat vše

espeak -v czech "Vážně to mluví česky, sice děsně, ale česky."

pico2wave  -w filename.wav   "The called number is temporary unavailable." 
aplay filename.wav
# umí jen tyto jazyky  en-US ,en-GB, de-DE, es-ES, fr-FR, it-IT , docela dobrá kvalita

echo "The called number is temporarily unavailable." |text2wave|aplay  # zde používáme Festival, na češtinu lze přepnout, ale je sotva rozumět.
echo "The called number is temporarily unavailable." |flite|aplay
Relativně kvalitní i svobodná automatická plechová huba je zde http://mary.dfki.de:59125/, bohužel zatím nepodporuje češtinu.

A kde jsou ty hlasy co připomínají hlasatele?

Nejdostupnější a poměrně kvalitní elektronický hlas má asi google překladač.
Podporuje i češtinu.
https://translate.google.com/?hl=cs&tab=iT

Stačí něco napsat, nebo nakopírovat v libovolném jazyce a kliknout ne ikonku reproduktoru.

A nebo ještě jednodušeji, stačí využít neoficiální google api

http://translate.google.com/translate_t ... t&tl=cs-cz (kdyžtak dejte reload nebo zkuste malinko zeditovat url, google nemá rád "odkazy")

Pokud budete chtít nahrát do souboru to, co je "slyšet" na vašem počítači, je to relativně snadné:

Pod Linuxem s audacity a pulseaudio trivialita (třikrát kliknout):
http://manual.audacityteam.org/o/man/tu ... linux.html
na Windows to může být trochu horší, ale jde to také:
http://manual.audacityteam.org/o/man/tu ... ndows.html

Nevím ale, jakým způsobem si google svoji plechovou hubu licencuje, ostatní proprietární hlasy obvykle zakazují jakékoli jiné použití než na testování. Pokud tedy nezaplatíte částky podobné těm, které byste museli dát živému hlasatelovi. I tak to ale může být velmi užitečné si nechat přečíst svoje texty, aby jste věděli jak to bude asi na volajícího působit a teprve finální verzi nechat namluvit nějakému profesionálovi.


Pokud chcete mít čtečku textu off-line, nahrajte si Chromium doplněk SpeakIt. Mluví docela slušně česky.
Za speakit stojí firma ispeech, má jeden český hlas, který si můžete vyzkoušet zde:
http://www.ispeech.org/text.to.speech

Rovnou na 6 hlasů na výběr jsem zatím narazil u české firmy SpeechTech, která, zdá se, má svůj vlastní vývoj v Plzni. Má též jeden kvalitní slovenský hlas a jeden ruský.
http://www.speechtech.cz/cs/produkty/demo.html#Jan210


Další možnost, jak se ke kvalitním hlasům dostat (mají jeden český), je pomocí Android aplikace, kdy je teoreticky možné si češtinu dokoupit za cca 50 Kč a ze staršího android telefonu si udělat svého mluvčího.
https://play.google.com/store/apps/deta ... es_cze_fem
http://svox-czech-or-esk-iveta-voice.soft112.com/

Autor následujícího příspěvku se neúspěšně snažil zakoupený hlas pod Androidem přenést na Linux. Nakonec přišel s uspokojivě dobrým řešením, kdy převodník textu na hlas nechá běžet jako automatizovaný server na androidu. http://sweethack.wordpress.com/2014/04/ ... -francais/

Jiný komerční a velmi povedený český hlas - Eliška.
http://www.acapela-group.com/ - mají relativně dobré ceny - https://acapela-box.com/AcaBox/acabox-prices.php - přečíst, uložit a libovolně použít 87 000 písmenek stojí 605 EUR vč. DPH.
Tedy řekl bych, že je to podobná cena jako u živého hlasatele - ale jste flexibilnější.

Říká se, že acapela má nejlepší český hlas pro android.
https://play.google.com/store/apps/deta ... .tts&hl=cs

Linguatec má dva české ženské hlasy.
http://www.linguatec.net/products/tts/v ... /vrs15demo

http://www.readspeaker.com/languages-voices/ - jeden poměrně kvalitní český ženský hlas

http://www.oddcast.com/demos/tts/tts_example.php?ttsapi - český hlas zuzana, nic moc

http://www.neospeech.com/default.aspx - kvalitní ale bez češtiny

Víte o něčem dalším co by stálo za zmínku?
JPT
Příspěvky: 322
Registrován: sob 03. lis 2012 22:21:05

Re: Počítač dovede mluvit srozumitelněji než většina lidí.

Příspěvek od JPT »

Pokud všechny ty hlasy z odkazu "celá řada" jsou syntetické, tak některé mi připadají, jako by to tam fakt někdo živý namlouval slovo od slova a neřekl bych, že jsou syntetické. To už se teda dobře vyvinulo od doby, co jsem naposledy slyšel nějaký syntetický hlas :-)
ZdePri
Příspěvky: 19
Registrován: pon 26. srp 2013 14:00:47

Re: Počítač dovede mluvit srozumitelněji než většina lidí.

Příspěvek od ZdePri »

Na Linuxu jsem dříve zkoušel TTS Epos http://epos.ufe.cz/. Kvalitnější hlas se musel stáhnou mimo (asi Violka) a výstup celkem ušel. Nevím zdali je použitelný pro nasazení.
Edit:
Ještě jsem něco zahlédl na Abclinuxu.cz http://www.abclinuxu.cz/zpravicky/svobo ... ystem-alex
mobilemanic
Příspěvky: 486
Registrován: čtv 10. říj 2013 10:20:15

Re: Počítač dovede mluvit srozumitelněji než většina lidí.

Příspěvek od mobilemanic »

Acapela-box mám vyzkoušený jako hlas pro IVR a jako člověk to úplně není, nicméně je to přijatelné. Akorát teda má to strašné sykavky, že bez úprav je to pro telefon naprosto nepoužitelné, je potřeba to ořezat.
Uživatelský avatar
Pitomec
Příspěvky: 2570
Registrován: ned 27. lis 2011 21:26:33
Bydliště: Brno

Re: Počítač dovede mluvit srozumitelněji než většina lidí.

Příspěvek od Pitomec »

U Acapela byl kdysi problém s přečtením telefonního čísla, kdy např. 800123456 neuměl automat číst jednotlivě po číslicích, ale vhazoval tam desítky, stovky a tisíce, což pak bylo spíš k pobavení, než užitku.
Obrázek
xtonda
Příspěvky: 763
Registrován: čtv 08. zář 2011 14:38:19

Re: Počítač dovede mluvit srozumitelněji než většina lidí.

Příspěvek od xtonda »

Osobně preferuji čtení telefonního čísla po jednotlivých číslicích, ale obecně je to věc vkusu, běžně se setkávám i s čtením osm set sto dvacet tři čtyři sta padesát šest. Ovšem aby automat poznal zda se jedná o telefonní číslo nebo číslovku už je určitá forma AI a je otázka, jestli to po hlasovém syntezátoru požadovat.
Uživatelský avatar
xsouku04
Administrátor
Příspěvky: 8137
Registrován: pát 15. říj 2010 11:11:44
Bydliště: Brno
Kontaktovat uživatele:

Re: Počítač dovede mluvit srozumitelněji než většina lidí.

Příspěvek od xsouku04 »

ZdePri píše:Na Linuxu jsem dříve zkoušel TTS Epos http://epos.ufe.cz/. Kvalitnější hlas se musel stáhnou mimo (asi Violka) a výstup celkem ušel. Nevím zdali je použitelný pro nasazení.
Edit:
Ještě jsem něco zahlédl na Abclinuxu.cz http://www.abclinuxu.cz/zpravicky/svobo ... ystem-alex
Díky za tip. Epos je asi z těch svobodných nejkvalitnější, který podporuje češtinu. Věděl jsem o něm, ale nemohl jsem najít domácí stránku.
Epos měl originál debian balíčky pro debian squeeze, v nejnovějším debianu bohužel nejsou a když nainstaluji starší balíčky tak to hodí Segmentation fault eposd. Asi jako první nejdříve zkusím kontaktovat autory, jestli by proti bezplatnému použití na Odorik.cz něco měli. A možná se bude dát domluvit na slušnou cenu i u některých komerčních hlasů. Také jsem nemohl najít aktuální domácí stránku, díky za odkaz.

Ukázka violky je zde http://www.pcvox.cz/viewdio/cz/wav-vw/Violka_epos.mp3

Jinak asi nejednodušší je použít neoficiální google api:
http://translate.google.com/translate_t ... t&tl=cs-cz

Ale jsou tam dva problémy. Google to může kdykoli oddělat nebo zrušit. Není to oficiální. A pravděpodobně se to "nesmí". I když si dovedu těžko představit, že by google dával někoho k soudu, když to nechal takto jednoduše pro veřejnost. Google asi prostě jen nechce ničit business firem, které se tím živí a proto to nechává takto ve vakuu.

Podobných ale placených API je víc, nicméně jejich představa je taková, že by nemělo docházet ke cachování zvuků, tedy každý hovor by měl udělat další dotaz přes api - což by jaksi vyšlo draze.
Např. https://www.ispeech.org/developer/purchase/plans http://acapela-vaas.com/pricing.html
Možná se ale půjde nějak rozumně domluvit. Chceme přidat IVR do funkčnosti odoriku (zdarma) a mít možnost si poslechnout texty by se fakt hodila.
Uživatelský avatar
xsouku04
Administrátor
Příspěvky: 8137
Registrován: pát 15. říj 2010 11:11:44
Bydliště: Brno
Kontaktovat uživatele:

Re: Počítač dovede mluvit srozumitelněji než většina lidí.

Příspěvek od xsouku04 »

Pitomec píše:U Acapela byl kdysi problém s přečtením telefonního čísla, kdy např. 800123456 neuměl automat číst jednotlivě po číslicích, ale vhazoval tam desítky, stovky a tisíce, což pak bylo spíš k pobavení, než užitku.
Dělá to pořád. Viz test na http://www.acapela-group.com/

Je třeba to napsat Volejte aha číslo 800 123 456 / 800 1 2 3 4 5 6 a mezi číslicemi nechat dvě mezery.
Uživatelský avatar
Pitomec
Příspěvky: 2570
Registrován: ned 27. lis 2011 21:26:33
Bydliště: Brno

Re: Počítač dovede mluvit srozumitelněji než většina lidí.

Příspěvek od Pitomec »

Bingo, fachá to! :)
Obrázek
Uživatelský avatar
xsouku04
Administrátor
Příspěvky: 8137
Registrován: pát 15. říj 2010 11:11:44
Bydliště: Brno
Kontaktovat uživatele:

Re: Počítač dovede mluvit srozumitelněji než většina lidí.

Příspěvek od xsouku04 »

Pracujeme nyní na využití enginu speechtech.
http://www.speechtech.cz/cs/produkty/demo.html#Jan210

Bude se platit v závislosti na počtu vteřin mluveného slova, nebude to sice úplně zdarma, ale bude to výrazně levnější, než jaké jsou běžné ceny na trhu, co se týče licence využití proprietárních TTS sytémů pro IVR.

Tedy bude to něco jako https://acapela-box.com/AcaBox/acabox-prices.php , více hlasů na výběr v češtině, jeden ruský a slovenský, bude to pohodlnější (pro uživatele Odorik.cz) a levnější. A bez minimální konzumace s odečítáním z Odorik kreditu.
Co se angličtiny týče, tam si lze zjevně vystačit s tím, co je k dispozici zdarma.

Předpokládáme, že pro veřejnost by to mohlo být tak do měsíce.
Odpovědět