Warning: Invalid argument supplied for foreach() in /www/doc/www.6dhub.cz/www/templates/6dhub/html/com_k2/default/item.php on line 37
Čínská umělá inteligence od Baidu napodobí váš hlas během minuty
Technologie

Čínská umělá inteligence od Baidu napodobí váš hlas během minuty

10.05.21

Martin Kysilka, 16. BŘEZNA 2018

Co to je: Budoucnost kyberzločinu a kyberbezpečnosti bude velmi záludná. Už dnes je velmi obtížné rozeznat, zdali je daná informace pravdivá, či se jedná o takzvané „fake news“. Techniku digitální chirurgie, ve které AI na bázi hlubokého učení dokáže implantovat obličej na libovolné tělo, již vědci vyvinuli. Nyní čínští vědci přišli s novou klamavou technologií.

Vědci z čínské Baidu vymysleli program umělé inteligence, který dokáže po pouhé minutě poslechu napodobit váš hlas.

„Z technického hlediska se jedná o velmi důležitý průlom, který demonstruje, jak komplikovaný generativní problém jako je napodobování řeči, lze tréninkem na pár příkladech přizpůsobit novým obchodním modelům,“ vysvětluje člen týmu Leo Zou.

Baidu však není první, kdo s napodobováním hlasu přišel. Minulý rok ukázal projekt Lyrebird, jak dokáže jeho neurální síť napodobit Trumpa nebo Obamu. Taktéž jim k tomu stačilo pouze pár nahrávek. Stejně jako v případě Lyrebird nezní syntéza řeči od Baidu zcela přesvědčivě, ale i tak se jedná o velký krok vpřed. Především ve srovnání s nynějšími zvukovými asistenty.

Celá práce je založena na „text-to-speech“ systému Deep Voice, který byl vytrénován na osmisethodinové zvukové stopě 2 400 různých řečníků. Programu stačilo pouze 100 pětisekundových úseků hlasových tréninkových dat, aby dosáhl svého maxima. Už ale samotná verze vytrénovaná na 10 pětisekundových samplech byla schopna ošálit systém rozpoznávání řeči – s úspěšností 95%.

Dopad: Již nyní se nabízí nespočet možných využití. Klonování hlasu například pomůže lidem, kteří o hlas přišli. Další velký průlom nastane v oblasti personalizovaných humanoidních robotických rozhraní.

Nová metoda klonování hlasu také umožní vytvářet originální digitální obsah. Například ve videoherním průmyslu. Každá postava ve hře bude mít vlastní autentický hlas.

Jiné zajímavé využití bude v „speech-to-speech“ jazykových překladačích. Syntetizér se naučí do cizího jazyka přenést i způsob vašeho vyjadřování, tedy částečně i vaši osobnost.

Vzniká tu však také značný prostor pro zneužití technologie. Věrné napodobování hlasu konkrétní osoby se může stát i velmi mocnou zbraní. Zvlášť pokud si budeme moci daný hlas „vypůjčit“ a používat ho v reálném čase.

ukázky naklonované řeči a studie

Související