ElevenLabs se zabývá hlasovou technologií s umělou inteligencí. Startup založili polští inženýři Mati Staniszewski a Piotr Dabkowski. Vyvinuli model pro syntézu řeči založený na hlubokém učení. Technologie tak dokáže převádět text na řeč s jakýmkoliv hlasem a jakoukoliv emocí.
„Existuje OpenAI a několik dalších, kteří dělají podobné věci s textem a obrázky, ale řešení pro zvuk chybí,“ říká generální ředitel ElevenLabs Mati Staniszewski. V oblasti hlasové umělé inteligence působí například ukrajinský Respeecher, kanadský Resemble AI nebo americká firma WellSaid Labs.
Technologie ElevenLabs funguje pro krátký i dlouhý obsah. Mohli by ji tak využívat vydavatelé knih, novináři nebo tvůrci obsahu.
Startup vytváří umělé hlasy, dokáže ale také klonovat již existující. Kniha tak může být namluvena hlasem slavné osobnosti, aniž by se na tom výrazněji podílela. Technologie navíc dokáže naklonovat hlas ze vzorků o délce pouhých pěti sekund.
V současné době technologie funguje v angličtině a polštině. Startup doufá, že do budoucna bude schopna okamžitě převádět mluvený zvuk mezi různými jazyky, což by se dalo využít například při dabingu v kinech, živém televizním vysílání a komunikaci v reálném čase.
Startup nyní oznámil, že v předvstupním kole vedeném českou společností Credo získal dva miliony dolarů. Díky tomu chce ElevenLabs rozšířit své řešení po celém světě, aby bylo dostupné ve všech jazycích. Chce také zahájit výzkum automatického dabingu z jednoho jazyka do druhého stejným hlasem. Tento nástroj pro dabing s umělou inteligencí by měl být uveden na trh ještě letos.
Technologii zatím otestovalo 250 klientů. Od února pak bude k dispozici v širším měřítku. V příštích několika měsících Staniszewski také plánuje zdvojnásobit svůj tým, který v současné době čítá pět lidí.