Schopnost odezírání řeči z pohybu rtů je klíčovou dovedností nejen pro neslyšící, ale také důležitá v hlučném prostředí, při hlasových handicapech řečníků, zpracování zvukově nekvalitních videí a filmů, v biometrické identifikaci atp. Není divu, že se proto řada projektů zabývá strojovým odezíráním. Velký pokrok oznámil společný projekt googlovského DeepMind, kanadského Institute for Advanced Research a Oxfordské univerzity nazvaný LipNet. Za pomoci umělé inteligence povýšil schopnost odezírání z úrovně slov na úroveň vět na principu "naučené" predikce slovosledu. Výsledek překonává svojí 93.4% přesností nejendosavadní výsledky strojového odezírání (80%), ale i výsledky nejdovednějších lidí. Jde o další ukázku obrovského potenciálu umělé inteligence pro řešení různých praktických problémů našeho života, zdraví, práce, komunikace...
Originální článekSouvisející
Automatizace rutinních aktivit. O marketingové transformaci v éře AI se Zdeňkem Valutem
6Dhub.cz · CZECHárna Petra Beneše #45 - Zdeněk Valut
„Umím předvídat technologické a společenské změny a včas na ně upozornit." Rozhovor se Sentou Čermákovou nejen o umělé inteligenci, druhé kariéře a české identitě
6Dhub.cz · CZECHárna Petra Beneše #43 - Senta Čermáková