Az utóbbi években sokat javult a virtuális asszisztensek hangja. Kevésbé robotszerűek, egyre jobban hasonlítanak az igazi emberi hanga. Az Apple bejelentette, hogy a Sirinek új hangja lesz egy Neural Text-to-Speech-nek nevezett technológiának köszönhetően. A Google viszont az általa ellenőrzött DeepMind-dal fejlesztette ki a Wavenetet.
A Facebook új modellje, a MelNet viszont kifogástalanul tudja utánozni híres emberek hangját, hanghordozását, akcentusát. Így sikerült egészen meggyőzően utánozni Bill Gates-et.
Mint a konkurensek, a MelNetet is a machine learningre, és a nagy mennyiségű mintára alapozták. Nem a hullámok formáját elemzi, hanem a spektrogrammjukat. Ezáltal a mesterséges intelligencia algoritmusa a legkisebb árnyalatot is képes reprodukálni, a hangnak olyan elemeit, amelyet az ember maga már észre sem vesz.
A MelNetnek azonban van egy korlátja: hitelesen főleg a rövidebb mondatokat tudja utánozni, egy könyvfejezetnyi szöveget, vagy egy hosszabb beszédet azonban nem.
Ennek pozitív oldala is van. Nem használható fel például politikusok beszédeinek hamisítására, vagy hosszabb szövegek közszereplők szájába adására. Lehet viszont vele álhíreket gyártani, vagy hanghamisításokkal csalásokat elkövetni. Ugyanakkor utat nyithat a beszédzavarokban szenvedők kezelésében, vagy érdekes hangvágási technikák fejlesztésében a film- és a zeneipar számára.
Kommentek:
A hozzászólások a vonatkozó jogszabályok értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a Felhasználási feltételekben és az adatvédelmi tájékoztatóban.
arabok balrol 2019.06.18. 20:37:18