A Baidu kutatói létrehoztak egy mesterséges intelligenciát, melyről azt állítják, hogy egy percen belül képes klónozni az ember hangját. A Deep Voice egy szöveg-beszéd szintézis rendszer, amelyet a Baidu 80000 órányi hanganyagból képzett 2400 résztvevő hangjának segítségével.
Bár a rendszernek jellemzően 100 darab 5 másodperces vokális szakaszra van szüksége a hang utánzására, általában már 10 darab 5 másodperces minta elegendő ahhoz, hogy a hang felismerő rendszer 95% -ban pontos legyen. (1)
A Deep Voice ezután már képes új beszédet, hangsúlyokat, hangszíneket és stílusokat generálni. Például képes a női hangot férfi hanggá változtatni és a brit akcentust amerikaivá.
"Technikai szempontból ez egy fontos áttörés, amely azt mutatja, hogy egy bonyolult generatív modellezési probléma, nevezetesen a beszédszintézis, új esetekhez igazítható, ha csak néhány példán keresztül hatékonyan tanul," - mondta Leo Zou, a Baidu kommunikációs csapatának tagja. "Korábban több példát is igénybe vett egy modell a tanulás során. Most csupán ennek egy töredékére van szüksége."
"Sok hasznos lehetőséget látunk a technológia alkalmazására," - mondta Zou. "Például a hangklónozás segíthet azoknak a betegeknek, akik elvesztették a hangjukat. Ez is fontos áttörés a személyre szabott ember-gép interfészek irányában. Például valaki könnyen beállíthatja az audió olvasót a saját hangjára. A módszer továbbá lehetővé teszi az eredeti digitális tartalom létrehozását. A videojátékok karaktereinek százai kaphatnak egyedülálló hangzást a technológia miatt. Egy másik érdekes alkalmazás a beszéd-beszéd fordítás, mivel a szintetizátor képes megtanulni, utánozni a beszélő identitását egy másik nyelven." (2)
A Deep Voice és a hasonló technológiák a gépi tanulás gyors fejlődését jelentik. Vannak azonban, akik aggodalmukat fejezik ki amiatt, hogy a rendszert fel lehet használni interjúk, hírszegmensek és sajtótájékoztatók készítésére. Jogosak lehetnek azon aggodalmak, hogy ez az új klón technológia még több hamis hírhez vezethet, de reméljük, hogy nem kerül rossz kezekbe.
(1) - https://arxiv.org/pdf/1802.06006.pdf
(2) - http://research.baidu.com/Blog/index-view?id=81