帶你了解最新最好玩的高端科技! 來(lái)自專欄人工智能 我們生活在一個(gè)視頻占據(jù)大片江山的時(shí)代,但無(wú)論電視、電腦、還是你手中瘋狂刷新的短視頻APP,都離不開其中的靈魂——音頻。 現(xiàn)在,人工智能可以在一瞬間克隆人類的聲音。你只需要盡可能仔細(xì)地閱讀劇本,對(duì)著麥克風(fēng)講話 30 分鐘左右。 在啟動(dòng)和停止數(shù)十次以重新錄制你的聲音之后,將發(fā)送生成的音頻文件進(jìn)行處理,并在幾小時(shí)后被告知您的聲音副本已準(zhǔn)備就緒,正在等待中; 然后,你可以在聊天框中輸入任何你想要的東西,你的 AI 克隆聲音會(huì)告訴你,所產(chǎn)生的音頻逼真程度甚至可以欺騙到朋友和家人。 由于人工智能學(xué)習(xí)的進(jìn)步,近年來(lái)語(yǔ)音合成的工作有了很大的改進(jìn)。 以前,最真實(shí)的合成聲音是通過(guò)錄制人類配音演員的音頻,將他們的語(yǔ)音切割成組件聲音,然后像贖金票據(jù)中的字母一樣將它們拼接在一起形成新詞語(yǔ)來(lái)創(chuàng)建的(很多短視頻APP的配音就是這樣的金屬聲)。 現(xiàn)在,神經(jīng)網(wǎng)絡(luò)可以對(duì)其目標(biāo)語(yǔ)音的未分類數(shù)據(jù)進(jìn)行訓(xùn)練,以從頭開始生成某人說(shuō)話的原始音頻,最終結(jié)果可以更快、更容易、更真實(shí)地啟動(dòng)。 名人將成為AI語(yǔ)音合成的最大受益者 曾經(jīng)飾演過(guò)蝙蝠俠的瓦爾·基爾默,在早年間不幸診斷出喉癌。作為喉癌治療的一部分,他接受了氣管切開術(shù),導(dǎo)致自己的聲音受損,這也意味著他的演藝生涯就此結(jié)束。 值得慶幸的是他在完全失去發(fā)聲之前,錄制了一段音頻以作備用,這段音頻后來(lái)被公司利用AI技術(shù)完美克隆,使瓦爾·基爾默又重回到熒幕之上。 名人的聲音克隆應(yīng)用可能在未來(lái)幾年最為突出,很多公司希望名人通過(guò)克隆和出租他們的聲音以最小的努力來(lái)增加他們的收入。 一家名為 Veritone 的公司在今年早些時(shí)候推出了這樣的服務(wù),稱它可以讓有影響力的人、運(yùn)動(dòng)員和演員授權(quán)他們的 AI 聲音用于代言和無(wú)線電識(shí)別等事情,而無(wú)需進(jìn)入工作室。 Veritone 執(zhí)行副總裁 Sean King 表示:“這項(xiàng)技術(shù)能夠賦能許多不同行業(yè),因?yàn)殛P(guān)于某人的聲音以及能夠使用它并能夠擴(kuò)展它的最困難的部分是個(gè)人的時(shí)間” 例如,布魯斯·威利斯 (Bruce Willis) 已經(jīng)授權(quán)將他的圖像用作俄羅斯手機(jī)廣告中的視覺深度偽造。這筆交易讓他足不出戶就能賺錢,而廣告公司則得到了一個(gè)無(wú)限可塑性的演員。 克隆聲音感覺就像與未來(lái)會(huì)面 但這項(xiàng)技術(shù)對(duì)普通大眾意味著什么? 其實(shí)潛在的應(yīng)用是多種多樣的,不難想象一個(gè)視頻游戲,其中角色創(chuàng)建中包含有創(chuàng)建語(yǔ)音克隆的選項(xiàng),因此聽起來(lái)像是玩家正在說(shuō)出游戲中的所有對(duì)話。 或者可能有一款供父母使用的應(yīng)用程序,允許他們復(fù)制自己的聲音,這樣即使他們不在身邊,他們也可以給孩子讀睡前故事。 諸如此類這樣的應(yīng)用在不同的場(chǎng)景中得以實(shí)現(xiàn),我們始終堅(jiān)信——任何一種發(fā)明技術(shù)都有其存在的意義,尤其是出現(xiàn)在人工智能上。 當(dāng)然了,AI語(yǔ)音合成技術(shù)也有潛在的危險(xiǎn)。 這項(xiàng)技術(shù)難免以后會(huì)被一些別有用心的人來(lái)用于欺騙公司,將資金轉(zhuǎn)移到他們的賬戶中,而其他惡意用途肯定潛伏在人們看不到的陰暗角落。 想象一下,一個(gè)高中生偷偷錄制一個(gè)同學(xué)來(lái)創(chuàng)建他們的聲音克隆,然后偽造那個(gè)人說(shuō)老師壞話的音頻來(lái)給他們帶來(lái)麻煩。 不過(guò),有一件事是肯定的:在未來(lái)如果愿意,任何人都可以創(chuàng)建自己的 AI 語(yǔ)音克隆,這對(duì)于想念已故親人的年輕人是一種莫大的安慰。 結(jié)語(yǔ) 科技的進(jìn)步和人類的智慧是分不開的,而人類又是一種情感復(fù)雜的生物;AI語(yǔ)音合成技術(shù)在現(xiàn)在看來(lái)沒有太多的應(yīng)用場(chǎng)景,也不用太深層次的研究,但音頻的獨(dú)特性讓人們可以體驗(yàn)到已故親人的存在,這就夠了。 這也是——始于科技,融于自然。 |
|
來(lái)自: 藥師海印月 > 《科學(xué)界、物理學(xué)》