小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

微軟Edge的獨(dú)門(mén)絕技又進(jìn)化了,效果驚人!

 網(wǎng)羅燈下黑 2021-08-18

今年一月份的時(shí)候,Chromium 內(nèi)核的 Edge 瀏覽器是毫無(wú)疑問(wèn)的當(dāng)紅炸子雞,每次提到 Edge 瀏覽器,留言里滿(mǎn)滿(mǎn)都是「真香」的聲音。

不過(guò)說(shuō)實(shí)話(huà),雖然早在 2019 年新版 Edge 內(nèi)測(cè)的時(shí)候咱就搞來(lái)了漢化版測(cè)試了一番,可新鮮歸新鮮,我還真沒(méi)準(zhǔn)備從 Chrome 遷移到 Edge。

真正讓我意識(shí)到 Edge 強(qiáng)大的,還是今年一月份寫(xiě)的那篇關(guān)于 Edge 「大聲朗讀」功能的文章,這才讓我感受到 Edge 是真的香。

給不了解的小伙伴重新解釋一下,相比谷歌的 Chrome,微軟 Edge 上獨(dú)占的「大聲朗讀」功能可以把瀏覽器內(nèi)的文字生成 TTS 語(yǔ)音朗讀,說(shuō)白了就是提供了內(nèi)置的文字轉(zhuǎn)語(yǔ)音功能。

香的地方在于,一般的文字轉(zhuǎn)語(yǔ)音調(diào)用的都是通用引擎,那發(fā)聲一聽(tīng)就是程序合成的,根本讓人聽(tīng)不下去。

而 Edge 背靠微軟這顆大樹(shù),有著微軟這些年在人工智能語(yǔ)音合成領(lǐng)域的技術(shù)沉淀背書(shū),吐字清晰、字正腔圓,堪比真人,不信的小伙伴可以看看當(dāng)時(shí)寫(xiě)的這篇文章:《微軟Edge,你這是人干的事嗎?》。

但是,要說(shuō)但是了啊,那篇文章的最后有不少小伙伴留言說(shuō)「想導(dǎo)出朗讀的內(nèi)容」,當(dāng)時(shí)我的回復(fù)都是只能額外錄音。

可這個(gè)問(wèn)題我拿小本本記住了,就是有什么辦法利用 Edge 的「大聲朗讀」把文字轉(zhuǎn)過(guò)來(lái)的語(yǔ)音導(dǎo)出成獨(dú)立的文件呢?

今天我找到了解決方案,Read Aloud,一個(gè)把「大聲朗讀」功能獨(dú)立出來(lái)的文本轉(zhuǎn)語(yǔ)音軟件。

Read Aloud

滿(mǎn)打滿(mǎn)算也就 3M 大小出頭的 Read Aloud,界面簡(jiǎn)約啥的咱就不說(shuō)了,可麻雀雖小五臟俱全。

如果你就聽(tīng)聽(tīng)作罷,直接輸入文本,選擇合適的「語(yǔ)音」,然后點(diǎn)擊「朗讀」即可。

別擔(dān)心它提供的接口不夠,語(yǔ)音那欄里我數(shù)了數(shù),和 Edge 上「大聲朗讀」里的支持的語(yǔ)音數(shù)量一致,都是 38 個(gè)(順序有所差別),普通話(huà)、粵語(yǔ)、臺(tái)灣方言都有,主流的外語(yǔ)也都不在話(huà)下。

但如果你想把語(yǔ)音導(dǎo)出到本地,就得在下方設(shè)置那安排好你的導(dǎo)出目錄。

給大家錄了個(gè)屏來(lái)展示一下操作,語(yǔ)音方面當(dāng)然還是選擇公認(rèn)的擬人度效果最好的「xiaoxiao」了。

點(diǎn)擊「錄制」,Read Aloud 會(huì)自動(dòng)開(kāi)始播放文本,而在播放的同時(shí),它會(huì)把語(yǔ)音保存到了你設(shè)置好的目錄,唯一支持的文件格式為 .wav。

給大家聽(tīng)聽(tīng)「xiaoxiao」的效果:

啊,我又被治愈了。

當(dāng)然,你可以在右下角設(shè)置最大錄制時(shí)間,還能調(diào)整語(yǔ)速和音調(diào),不過(guò)對(duì)于部分語(yǔ)音的音調(diào)是不可調(diào)的,比如「xiaoxiao」。

但作為一個(gè) 3M 的小工具,達(dá)成這樣的效果已經(jīng)很不容易了,回到一開(kāi)始的問(wèn)題,這不就是利用 Edge 的「大聲朗讀」把文字轉(zhuǎn)過(guò)來(lái)的語(yǔ)音導(dǎo)出成獨(dú)立的文件嘛。

什么,還有人嫌 Read Aloud 不夠給力?

想想也對(duì),之前的那篇文章里不是還介紹了如何利用微軟提供的 SSML 語(yǔ)音合成標(biāo)記語(yǔ)言,來(lái)手把手調(diào)教語(yǔ)音,現(xiàn)在一個(gè)把「大聲朗讀」獨(dú)立出來(lái)的小工具可喂不飽大家。

我想了想,既然「大聲朗讀」的出處是 Edge,那老家自然是微軟,我何不去探一探源頭處微軟「語(yǔ)音合成」的究竟。

高階操作

既然是微軟的 AI 服務(wù),那應(yīng)該就出自它們家的 Azure 了,陌生的小伙伴可以類(lèi)比一下國(guó)內(nèi)的阿里云和騰訊云。

去微軟他們家的官網(wǎng),找到 Azure 的頁(yè)面,然后在「產(chǎn)品-AI + 機(jī)器學(xué)習(xí)-Azure 認(rèn)知服務(wù)」的頁(yè)面里找到我們的目標(biāo)。

語(yǔ)音-文本轉(zhuǎn)語(yǔ)音:

點(diǎn)進(jìn)去,選擇「免費(fèi)開(kāi)始使用」,登錄你的微軟賬號(hào),再注冊(cè) Azure 賬號(hào),填寫(xiě)個(gè)人資料,基本搞定。

其實(shí)上面都沒(méi)啥好說(shuō)的,有手就行,但最后一步有個(gè)門(mén)檻,需要綁定你的信用卡,主要用來(lái)驗(yàn)證真實(shí)用戶(hù),不扣費(fèi),在綁好信用卡注冊(cè)成功后,你就可以享受原汁原味的微軟服務(wù)了。

登錄后添加項(xiàng)目,選擇「語(yǔ)音-文本轉(zhuǎn)語(yǔ)音」中的「語(yǔ)音庫(kù)」。

你就能看到包括曉曉(xiaoxiao)在內(nèi)的 174 種語(yǔ)音了,然后點(diǎn)擊「創(chuàng)建音頻」。

當(dāng)你看到下面這個(gè)界面的時(shí)候,證明所有的準(zhǔn)備工作就緒,非這么老鼻子勁,我倒要看看微軟的文本轉(zhuǎn)語(yǔ)音服務(wù)有多強(qiáng)。

還是選了《許三觀賣(mài)血記》第一章的前兩段話(huà)作為例子:

許三觀是城里絲廠的送繭工,這一天他回到村里來(lái)看望他的爺爺。他爺爺年老以后眼睛昏花,看不見(jiàn)許二觀在門(mén)口的臉,就把他叫到面前,看了一會(huì)兒后問(wèn)他:

“我兒,你的臉在哪里?”

許三觀說(shuō):“爺爺,我不是你兒,我是你孫子,我的臉在這里……”

試一下導(dǎo)出,有導(dǎo)出到「音頻庫(kù)」和導(dǎo)出到本地兩種選擇,不用說(shuō)了肯定是后者,有意思的來(lái)了,支持高品質(zhì) 16k 和 24k wav 格式文件,也支持標(biāo)準(zhǔn)品質(zhì) MP3 格式文件,可以整篇導(dǎo)出,也可以分段落導(dǎo)出音頻。

曉曉的朗讀效果是這樣的:

好聽(tīng)歸好聽(tīng),可一切都是默認(rèn)選項(xiàng),和 Edge 自帶的曉曉沒(méi)什么區(qū)別,別急,在右側(cè)的優(yōu)化欄,我找到了「好東西」。

我把它分成了三欄,你可以在第一欄里從 174 種語(yǔ)音中選擇不同的語(yǔ)音,這是最基礎(chǔ)的,多國(guó)多人不同的語(yǔ)音。

而在第二欄,可以選擇上面不同語(yǔ)音的說(shuō)話(huà)風(fēng)格,比如「助理、聊天、客服、新聞」,還有各種說(shuō)話(huà)情緒,比如「撒嬌、生氣、平靜、開(kāi)心、不滿(mǎn)、害怕、溫柔、抒情、悲傷、嚴(yán)肅」。

至于第三欄,你可以設(shè)置語(yǔ)音的停頓、發(fā)音、語(yǔ)調(diào)、語(yǔ)速、音高、音量。

最最關(guān)鍵的是,上面的每一種選擇,你都能應(yīng)用在文本中的每一段、每一句、每一詞,甚至每一字。

也就是說(shuō),一個(gè)文本,你可以多個(gè)人以不同風(fēng)格討論的形式念出來(lái),比如這個(gè)樣子:

當(dāng)然,也可以讓每句話(huà)帶有不同的情緒。

這就很厲害了,我讓曉曉以平靜的語(yǔ)氣念旁白,以害怕的語(yǔ)氣念爺爺?shù)膶?duì)話(huà),以撒嬌的語(yǔ)氣念許三觀的話(huà)。

操作起來(lái)很簡(jiǎn)單,拉住需要改變的那句話(huà),然后點(diǎn)擊對(duì)應(yīng)的選項(xiàng)就好了。

我們來(lái)聽(tīng)聽(tīng)效果:

有沒(méi)有覺(jué)得,最后許三觀說(shuō)的話(huà),「孫子」倆字發(fā)音聽(tīng)起來(lái)怪怪的,好解決,我們?cè)趩为?dú)改一下發(fā)音,然后插入個(gè)停頓就好了。

再來(lái)聽(tīng)聽(tīng)效果,是不是沒(méi)有那種囫圇喊「孫子」的感覺(jué),吐字更加清晰了。

豐富的操作,讓合成的語(yǔ)音在你的巧手下變得更加真實(shí),如果你愿意,甚至可以通過(guò)更改每個(gè)字來(lái)讓曉曉口吐方言。

為了讓大家感受一下微軟這個(gè)服務(wù)的強(qiáng)大,我專(zhuān)門(mén)用抖音的剪映挑了個(gè)小姐姐的語(yǔ)音,來(lái)聽(tīng)聽(tīng)效果。

同樣,我還充了個(gè)訊飛出品的「訊飛快讀」的會(huì)員,這是高級(jí) VIP 小媛的語(yǔ)音,聽(tīng)聽(tīng)看效果。

哪個(gè)更有人味不用多說(shuō)了吧,重要的是微軟的這個(gè)服務(wù)還是免費(fèi)的,但實(shí)際上,微軟的這個(gè)應(yīng)用比市面上很多收費(fèi)軟件的效果都更出色,如果你是一名短視頻創(chuàng)作者,相信你心中自有定論。

之前還需要 SSML 語(yǔ)音合成標(biāo)記語(yǔ)言的代碼,現(xiàn)在怎么就能這么點(diǎn)點(diǎn)就實(shí)現(xiàn)了,你點(diǎn)開(kāi)上面「SSML」的開(kāi)關(guān),本質(zhì)上是一樣的:

聽(tīng)著曉曉的聲音,想著合成語(yǔ)音的未來(lái),嗯,千萬(wàn)別有什么大膽的想法。

結(jié)語(yǔ)

今天給大家安利的兩個(gè)工具,一個(gè)初階 Edge 「大聲朗讀」導(dǎo)出工具,一個(gè)高階的微軟 AI 服務(wù),怎么選擇還得看大家的需求咯。

不知道大家發(fā)現(xiàn)沒(méi)有,現(xiàn)在不少推銷(xiāo)電話(huà)都開(kāi)始用 AI 合成音了,不過(guò)還是能聽(tīng)出來(lái)有 AI 那種特有的頓感。

那如果未來(lái) AI 合成音更逼真了呢,不管是語(yǔ)調(diào)、尾音、口音,甚至說(shuō)每句話(huà)的抑揚(yáng)頓挫,和我們說(shuō)話(huà)都差不多呢。

想想還真有點(diǎn)可怕。

不管怎么樣,希望我們還能拿捏的住這技術(shù),最后還是讓曉曉幫我送上祝福吧:

這次別下次一定了,記得點(diǎn)贊三連?。?/span>

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶(hù) 評(píng)論公約

    類(lèi)似文章 更多