晚上有個(gè)同學(xué)問我,有沒有用過mp3轉(zhuǎn)文字的軟件?確實(shí),前段時(shí)間有過嘗試部署whisper程序,OpenAI的開源應(yīng)用,經(jīng)過數(shù)次失敗后,最終得知在Google colab正常運(yùn)行的方法,當(dāng)時(shí)用一首歌測試了效果。 有段時(shí)間沒實(shí)際測試,差不多又忘記了如何操作。同學(xué)隨口問了一句,我重新折騰了兩個(gè)小時(shí),不為別的,只為重溫操作流程。 下載過經(jīng)濟(jì)學(xué)人的音頻,一直希望有個(gè)功能,就是在播放音頻的時(shí)候,可以同步顯示字幕。音頻文件生成了字幕文件,打開播放軟件,字幕卻沒有同步出現(xiàn),原來默認(rèn)功能只支持播放視頻。 當(dāng)然,這件事有更方便的選項(xiàng),用谷歌瀏覽器打開音頻文件時(shí),會(huì)自動(dòng)為英文版音頻和視頻創(chuàng)建字幕,唯一不足是字幕格式無法調(diào)整。 有時(shí)候,我就是一根筋,為了一個(gè)無關(guān)緊要的功能,心不甘情不愿的浪費(fèi)時(shí)間。 我找了一個(gè)視頻,過年期間給兒子交作業(yè)的視頻,把音頻分離出來,用whisper轉(zhuǎn)成字幕格式的文本,跟原始視頻放在一起,測試播放時(shí)能否自動(dòng)添加字幕,VLC媒體播放器確實(shí)能夠勝任。 像這種小視頻的字幕,很多軟件能夠同步添加,不過對(duì)于美劇,估計(jì)難以勝任。 忽然想起來,多年以前,有個(gè)同學(xué)給我推薦了國外的科幻劇,網(wǎng)上沒有字幕,就那么連蒙帶猜看了幾遍。 片名記不清了,情節(jié)大概是這樣的:地球已經(jīng)不適合人類居住,所有的幸存者,在一艘巨大的宇宙飛船上,飄蕩在茫茫外太空,最初相安無事,慢慢地,人性的弱點(diǎn)開始爆發(fā),對(duì)生存資源的掠奪和爭搶,將飛船上的人們推向深淵。 現(xiàn)在有個(gè)AI的加持,看劇沒字幕的難題,從此一去不復(fù)返了。不過,那部劇,確實(shí)也是一去不復(fù)返了。 修改建議修正語言和語法錯(cuò)誤。例如,“確實(shí)”后面應(yīng)該加逗號(hào),“流程”和“操作”在文中混用等。 建議重新組織和調(diào)整文章結(jié)構(gòu),以更好地傳達(dá)信息??梢詫⑽恼路譃閹讉€(gè)段落,每段主要討論一個(gè)話題,并使用標(biāo)題或段落縮進(jìn)來標(biāo)識(shí)段落之間的轉(zhuǎn)換。 建議對(duì)文章中使用的術(shù)語和縮寫進(jìn)行解釋或定義,以幫助讀者更好地理解文章內(nèi)容。例如,如果普通讀者可能不熟悉“OpenAI”或“VLC媒體播放器”等術(shù)語,那么需要在文章中進(jìn)行一定的解釋和定義。 建議避免使用口語和太多的個(gè)人化表達(dá)方式,盡可能使用正式和客觀的語言。例如,“我就是一根筋”可以改為“我有時(shí)會(huì)很執(zhí)著”。 建議明確文章的主題和目的。文章似乎是在討論“如何使用mp3轉(zhuǎn)文字的軟件”和“如何在播放音頻時(shí)顯示字幕”的問題,但這些話題沒有很好地串聯(lián)起來。因此,需要對(duì)主題和目的進(jìn)行澄清。 建議將一些無關(guān)的細(xì)節(jié)或背景信息剔除,以減少文章的雜亂程度。例如,文章中談到了一些個(gè)人經(jīng)歷和情感反應(yīng),但這些信息似乎與文章的主題和目的無關(guān),可能會(huì)分散讀者的注意力。 chatGPT修改潤色版晚上有位同學(xué)問我是否用過將MP3轉(zhuǎn)換為文字的軟件。前段時(shí)間我曾嘗試部署Whisper程序,這是OpenAI的開源應(yīng)用。盡管經(jīng)過了數(shù)次失敗,最終我還是找到了在Google Colab上正常運(yùn)行該程序的方法,并用一首歌進(jìn)行了測試。 但是,由于已經(jīng)有一段時(shí)間沒有進(jìn)行實(shí)際測試了,我差不多又忘記了如何操作。這位同學(xué)隨口問了一句,結(jié)果我又重新折騰了兩個(gè)小時(shí),只為了重新熟悉操作流程。 曾經(jīng)我下載過《經(jīng)濟(jì)學(xué)人》的音頻,一直希望有一個(gè)功能,即在播放音頻時(shí)能夠同步顯示字幕。音頻文件生成了字幕文件,但打開播放軟件后,字幕卻沒有同步出現(xiàn)。原來默認(rèn)功能只支持播放視頻。 當(dāng)然,這個(gè)問題有更方便的解決方法。在谷歌瀏覽器中打開音頻文件時(shí),會(huì)自動(dòng)為英文版音頻和視頻創(chuàng)建字幕。唯一不足的是,字幕格式無法調(diào)整。 有時(shí)候,我就是一根筋,為了一個(gè)無關(guān)緊要的功能,就會(huì)心不甘情不愿地浪費(fèi)時(shí)間。 于是我找了一個(gè)視頻,在過年期間給兒子交作業(yè)的視頻中,將音頻分離出來,用Whisper轉(zhuǎn)成字幕格式的文本,然后將其與原始視頻放在一起,測試播放時(shí)是否能夠自動(dòng)添加字幕。結(jié)果,VLC媒體播放器確實(shí)能夠勝任。 像這種小視頻的字幕,很多軟件都能夠同步添加,但對(duì)于美劇來說,估計(jì)難以勝任。 我突然想起多年前,有個(gè)同學(xué)向我推薦了一部國外的科幻劇,但網(wǎng)上沒有字幕,我只能連蒙帶猜地看了幾遍。雖然我已經(jīng)記不清那部劇的片名了,但情節(jié)大概是這樣的:由于地球不再適合人類居住,所有幸存者被迫居住在一艘巨大的宇宙飛船上,在最初相安無事的狀態(tài)下,人性的弱點(diǎn)開始暴露,對(duì)生存資源的掠奪和爭搶,將飛船上的人們推向深淵。 現(xiàn)在有了AI技術(shù)的加持,沒有字幕的觀劇難題一去不復(fù)返了。不過,那部劇確實(shí)也是一去不復(fù)返了。 猜猜這是誰的風(fēng)格深夜里,一個(gè)家伙問我,有沒有用過mp3轉(zhuǎn)文字的軟件。我跟他說,我以前嘗試過一個(gè)叫做whisper的開源應(yīng)用,可是一直都搞不定,最后只有在Google colab上運(yùn)行才行。不過,我用一首歌測試了一下,效果還不錯(cuò)。 雖然有段時(shí)間沒實(shí)際測試了,我還是挺記得操作流程的。但這家伙問了我這么一句,我又花了兩個(gè)小時(shí)重新折騰,就是想重溫一下操作步驟。 之前下載了經(jīng)濟(jì)學(xué)人的音頻,但一直想要一個(gè)功能:在播放音頻的同時(shí),顯示字幕。雖然生成了字幕文件,可是在播放軟件里,字幕卻沒有同步出現(xiàn),原來默認(rèn)功能只支持播放視頻。 當(dāng)然,還有更方便的選項(xiàng),用谷歌瀏覽器打開音頻文件時(shí),會(huì)自動(dòng)為英文版音頻和視頻創(chuàng)建字幕,但是字幕格式不能調(diào)整。 我有時(shí)候就是這么固執(zhí),為了一個(gè)無關(guān)緊要的功能,浪費(fèi)時(shí)間都不心疼。 我找了一個(gè)視頻,是過年期間兒子的作業(yè),把音頻分離出來,用whisper轉(zhuǎn)成字幕格式的文本,再跟原始視頻放在一起,測試播放時(shí)能否自動(dòng)添加字幕,VLC媒體播放器確實(shí)能夠勝任。 這樣的小視頻的字幕,很多軟件都能同步添加,但是對(duì)于美劇之類的,估計(jì)就難以應(yīng)對(duì)了。 突然想起來,很多年前,一個(gè)同學(xué)推薦了一部國外的科幻劇,可是網(wǎng)上找不到字幕,只好瞎猜了幾遍。雖然片名我都忘了,但情節(jié)還是記得很清楚的:地球已經(jīng)不適合人類居住了,所以一艘巨大的宇宙飛船上的所有幸存者開始飄蕩在茫茫外太空。一開始大家相安無事,但是慢慢地人性的弱點(diǎn)開始爆發(fā),對(duì)生存資源的掠奪和爭搶,將飛船上的人們推向深淵。 現(xiàn)在有了AI的幫助,看沒有字幕的劇,再也不用瞎猜了。不過那部劇,確實(shí)是一去不復(fù)返了。 |
|