大家好,我是安果! 對于從事影視剪輯的同學(xué)來說,能快速通過一個畫面找到原片中出現(xiàn)的位置,將大大提升視頻剪輯的效率 本篇文章將聊聊常見可行的方案 1、以圖搜索 我們對影視畫面進(jìn)行截圖后,直接將圖片上傳到下面這些網(wǎng)站,網(wǎng)站會返回截圖相關(guān)的結(jié)果(比如:片名、演員名、位于第幾集等) PS:針對國內(nèi)影片,建議使用國內(nèi)搜索引擎 百度識圖: https://graph.baidu.com/pcpage/index?tpl_from=pc 搜狗識圖: https://pic.sogou.com/ 360 搜圖: https://image.so.com/ Google 搜圖: https://www.google.com/imghp?hl=zh-CN&authuser=0&ogbl Yandex 搜圖: https:///images 當(dāng)然也可以直接安裝 Chrome 插件 search-by-image,它支持圖片右鍵直接搜索 https://chromewebstore.google.com/detail/search-by-image/cnojnbdhbhnkbcieeekonklommdnndci?hl=zh-CN&utm_source=ext_sidebar 2、臺詞 可以使用下面網(wǎng)站,通過臺詞或描述內(nèi)容進(jìn)行檢索 33 搜幀: https://fse./ 33 臺詞: https://33./ 找臺詞: https:/// 3、視頻/音頻轉(zhuǎn)文字(Whisper) Whisper 是用于自動語音識別的預(yù)訓(xùn)練模型,它同樣出自于 OpenAI,支持中文,模型的準(zhǔn)確性和穩(wěn)健性接近人類 Whisper 可以通過在線和離線使用 在線可以參考下面鏈接 https://platform./docs/guides/speech-to-text 下面介紹一下離線使用方案 PS:離線使用對本地顯卡有一定要求,具體可以參考官網(wǎng) 首先,在本地安裝 ffmpeg https:/// 然后安裝依賴包
接著加載模型后,傳入本地音頻或視頻文件后,一段時間后就能返回模型分析后的結(jié)果 PS:如果本地不包含模型,會在線下載對應(yīng)模型
4、Whisper.cpp Whisper 對硬件要求很高,拿一段長視頻實際體驗下來,發(fā)現(xiàn)效率極低 這里推薦 Whisper.cpp 這個項目,它提供了 GUI 和 CLI 兩種使用方式 項目地址: https://github.com/Const-me/Whisper 在 Releases 下載頁面,我們下載最新版本 cli.zip 文件并解壓到本地 然后,在下面鏈接下載一個模型到本地 https://huggingface.co/ggerganov/whisper.cpp/tree/main 這樣我們通過命令就可以將視頻或音頻轉(zhuǎn)為文字了
當(dāng)然為了提升效率,也可以編寫腳本后,配置 alias 變量快速使用 注意:為了保證最后生成的文字為簡體中文,這里通過參數(shù) --prompt 指定為簡體中文
以 windows 添加 alias 為例 編輯 Microsoft.PowerShell_profile.ps1 文件,以函數(shù)的形式添加一個 alias,然后重啟 PowerShell 即可
5、其他方案 除了上面這些方案,我們也可以將原片提前上傳到飛書妙記或阿里的通義聽悟,提前生成臺詞及關(guān)聯(lián)關(guān)系;然后通過臺詞檢索尋找對應(yīng)畫面 |
|