【原】自媒體創(chuàng)作利器：混剪如何快速找到對應(yīng)畫面？（多套方案）

AirPython 2023-12-13 發(fā)布于重慶

展開全文

大家好，我是安果！

對于從事影視剪輯的同學(xué)來說，能快速通過一個畫面找到原片中出現(xiàn)的位置，將大大提升視頻剪輯的效率

本篇文章將聊聊常見可行的方案

1、以圖搜索

我們對影視畫面進(jìn)行截圖后，直接將圖片上傳到下面這些網(wǎng)站，網(wǎng)站會返回截圖相關(guān)的結(jié)果（比如：片名、演員名、位于第幾集等）

PS：針對國內(nèi)影片，建議使用國內(nèi)搜索引擎

百度識圖：

https://graph.baidu.com/pcpage/index?tpl_from=pc

搜狗識圖：

https://pic.sogou.com/

360 搜圖：

https://image.so.com/

Google 搜圖：

https://www.google.com/imghp?hl=zh-CN&authuser=0&ogbl

Yandex 搜圖：

https:///images

當(dāng)然也可以直接安裝 Chrome 插件 search-by-image，它支持圖片右鍵直接搜索

https://chromewebstore.google.com/detail/search-by-image/cnojnbdhbhnkbcieeekonklommdnndci?hl=zh-CN&utm_source=ext_sidebar

2、臺詞

可以使用下面網(wǎng)站，通過臺詞或描述內(nèi)容進(jìn)行檢索

33 搜幀：

https://fse./

33 臺詞：

https://33./

找臺詞：

https:///

3、視頻/音頻轉(zhuǎn)文字（Whisper）

Whisper 是用于自動語音識別的預(yù)訓(xùn)練模型，它同樣出自于 OpenAI，支持中文，模型的準(zhǔn)確性和穩(wěn)健性接近人類

Whisper 可以通過在線和離線使用

在線可以參考下面鏈接

https://platform./docs/guides/speech-to-text

下面介紹一下離線使用方案

PS：離線使用對本地顯卡有一定要求，具體可以參考官網(wǎng)

首先，在本地安裝 ffmpeg

https:///

然后安裝依賴包

# 安裝依賴
# 注意：python版本必須3.8以上
pip3 install openai-whisper

接著加載模型后，傳入本地音頻或視頻文件后，一段時間后就能返回模型分析后的結(jié)果

PS：如果本地不包含模型，會在線下載對應(yīng)模型

import whisper
import time

def get_content():
    # 加載模型
    whisper_model = whisper.load_model("large")
    # result = whisper_model.transcribe(r"./temp.WAV")
    # print(", ".join([i["text"] for i in result["segments"] if i is not None]))

    result = whisper_model.transcribe(r"./01.mp4")
    print(result)

if __name__ == '__main__':
    get_content()

4、Whisper.cpp

Whisper 對硬件要求很高，拿一段長視頻實際體驗下來，發(fā)現(xiàn)效率極低

這里推薦 Whisper.cpp 這個項目，它提供了 GUI 和 CLI 兩種使用方式

項目地址：

https://github.com/Const-me/Whisper

在 Releases 下載頁面，我們下載最新版本 cli.zip 文件并解壓到本地

然后，在下面鏈接下載一個模型到本地

https://huggingface.co/ggerganov/whisper.cpp/tree/main

這樣我們通過命令就可以將視頻或音頻轉(zhuǎn)為文字了

# 模型：ggml-medium.bin
# 音頻轉(zhuǎn)文字（中文）
main.exe -l zh -otxt -m ggml-medium.bin "temp.WAV" --prompt "簡體中文

# 視頻轉(zhuǎn)文字（中文）
main.exe -l zh -otxt -m ggml-medium.bin "temp.mp4" --prompt "簡體中文

當(dāng)然為了提升效率，也可以編寫腳本后，配置 alias 變量快速使用

注意：為了保證最后生成的文字為簡體中文，這里通過參數(shù) --prompt 指定為簡體中文

import os
import fnmatch, shutil

# 使用whisper.cpp項目將當(dāng)前目錄下【所有視頻語音】轉(zhuǎn)為文字

# 獲取當(dāng)前目錄下所有的視頻文件
def find_video_files(path):
    video_extensions = ['*.mp4', '*.mkv', '*.avi', '*.flv', '*.mov']
    video_files = []

    for root, dirs, files in os.walk(path):
        for extension in video_extensions:
            for filename in fnmatch.filter(files, extension):
                video_files.append(os.path.join(root, filename))

    return video_files


# 1、獲取所有視頻文件
current_directory = os.getcwd()
video_files = find_video_files(current_directory)

# 2、遍歷，將視頻語音使用whisper轉(zhuǎn)為中文
for video_file in video_files:
    # 轉(zhuǎn)換命令
    command = f'D:\\ai\\cli\\main.exe -l zh -otxt -m D:\\ai\\ggml-medium.bin -f {video_file} --prompt "簡體中文"'
    os.system(command)

以 windows 添加 alias 為例

編輯 Microsoft.PowerShell_profile.ps1 文件，以函數(shù)的形式添加一個 alias，然后重啟 PowerShell 即可

# SP文件目錄：C:\Users\wnn\Documents\WindowsPowerShell\Microsoft.PowerShell_profile.ps1

Function zzm(){
    python D:\\ai\\main.py
}

5、其他方案

除了上面這些方案，我們也可以將原片提前上傳到飛書妙記或阿里的通義聽悟，提前生成臺詞及關(guān)聯(lián)關(guān)系；然后通過臺詞檢索尋找對應(yīng)畫面

贊賞

共11人贊賞

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自： AirPython > 《待分類》

舉報/認(rèn)領(lǐng)

0條評論

發(fā)表

請遵守用戶評論公約

類似文章 更多

AirPython

關(guān)注對話

TA的最新館藏

自媒體創(chuàng)作利器：混剪如何快速找到對應(yīng)畫面？（多套方案）
自媒體創(chuàng)作利器：借助油猴腳本助你輕松應(yīng)對熱門話題
玩轉(zhuǎn) JS 逆向：RPC 加持，爬蟲效率飆升
最佳實戰(zhàn) | 教你用 Python 駕馭 Nacos 配置中心
反爬篇 | 手把手教你處理 JS 逆向之字體反爬（下）
休閑時光：最近上映的電影與爬蟲世界，帶您徹底放松！

喜歡該文的人也喜歡更多

熱門閱讀換一換

小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

【原】自媒體創(chuàng)作利器：混剪如何快速找到對應(yīng)畫面？（多套方案）

【原】自媒體創(chuàng)作利器：混剪如何快速找到對應(yīng)畫面？（多套方案）