小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

Sora要改變視頻創(chuàng)作,前提是它還不能太貴

 三易生活 2024-02-23 發(fā)布于湖北
最近這幾天,OpenAI的文生視頻模型Sora毫無疑問是互聯(lián)網(wǎng)話題的中心,更成為了AI界新的頂流。關(guān)于Sora的魅力,用周鴻祎的話來說,“去年這個時候GPT實現(xiàn)了第一個突破,實現(xiàn)了對人類語言的理解,解決了機(jī)器和人之間對話的問題。Sora的突破在于,它實現(xiàn)了機(jī)器對這個世界的感知、觀察和交互的能力。”


Sora走紅后,自然就少不了想要蹭這個熱度的企業(yè)。比如國內(nèi)知名游戲廠商盛趣的高層就表示,Sora是體現(xiàn)ChatGPT大語言模型邏輯的“世界模擬器”,其潛力遠(yuǎn)超影片生成工具的范圍,落地AI文生視頻技術(shù)對于游戲研發(fā)團(tuán)隊來說是充滿吸引力的選項,盛趣也對AI視頻生成技術(shù)接入實際研發(fā)管線保持樂觀。

又比如網(wǎng)文平臺中文在線日前宣稱,從目前的公開信息來看,Sora在相當(dāng)程度上會進(jìn)一步提高生產(chǎn)效率、降低制作成本,其所擁有的海量IP未來或可運用Sora或類似應(yīng)用生成短劇/短視頻,通過現(xiàn)有成熟短劇或短視頻營銷等商業(yè)路徑進(jìn)行規(guī)?;?、商業(yè)化的變現(xiàn)。

雖然目前Sora并未對公眾開放,但許多人都已經(jīng)認(rèn)為它將能夠改變視頻創(chuàng)作市場的格局。Sora的出現(xiàn)就意味著像電影這樣的專業(yè)長視頻內(nèi)容可能會進(jìn)入“創(chuàng)作平權(quán)”時代,消解內(nèi)容平臺的話語權(quán),這個觀點如今在影視圈也很有市場。畢竟Sora代表大家不再需要費勁地去學(xué)習(xí)操作PR、AE等工具,也不用搜集素材,只需要有一個腳本交給Sora,就能得到一段高質(zhì)量的視頻。


盡管這樣樂觀的情緒已經(jīng)彌漫在游戲、影視、短視頻等,可能被Sora賦能的賽道,然而AI行業(yè)的從業(yè)者對于Sora的態(tài)度就要理性得多。比如獵豹移動董事長傅盛就在直播中表示,Sora這次的突破并不代表技術(shù)上的重大升級,更可以理解成是一個暴力美學(xué)。

事實上,即便拋開技術(shù)不談,決定Sora到底是一個改變視頻創(chuàng)作的“王炸”、還是一個玩具,核心問題就是被不少人選擇性忽略的成本。

成本方面的顛覆正是現(xiàn)階段Sora被外界寄予厚望的關(guān)鍵因素之一,可如果使用它的成本比現(xiàn)有模式更高呢?目前,受邀用戶在X、Reddit等社交平臺上,已經(jīng)在陸續(xù)分享關(guān)于Sora的使用體驗,除了其對于物理世界的理解依然存在明顯瑕疵外,另一個引發(fā)廣泛討論的,則是Sora生成視頻的時間很長。

根據(jù)相關(guān)網(wǎng)友的反饋,Sora生成1分鐘視頻的時間,需要渲染超過1個小時。但也有Redditde用戶表示,“如果你計算一下所有典型的動畫制作工時,Sora的渲染時間也不是很瘋狂了?!?/section>


事實上,到目前為止OpenAI并沒有公布Sora的訓(xùn)練和推理成本,但其兩大王牌產(chǎn)品ChatGPT和GPT-4的價格則是擺在臺面上的,其中ChatGPT的每1000個tokens需花費0.002美元,而GPT-4的每1000個tokens要花費0.002-0.006美元。

只是文生視頻模型對于算力的要求必然會更高,而且大模型的推理成本是遞增的,也就是用的人越多、算力要求越大。要不然,OpenAI CEO奧特曼也不會提出所謂籌資7萬億美元建AI芯片基礎(chǔ)設(shè)施這樣的計劃。

那么Sora生成視頻的成本究竟是多少呢?如今基于GPT-4的文生圖工具DALLE-3生成1024x1024的圖片需要0.04美元,在Sora之前業(yè)界最好的文生視頻模型RunwayML Gen2生成7.5分鐘視頻就需要90美元。盡管OpenAI并未公布Sora的每1000個tokens需要多少錢,但它公開了其技術(shù)文檔,讓外界有機(jī)會模糊地推測Sora的使用成本。


按照OpenAI方面的說法,Sora是基于擴(kuò)散模型的視頻生成模型,Sora使用視覺補(bǔ)?。╬atches)作為其表示方式,類似于大型語言模型(LLM)中的文本標(biāo)記,是將視頻編碼到一個降低視覺數(shù)據(jù)維度的網(wǎng)絡(luò)(Video compression network),再將latent轉(zhuǎn)成patches,送入到基于Transformer架構(gòu)的擴(kuò)散模型中。因此Sora的工作流程其實與Stable Diffusion非常類似,后者使用自動編碼器(VAE)也是將圖片壓縮到低維度的latent空間。

假如Sora和Stable Diffusion都使用了8倍的空間壓縮率,一個1024x1024分辨率的30幀視頻大概需要處理8K級別的tokens,同時由于擴(kuò)散模型的原理就是給一張圖片加上大堆雪花一樣的噪音,然后讓AI去除噪音、還原本真。此外,Sora生成視頻還需要進(jìn)行去噪聲操作,而每進(jìn)行一次去噪,消耗的tokens就要增加一倍。所以如果是去噪步數(shù)和Stable Diffusion的30步一樣,那么Sora生成視頻消耗的tokens就是240K。


以GPT-4的每1000個tokens最低0.002美元計算,Sora生成1分鐘視頻的成本就在600美元左右。對于專業(yè)化的影視、CG渲染來說,這個價格并不算貴,但問題是專業(yè)化的影視制作不可能接受Sora生成的視頻有不可控缺陷,而對于短視頻創(chuàng)作來說,這樣的價格又過于昂貴了。

過去AI聊天機(jī)器人、文生圖能走紅是因為便宜,生成一大段話或幾張圖要不了太多錢,可如今文生視頻的成本指數(shù)級提升,這就有些麻煩了。

【本文圖片來自網(wǎng)絡(luò)】

推薦閱讀:

讓“智能”和“專業(yè)”惠及更多人,是小米現(xiàn)階段的關(guān)鍵

小米人車家生態(tài)全面升級,現(xiàn)在不僅僅只是互聯(lián)這么簡單。

淘寶已開始支持微信支付,大廠們以和為貴

如果因為自身的傲慢讓潛在消費者流失,對如今的淘寶來說無疑是罪過。

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多