【原】最近很火的AI作畫，游戲開發(fā)者們已經(jīng)在嘗試了丨觸樂

觸樂 2022-09-01 發(fā)布于北京

展開全文

很有潛力，但仍在路上。

最近，“AI作畫”產(chǎn)出的作品似乎成了一股互聯(lián)網(wǎng)風(fēng)潮。這些初看驚艷、氣氛拉滿，仔細(xì)琢磨又看不出所以然的畫作往往給人留下深刻印象。當(dāng)人們得知這些畫作完全由AI繪制，更是又多了一份驚異與危機(jī)感。

一些AI作畫的成品效果的確十分驚艷

雖然涉及復(fù)雜的機(jī)器學(xué)習(xí)算法，AI作畫的原理解釋起來并不復(fù)雜。用戶可以在平臺(tái)上輸入各種與風(fēng)格、主題、氛圍有關(guān)的關(guān)鍵詞，AI根據(jù)這些關(guān)鍵詞在互聯(lián)網(wǎng)浩如煙海的資源和素材中搜索、學(xué)習(xí)，最后糅合與拼接成一些符合要求的畫作。

拿在移動(dòng)端十分紅火的Wombo Dream為例，它是一個(gè)面向大眾用戶的AI作畫工具，界面可視化程度高，操作簡單。我在界面中選擇“吉卜力風(fēng)格”，輸入主題“夢(mèng)中夢(mèng)”，并且上傳了一張湖中小船的圖片作為參考基準(zhǔn)。很快，AI就給我生成了一張和吉卜力動(dòng)畫背景類似的成品。

移動(dòng)端面向大眾的Wombo Dream操作簡單，生成圖片的速度很快

除此之外，還有很多更專業(yè)、側(cè)重點(diǎn)不同的圖像制作AI。比如谷歌的Disco Diffusion可調(diào)參數(shù)更多，能夠詳盡地設(shè)置圖片的大小、質(zhì)量，在描述上的要求也更加精細(xì)，可以涵蓋畫師風(fēng)格、色調(diào)、主題等許多方面。這使得它生成的一些圖片仿佛出自真人畫師之手。而Midjourney模仿了各種用戶可能對(duì)真人畫師提出的需求，是不少從事數(shù)字繪畫的藝術(shù)家的寵兒。Stable Diffusion是一款開源軟件，許多游戲開發(fā)者都青睞于它廣闊的應(yīng)用前景。Artbreeder則因?yàn)閷?duì)真人頭像的模擬，早幾年就在網(wǎng)絡(luò)上風(fēng)靡。

雖然這項(xiàng)技術(shù)并不是近年才有，但隨著AI技術(shù)的發(fā)展和互聯(lián)網(wǎng)帶來的更多素材，這一類產(chǎn)出作品的質(zhì)量肉眼可見地日益提升，效率也大大升高。今年年初，先不論畫得怎么樣，一些AI畫圖工具畫一張圖還要1小時(shí)左右，現(xiàn)在這個(gè)時(shí)間已經(jīng)縮短到十幾秒了。

如果說普通用戶使用這類AI作畫是為了滿足自己內(nèi)心對(duì)種種場景的幻想，游戲開發(fā)者們則從中看到了更多潛力。

觸樂找到幾位開發(fā)者，他們或多或少地正在自己的游戲中進(jìn)行探索和實(shí)驗(yàn)，尋找應(yīng)用這項(xiàng)技術(shù)的可能。

從機(jī)械化的勞動(dòng)中解放

“正義的史官”（化名）是一款策略游戲的開發(fā)者。聯(lián)系上他時(shí)，他開玩笑說，自己正在朋友圈里“布道”，號(hào)召同行們都來嘗試AI作畫。他自己已經(jīng)開始在項(xiàng)目中使用，而且感覺用得很順手。說到AI畫圖的好處，他提得最多的是“量大”“速度快”，尤其在開發(fā)初期找概念方向的時(shí)候，效率比人工畫圖高出非常多。

在這個(gè)階段，策劃最想看的是畫面的整體效果和大感覺，但很多具體細(xì)節(jié)還無法確定。打個(gè)比方，假如他們想做一個(gè)黑暗奇幻背景的游戲，可能有哥特風(fēng)、中世紀(jì)風(fēng)、工業(yè)風(fēng)等等好幾個(gè)方向。在無法判斷哪些元素組合和色彩搭配效果最好的情況下，反復(fù)提需求可能會(huì)造成人力的無謂消耗?！癆I作畫就不一樣，我們可以不斷調(diào)整關(guān)鍵詞，調(diào)一次讓AI出100張看看效果?！笔饭僬f，“如果我讓公司美術(shù)或者外包先出100張看看效果，他們應(yīng)該會(huì)直接把我從窗口扔下去……”

在角色設(shè)計(jì)上也是一樣?！凹偃缥蚁朐O(shè)計(jì)個(gè)外星人形象，可以先讓AI來500個(gè)看效果，再從中挑一個(gè)進(jìn)行更細(xì)致的設(shè)計(jì)?！彼^續(xù)說，“你不可能讓真人畫師去承擔(dān)這種試錯(cuò)成本，但AI就無怨無悔?！?/span>

已經(jīng)有藝術(shù)家嘗試用AI生成圖片，參加數(shù)字藝術(shù)比賽，這是獲獎(jiǎng)作品

除了提供靈感大方向，AI生成的圖片還可以當(dāng)作參考素材。邢峰（化名）是一款主打文字?jǐn)⑹潞蛽Q裝類游戲的制作人。他的游戲中有大量涉及服裝褶皺、布料質(zhì)感和飄逸動(dòng)態(tài)的繪畫。

“這種東西你不可能讓畫師憑空去想，他們平時(shí)畫也要找很多參考，而且找到角度和姿勢(shì)合適的參考其實(shí)很麻煩，”邢峰介紹說，“輸入關(guān)鍵字，直接拿AI出的圖當(dāng)參考就方便很多，而且也不用考慮潛在的動(dòng)態(tài)、姿勢(shì)之類的侵權(quán)問題，因?yàn)锳I是憑空給你做出來的。更何況，AI做的3D渲染，一般打光都比較正確，不需要你再自己去腦補(bǔ)。”

不過AI生成的概念圖、人物圖目前很難直接使用?！白詈筮€是得讓畫師來畫，畢竟AI生成的東西都很破碎，它沒有一個(gè)統(tǒng)一的設(shè)計(jì)，直接拿來用，不太符合我們的項(xiàng)目需求。”邢峰說。

目前最接近于直接可用的AI作畫的成品，主要集中在一些相對(duì)簡單的平面圖案設(shè)計(jì)和3D素材貼圖上。這類圖片一旦生成，開發(fā)者只需要進(jìn)行一些裁切、調(diào)色之類的簡單處理，就能應(yīng)用到游戲中。

我嘗試用AI生成了一幅寫實(shí)風(fēng)景，這種效果作為一些文字類游戲不太重要的背景，已經(jīng)接近于直接可用

簡單的平面圖案設(shè)計(jì)包括各種旗幟圖標(biāo)、徽章、法陣等等。如果它們與游戲的世界觀、情節(jié)并不緊密掛鉤，不需要專門設(shè)計(jì)，就可以交給AI去批量產(chǎn)出。

史官開發(fā)的游戲中就要用到很多勛章圖案和供玩家選擇的旗幟圖標(biāo)。這種美術(shù)素材在游戲中不占據(jù)重要地位，如果讓畫師人工設(shè)計(jì)和繪制，一個(gè)人一天最多只能畫出十幾個(gè)，投入和產(chǎn)出非常不平衡。“用AI畫，如果畫勛章，一晚上能出大幾千個(gè)，圖標(biāo)一天能出1萬個(gè)。拿到成品之后再用腳本切圖打包，比人力不知道快多少倍?！彼绱诵稳菪实木薮蟛罹?。

他進(jìn)一步計(jì)算了不同設(shè)備下AI的出圖效率：“我們現(xiàn)在主要租用的是谷歌云。AI畫圖工具Stable Diffusion出的圖，以一張圖512×512像素為標(biāo)準(zhǔn)，在Stable Diffusion里走50步的話，用T4顯卡大概需要15秒，64步大概20秒，步數(shù)越多時(shí)間越長。要是有V100的顯卡，估計(jì)50步幾秒就出來了。出圖數(shù)量可以自己設(shè)置。電腦的顯存決定能不能生成足夠大的圖，GPU決定有多快?！?/span>

至于開銷，Stable Diffusion本身是免費(fèi)的開源軟件，谷歌云的花費(fèi)則是每月10美元，更高的配置也僅需50美元。

邢峰也提到了一些接近于一次性使用、在游戲中不起到重要作用的圖案。“假如要做一個(gè)獸人小兵，出來不到一分鐘就被打回去的那種，他身上的文身就完全可以用AI生成。還有各種魔法陣，設(shè)計(jì)起來其實(shí)很麻煩，在游戲里作用卻不大，直接找素材又很容易碰到版權(quán)糾紛……”AI作畫可以把畫師從這類機(jī)械化的勞動(dòng)中解放出來。

但并不是所有平面紋樣都適用于AI，最終要看的還是開發(fā)者的需求。“比如衣服上的刺繡、布料上的花紋，這些在我們的游戲里涉及到世界觀、文化、陣營等等，還挺重要的?！毙戏逭f，“所以這些我們還是人工設(shè)計(jì)，不會(huì)用AI來畫?！?/span>

開發(fā)者們覺得用起來最沒有負(fù)擔(dān)的是AI生成的3D貼圖素材，尤其是石頭花紋、花草樹木這類放之四海而皆準(zhǔn)的東西。如果他們需要的只是寫實(shí)背景，這些逼真、沒有特殊風(fēng)格，也不存在版權(quán)的自然外觀，可以算作最方便的素材，甚至生成之后也不需要多少人工修正。

獨(dú)立開發(fā)者葉蘭舟也一直關(guān)注著AI作畫，他進(jìn)一步解釋了目前廠商使用AI作畫工具的關(guān)鍵：“AI現(xiàn)在是一個(gè)混沌的黑箱。在圖出來之前，你很難知道自己會(huì)得到什么結(jié)果，每一個(gè)關(guān)鍵字會(huì)在里面起到什么作用，也是不清楚的?！?/span>

現(xiàn)在開發(fā)者們對(duì)AI作畫的調(diào)試，更像是在完成“關(guān)鍵詞獵手”的工作?！捌鋵?shí)核心就是兩點(diǎn)：找到自己游戲風(fēng)格對(duì)應(yīng)的關(guān)鍵詞組，以及篩選適合在游戲里發(fā)揮的圖?！?/span>

他拿出一張很接近游戲原畫的白發(fā)女性人像作為例子。要生成這張圖，除了基本的“girl with super long hair, hair becoming white snow”（超級(jí)長發(fā)女孩，頭發(fā)雪白）的關(guān)鍵詞之外，還要加上各種其他的限制。比如“細(xì)節(jié)豐富”“數(shù)字繪畫”“Artstation”“概念設(shè)計(jì)”“光滑”“聚焦清晰”“虛幻引擎5”“8K”等。最后，還要加入“by Artgerm and Greg Rutkowski and Alphonse Mucha”等著名畫家的名字對(duì)圖畫的風(fēng)格進(jìn)行調(diào)整。

開發(fā)者要調(diào)整多次關(guān)鍵詞才能生成自己想要的效果

“所以，關(guān)鍵詞就跟咒語一樣，需要不斷地嘗試調(diào)換，看怎么樣才能出來最能表達(dá)自己想法的風(fēng)格。”葉蘭舟說。一般來說，根據(jù)成圖的復(fù)雜程度，調(diào)整關(guān)鍵詞的過程在15分鐘至1小時(shí)之間。

無法代替人類，也確實(shí)存在問題

目前，AI作畫技術(shù)仍然處在不斷的變化發(fā)展之中，可以用“日新月異”來形容。哪怕把今年年初的AI作畫和現(xiàn)在相比，效果也是天差地別。

葉蘭舟回憶了幾個(gè)印象深刻的例子。大約在今年三四月，使用DDV5這一AI作畫工具，以“德魯伊”“Pablo Amaringo”“Artstation流行”等關(guān)鍵詞繪制的圖畫在氛圍和畫面元素上已經(jīng)足夠令人印象深刻，但當(dāng)時(shí)還基本上無法生成正常的人臉。幾個(gè)月后，DALL-E2已經(jīng)可以生成比較準(zhǔn)確的五官，而Stable Diffusion在畫面表現(xiàn)上更上一層樓。

大約5個(gè)月前，DDV5生成的德魯伊主題圖片效果

經(jīng)過幾個(gè)月的發(fā)展，DALL-E2（左）和Stable Diffusion（右）的圖片生成質(zhì)量都大有提升

另一個(gè)例子是Midjourney在兩個(gè)月的時(shí)間內(nèi)，以同樣的關(guān)鍵詞生成的以魚為主題的圖片。

“所以AI進(jìn)化的速度真的非常驚人，簡直像超人劇變，每天甚至每小時(shí)都在變化?！比~蘭舟如此評(píng)價(jià)。

時(shí)隔兩個(gè)月，Midjourney對(duì)同組關(guān)鍵詞生成的不同畫面

與所有引起人們注意的新興事物一樣，AI作畫在引人驚嘆的同時(shí)也帶來了不少爭議。

首先是一種久已有之的擔(dān)憂：AI的發(fā)展，乃至廣義上機(jī)器學(xué)習(xí)的發(fā)展是否最終會(huì)代替人工？這個(gè)問題有些形而上，討論起來還挺復(fù)雜的。但從開發(fā)者們最務(wù)實(shí)的角度來看，答案其實(shí)比較簡單：目前來說，“遠(yuǎn)遠(yuǎn)沒到可代替的程度”。

就像前文所說，AI依然只是工具，只能對(duì)美術(shù)方面的重復(fù)性勞動(dòng)進(jìn)行輔助，是用來解放畫師而不是代替畫師的。“或者說，它們代替的是缺乏創(chuàng)造性的勞動(dòng)。”邢峰說，“對(duì)AI生成的素材進(jìn)行篩選，以及最終的設(shè)計(jì)和繪畫，還是得讓真人來，只不過簡化了前面若干會(huì)讓真人畫師'頭禿’的步驟。”

史官說，根據(jù)他在同行圈子里“賣安利”的經(jīng)驗(yàn)，策劃和制作人嘗試AI作畫的積極性最高，畫師的積極性最低，但不是因?yàn)楫嫀熡X得自己會(huì)被替代。“他們對(duì)AI作畫本身沒有興趣，最關(guān)心的是用AI輔助進(jìn)行繪畫的實(shí)例。”

另外，哪怕AI能畫出各種精致的圖片，在實(shí)際應(yīng)用上，開發(fā)者們依舊處在探索和研究的階段，離真正的工業(yè)化、大規(guī)模應(yīng)用還有一段距離。

首先，工業(yè)化的開發(fā)者工具往往需要和其他常用工具的接口，方便創(chuàng)作者在不同軟件之間隨時(shí)拷貝和編輯素材，而目前大部分AI作畫工具都缺乏這項(xiàng)功能。許多人已經(jīng)注意到了這個(gè)問題，并正在努力解決。“比如我們使用的Stable Diffusion現(xiàn)在已經(jīng)開源了，以后應(yīng)該會(huì)有更多優(yōu)化和工具的接入?，F(xiàn)在已經(jīng)有接入Photoshop的視頻了?！笔饭僬f。

史官提到的這段演示視頻的效果確實(shí)讓人驚訝。將Stable Diffusion接入Photoshop后，畫師幾乎能夠隨時(shí)通過輸入關(guān)鍵詞的方式，用AI生成的內(nèi)容填補(bǔ)畫布上的空白，然后直接用畫筆在上面修改，儼然多了一個(gè)有求必應(yīng)的繪圖助理。

畫面上的建筑和植物都是先用AI生成，再手動(dòng)繪制調(diào)整出來的

邢峰則希望有更多讓開發(fā)者定制的內(nèi)容，比如定制素材庫。“假如我們?cè)瓉碜隽艘粋€(gè)特別風(fēng)格化的游戲，接下來想做個(gè)類似的，能不能把我們自己的素材上傳上去訓(xùn)練AI，讓AI給我們畫呢？”

葉蘭舟將這個(gè)過程稱為針對(duì)某個(gè)畫師或者特定畫風(fēng)的小規(guī)模機(jī)器訓(xùn)練，但目前大部分渴望用上的游戲廠商還沒有能力進(jìn)行。“不過大家已經(jīng)在做研究了，比如現(xiàn)在Stable Diffusion的開發(fā)者說，訓(xùn)練包最終會(huì)壓縮到100MB……這樣我們大概就能拿來跑訓(xùn)練了?！?這個(gè)趨勢(shì)的發(fā)展速度也很快。這兩天史官下載的版本，訓(xùn)練包已經(jīng)從7GB變成了2.7GB。

在形而上的“AI是否會(huì)取代人類”的討論之外，AI作畫確實(shí)存在一些灰色地帶沒有解決。這些問題給它商業(yè)化、工業(yè)化的應(yīng)用前景蒙上了一層陰影。

通常情況下，開發(fā)者們不太擔(dān)心AI生成的紋樣、姿勢(shì)等出現(xiàn)版權(quán)問題。“因?yàn)锳I生成的東西是'長’出來的，就像一棵樹不會(huì)長出兩片相同的葉子，哪怕用同一組關(guān)鍵詞，AI也會(huì)給不同的人畫出不同的東西?！毙戏逭f。

但有些版權(quán)概念更為模糊，比如畫風(fēng)。這是目前AI作畫爭議的焦點(diǎn)。因?yàn)橛?xùn)練AI時(shí)的不少關(guān)鍵詞都涉及到畫師的風(fēng)格，使用者既可以指名道姓地輸入現(xiàn)有著名畫師的姓名，也可以輸入諸如“吉卜力”“迪士尼”這樣已經(jīng)相對(duì)穩(wěn)定的商業(yè)流派。結(jié)果，當(dāng)AI作畫的成品和這些參考圖的風(fēng)格越來越像，畫師們難免會(huì)感到被冒犯。

8月底，已經(jīng)有不少日本畫師在社交平臺(tái)聲明，禁止AI學(xué)習(xí)自己的畫風(fēng)。抗議涉及的AI作畫平臺(tái)Mimic主打二次元頭像，他們放出的對(duì)比圖乍一看的確難辨真假。

用戶上傳畫師們已有的作品，Mimic用AI生成新的畫風(fēng)類似的頭像

盡管葉蘭舟從開發(fā)者的角度指出，如果真的要應(yīng)用在游戲中，AI生成的角色在面部表情、形象的連續(xù)性（指角色長相在不同場景中不會(huì)“一人千面”）等方面仍有不少瑕疵，但光從靜態(tài)圖看，AI過強(qiáng)的模仿能力似乎一下子就讓畫師們十幾年的努力顯得岌岌可危。

因?yàn)闋幾h過大，Mimic現(xiàn)在已經(jīng)宣布終止測試，并聲稱將在正式版中加入保護(hù)畫師版權(quán)的措施。

一些歐美游戲廠商的概念設(shè)計(jì)師也站出來指責(zé)這類AI工具是“版權(quán)洗衣機(jī)”，認(rèn)為它們對(duì)畫風(fēng)的模仿空洞且華而不實(shí)。也有設(shè)計(jì)師認(rèn)為，可能行業(yè)大佬確實(shí)不會(huì)被AI取代，但初出茅廬的新手畫師就不一定了。

此外，AI作畫中出現(xiàn)的人像還會(huì)涉及肖像權(quán)的問題。有網(wǎng)友指出，如果AI訓(xùn)練用的數(shù)據(jù)是從網(wǎng)上爬來的，要商用的話，必須保證它爬的不是禁止爬數(shù)據(jù)的網(wǎng)站。正常情況下，對(duì)人臉等敏感數(shù)據(jù)進(jìn)行抓取需要授權(quán)和知情同意。

目前，各大AI作畫平臺(tái)對(duì)圖像使用的規(guī)定都語焉不詳。一些只是概括地規(guī)定不能制作色情內(nèi)容，不能將圖片用作有害用途，或者成為付費(fèi)會(huì)員才能把成品圖商用。DALL-E2和Stable Diffusion的協(xié)議里則提到，理論上所有成圖的版權(quán)屬于使用者，但如果它們和現(xiàn)存的其他圖片相似度過高，AI工具不會(huì)為此負(fù)責(zé)，大體還是讓使用者風(fēng)險(xiǎn)自負(fù)的意思。

“這一塊依然是法律的灰色地帶，”邢峰說，“以后可能需要一兩場很大的官司來推動(dòng)大家認(rèn)知和變革?！?/span>

潮流難以阻擋

總結(jié)來說，AI作畫被游戲開發(fā)者們視作一個(gè)相當(dāng)有潛力的工具，但不管是出于現(xiàn)有的技術(shù)限制還是版權(quán)上的爭議，它仍然處在探索階段，尚無法大規(guī)模使用，并且短期內(nèi)難以代替人工。

已經(jīng)上架Steam的游戲《瘋狂之源》（Source of Madness）是目前所知的唯一完全用AI生成怪物和場景，對(duì)這一技術(shù)進(jìn)行密集運(yùn)用的例子。但它本身是克蘇魯題材的，可以容納各種奇異的怪物形象，最終視覺效果看起來也和通常意義上的商業(yè)游戲有一定距離。

《瘋狂之源》的克蘇魯風(fēng)格和AI生成的一些“不明覺厲”的形象相當(dāng)搭配

不管怎么說，AI作畫的潮流很難忽視，開發(fā)者們也不會(huì)拒絕能夠降低成本、提高效率的新生產(chǎn)方式。許多獨(dú)立游戲開發(fā)者樂于擁抱和研究這種變化?！爱吘鼓愫茈y阻擋技術(shù)進(jìn)步的腳步?！毙戏逭f。AI作畫就像是現(xiàn)代建筑工人擁有的起重機(jī)，解放的是古代需要親自扛石料的三千苦工，但工人本身無法替代。至于隨之而來的其他摩擦和潛在的糾紛，可能是所有新事物在普及伊始都要面臨的陣痛。

編輯丨祝思齊

咖啡因驅(qū)動(dòng)型碼字機(jī)。

贊賞

共11人贊賞

小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

【原】最近很火的AI作畫，游戲開發(fā)者們已經(jīng)在嘗試了丨觸樂

從機(jī)械化的勞動(dòng)中解放

無法代替人類，也確實(shí)存在問題

潮流難以阻擋

無法代替人類，也確實(shí)存在問題