小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

最時髦的AI畫畫,一文包教包會

 鐵樹228TS 2022-10-20 發(fā)布于北京

大概半年前,AI 繪畫工具 Disco Diffusion 從 Text-to-Image 開發(fā)社區(qū)和設(shè)計行業(yè),火到了普通用戶的視野中。即便它界面簡陋,滿屏英文和代碼,也“勸退”不了人們。因為對那些沒有任何美術(shù)功底的他們來說,往輸入框?qū)懸恍《巫?,就能指?dǎo) AI 生成畫面足夠驚艷的畫作。

圖片

Simon_阿文用 Disco Diffusion 生成,他輸入的描述詞是 ?? ?? ??|作者授權(quán)

AI 繪畫工具進(jìn)化的速度,在這半年遠(yuǎn)超人們想象。Disco Diffusion 之后,搭在 Discord 群聊上的 Midjourney、OpenAI 擅長寫實的 DALL·E 2、開源的 Stable Diffusion 等工具涌現(xiàn),它們更強(qiáng)大,更用戶友好,生成一張圖的時間甚至壓縮到了數(shù)秒。

AI 繪畫的熱度被一步步推高。在國內(nèi)一些電商平臺,你甚至可以看到有零散商家在賣教程。

今天,我們整理了 3 個對普通用戶來說最容易上手的工具:它們中一個專于生成二次元畫作;一個社區(qū)氛圍濃厚,生成圖藝術(shù)感極強(qiáng);一個是國內(nèi)團(tuán)隊的產(chǎn)品,這回,你用中文揮灑創(chuàng)意!

  Stable Diffusion  

圖片

特點:被認(rèn)為是最強(qiáng)的 AI 繪畫工具,已完全開源,市面上還有很多”魔改版“,比如專用來生成二次元人像的 Waifu Diffusion;

事前準(zhǔn)備:以下介紹的是 Stable Diffusion 的在線版本 DreamStudio,這種方案對設(shè)備沒有要求,只要用瀏覽器打開 https://beta./dream 即可。

相比 Disco Diffusion,Stable Diffusion 這個在線工具的界面非常簡潔、友好,你打開網(wǎng)站后注冊,然后在底下的輸入框?qū)懞妹枋稣Z句,點擊“Dream”就能一鍵生成,等待時間僅為數(shù)秒。

圖片

描述詞為 A dream of a distant galaxy(圖像主體), by Caspar David Friedrich(藝術(shù)家), matte painting trending on artstation HQ(繪畫風(fēng)格)丨界面截圖

界面右側(cè)還有一系列的調(diào)節(jié)選項,從上到下分別是:

  • Width、Height:生成圖的長寬尺寸;

  • Cfg Scale:大概可以理解為是圖像和描述詞(prompt)的匹配程度,高于 20 容易有失真效果;

  • Steps:模型生成圖片的迭代步數(shù),每多一次迭代都會給 AI 更多的機(jī)會去比對描述詞和當(dāng)前結(jié)果,默認(rèn)值為 50;

  • Number of images:生成圖的數(shù)量;

  • Sampler:擴(kuò)散去噪算法的采樣模式;

  • Seed:隨機(jī)種子,系統(tǒng)每次產(chǎn)生的隨機(jī)種子都不同,所以即使你原封不動搬來了藝術(shù)家給的描述詞,也無法生成相同的圖片,但如果他給了你特定的隨機(jī)種子碼,就能生成。

基本的配置搞定后,開始做畫作生成中最關(guān)鍵的一步——寫描述詞。該怎么寫呢?官方提供了一份入門教程:

  • 先輸入你圖像的對象、主體,比如一只熊貓、一個持劍的戰(zhàn)士,如果只是如此簡單的描述,生成的風(fēng)格會非常隨機(jī),所以需要描述風(fēng)格來加以限定;

  • 常被使用的風(fēng)格有寫實、油畫、鉛筆畫、概念藝術(shù)等,你可以指定你要的是一幅畫(a painting of raw prompt)還是一張照片(a photograph of raw prompt);

  • 加上風(fēng)格鮮明的藝術(shù)家關(guān)鍵詞,來進(jìn)一步明確和加強(qiáng)生成圖的風(fēng),比如加上達(dá)芬奇、米開朗基羅、莫奈等,另外,官方還建議嘗試混合多個藝術(shù)家,這或許可以融合成更讓人驚嘆的效果;

  • 還可以加上一些特定的描述詞,來完成最后的潤色。比如,你如果讓畫面有更逼真的光照,可以帶上“Unreal Engine”,建議的關(guān)鍵詞還有 surrealism(超現(xiàn)實主義)、sharp focus(有銳利的對焦)、8k,甚至是“the most beautiful image ever seen”。

在線版本目前調(diào)教功能偏弱,比如無法批量生成圖像等,如果你想有更好的生成體驗,可以將已開源的 Stable Diffusion 部署到自己的電腦上,配置要求 RTX 2060 顯卡等 6GB 顯存(及以上)顯卡等。這里不展開了。

自 Stable Diffusion 開源以來,市面上迅速出現(xiàn)了它的各種“魔改版”,其中近期熱度最高的要數(shù) Waifu Diffusion。Waifu 指漫畫、動畫、游戲中的一些女性角色,有些玩家、觀眾喜歡這類角色到了會將她們當(dāng)成妻子。可見,這是一個專于生成“紙片人”的模型。

圖片

界面截圖

只要打開 https://colab.research.google.com/drive/1_8wPN7dJO746QXsFnB09Uq2VGgSRFuYE#scrollTo=1HaCauSq546O,然后點擊上方的“全部運行”,等幾分鐘就能看到描述詞的輸入框。

圖片

界面截圖

至于描述詞參考,可以在 Twitter 上搜索“waifudiffusion ALT”,之后你就會看到玩家們的圖像,圖像上如果有 ALT 標(biāo)識,點開即可找到生成圖的描述詞。

圖片

界面截圖

在 Stable Diffusion 上試驗 AI 作畫的人太多了,各渠道累計日活用戶超過 1000 萬。創(chuàng)始人 Emad Mostaque 說,“我們遲早會到達(dá)每天生成 10 億張圖片的階段,尤其是當(dāng)動畫生成的功能被解鎖后。” 

現(xiàn)在,甚至有人建起了 AI 作畫關(guān)鍵詞相關(guān)的搜索引擎,比如 KERA。

圖片

界面截圖

目前,KERA 已經(jīng)收錄了百萬條關(guān)鍵詞,比如搜索“Elon Musk”就能得到以上結(jié)果,如果對某一個結(jié)果感興趣,還可以點進(jìn)去看看對應(yīng)的描述語句。

收費標(biāo)準(zhǔn):有大概 200 張的免費生成額度,之后需要付費購買點數(shù)(生成越復(fù)雜,尺寸越大,消耗的點數(shù)越多)

版權(quán)要求:可以商用自己創(chuàng)作的圖像,但圖像如果是通過 DreamStudio 生成的,就自動變成了 CC0 1.0  授權(quán),這樣,服務(wù)提供商 Stability.ai 也能處理你的圖像,無需付費甚至不會經(jīng)過你同意,也會一并成為通用公共領(lǐng)域 royalty-free 的圖片資源。如果是你自己部署了開源的 Stable Diffusion,消耗的是你自己的 GPU 資源,那著作權(quán)都?xì)w你所有。

  Midjourney  

圖片

特點:可以邊聊天邊生成,社區(qū)氛圍濃重,畫作藝術(shù)感強(qiáng);

事前準(zhǔn)備:備好電腦,以及注冊一個通訊軟件 Discord 的賬號,打開 https://discord.gg/midjourney。

點擊上方鏈接進(jìn)入官方服務(wù)器后,你在左側(cè)頻道列表中找到任意一個 #newbies 頻道進(jìn)入,然后在對話框輸入/imagine,在其后出現(xiàn)的填空框里輸入描述詞,按下回車。Midjourney bot 會在 60 秒內(nèi)生成 4 張圖像。

圖片

如圖所示的紅框內(nèi),是屬于我們 #newbies 的頻道 | Midjourney 頁面截圖

圖像生成后,下方會附帶 4 個“U”和 4 個“V”選項,U 代表 upscaling(提升清晰度),V 代表 variations(基于已生成圖像的風(fēng)格再生成四張不同的圖像)。你可以點擊它們進(jìn)一步優(yōu)化圖像。

圖片

描述詞為埃德加·艾倫·坡的塔羅牌,新藝術(shù)風(fēng)格,安妮·麥卡弗里 --s 1250  | Midjourney 頁面截圖

Midjourney 設(shè)在一個人聲鼎沸的聊天室,初次接觸 Discord 的人或許會有些暈頭轉(zhuǎn)向,這里有幾點需要注意:首先,你在公開的頻道里試用時,生成結(jié)果是所有人可見的!同時,你的請求可能會混入快速變化的信息流,不要走開!如果真的找不到了,不要慌張,點擊右上角的收件箱找回你的請求。

圖片

任意時間點進(jìn)去,都有很多人在跟你一起玩  | Midjourney 頁面截圖

對于描述詞,官方給出了一些建議:

  • 使用已經(jīng)存在大量視覺圖像的物體,比如 Wizard(巫師)、Angel(天使)、Rocket(火箭)等;

  • 使用風(fēng)格、藝術(shù)家、繪畫媒介作為提示詞,比如賽博朋克、達(dá)利、吉卜力、水墨畫、雕塑等;

  • 避免否定句,因為模型通常會無視它,比如當(dāng)你輸入“一頂不是紅色的帽子”,模型看到的更可能是“帽子”、“紅色”;

  • 使用單數(shù)或具體數(shù)字,而非“一堆”、“很多”、“一些”;

  • 避免空泛概念,你知道的,就是老板開會時經(jīng)常會說的那些,以及甲方的需求。

圖片

火龍,但是建筑草圖風(fēng)格

真正的“高玩”還可以加入一些“黑話”,也就是一系列以“--”為前綴的提示詞為圖片設(shè)定條件。比如,輸入--ar 16:9”,圖片比例會變成 16 乘 9;輸入“--s”加一個數(shù)值,你可以決定 AI 要在風(fēng)格化這條路上走多遠(yuǎn),數(shù)字越大越離譜,--s 60000,天知道會發(fā)生什么!”

實在寫不動描述詞了,或者某張圖片符合你想要的感覺,也可以直接把圖片鏈接寫進(jìn)描述詞里。

看看別人是怎么寫的是個很好的學(xué)習(xí)渠道。當(dāng)然,你也可以隨時在 #prompt-chat 頻道禮貌請教:我想生成特定樣式的圖像,該用怎樣的提示詞呢?或者常在官方畫廊https://www./showcase/)那里逛逛,可以參考自己與別人生成的作品。

與別的模型相比,Midjourney 以其藝術(shù)性聞名。有人如此評價,“Midjourney 就像一個有它自己風(fēng)格的藝術(shù)生。”身上附著著成百上千藝術(shù)家先輩的魂靈。

圖片

從生成結(jié)果也能看出,不管你輸入什么,Midjourney 都更傾向于給你輸出一幅繪畫一樣的圖像,而不是假照片。比如,同樣是面對描述詞“女孩發(fā)現(xiàn)生命的意義”,Midjourney 和 DALL-E 得到的分別是以上的樣子|https://llery/midjourney-guide-ai-art-explained/

這也讓它備受美術(shù)領(lǐng)域青睞,此前廣受爭議的在數(shù)字藝術(shù)比賽上獲獎的作品《太空歌劇院》就是由 Midjourney 生成(后用 Photoshop 潤色)。

圖片

《太空歌劇院》|Jason Allen

新平臺層出不窮的情況下,讓 Midjourney 仍能保持吸引力的是它的超級社群——目前人數(shù)已經(jīng)超三百萬,遠(yuǎn)超原本占據(jù)頭部的 Minecraft 和《堡壘之夜》。在紅杉總結(jié)的當(dāng)前 AIGC 創(chuàng)業(yè)圖譜中,只有 Midjourney 同時具備了圖像生成和消費者 / 社交兩項特性。

社群里,人們會自發(fā)地為新手答疑解惑,互相稱贊,大方分享自己使用的描述詞。官方也會定期發(fā)起主題創(chuàng)作,舉行 Office Hour。用創(chuàng)始人的話說,他想讓人們體驗“一起做一件事”的快樂:你“畫”出一只“狗”,有人會添一筆把它變成“太空狗”,緊接著有人把它變成“阿茲特克太空狗”……

圖片

你能不能在 Midjourney 里用中文呢?也不是不可以,但它似乎不是很懂。

收費標(biāo)準(zhǔn):任何人都可以免費在公共頻道生成 25 張圖片,之后繼續(xù)使用需要會員訂閱?;A(chǔ)會員價格為每月 10 美元,可生成 200 張圖片;標(biāo)準(zhǔn)會員為每月 30 美元,生成次數(shù)不限。

版權(quán)要求:公共頻道里生成的作品默認(rèn)為 CC BY-NC 4.0 版權(quán),意味著他人可任意使用或改動你的這些作品。付費用戶可以任意商用生成的圖片,但有一個例外,如果是一家年收入超 100 萬的公司在使用,就需轉(zhuǎn)而訂閱企業(yè)會員。

  6pen  

圖片

特點:支持用中文描述,還列出了很多藝術(shù)家和風(fēng)格限定詞供參考;

事前準(zhǔn)備:在 iOS 平臺下載 app,或者打開 https:/// 直接在網(wǎng)頁生成。

Disco Diffusion 大火之后,國內(nèi)一些團(tuán)隊開始嘗試降低其使用門檻,將它產(chǎn)品化,比如說重整 UI、提供云端算力、對模型做 finetune(微調(diào))等。6pen 就是其中一支團(tuán)隊。

6pen 基于市面上已有的開源模型 Latent Diffusion 和 Disco Diffusion,做了自研模型,還根據(jù)生成速度和體量,分別研發(fā)了擅長小體量、簡單場景的南瓜模型,和擅長復(fù)雜場景,但響應(yīng)速度較慢的西瓜模型。官方表示,相比原版,自研模型比較重要的優(yōu)化部分,是提高分辨率和支持中文。

6pen 很自信,在合適的文本描述和風(fēng)格修飾下,他們相信 6pen 可以實現(xiàn)不輸于 Midjourney 甚至 DALL·E 2 的效果。

圖片

界面簡潔,引導(dǎo)細(xì)致,還列出了很多藝術(shù)家和風(fēng)格限定詞供參考丨app 界面截圖

官方自己有一份非常詳細(xì)的使用教程,手把手教,親切地像生怕你學(xué)不會的老母親。

我們整理了這樣一些建議:

  • 你可以直接使用中文描述!

  • 描述詞要具體,講出你要的物體和它的特征,但物體不要太多,兩到三個就好;

  • 放棄描述情緒和事件,模型不會懂什么是“她愛不愛我”并畫下來;

  • 視角、細(xì)節(jié)和紋理、物體占據(jù)畫面的大小、色調(diào)、畫面特點、年代、渲染 / 建模工具,這些是模型可以處理的信息;

  • 如果點選的參考藝術(shù)家畫過很多裸體,會有概率出現(xiàn)純黑的圖片(系統(tǒng)判定你在“搞黃色”);

  • 描述詞之外,可以加入畫面類型、藝術(shù)家、尺寸等信息,他們有點像濾鏡,能讓你的畫看起來更像那么回事兒;

  • 如果你有繪畫基礎(chǔ),可以自己畫底稿,再由 AI 在你的基礎(chǔ)上描繪具體場景,底稿建議使用色塊和形狀而非純線稿,因為 AI 不會自動填色。

圖片

官方給的描述詞案例丨界面截圖

此外,6pen 還會返回每個生成過程的迭代圖,Loss 曲線,甚至電量消耗等數(shù)據(jù),讓用戶更好了解生產(chǎn)過程,幫助改進(jìn)。

圖片

在等待生成期間,6pen 會讓你為一些生成作品投票,看看哪張作品效果更好。這時你會覺得自己像一個給 AI 的打工者,幫助模型升級進(jìn)步。

6pen 的創(chuàng)始人王登科指出過 AI 繪畫技術(shù)目前的不足,比如人的肢體(主要是手指)和眼球效果較差,多主體對象生成效果差,也無法進(jìn)行有邏輯延續(xù)的故事性生成。

收費標(biāo)準(zhǔn):可以免費排隊生成,也可以付費快速生成,價格為 0.1 元起;

版權(quán)要求:6pen 的自研模型都采用 MIT 協(xié)議開源,生成出來的圖片版權(quán)完全授權(quán)給生成者本人。6pen 也支持采用 CC0 協(xié)議的 Stable Diffusion,這時產(chǎn)生的作品版權(quán)就不由生成者獨享了。生成者如果使用了還在世的藝術(shù)家作為畫面參考,且生成作品的風(fēng)格與藝術(shù)家相似,也可能存在版權(quán)爭議。同理,如果使用了參考圖,且參考圖并非原創(chuàng) (如攝影、繪畫),那么生成的結(jié)果也存在版權(quán)爭議。

AI 繪畫還在狂奔路上,現(xiàn)在這些工具解決的是“寫寫字就能畫畫”,未來可能會進(jìn)一步解決“寫寫字就能畫多好”的問題。

隨著這些工具的基礎(chǔ)功能,以及背后的模型逐步完善,我們要爭的,就是如何寫 prompt 了。

那天,我看到有人問“prompt 這個詞現(xiàn)在有中文翻譯了嗎?”底下有人回答,“咒語?!?/strong>

參考文獻(xiàn)

[1] 中國 AI 繪畫行業(yè)調(diào)查報告——技術(shù),用戶,爭議與未來 https://mp.weixin.qq.com/s/CSdAfew2wPbt2yhsNWav8g

[2] 當(dāng)下最強(qiáng)的 AI art 生成模型 Stable Diffusion 最全面介紹 https://mp.weixin.qq.com/s/Q4ZYjUxt22Jsx2W2179C8Q

[3] @Simon_阿文 的微博“這是我所知道的關(guān)于 AI 繪畫的一切” https://share.api.weibo.cn/share/342626167,4780343335326874.html?weibo_id=4780343335326874

[4] https://midjourney./docs/

[5] https://www./2022/09/02/technology/ai-artificial-intelligence-artists.html

[6] https:///midjourney-copyright-commercial-use/#:~:text=Can%20I%20use%20Midjourney%20commercially,Midjourney%20for%20any%20business%20purpose.

作者:翁垟、睿悅、biu

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多