- 可在15小時內(nèi)完成8.6億token的GPT3-40B的微調(diào)- Stable Diffusion XL每分鐘生成40張圖片,比4090快5倍很多人都用過Stable Diffusion了,那么,SD的技術(shù)原理是什么呢? 嗨,小朋友們!今天我要給大家講一個有趣的科學故事,它的名字叫做"Stable Diffusion",聽起來很高大上吧!其實,它是一種讓電腦學會創(chuàng)作畫作的技術(shù)。 首先,我們知道電腦是不會自己畫畫的,它需要我們告訴它該畫什么。而"Stable Diffusion"就是一種讓電腦根據(jù)我們的指令來創(chuàng)作畫作的方法。這個方法的原理有點復雜,但是我會用簡單的話語和你們一起理解。首先,我們需要輸入一些文字描述,比如"天堂"、"廣闊的"、"海灘",然后電腦就會根據(jù)這些文字生成一張符合描述的圖片。那么,電腦是如何做到這一點的呢?它使用了一個叫做CLIP的模型,這個模型可以將文字轉(zhuǎn)換成電腦可以理解的數(shù)學表示,然后指導“Unet”模型把隨機生成的噪聲圖像不斷地去除噪聲。使用step來表示去噪次數(shù),通過不斷地去除噪聲,將純噪聲的圖片逐漸轉(zhuǎn)化為包含豐富語義信息的向量。最后,通過圖像解碼器,把語義向量生成一張具有語義信息的圖片。本文使用MixCopilot完成科普故事的生成。 1/ 輸入原文: jalammar.github.io/illustrated-stable-diffusion 2/ MixCopilot工作流完成輸出 歡迎交流:
#知識礦工 演示v1.0
|