機(jī)器之心原創(chuàng) 最近,Meta 開源的 Llama 2 系列模型引發(fā)了不小的轟動(dòng)。這些模型包含 7B、13B、70B 三種版本,最大的 70B 版本性能接近 GPT-3.5,小一點(diǎn)的版本甚至可以在移動(dòng)端運(yùn)行,且整個(gè)系列都允許商用,有望成為眾多大模型應(yīng)用的底層支撐。很多人預(yù)言說,「大模型的安卓時(shí)代就要來了」。 Llama 系列模型的 Github star 量已經(jīng)逼近 4 萬。根據(jù)官方消息,自發(fā)布以來,Llama 2 一周內(nèi)就有超過 15 萬次的下載請(qǐng)求。 不過,基于 Llama 2 構(gòu)建應(yīng)用并不只是把它從開源庫里下載下來那么簡(jiǎn)單,模型的后續(xù)調(diào)優(yōu)、中文增強(qiáng)、安全評(píng)估、與外部數(shù)據(jù)的融合、推理算力消耗等都是擺在開發(fā)者、企業(yè)面前的現(xiàn)實(shí)問題。這也是當(dāng)前很多大模型的共性問題。大模型和應(yīng)用之間需要一座橋梁。 在國(guó)內(nèi),百度智能云的千帆大模型平臺(tái)正在努力作好這個(gè)角色。 該平臺(tái)以百度自研的文心大模型為核心,還支持 ChatGLM2、RWKV、MPT、Dolly、OpenLlama、Falcon 等第三方大模型。而且,剛剛發(fā)布十幾天的 Llama 2 也已經(jīng)在他們的模型庫中上線(7B、13B、70B 三種版本都有)。 再加上,千帆本身就是一個(gè)從數(shù)據(jù)管理、訓(xùn)練調(diào)優(yōu)到大模型發(fā)布的一站式工具鏈平臺(tái),剛剛還新增了預(yù)置 Prompt 模板,所以,利用這個(gè)平臺(tái)構(gòu)建基于 Llama 2 等大模型的應(yīng)用變得非常簡(jiǎn)單、高效,其效果也將明顯區(qū)別于直接調(diào)用原生開源大模型。 在這篇文章中,我們將走近這一平臺(tái),看看它到底有哪些功能。 千帆大模型平臺(tái):大模型落地加速器 打開千帆平臺(tái),可以看到它的左側(cè)羅列了很多功能模塊,包括數(shù)據(jù)服務(wù)、大模型訓(xùn)練、大模型管理、大模型服務(wù)以及最近新增的 Prompt 模板。這些都是為了加快大模型的落地應(yīng)用而設(shè)計(jì)的。 在應(yīng)用端,很多人對(duì)于大模型的感知來源于 ChatGPT 等提供的一個(gè)對(duì)話框。一開始,大家會(huì)覺得這個(gè)對(duì)話框幾乎是萬能的,想問什么就問什么。但時(shí)間一長(zhǎng),人們也發(fā)現(xiàn)了各種問題,有很多個(gè)性化需求無法得到滿足,尤其是企業(yè)需求。 這些企業(yè)有一部分想要用更低的成本調(diào)用效果依然不錯(cuò)的大模型,希望利用有限的算力獲取更大的價(jià)值,最好有一個(gè)模型庫可以選擇,還要有配套的「說明書」;還有一部分希望基于某些強(qiáng)大的開源模型訓(xùn)練自己的行業(yè)大模型,追求高效的訓(xùn)練、部署方法以及更低的成本。當(dāng)然,他們也有一些共同的訴求,即克服大模型的一些固有缺陷,比如可能輸出有害或違反法律法規(guī)的內(nèi)容,信息的時(shí)效性有所延遲,無法原生地結(jié)合企業(yè)個(gè)性化信息等。 這些問題的解決方案都藏在上面提到的那些功能模塊里。 首先,在基礎(chǔ)模型的選擇上,為了確保模型的可靠性,千帆以模型效果、模型安全性、可商用為指標(biāo)嚴(yán)選了 33 個(gè)大模型。這些大模型各有所長(zhǎng),比如 Llama2 7B 體積較小,RWKV 擅長(zhǎng)處理長(zhǎng)文本。企業(yè)可以根據(jù)不同細(xì)分場(chǎng)景的業(yè)務(wù)需求,把這些模型組合起來使用。 此外,千帆還對(duì)這 33 個(gè)大模型進(jìn)行了性能 + 安全的雙重增強(qiáng)。 其中,性能的增強(qiáng)通過優(yōu)化模型吞吐、降低模型尺寸來實(shí)現(xiàn),調(diào)優(yōu)后模型體積可壓縮至 25%-50%,推理成本最多可降低 50%,與直接調(diào)用或部署第三方開源模型相比更經(jīng)濟(jì)。 安全增強(qiáng)是指對(duì)輸出的內(nèi)容進(jìn)行審核,確保其安全合規(guī),這項(xiàng)功能兼顧第三方和自有模型,大大降低了企業(yè)直接調(diào)用、部署第三方開源模型可能面臨的風(fēng)險(xiǎn)。 當(dāng)然,除了直接調(diào)用外,企業(yè)還可以對(duì)這些模型進(jìn)行訓(xùn)練、調(diào)優(yōu),定制自己的專屬大模型。在這一過程中,千帆不僅支持傳統(tǒng)的全量參數(shù)更新,還支持 prompt tuning、LoRA 等只更新部分參數(shù)的高效微調(diào)方法。同時(shí),為了讓模型更好地與人類意圖對(duì)齊,它還支持人類反饋強(qiáng)化學(xué)習(xí)(RLHF)訓(xùn)練。
眾所周知,RLHF 訓(xùn)練是一件費(fèi)時(shí)費(fèi)力的事情,就連 Meta 在第一版 Llama 模型中都沒有著重進(jìn)行這項(xiàng)訓(xùn)練。但在千帆大模型平臺(tái)的頁面上,我們能夠很容易地找到一套完整的訓(xùn)練流程,這可能成為很多企業(yè)、開發(fā)者大幅提升開源模型性能的關(guān)鍵。這點(diǎn)在 Llama 1 到 Llama 2 的進(jìn)化中已經(jīng)得到了證明,Meta 的研究人員在 Llama 2 的論文中指出,RLHF 非常重要,模型的出色寫作能力基本上是由 RLHF 驅(qū)動(dòng)的,它不只是一種安全工具,更是一種提高模型能力上限的訓(xùn)練方法。 具體到每個(gè)訓(xùn)練步驟,千帆都配套了相應(yīng)的工具,包括 13 種數(shù)據(jù)清洗及增強(qiáng)算子以及嚴(yán)密的數(shù)據(jù)回流設(shè)計(jì)。 為了降低訓(xùn)練成本,千帆在數(shù)據(jù)服務(wù)中提供了答案自動(dòng)生成功能和智能在線標(biāo)注,而且支持帶排序的標(biāo)注功能,讓想要進(jìn)行這項(xiàng)訓(xùn)練的開發(fā)者、企業(yè)可以借助一套自動(dòng)化的工具來高效、低門檻地完成。 除了強(qiáng)大的模型庫,Prompt 模板也是千帆本次更新的重點(diǎn)。 Prompt 有多重要?相信每個(gè)用過 ChatGPT、文心一言的人都深有體會(huì)。在工業(yè)界,Prompt 工程已經(jīng)成為一個(gè)熱門的就業(yè)方向。 為什么要專門招人做這件事?因?yàn)閷?duì)于企業(yè)來說,大模型就像一個(gè)強(qiáng)大但沒有說明書的機(jī)器,需要一個(gè)非常了解大模型技術(shù)特點(diǎn)的人來總結(jié)其使用方法。 千帆此次發(fā)布的 103 款 prompt 模板有望在一定程度上減輕企業(yè)這方面的負(fù)擔(dān)。這些模板包含對(duì)話、編程、電商、醫(yī)療、游戲、翻譯、演講等十余個(gè)場(chǎng)景,企業(yè)既可以直接調(diào)用,也可以借鑒模板思路進(jìn)行改寫。 從這些功能模塊中,我們可以看出千帆平臺(tái)創(chuàng)建的初衷:他們希望企業(yè)在將大模型引入業(yè)務(wù)的時(shí)候不用再到處找工具,在一個(gè)平臺(tái)上就可以把所有問題都解決掉,從而加快大模型在產(chǎn)業(yè)界的落地速度。平臺(tái)的這次密集更新讓他們離這一目標(biāo)更近了一步。 目前,平臺(tái)新增的 Prompt 模板已經(jīng)開放內(nèi)測(cè),機(jī)器之心在千帆后臺(tái),選擇平臺(tái)接入的某個(gè)大型語言模型進(jìn)行了測(cè)試(模型生成結(jié)果僅供參考,可能存在紕漏)。 Prompt 模板上手體驗(yàn) 打開「Prompt 模板」模塊可以發(fā)現(xiàn),模板列表位于對(duì)話框的右側(cè),找到想用的模板,選擇「引用」,即可將模板復(fù)制到對(duì)話框。 在這里,我們以機(jī)器之心高頻的素材收集任務(wù)為例,看看使用模板前后的效果差異。 比如,在報(bào)道最近大火的「室溫超導(dǎo)」話題時(shí),我們想搜集一些有關(guān)該話題的科普素材。如果隨便問一個(gè)問題,效果是這樣的:
但調(diào)用了千帆提供的素材收集模板后,我們得到了更全面的信息:
借助模板,我們還可以讓大模型提供寫評(píng)論的參考角度:
由于兩個(gè)模板應(yīng)用起來比較高頻,我們選擇把它們加入「我的收藏」,節(jié)省查找時(shí)間。 此外,我們發(fā)現(xiàn),千帆還支持自定義模板功能。于是,我們把平時(shí)積累的一些高效 Prompt 創(chuàng)建成了模板,讓模型更好地提供翻譯建議,結(jié)果非常令人滿意,大大節(jié)省了每次重新編輯 Prompt 的時(shí)間。
升級(jí)背后的思考 在媒體交流會(huì)上,千帆的工程師將千帆大模型平臺(tái)的未來發(fā)展方向概括為更易用、更全面、更安全、更高效、更開放,更擴(kuò)展,這也是我們?cè)谶@次升級(jí)中能感受到的。 「易用」的感受非常直觀。整個(gè)千帆的界面看似復(fù)雜,但框架清晰,操作簡(jiǎn)單,而且每個(gè)功能模塊都搭配了使用文檔和操作指引。此外,模型的易用性也隨著 Prompt 模板等功能的推出而逐步提升。 「全面」、「安全」、「高效」、「開放」、「擴(kuò)展」體現(xiàn)在豐富的模型庫和工具鏈上。這些模型庫和工具鏈既滿足了當(dāng)前的一些「不確定性」需求,也滿足了一些「確定性」需求。 不確定性需求指的是,當(dāng)前大模型還處在發(fā)展初期,企業(yè)還不確定什么樣的模型更適合自己的業(yè)務(wù)。所以在這個(gè)階段,千帆想通過更加全面、開放的工具鏈、更多樣的模型庫來為企業(yè)提供更多的選擇,在一個(gè)繁榮的平臺(tái)上快速接受市場(chǎng)反饋,然后把這些反饋沉淀下來,利用平臺(tái)分享出去。 確定性需求指的是企業(yè)在降本增效、模型安全性等方面的共性需求,比如在某些場(chǎng)景中,企業(yè)并不需要參數(shù)量巨大的通用模型,算力要求較低的小模型就能解決問題,所以千帆要為這樣的需求配置全面、高效的工具鏈,完成模型壓縮等剛需任務(wù),同時(shí)確保模型安全。 基于這樣的思考,千帆的技術(shù)團(tuán)隊(duì)對(duì)平臺(tái)上的模型庫和工具鏈持續(xù)打磨,在短短幾個(gè)月的時(shí)間內(nèi)就實(shí)現(xiàn)了數(shù)次迭代,將大模型的強(qiáng)大能力持續(xù)輸送到各行各業(yè)。在未來幾個(gè)月,我們還將看到這一平臺(tái)帶來更多的驚喜。 |
|