為了讓大語(yǔ)言模型的AI能力更貼近業(yè)務(wù)需求,本文詳細(xì)介紹了在阿里云百煉創(chuàng)建自定義模型的最佳實(shí)踐。即便不清楚大模型的技術(shù)細(xì)節(jié),您也能按照本篇的操作指引創(chuàng)建一個(gè)有效的自定義模型,從而輕松地為業(yè)務(wù)場(chǎng)景添加大模型服務(wù)能力。 自定義模型概述自定義大模型是指基于通用大語(yǔ)言模型,通過(guò)微調(diào)和訓(xùn)練,能更好地適應(yīng)特定領(lǐng)域或任務(wù)的大語(yǔ)言模型。 為什么選擇自定義模型?提高特定領(lǐng)域的準(zhǔn)確性:通用的大語(yǔ)言模型盡管強(qiáng)大,但在處理特定領(lǐng)域的任務(wù)時(shí),可能會(huì)因?yàn)槿狈︻I(lǐng)域特定知識(shí)而表現(xiàn)不佳。自定義大語(yǔ)言模型通過(guò)領(lǐng)域特定的數(shù)據(jù)進(jìn)行重新訓(xùn)練,可以顯著提高在該領(lǐng)域的表現(xiàn)和準(zhǔn)確性。 增強(qiáng)模型的適用性:自定義大語(yǔ)言模型可以根據(jù)特定應(yīng)用場(chǎng)景的需求進(jìn)行微調(diào),使其更好地適應(yīng)特定任務(wù)。例如,在客戶服務(wù)中,自定義模型可以更好地理解和回應(yīng)客戶的特定問(wèn)題,提高客戶滿意度。 節(jié)約開(kāi)發(fā)時(shí)間和成本:利用現(xiàn)有的大語(yǔ)言模型進(jìn)行定制化訓(xùn)練,比從頭開(kāi)發(fā)一個(gè)模型要節(jié)約大量時(shí)間和成本。您可以快速部署自定義模型,滿足業(yè)務(wù)需求。 增強(qiáng)品牌和用戶體驗(yàn):自定義大語(yǔ)言模型可以根據(jù)企業(yè)的品牌語(yǔ)言風(fēng)格進(jìn)行調(diào)整,確保輸出內(nèi)容的一致性和品牌調(diào)性,從而提升用戶體驗(yàn)和品牌形象。
創(chuàng)建自定義模型的流程創(chuàng)建自定義模型涉及三個(gè)主要步驟:模型調(diào)優(yōu)、模型部署、模型評(píng)測(cè),以及三個(gè)輔助步驟:訓(xùn)練數(shù)據(jù)準(zhǔn)備、評(píng)測(cè)模板設(shè)計(jì)、調(diào)整訓(xùn)練策略。 模型調(diào)優(yōu)階段:模型會(huì)“學(xué)習(xí)”大量訓(xùn)練數(shù)據(jù)的語(yǔ)言特征,從而理解并生成相似的自然語(yǔ)言。開(kāi)始模型調(diào)優(yōu)之前,您需要做一些訓(xùn)練數(shù)據(jù)準(zhǔn)備工作,包括數(shù)據(jù)收集、數(shù)據(jù)清洗、數(shù)據(jù)集劃分等操作。您需按照訓(xùn)練新模型向?qū)У闹敢渲?span style="outline: none;box-sizing: border-box;margin: 0px;padding: 0px;font-weight: 700;">模型調(diào)優(yōu)。根據(jù)配置的訓(xùn)練超參數(shù)(超參數(shù)是指在模型調(diào)優(yōu)前需要提前設(shè)定的參數(shù),包括學(xué)習(xí)率、迭代次數(shù)等),阿里云百煉將自動(dòng)訓(xùn)練您選擇的預(yù)置模型。一般情況下,訓(xùn)練過(guò)程是自動(dòng)完成的,無(wú)需進(jìn)一步操作。 模型部署階段:您需要將自定義模型部署到獨(dú)占實(shí)例上,然后調(diào)用或評(píng)測(cè)自定義模型。部署新模型向?qū)椭渲?span style="outline: none;box-sizing: border-box;margin: 0px;padding: 0px;font-weight: 700;">模型部署。根據(jù)配置的自定義模型規(guī)格和資源配置方式,阿里云百煉將計(jì)算預(yù)估價(jià)格。待您確認(rèn)價(jià)格后,阿里云百煉會(huì)自動(dòng)部署模型,一般無(wú)需干預(yù)。完成部署后,您便可以在代碼或評(píng)測(cè)中配置自定義模型。 模型評(píng)測(cè)階段:您可以評(píng)測(cè)已部署的自定義模型。您可以按照創(chuàng)建評(píng)測(cè)任務(wù)向?qū)У闹敢渲?span style="outline: none;box-sizing: border-box;margin: 0px;padding: 0px;font-weight: 700;">模型評(píng)測(cè)。自定義模型不涉及評(píng)測(cè)模板設(shè)計(jì)環(huán)節(jié)。根據(jù)您選擇的評(píng)測(cè)方式、數(shù)據(jù)和維度,阿里云百煉將自動(dòng)完成評(píng)測(cè),一般無(wú)需干預(yù)。
說(shuō)明 如果對(duì)模型的評(píng)測(cè)結(jié)果不滿意,您還可以調(diào)整訓(xùn)練策略(選擇不同的預(yù)置模型作為基礎(chǔ)模型、擴(kuò)充訓(xùn)練數(shù)據(jù)樣本、選擇不同的超參數(shù)配置等),再次完成訓(xùn)練、部署和評(píng)測(cè)。您可以重復(fù)整個(gè)流程,直到模型的評(píng)測(cè)結(jié)果滿足預(yù)期。 說(shuō)明 在阿里云百煉,完成調(diào)優(yōu)的模型必須部署后才能調(diào)用和評(píng)測(cè)。因此,您需要首先完成模型部署,方可繼續(xù)評(píng)測(cè)模型。 前提條件前置知識(shí)您可能需要了解機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和自然語(yǔ)言處理的基礎(chǔ)概念。如果不了解這些概念,您也可以遵循本實(shí)踐文檔的指引完成整個(gè)創(chuàng)建流程。 工具和資源您需要開(kāi)通阿里云百煉大模型服務(wù)平臺(tái),并確認(rèn)賬號(hào)余額充足,以免無(wú)法創(chuàng)建自定義模型。 計(jì)費(fèi)信息創(chuàng)建自定義模型時(shí),可能涉及多種計(jì)費(fèi)項(xiàng),包括但不限于模型調(diào)優(yōu)、模型部署和模型評(píng)測(cè)。計(jì)費(fèi)規(guī)則請(qǐng)參考產(chǎn)品計(jì)費(fèi)。 訓(xùn)練數(shù)據(jù)準(zhǔn)備在開(kāi)始訓(xùn)練前,您需要完成訓(xùn)練數(shù)據(jù)的準(zhǔn)備工作。這些準(zhǔn)備工作包括:從業(yè)務(wù)場(chǎng)景中收集具有代表性的業(yè)務(wù)數(shù)據(jù),并轉(zhuǎn)換為問(wèn)答對(duì)的形式(數(shù)據(jù)收集);上傳訓(xùn)練數(shù)據(jù)、評(píng)測(cè)數(shù)據(jù)、驗(yàn)證數(shù)據(jù)(數(shù)據(jù)上傳);使用阿里云大模型服務(wù)平臺(tái)百煉提供的數(shù)據(jù)清洗工具和數(shù)據(jù)增強(qiáng)工具,提升訓(xùn)練數(shù)據(jù)的質(zhì)量。 1. 數(shù)據(jù)收集您可以從各種信息來(lái)源中發(fā)掘有業(yè)務(wù)價(jià)值的數(shù)據(jù),并將這些數(shù)據(jù)編排成特定結(jié)構(gòu)。您在完成數(shù)據(jù)收集時(shí),需仔細(xì)考慮以下策略: 來(lái)源多樣化:從書(shū)籍摘錄、學(xué)術(shù)論文、新聞報(bào)道和專業(yè)網(wǎng)站等多種來(lái)源收集數(shù)據(jù),來(lái)確保模型的適用范圍更廣,可以處理不同類型的問(wèn)題或理解多種表達(dá)方式。 質(zhì)量控制:數(shù)據(jù)質(zhì)量決定了模型質(zhì)量。質(zhì)量高、數(shù)量足的數(shù)據(jù)可以讓模型學(xué)得更好,表現(xiàn)更優(yōu)。 平衡性考量:確保問(wèn)題類型、難度和答案的分布均勻,避免模型偏向某一特定類型的數(shù)據(jù),導(dǎo)致訓(xùn)練偏差。
在阿里云百煉,您需要將收集到的數(shù)據(jù)編排成“Prompt-Completion”格式,便于平臺(tái)解析和訓(xùn)練。為了盡可能提高訓(xùn)練效率,我們建議至少準(zhǔn)備500條訓(xùn)練數(shù)據(jù),要求如下: 文本分割:合理分割長(zhǎng)文本,確保每個(gè)Prompt-Completion對(duì)聚焦于單一明確的主題,便于模型學(xué)習(xí)。 脫敏處理:移除個(gè)人身份信息、敏感詞匯或不適宜內(nèi)容,保證數(shù)據(jù)合規(guī)與安全。 說(shuō)明 小貼士:構(gòu)建聊天機(jī)器人的數(shù)據(jù)收集 假設(shè)您想創(chuàng)建一個(gè)智能聊天機(jī)器人,能夠回答客戶提出的問(wèn)題。 在數(shù)據(jù)收集階段,您的目標(biāo)是:為聊天機(jī)器人收集學(xué)習(xí)材料。 數(shù)據(jù)來(lái)源: 用戶聊天記錄:比如網(wǎng)站上的在線客服聊天記錄。 FAQ文檔:公司網(wǎng)站上的常見(jiàn)問(wèn)題解答列表。 客戶服務(wù)郵件:客戶發(fā)送給客服團(tuán)隊(duì)的問(wèn)題和相應(yīng)的回復(fù)。 數(shù)據(jù)示例: 用戶聊天記錄:導(dǎo)出在線客服系統(tǒng)中的聊天記錄,可以包括客戶問(wèn)題和客服回復(fù)。例如: 客戶:你們的退貨政策是什么?
客服:我們的退貨政策是在購(gòu)買30天內(nèi)可以無(wú)條件退貨。 FAQ文檔:收集網(wǎng)站上列出的常見(jiàn)問(wèn)題及其答案。例如: 問(wèn):如何更改我的密碼?
答:請(qǐng)點(diǎn)擊“設(shè)置”,然后選擇“更改密碼”。 客戶服務(wù)郵件:導(dǎo)出郵件系統(tǒng)中跟客戶的來(lái)往郵件。例如: 客戶郵件:我的訂單沒(méi)有收到,怎么辦?
客服回復(fù):我們很抱歉,請(qǐng)?zhí)峁┠挠唵翁?hào),我們會(huì)盡快處理。
數(shù)據(jù)編排: Prompt | Completion | 你們的退貨政策是什么? | 我們的退貨政策是購(gòu)買30天內(nèi)可以無(wú)條件退貨。 | 如何更改我的密碼? | 請(qǐng)點(diǎn)擊“設(shè)置”,然后選擇“更改密碼”。 | 我的訂單沒(méi)有收到,怎么辦? | 我們很抱歉,請(qǐng)?zhí)峁┠挠唵翁?hào),我們會(huì)盡快處理。 |
2. 數(shù)據(jù)上傳您需要將準(zhǔn)備好的數(shù)據(jù)上傳至阿里云百煉,以備進(jìn)一步清洗和增強(qiáng),或直接參與模型調(diào)優(yōu)。平臺(tái)自動(dòng)進(jìn)行格式檢查和基礎(chǔ)數(shù)據(jù)質(zhì)量審核,確保數(shù)據(jù)符合訓(xùn)練要求。 阿里云百煉支持創(chuàng)建不同數(shù)據(jù)類型的數(shù)據(jù)集,包括訓(xùn)練集、評(píng)測(cè)集,支持多版本數(shù)據(jù)管理,發(fā)布后可前往模型調(diào)優(yōu)/評(píng)測(cè)功能使用。您可以利用平臺(tái)提供的工具對(duì)數(shù)據(jù)集進(jìn)行標(biāo)簽標(biāo)注、篩選和版本管理,有利于迭代訓(xùn)練和性能追蹤。 說(shuō)明 小貼士:迭代優(yōu)化 數(shù)據(jù)準(zhǔn)備是一個(gè)迭代過(guò)程,初期數(shù)據(jù)集不必完美,但在模型調(diào)優(yōu)過(guò)程中,根據(jù)訓(xùn)練反饋不斷調(diào)整和豐富數(shù)據(jù),可以逐步提升模型表現(xiàn)。 3. 數(shù)據(jù)清洗與數(shù)據(jù)增強(qiáng)(可選)數(shù)據(jù)清洗是指檢查并處理收集到的數(shù)據(jù),以保證數(shù)據(jù)的質(zhì)量、完整性和一致性。這一步驟可以顯著提高模型的訓(xùn)練效果和預(yù)測(cè)能力。數(shù)據(jù)增強(qiáng)是指增加多樣性并擴(kuò)展訓(xùn)練數(shù)據(jù)的規(guī)模。 阿里云百煉提供了模型數(shù)據(jù)的版本管理能力,您的數(shù)據(jù)將在清洗或增強(qiáng)后自動(dòng)生成一個(gè)新版本。新版本數(shù)據(jù)獨(dú)立保存,不會(huì)覆蓋源數(shù)據(jù)。 重要 如果您的數(shù)據(jù)類型不適合數(shù)據(jù)清洗與增強(qiáng)(如法律文件、醫(yī)學(xué)記錄、文學(xué)作品、方言匯總、用戶評(píng)論、技術(shù)手冊(cè)等),建議跳過(guò)該步驟。 建議您優(yōu)先清洗數(shù)據(jù),再增強(qiáng)清洗后的數(shù)據(jù)。這樣可以確保增強(qiáng)操作是在一個(gè)干凈、高質(zhì)量的數(shù)據(jù)集上進(jìn)行的。這樣可以避免在低質(zhì)量數(shù)據(jù)上進(jìn)行增強(qiáng),從而保證模型調(diào)優(yōu)的數(shù)據(jù)源是準(zhǔn)確的。 說(shuō)明 小貼士:精準(zhǔn)與多樣化 在數(shù)據(jù)處理中,數(shù)據(jù)清洗和數(shù)據(jù)增強(qiáng)是提升數(shù)據(jù)質(zhì)量和多樣性的關(guān)鍵步驟。為了確保這兩個(gè)步驟的有效性和合理性,請(qǐng)您參考以下建議: 逐步清洗: 分階段進(jìn)行數(shù)據(jù)清洗,每次只執(zhí)行特定的一類清洗操作(如移除重復(fù)項(xiàng)、處理缺失值等)。這樣可以更容易地檢測(cè)和糾正錯(cuò)誤,提高數(shù)據(jù)的整潔度和一致性。 驗(yàn)證清洗效果: 每個(gè)清洗步驟之后,檢查數(shù)據(jù)的樣本,以確保數(shù)據(jù)的完整性和真實(shí)性沒(méi)有被破壞。 任務(wù)相關(guān)性: 在數(shù)據(jù)增強(qiáng)時(shí),確保生成的增強(qiáng)數(shù)據(jù)與目標(biāo)任務(wù)高度相關(guān),避免引入不相關(guān)的變體,保持?jǐn)?shù)據(jù)上下文和語(yǔ)義的一致性。 多樣化策略: 使用多種數(shù)據(jù)增強(qiáng)策略(如同義詞替換、隨機(jī)抽樣、翻譯變換等),以最大限度地增加數(shù)據(jù)的多樣性。這有助于提升模型的泛化能力。 平衡增強(qiáng): 生成的增強(qiáng)數(shù)據(jù)應(yīng)在類別、難度和結(jié)構(gòu)上相對(duì)平衡,避免讓模型接觸過(guò)多的特定類型數(shù)據(jù),導(dǎo)致過(guò)擬合。確保在數(shù)據(jù)增強(qiáng)過(guò)程中,不偏離數(shù)據(jù)的真實(shí)分布。
模型調(diào)優(yōu)完成訓(xùn)練數(shù)據(jù)的準(zhǔn)備后,您便可以開(kāi)始模型調(diào)優(yōu)。模型調(diào)優(yōu),即使用訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集訓(xùn)練模型。 阿里云百煉提供Fine-tuning的訓(xùn)練方式,還提供多種參數(shù)的調(diào)整,可以根據(jù)業(yè)務(wù)需求調(diào)整參數(shù),優(yōu)化模型調(diào)優(yōu)效果。以下是新建模型訓(xùn)練任務(wù)和關(guān)聯(lián)模型訓(xùn)練任務(wù)的操作方法: 新建訓(xùn)練任務(wù)您可通過(guò)模型調(diào)優(yōu)頁(yè)面的訓(xùn)練新模型操作向?qū)В瓿捎?xùn)練的參數(shù)設(shè)置,具體操作如下: 登錄阿里云百煉控制臺(tái),在左側(cè)導(dǎo)航欄中,選擇模型工具 > 模型調(diào)優(yōu)。這里展示了所有調(diào)優(yōu)任務(wù)。 點(diǎn)擊訓(xùn)練新模型,阿里云百煉將會(huì)引導(dǎo)您配置訓(xùn)練參數(shù): 訓(xùn)練方式:阿里云百煉支持全參訓(xùn)練和高效訓(xùn)練兩種方式,以下是選擇建議: 訓(xùn)練方式 | 優(yōu)點(diǎn) | 缺點(diǎn) | 全參訓(xùn)練 |
|
| 高效訓(xùn)練 |
|
|
高效訓(xùn)練能較好地平衡訓(xùn)練時(shí)長(zhǎng)和訓(xùn)練效果,一般建議您選擇高效訓(xùn)練。 選擇模型:阿里云百煉支持基于預(yù)置模型或自定義模型的調(diào)優(yōu)。 如果您是第一次訓(xùn)練模型,建議選擇預(yù)置模型;如果您調(diào)整了訓(xùn)練策略,希望基于已訓(xùn)練的模型進(jìn)行再次訓(xùn)練,則可選擇自定義模型。 阿里云百煉提供了多種可調(diào)優(yōu)的預(yù)置模型,各模型特性請(qǐng)參閱模型調(diào)用。 選擇訓(xùn)練數(shù)據(jù):選擇參與訓(xùn)練的數(shù)據(jù)集,您在已上傳的數(shù)據(jù)集列表中選擇訓(xùn)練集。 說(shuō)明 如果清洗或增強(qiáng)了數(shù)據(jù),您需要注意數(shù)據(jù)集的名稱和版本,以免誤選未經(jīng)處理的數(shù)據(jù)。 選擇驗(yàn)證數(shù)據(jù):選擇參與驗(yàn)證訓(xùn)練效果的數(shù)據(jù)集,您可以選擇自動(dòng)切分或從數(shù)據(jù)列表中選擇驗(yàn)證集。 如果您沒(méi)有準(zhǔn)備驗(yàn)證數(shù)據(jù)集,建議選擇自動(dòng)切分,阿里云百煉將從選定的訓(xùn)練集中劃分一部分?jǐn)?shù)據(jù)作為驗(yàn)證集。反之,建議從數(shù)據(jù)列表中選擇驗(yàn)證集。 說(shuō)明 如果您清洗或增強(qiáng)了數(shù)據(jù),您需要注意數(shù)據(jù)集的名稱和版本,以免誤選未經(jīng)處理的數(shù)據(jù)。 混合訓(xùn)練:為了避免基礎(chǔ)模型能力的遺失并提高訓(xùn)練效果,阿里云百煉支持您將自備的訓(xùn)練數(shù)據(jù)與預(yù)置通用數(shù)據(jù)混合訓(xùn)練。您可以調(diào)整自備訓(xùn)練數(shù)據(jù)與預(yù)置通用數(shù)據(jù)的比例,如果所有類型的預(yù)置通用數(shù)據(jù)的比例設(shè)置為0,您將不使用預(yù)置數(shù)據(jù)。 超參配置:模型的超參配置決定一定程度的模型調(diào)優(yōu)效果,您可按照自己的訓(xùn)練經(jīng)驗(yàn)進(jìn)行配置。如果您不了解超參數(shù),阿里云百煉也提供一套基于實(shí)驗(yàn)所得的默認(rèn)配置,您可以遵循默認(rèn)配置。 開(kāi)始訓(xùn)練:這一步將展示您的所有訓(xùn)練配置,阿里云百煉會(huì)自動(dòng)計(jì)算預(yù)估的訓(xùn)練費(fèi)用(稍后您也可以在訓(xùn)練任務(wù)列表中瀏覽預(yù)估費(fèi)用明細(xì),實(shí)際產(chǎn)生費(fèi)用以生成賬單為準(zhǔn))。待您確認(rèn)配置和價(jià)格信息無(wú)誤后即可開(kāi)始訓(xùn)練。
開(kāi)始訓(xùn)練后,您可以在模型調(diào)優(yōu)列表中查看模型的訓(xùn)練進(jìn)度、預(yù)估費(fèi)用和其他管理操作。有關(guān)訓(xùn)練費(fèi)用的詳細(xì)信息,請(qǐng)參考產(chǎn)品計(jì)費(fèi)。
說(shuō)明 小貼士:模型訓(xùn)練入門指南 如果您是大語(yǔ)言模型訓(xùn)練的新手,以下是一些簡(jiǎn)單且實(shí)用的小貼士,幫您輕松入門并提高訓(xùn)練效果: 管理訓(xùn)練任務(wù)待您啟動(dòng)訓(xùn)練后,您新建的模型訓(xùn)練任務(wù)將出現(xiàn)在模型調(diào)優(yōu)的列表里,其訓(xùn)練狀態(tài)將變更為訓(xùn)練中。此時(shí),您可點(diǎn)擊訓(xùn)練任務(wù)的查看操作進(jìn)入訓(xùn)練詳情頁(yè),瀏覽訓(xùn)練任務(wù)的配置和訓(xùn)練的過(guò)程指標(biāo)。您可以點(diǎn)擊查看預(yù)估來(lái)瀏覽本次訓(xùn)練任務(wù)預(yù)估的計(jì)費(fèi)信息。您也可以隨時(shí)點(diǎn)擊終止訓(xùn)練來(lái)結(jié)束訓(xùn)練任務(wù)。 訓(xùn)練過(guò)程指標(biāo)主要有以下三個(gè),大致體現(xiàn)了模型的訓(xùn)練效果。如果您不了解這些指標(biāo)的含義,也可以等待訓(xùn)練結(jié)束后,使用阿里云百煉的模型評(píng)測(cè)工具評(píng)價(jià)訓(xùn)練效果。 指標(biāo) | 解釋 | Training Loss | Training Loss 代表針對(duì)訓(xùn)練數(shù)據(jù)學(xué)習(xí)的擬合程度,曲線一般呈現(xiàn)下降趨勢(shì)。Loss越小,表示訓(xùn)練數(shù)據(jù)擬合程度越高。過(guò)小的Loss易導(dǎo)致數(shù)據(jù)過(guò)擬合,需要根據(jù)實(shí)際訓(xùn)練過(guò)程進(jìn)行判斷。 | Validation Loss | Validation Loss代表針對(duì)驗(yàn)證集學(xué)習(xí)的擬合程度,曲線一般呈現(xiàn)先下降后上升趨勢(shì)。Loss越小,表示驗(yàn)證數(shù)據(jù)擬合程度越高。優(yōu)秀的模型效果往往出現(xiàn)Validation Loss的最小值節(jié)點(diǎn),此時(shí)擬合程度最佳,訓(xùn)練效果最好。 | Validation Token Accuracy | Validation Token Acc代表針對(duì)驗(yàn)證集學(xué)習(xí)的準(zhǔn)確程度,曲線一般呈現(xiàn)上升趨勢(shì)。訓(xùn)練過(guò)擬合后,該曲線會(huì)呈現(xiàn)下降趨勢(shì)。優(yōu)秀的模型效果往往出現(xiàn)在Validation Token Acc的最大值節(jié)點(diǎn),此時(shí)預(yù)測(cè)準(zhǔn)確率最高,訓(xùn)練效果最好。 |
一般情況下,千條以下的數(shù)據(jù)訓(xùn)練所需的時(shí)長(zhǎng)為2-3個(gè)小時(shí)。由于平臺(tái)承載能力有限,可能出現(xiàn)排隊(duì)狀態(tài),還請(qǐng)您諒解。訓(xùn)練任務(wù)完成后,列表及詳情頁(yè)中模型的狀態(tài)將變更為訓(xùn)練成功,此時(shí)您已經(jīng)獲得自定義模型,該模型已處于等待部署狀態(tài),您可以直接點(diǎn)擊模型部署跳轉(zhuǎn)到部署頁(yè)面。 模型部署待您獲得自定義模型后,您需要將該模型部署到計(jì)算資源上,方可調(diào)用該模型。 阿里云百煉提供了多種資源配置方式,您可以按需選擇。如果需要評(píng)測(cè)模型的訓(xùn)練效果,您需要先部署自定義模型,再使用模型評(píng)測(cè)評(píng)估自定義模型的訓(xùn)練效果。 新建部署任務(wù)登錄阿里云百煉控制臺(tái),在左側(cè)導(dǎo)航欄中,選擇模型工具 > 模型部署。您也可以在模型工具 > 模型訓(xùn)練中等待模型訓(xùn)練結(jié)束后,直接點(diǎn)擊模型部署。這里展示了所有模型部署任務(wù)。 點(diǎn)擊部署新模型,您將跟隨向?qū)У闹敢瓿刹渴鹋渲茫?/p> 選擇模型:阿里云百煉提供了兩類可部署的模型,此處請(qǐng)您選擇之前訓(xùn)練的自定義模型。 選擇資源配置:阿里云百煉提供了兩類資源配置方式。包月資源是按月購(gòu)買計(jì)算資源的方式,不同版本的包月資源在部署模型的能力上有差別。按量付費(fèi)是按實(shí)際使用時(shí)長(zhǎng)購(gòu)買計(jì)算資源的方式,您可以按需購(gòu)買一定數(shù)量的計(jì)算資源,也可以隨后變更計(jì)算資源的數(shù)量。為完成后續(xù)的模型評(píng)測(cè),對(duì)訓(xùn)練效果做進(jìn)一步評(píng)估,此處推薦您選擇按量付費(fèi)。 開(kāi)始部署:這一步將展示您的所有部署配置和預(yù)估費(fèi)用,待您確認(rèn)所有信息后即可開(kāi)始部署。
開(kāi)始部署后,您可以在模型部署列表中查看模型的部署進(jìn)度、預(yù)估費(fèi)用和其他管理操作。有關(guān)部署費(fèi)用的詳細(xì)信息,請(qǐng)參考產(chǎn)品計(jì)費(fèi)。
一般情況下,模型部署時(shí)長(zhǎng)在幾十分鐘到幾個(gè)小時(shí)不等,由于阿里云百煉資源限制,部署可能會(huì)產(chǎn)生隊(duì)列,部署完成后,狀態(tài)將變?yōu)檫\(yùn)行中,運(yùn)行中的模型可被調(diào)用,用于模型評(píng)測(cè)及應(yīng)用調(diào)用。 說(shuō)明 小貼士:實(shí)例管理與性能優(yōu)化 什么是實(shí)例: 簡(jiǎn)單定義:實(shí)例是運(yùn)行模型和處理請(qǐng)求的獨(dú)立計(jì)算單元,通常對(duì)應(yīng)一臺(tái)服務(wù)器、一塊GPU,或在容器化環(huán)境中對(duì)應(yīng)一個(gè)容器。 實(shí)例用途:實(shí)例用于將模型加載到內(nèi)存中,接受用戶請(qǐng)求,執(zhí)行推理任務(wù)(如文本生成、分類等),并返回結(jié)果。
實(shí)例數(shù)量對(duì)性能的影響: 響應(yīng)時(shí)間:增加實(shí)例數(shù)量能有效分擔(dān)負(fù)載,降低每個(gè)實(shí)例處理請(qǐng)求的時(shí)間,提高整體響應(yīng)速度。 并發(fā)處理:更多實(shí)例可以并行處理更多請(qǐng)求,提高系統(tǒng)的并發(fā)處理能力。 成本效益:增加實(shí)例數(shù)量能提高性能和用戶體驗(yàn),但成本可能增加,需要權(quán)衡。
管理部署任務(wù)待您啟動(dòng)部署后,您新建的模型部署任務(wù)將出現(xiàn)在模型部署的列表里,其部署狀態(tài)將變更為部署中。此時(shí),您可點(diǎn)擊部署任務(wù)的查看操作瀏覽部署任務(wù)的配置。您可以點(diǎn)擊擴(kuò)縮容來(lái)變更計(jì)算資源的用量。您也可以隨時(shí)點(diǎn)擊下線來(lái)結(jié)束部署任務(wù)。 待部署完成后,其部署狀態(tài)將變更為運(yùn)行中。此時(shí)您訓(xùn)練的自定義模型已經(jīng)具備了推理調(diào)用的能力。您可以點(diǎn)擊去體驗(yàn),在模型體驗(yàn)頁(yè)面測(cè)試您的自定義模型推理效果。此時(shí),您可以使用模型評(píng)測(cè)對(duì)自定義模型的效果做評(píng)估。 模型評(píng)測(cè)完成模型部署后,如需測(cè)試模型的效果,可在模型評(píng)測(cè)中進(jìn)行評(píng)測(cè)。對(duì)于本篇介紹的自定義模型,阿里云百煉提供了基線評(píng)測(cè)方法。基線評(píng)測(cè)預(yù)置多種常用的能力評(píng)測(cè)集及評(píng)測(cè)腳本,可自動(dòng)評(píng)測(cè)模型多種基本能力。 新建評(píng)測(cè)任務(wù)登錄阿里云百煉控制臺(tái),在左側(cè)導(dǎo)航欄中,選擇模型工具 > 模型評(píng)測(cè)。這里展示了所有模型評(píng)測(cè)任務(wù)。 點(diǎn)擊創(chuàng)建評(píng)測(cè)任務(wù),您將遵循向?qū)瓿稍u(píng)測(cè)任務(wù)的配置: 評(píng)測(cè)方式:阿里云百煉提供了多種評(píng)測(cè)方式。對(duì)于自定義模型,請(qǐng)您選擇基線評(píng)測(cè)。 選擇模型:請(qǐng)?jiān)谙吕蛑羞x擇已部署的目標(biāo)評(píng)測(cè)模型。 選擇評(píng)測(cè)數(shù)據(jù):阿里云百煉預(yù)置了基線評(píng)測(cè)集(包括C-Eval/CMMLU等主流榜單評(píng)測(cè)集)對(duì)待測(cè)模型的各項(xiàng)基礎(chǔ)通用能力進(jìn)行自動(dòng)評(píng)測(cè)。您可以任選評(píng)測(cè)數(shù)據(jù),以此構(gòu)建您的所有評(píng)測(cè)數(shù)據(jù)。 開(kāi)始評(píng)測(cè):這一步將展示您的所有評(píng)測(cè)配置和預(yù)估費(fèi)用,待您確認(rèn)所有信息后即可開(kāi)始評(píng)測(cè)。
開(kāi)始評(píng)測(cè)后,您可以在模型評(píng)測(cè)列表中查看模型的評(píng)測(cè)進(jìn)度、預(yù)估費(fèi)用和其他管理操作。有關(guān)評(píng)測(cè)費(fèi)用的詳細(xì)信息,請(qǐng)參考產(chǎn)品計(jì)費(fèi)。
管理評(píng)測(cè)任務(wù)當(dāng)評(píng)測(cè)開(kāi)始后,該評(píng)測(cè)任務(wù)的狀態(tài)將變更為執(zhí)行中或隊(duì)列中,您可以隨時(shí)點(diǎn)擊中止來(lái)結(jié)束評(píng)測(cè)。待評(píng)測(cè)完成后,您可以點(diǎn)擊結(jié)果查看詳細(xì)的評(píng)測(cè)結(jié)果。您可以點(diǎn)擊刪除刪去一項(xiàng)評(píng)測(cè)任務(wù)。 后續(xù)操作至此,本篇已經(jīng)介紹了自定義模型調(diào)優(yōu)、部署與評(píng)測(cè)的全生命周期管理。閱讀完本篇后,您可以自行創(chuàng)建一個(gè)自定義模型,并能夠在業(yè)務(wù)場(chǎng)景中調(diào)用該自定義模型。
|