小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

【大語(yǔ)言模型】自定義模型最佳實(shí)踐

 三月陽(yáng)春 2024-10-09

為了讓大語(yǔ)言模型的AI能力更貼近業(yè)務(wù)需求,本文詳細(xì)介紹了在阿里云百煉創(chuàng)建自定義模型的最佳實(shí)踐。即便不清楚大模型的技術(shù)細(xì)節(jié),您也能按照本篇的操作指引創(chuàng)建一個(gè)有效的自定義模型,從而輕松地為業(yè)務(wù)場(chǎng)景添加大模型服務(wù)能力。

自定義模型概述

自定義大模型是指基于通用大語(yǔ)言模型,通過(guò)微調(diào)和訓(xùn)練,能更好地適應(yīng)特定領(lǐng)域或任務(wù)的大語(yǔ)言模型。

為什么選擇自定義模型?

  1. 提高特定領(lǐng)域的準(zhǔn)確性:通用的大語(yǔ)言模型盡管強(qiáng)大,但在處理特定領(lǐng)域的任務(wù)時(shí),可能會(huì)因?yàn)槿狈︻I(lǐng)域特定知識(shí)而表現(xiàn)不佳。自定義大語(yǔ)言模型通過(guò)領(lǐng)域特定的數(shù)據(jù)進(jìn)行重新訓(xùn)練,可以顯著提高在該領(lǐng)域的表現(xiàn)和準(zhǔn)確性。

  2. 增強(qiáng)模型的適用性:自定義大語(yǔ)言模型可以根據(jù)特定應(yīng)用場(chǎng)景的需求進(jìn)行微調(diào),使其更好地適應(yīng)特定任務(wù)。例如,在客戶服務(wù)中,自定義模型可以更好地理解和回應(yīng)客戶的特定問(wèn)題,提高客戶滿意度。

  3. 節(jié)約開(kāi)發(fā)時(shí)間和成本:利用現(xiàn)有的大語(yǔ)言模型進(jìn)行定制化訓(xùn)練,比從頭開(kāi)發(fā)一個(gè)模型要節(jié)約大量時(shí)間和成本。您可以快速部署自定義模型,滿足業(yè)務(wù)需求。

  4. 增強(qiáng)品牌和用戶體驗(yàn):自定義大語(yǔ)言模型可以根據(jù)企業(yè)的品牌語(yǔ)言風(fēng)格進(jìn)行調(diào)整,確保輸出內(nèi)容的一致性和品牌調(diào)性,從而提升用戶體驗(yàn)和品牌形象。

創(chuàng)建自定義模型的流程

創(chuàng)建自定義模型涉及三個(gè)主要步驟:模型調(diào)優(yōu)、模型部署模型評(píng)測(cè),以及三個(gè)輔助步驟:訓(xùn)練數(shù)據(jù)準(zhǔn)備、評(píng)測(cè)模板設(shè)計(jì)、調(diào)整訓(xùn)練策略。

  1. 模型調(diào)優(yōu)階段:模型會(huì)“學(xué)習(xí)”大量訓(xùn)練數(shù)據(jù)的語(yǔ)言特征,從而理解并生成相似的自然語(yǔ)言。開(kāi)始模型調(diào)優(yōu)之前,您需要做一些訓(xùn)練數(shù)據(jù)準(zhǔn)備工作,包括數(shù)據(jù)收集、數(shù)據(jù)清洗、數(shù)據(jù)集劃分等操作。您需按照訓(xùn)練新模型向?qū)У闹敢渲?span style="outline: none;box-sizing: border-box;margin: 0px;padding: 0px;font-weight: 700;">模型調(diào)優(yōu)。根據(jù)配置的訓(xùn)練超參數(shù)(超參數(shù)是指在模型調(diào)優(yōu)前需要提前設(shè)定的參數(shù),包括學(xué)習(xí)率、迭代次數(shù)等),阿里云百煉將自動(dòng)訓(xùn)練您選擇的預(yù)置模型。一般情況下,訓(xùn)練過(guò)程是自動(dòng)完成的,無(wú)需進(jìn)一步操作。

  2. 模型部署階段:您需要將自定義模型部署到獨(dú)占實(shí)例上,然后調(diào)用或評(píng)測(cè)自定義模型。部署新模型向?qū)椭渲?span style="outline: none;box-sizing: border-box;margin: 0px;padding: 0px;font-weight: 700;">模型部署。根據(jù)配置的自定義模型規(guī)格和資源配置方式,阿里云百煉將計(jì)算預(yù)估價(jià)格。待您確認(rèn)價(jià)格后,阿里云百煉會(huì)自動(dòng)部署模型,一般無(wú)需干預(yù)。完成部署后,您便可以在代碼或評(píng)測(cè)中配置自定義模型。

  3. 模型評(píng)測(cè)階段:您可以評(píng)測(cè)已部署的自定義模型。您可以按照創(chuàng)建評(píng)測(cè)任務(wù)向?qū)У闹敢渲?span style="outline: none;box-sizing: border-box;margin: 0px;padding: 0px;font-weight: 700;">模型評(píng)測(cè)。自定義模型不涉及評(píng)測(cè)模板設(shè)計(jì)環(huán)節(jié)。根據(jù)您選擇的評(píng)測(cè)方式、數(shù)據(jù)和維度,阿里云百煉將自動(dòng)完成評(píng)測(cè),一般無(wú)需干預(yù)。

說(shuō)明

如果對(duì)模型的評(píng)測(cè)結(jié)果不滿意,您還可以調(diào)整訓(xùn)練策略(選擇不同的預(yù)置模型作為基礎(chǔ)模型、擴(kuò)充訓(xùn)練數(shù)據(jù)樣本、選擇不同的超參數(shù)配置等),再次完成訓(xùn)練、部署和評(píng)測(cè)。您可以重復(fù)整個(gè)流程,直到模型的評(píng)測(cè)結(jié)果滿足預(yù)期。

說(shuō)明

在阿里云百煉,完成調(diào)優(yōu)的模型必須部署后才能調(diào)用和評(píng)測(cè)。因此,您需要首先完成模型部署,方可繼續(xù)評(píng)測(cè)模型。

image

前提條件

前置知識(shí)

您可能需要了解機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和自然語(yǔ)言處理的基礎(chǔ)概念。如果不了解這些概念,您也可以遵循本實(shí)踐文檔的指引完成整個(gè)創(chuàng)建流程。

工具和資源

您需要開(kāi)通阿里云百煉大模型服務(wù)平臺(tái),并確認(rèn)賬號(hào)余額充足,以免無(wú)法創(chuàng)建自定義模型。

計(jì)費(fèi)信息

創(chuàng)建自定義模型時(shí),可能涉及多種計(jì)費(fèi)項(xiàng),包括但不限于模型調(diào)優(yōu)、模型部署和模型評(píng)測(cè)。計(jì)費(fèi)規(guī)則請(qǐng)參考產(chǎn)品計(jì)費(fèi)。

訓(xùn)練數(shù)據(jù)準(zhǔn)備

在開(kāi)始訓(xùn)練前,您需要完成訓(xùn)練數(shù)據(jù)的準(zhǔn)備工作。這些準(zhǔn)備工作包括:從業(yè)務(wù)場(chǎng)景中收集具有代表性的業(yè)務(wù)數(shù)據(jù),并轉(zhuǎn)換為問(wèn)答對(duì)的形式(數(shù)據(jù)收集);上傳訓(xùn)練數(shù)據(jù)、評(píng)測(cè)數(shù)據(jù)、驗(yàn)證數(shù)據(jù)(數(shù)據(jù)上傳);使用阿里云大模型服務(wù)平臺(tái)百煉提供的數(shù)據(jù)清洗工具和數(shù)據(jù)增強(qiáng)工具,提升訓(xùn)練數(shù)據(jù)的質(zhì)量。

1. 數(shù)據(jù)收集

您可以從各種信息來(lái)源中發(fā)掘有業(yè)務(wù)價(jià)值的數(shù)據(jù),并將這些數(shù)據(jù)編排成特定結(jié)構(gòu)。您在完成數(shù)據(jù)收集時(shí),需仔細(xì)考慮以下策略:

  • 來(lái)源多樣化:從書(shū)籍摘錄、學(xué)術(shù)論文、新聞報(bào)道和專業(yè)網(wǎng)站等多種來(lái)源收集數(shù)據(jù),來(lái)確保模型的適用范圍更廣,可以處理不同類型的問(wèn)題或理解多種表達(dá)方式。

  • 質(zhì)量控制:數(shù)據(jù)質(zhì)量決定了模型質(zhì)量。質(zhì)量高、數(shù)量足的數(shù)據(jù)可以讓模型學(xué)得更好,表現(xiàn)更優(yōu)。

  • 平衡性考量:確保問(wèn)題類型、難度和答案的分布均勻,避免模型偏向某一特定類型的數(shù)據(jù),導(dǎo)致訓(xùn)練偏差。

在阿里云百煉,您需要將收集到的數(shù)據(jù)編排成“Prompt-Completion”格式,便于平臺(tái)解析和訓(xùn)練。為了盡可能提高訓(xùn)練效率,我們建議至少準(zhǔn)備500條訓(xùn)練數(shù)據(jù),要求如下:

  • 文本分割:合理分割長(zhǎng)文本,確保每個(gè)Prompt-Completion對(duì)聚焦于單一明確的主題,便于模型學(xué)習(xí)。

  • 脫敏處理:移除個(gè)人身份信息、敏感詞匯或不適宜內(nèi)容,保證數(shù)據(jù)合規(guī)與安全。

  • 說(shuō)明

  • 小貼士:構(gòu)建聊天機(jī)器人的數(shù)據(jù)收集

  • 假設(shè)您想創(chuàng)建一個(gè)智能聊天機(jī)器人,能夠回答客戶提出的問(wèn)題。

  • 在數(shù)據(jù)收集階段,您的目標(biāo)是:為聊天機(jī)器人收集學(xué)習(xí)材料。

  • 數(shù)據(jù)來(lái)源:

  • 用戶聊天記錄:比如網(wǎng)站上的在線客服聊天記錄。

  • FAQ文檔:公司網(wǎng)站上的常見(jiàn)問(wèn)題解答列表。

  • 客戶服務(wù)郵件:客戶發(fā)送給客服團(tuán)隊(duì)的問(wèn)題和相應(yīng)的回復(fù)。

  • 數(shù)據(jù)示例:

  • 用戶聊天記錄:導(dǎo)出在線客服系統(tǒng)中的聊天記錄,可以包括客戶問(wèn)題和客服回復(fù)。例如:

    客戶:你們的退貨政策是什么?
    客服:我們的退貨政策是在購(gòu)買30天內(nèi)可以無(wú)條件退貨。
  • FAQ文檔:收集網(wǎng)站上列出的常見(jiàn)問(wèn)題及其答案。例如:

    問(wèn):如何更改我的密碼?
    答:請(qǐng)點(diǎn)擊“設(shè)置”,然后選擇“更改密碼”。
  • 客戶服務(wù)郵件:導(dǎo)出郵件系統(tǒng)中跟客戶的來(lái)往郵件。例如:

    客戶郵件:我的訂單沒(méi)有收到,怎么辦?
    客服回復(fù):我們很抱歉,請(qǐng)?zhí)峁┠挠唵翁?hào),我們會(huì)盡快處理。
  • 數(shù)據(jù)編排:

  • Prompt

    Completion

    你們的退貨政策是什么?

    我們的退貨政策是購(gòu)買30天內(nèi)可以無(wú)條件退貨。

    如何更改我的密碼?

    請(qǐng)點(diǎn)擊“設(shè)置”,然后選擇“更改密碼”。

    我的訂單沒(méi)有收到,怎么辦?

    我們很抱歉,請(qǐng)?zhí)峁┠挠唵翁?hào),我們會(huì)盡快處理。

2. 數(shù)據(jù)上傳

您需要將準(zhǔn)備好的數(shù)據(jù)上傳至阿里云百煉,以備進(jìn)一步清洗和增強(qiáng),或直接參與模型調(diào)優(yōu)。平臺(tái)自動(dòng)進(jìn)行格式檢查和基礎(chǔ)數(shù)據(jù)質(zhì)量審核,確保數(shù)據(jù)符合訓(xùn)練要求。

阿里云百煉支持創(chuàng)建不同數(shù)據(jù)類型的數(shù)據(jù)集,包括訓(xùn)練集、評(píng)測(cè)集,支持多版本數(shù)據(jù)管理,發(fā)布后可前往模型調(diào)優(yōu)/評(píng)測(cè)功能使用。您可以利用平臺(tái)提供的工具對(duì)數(shù)據(jù)集進(jìn)行標(biāo)簽標(biāo)注、篩選和版本管理,有利于迭代訓(xùn)練和性能追蹤。

操作步驟

說(shuō)明

小貼士:迭代優(yōu)化

數(shù)據(jù)準(zhǔn)備是一個(gè)迭代過(guò)程,初期數(shù)據(jù)集不必完美,但在模型調(diào)優(yōu)過(guò)程中,根據(jù)訓(xùn)練反饋不斷調(diào)整和豐富數(shù)據(jù),可以逐步提升模型表現(xiàn)。

3. 數(shù)據(jù)清洗與數(shù)據(jù)增強(qiáng)(可選)

數(shù)據(jù)清洗是指檢查并處理收集到的數(shù)據(jù),以保證數(shù)據(jù)的質(zhì)量、完整性和一致性。這一步驟可以顯著提高模型的訓(xùn)練效果和預(yù)測(cè)能力。數(shù)據(jù)增強(qiáng)是指增加多樣性并擴(kuò)展訓(xùn)練數(shù)據(jù)的規(guī)模。

阿里云百煉提供了模型數(shù)據(jù)的版本管理能力,您的數(shù)據(jù)將在清洗或增強(qiáng)后自動(dòng)生成一個(gè)新版本。新版本數(shù)據(jù)獨(dú)立保存,不會(huì)覆蓋源數(shù)據(jù)。

重要

如果您的數(shù)據(jù)類型不適合數(shù)據(jù)清洗與增強(qiáng)(如法律文件、醫(yī)學(xué)記錄、文學(xué)作品、方言匯總、用戶評(píng)論、技術(shù)手冊(cè)等),建議跳過(guò)該步驟。

建議您優(yōu)先清洗數(shù)據(jù),再增強(qiáng)清洗后的數(shù)據(jù)。這樣可以確保增強(qiáng)操作是在一個(gè)干凈、高質(zhì)量的數(shù)據(jù)集上進(jìn)行的。這樣可以避免在低質(zhì)量數(shù)據(jù)上進(jìn)行增強(qiáng),從而保證模型調(diào)優(yōu)的數(shù)據(jù)源是準(zhǔn)確的。

數(shù)據(jù)清洗操作步驟

數(shù)據(jù)增強(qiáng)操作步驟

說(shuō)明

小貼士:精準(zhǔn)與多樣化

在數(shù)據(jù)處理中,數(shù)據(jù)清洗和數(shù)據(jù)增強(qiáng)是提升數(shù)據(jù)質(zhì)量和多樣性的關(guān)鍵步驟。為了確保這兩個(gè)步驟的有效性和合理性,請(qǐng)您參考以下建議:

  • 逐步清洗: 分階段進(jìn)行數(shù)據(jù)清洗,每次只執(zhí)行特定的一類清洗操作(如移除重復(fù)項(xiàng)、處理缺失值等)。這樣可以更容易地檢測(cè)和糾正錯(cuò)誤,提高數(shù)據(jù)的整潔度和一致性。

  • 驗(yàn)證清洗效果: 每個(gè)清洗步驟之后,檢查數(shù)據(jù)的樣本,以確保數(shù)據(jù)的完整性和真實(shí)性沒(méi)有被破壞。

  • 任務(wù)相關(guān)性: 在數(shù)據(jù)增強(qiáng)時(shí),確保生成的增強(qiáng)數(shù)據(jù)與目標(biāo)任務(wù)高度相關(guān),避免引入不相關(guān)的變體,保持?jǐn)?shù)據(jù)上下文和語(yǔ)義的一致性。

  • 多樣化策略: 使用多種數(shù)據(jù)增強(qiáng)策略(如同義詞替換、隨機(jī)抽樣、翻譯變換等),以最大限度地增加數(shù)據(jù)的多樣性。這有助于提升模型的泛化能力。

  • 平衡增強(qiáng): 生成的增強(qiáng)數(shù)據(jù)應(yīng)在類別、難度和結(jié)構(gòu)上相對(duì)平衡,避免讓模型接觸過(guò)多的特定類型數(shù)據(jù),導(dǎo)致過(guò)擬合。確保在數(shù)據(jù)增強(qiáng)過(guò)程中,不偏離數(shù)據(jù)的真實(shí)分布。

模型調(diào)優(yōu)

完成訓(xùn)練數(shù)據(jù)的準(zhǔn)備后,您便可以開(kāi)始模型調(diào)優(yōu)。模型調(diào)優(yōu),即使用訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集訓(xùn)練模型。

阿里云百煉提供Fine-tuning的訓(xùn)練方式,還提供多種參數(shù)的調(diào)整,可以根據(jù)業(yè)務(wù)需求調(diào)整參數(shù),優(yōu)化模型調(diào)優(yōu)效果。以下是新建模型訓(xùn)練任務(wù)和關(guān)聯(lián)模型訓(xùn)練任務(wù)的操作方法:

新建訓(xùn)練任務(wù)

您可通過(guò)模型調(diào)優(yōu)頁(yè)面的訓(xùn)練新模型操作向?qū)В瓿捎?xùn)練的參數(shù)設(shè)置,具體操作如下:

  1. 登錄阿里云百煉控制臺(tái),在左側(cè)導(dǎo)航欄中,選擇模型工具 > 模型調(diào)優(yōu)。這里展示了所有調(diào)優(yōu)任務(wù)。

  2. 點(diǎn)擊訓(xùn)練新模型,阿里云百煉將會(huì)引導(dǎo)您配置訓(xùn)練參數(shù):

    • 最大靈活性:全參數(shù)訓(xùn)練可使模型適應(yīng)新的數(shù)據(jù)和任務(wù),具有最大的調(diào)整靈活性。

    • 高性能:在理論上,全參數(shù)訓(xùn)練可以獲得最高的性能,因?yàn)樗袇?shù)都經(jīng)過(guò)調(diào)整以優(yōu)化特定任務(wù)。

    • 時(shí)間成本高:訓(xùn)練時(shí)間長(zhǎng),特別是在大型數(shù)據(jù)集上的訓(xùn)練。

    • 過(guò)擬合風(fēng)險(xiǎn):如果數(shù)據(jù)量不足或不平衡,全參數(shù)訓(xùn)練可能導(dǎo)致模型過(guò)擬合于特定訓(xùn)練數(shù)據(jù)。

    • 快速訓(xùn)練:比全參數(shù)訓(xùn)練更快,適合快速迭代和原型開(kāi)發(fā)。

    • 減小過(guò)擬合風(fēng)險(xiǎn):微調(diào)部分參數(shù)可以降低過(guò)擬合風(fēng)險(xiǎn)。

    • 性能可能受限:在某些任務(wù)上,性能可能略低于全參數(shù)訓(xùn)練。

    • 適用范圍有限:當(dāng)任務(wù)的性質(zhì)高度變化或與預(yù)訓(xùn)練任務(wù)顯著不同,高效訓(xùn)練可能無(wú)法有效遷移已有的知識(shí)。

    1. 訓(xùn)練方式:阿里云百煉支持全參訓(xùn)練高效訓(xùn)練兩種方式,以下是選擇建議:

      訓(xùn)練方式

      優(yōu)點(diǎn)

      缺點(diǎn)

      全參訓(xùn)練



      高效訓(xùn)練



      高效訓(xùn)練能較好地平衡訓(xùn)練時(shí)長(zhǎng)和訓(xùn)練效果,一般建議您選擇高效訓(xùn)練。

    2. 選擇模型:阿里云百煉支持基于預(yù)置模型或自定義模型的調(diào)優(yōu)。

      如果您是第一次訓(xùn)練模型,建議選擇預(yù)置模型;如果您調(diào)整了訓(xùn)練策略,希望基于已訓(xùn)練的模型進(jìn)行再次訓(xùn)練,則可選擇自定義模型。

      阿里云百煉提供了多種可調(diào)優(yōu)的預(yù)置模型,各模型特性請(qǐng)參閱模型調(diào)用

    3. 選擇訓(xùn)練數(shù)據(jù):選擇參與訓(xùn)練的數(shù)據(jù)集,您在已上傳的數(shù)據(jù)集列表中選擇訓(xùn)練集。

      說(shuō)明

      如果清洗或增強(qiáng)了數(shù)據(jù),您需要注意數(shù)據(jù)集的名稱和版本,以免誤選未經(jīng)處理的數(shù)據(jù)。

    4. 選擇驗(yàn)證數(shù)據(jù):選擇參與驗(yàn)證訓(xùn)練效果的數(shù)據(jù)集,您可以選擇自動(dòng)切分或從數(shù)據(jù)列表中選擇驗(yàn)證集。

      如果您沒(méi)有準(zhǔn)備驗(yàn)證數(shù)據(jù)集,建議選擇自動(dòng)切分,阿里云百煉將從選定的訓(xùn)練集中劃分一部分?jǐn)?shù)據(jù)作為驗(yàn)證集。反之,建議從數(shù)據(jù)列表中選擇驗(yàn)證集。

      說(shuō)明

      如果您清洗或增強(qiáng)了數(shù)據(jù),您需要注意數(shù)據(jù)集的名稱和版本,以免誤選未經(jīng)處理的數(shù)據(jù)。

    5. 混合訓(xùn)練:為了避免基礎(chǔ)模型能力的遺失并提高訓(xùn)練效果,阿里云百煉支持您將自備的訓(xùn)練數(shù)據(jù)與預(yù)置通用數(shù)據(jù)混合訓(xùn)練。您可以調(diào)整自備訓(xùn)練數(shù)據(jù)與預(yù)置通用數(shù)據(jù)的比例,如果所有類型的預(yù)置通用數(shù)據(jù)的比例設(shè)置為0,您將不使用預(yù)置數(shù)據(jù)。

    6. 超參配置:模型的超參配置決定一定程度的模型調(diào)優(yōu)效果,您可按照自己的訓(xùn)練經(jīng)驗(yàn)進(jìn)行配置。如果您不了解超參數(shù),阿里云百煉也提供一套基于實(shí)驗(yàn)所得的默認(rèn)配置,您可以遵循默認(rèn)配置。

    7. 開(kāi)始訓(xùn)練:這一步將展示您的所有訓(xùn)練配置,阿里云百煉會(huì)自動(dòng)計(jì)算預(yù)估的訓(xùn)練費(fèi)用(稍后您也可以在訓(xùn)練任務(wù)列表中瀏覽預(yù)估費(fèi)用明細(xì),實(shí)際產(chǎn)生費(fèi)用以生成賬單為準(zhǔn))。待您確認(rèn)配置和價(jià)格信息無(wú)誤后即可開(kāi)始訓(xùn)練。

  3. 開(kāi)始訓(xùn)練后,您可以在模型調(diào)優(yōu)列表中查看模型的訓(xùn)練進(jìn)度、預(yù)估費(fèi)用和其他管理操作。有關(guān)訓(xùn)練費(fèi)用的詳細(xì)信息,請(qǐng)參考產(chǎn)品計(jì)費(fèi)。

說(shuō)明

小貼士:模型訓(xùn)練入門指南

如果您是大語(yǔ)言模型訓(xùn)練的新手,以下是一些簡(jiǎn)單且實(shí)用的小貼士,幫您輕松入門并提高訓(xùn)練效果:

  • 優(yōu)化學(xué)習(xí)率:

    • 簡(jiǎn)單理解:學(xué)習(xí)率決定模型每次調(diào)整的步伐大小。開(kāi)始訓(xùn)練時(shí),可以從較小的學(xué)習(xí)率(如0.001)開(kāi)始,如果訓(xùn)練速度很慢或效果不好,可以逐步增加。

    • 如何調(diào)整:如果驗(yàn)證集性能沒(méi)有提升,可以嘗試調(diào)整學(xué)習(xí)率,通??s小10倍或增加10倍是一個(gè)好的做法。

  • 選擇合適的批次大?。?/p>

    • 簡(jiǎn)單理解:批次大小是每次訓(xùn)練中用來(lái)更新模型的樣本數(shù)。更大的批次大小可以提高訓(xùn)練效率。

    • 推薦設(shè)置:常見(jiàn)的批次大小是8、16或32,默認(rèn)選擇16.

  • 學(xué)習(xí)監(jiān)控?fù)p失和準(zhǔn)確率:

    • 簡(jiǎn)單理解:損失(Loss)表示模型在訓(xùn)練數(shù)據(jù)上的誤差,準(zhǔn)確率(Accuracy)表示模型的性能。如果損失一直下降而準(zhǔn)確率提升,說(shuō)明訓(xùn)練進(jìn)展順利。

    • 如何操作:您可以進(jìn)入訓(xùn)練任務(wù)詳情頁(yè),實(shí)時(shí)監(jiān)控訓(xùn)練過(guò)程中的損失和準(zhǔn)確率變化。驗(yàn)證集上的損失可以幫助您決定是否需要調(diào)整超參數(shù)。

  • 簡(jiǎn)單的數(shù)據(jù)增強(qiáng)方式:

    • 簡(jiǎn)單理解:數(shù)據(jù)增強(qiáng)可以增加數(shù)據(jù)的多樣性,提高模型的泛化能力。例如,同義詞替換、隨機(jī)遮蓋等。

    • 如何操作:在數(shù)據(jù)預(yù)處理階段,進(jìn)行簡(jiǎn)單的同義詞替換或其他文本增強(qiáng)。

管理訓(xùn)練任務(wù)

待您啟動(dòng)訓(xùn)練后,您新建的模型訓(xùn)練任務(wù)將出現(xiàn)在模型調(diào)優(yōu)的列表里,其訓(xùn)練狀態(tài)將變更為訓(xùn)練中。此時(shí),您可點(diǎn)擊訓(xùn)練任務(wù)的查看操作進(jìn)入訓(xùn)練詳情頁(yè),瀏覽訓(xùn)練任務(wù)的配置和訓(xùn)練的過(guò)程指標(biāo)。您可以點(diǎn)擊查看預(yù)估來(lái)瀏覽本次訓(xùn)練任務(wù)預(yù)估的計(jì)費(fèi)信息。您也可以隨時(shí)點(diǎn)擊終止訓(xùn)練來(lái)結(jié)束訓(xùn)練任務(wù)。

訓(xùn)練過(guò)程指標(biāo)主要有以下三個(gè),大致體現(xiàn)了模型的訓(xùn)練效果。如果您不了解這些指標(biāo)的含義,也可以等待訓(xùn)練結(jié)束后,使用阿里云百煉的模型評(píng)測(cè)工具評(píng)價(jià)訓(xùn)練效果。

指標(biāo)

解釋

Training Loss

Training Loss 代表針對(duì)訓(xùn)練數(shù)據(jù)學(xué)習(xí)的擬合程度,曲線一般呈現(xiàn)下降趨勢(shì)。Loss越小,表示訓(xùn)練數(shù)據(jù)擬合程度越高。過(guò)小的Loss易導(dǎo)致數(shù)據(jù)過(guò)擬合,需要根據(jù)實(shí)際訓(xùn)練過(guò)程進(jìn)行判斷。

Validation Loss

Validation Loss代表針對(duì)驗(yàn)證集學(xué)習(xí)的擬合程度,曲線一般呈現(xiàn)先下降后上升趨勢(shì)。Loss越小,表示驗(yàn)證數(shù)據(jù)擬合程度越高。優(yōu)秀的模型效果往往出現(xiàn)Validation Loss的最小值節(jié)點(diǎn),此時(shí)擬合程度最佳,訓(xùn)練效果最好。

Validation Token Accuracy

Validation Token Acc代表針對(duì)驗(yàn)證集學(xué)習(xí)的準(zhǔn)確程度,曲線一般呈現(xiàn)上升趨勢(shì)。訓(xùn)練過(guò)擬合后,該曲線會(huì)呈現(xiàn)下降趨勢(shì)。優(yōu)秀的模型效果往往出現(xiàn)在Validation Token Acc的最大值節(jié)點(diǎn),此時(shí)預(yù)測(cè)準(zhǔn)確率最高,訓(xùn)練效果最好。

一般情況下,千條以下的數(shù)據(jù)訓(xùn)練所需的時(shí)長(zhǎng)為2-3個(gè)小時(shí)。由于平臺(tái)承載能力有限,可能出現(xiàn)排隊(duì)狀態(tài),還請(qǐng)您諒解。訓(xùn)練任務(wù)完成后,列表及詳情頁(yè)中模型的狀態(tài)將變更為訓(xùn)練成功,此時(shí)您已經(jīng)獲得自定義模型,該模型已處于等待部署狀態(tài),您可以直接點(diǎn)擊模型部署跳轉(zhuǎn)到部署頁(yè)面。

模型部署

待您獲得自定義模型后,您需要將該模型部署到計(jì)算資源上,方可調(diào)用該模型。

阿里云百煉提供了多種資源配置方式,您可以按需選擇。如果需要評(píng)測(cè)模型的訓(xùn)練效果,您需要先部署自定義模型,再使用模型評(píng)測(cè)評(píng)估自定義模型的訓(xùn)練效果。

新建部署任務(wù)

  1. 登錄阿里云百煉控制臺(tái),在左側(cè)導(dǎo)航欄中,選擇模型工具 > 模型部署。您也可以在模型工具 > 模型訓(xùn)練中等待模型訓(xùn)練結(jié)束后,直接點(diǎn)擊模型部署。這里展示了所有模型部署任務(wù)。

  2. 點(diǎn)擊部署新模型,您將跟隨向?qū)У闹敢瓿刹渴鹋渲茫?/p>

    1. 選擇模型:阿里云百煉提供了兩類可部署的模型,此處請(qǐng)您選擇之前訓(xùn)練的自定義模型。

    2. 選擇資源配置:阿里云百煉提供了兩類資源配置方式。包月資源是按月購(gòu)買計(jì)算資源的方式,不同版本的包月資源在部署模型的能力上有差別。按量付費(fèi)是按實(shí)際使用時(shí)長(zhǎng)購(gòu)買計(jì)算資源的方式,您可以按需購(gòu)買一定數(shù)量的計(jì)算資源,也可以隨后變更計(jì)算資源的數(shù)量。為完成后續(xù)的模型評(píng)測(cè),對(duì)訓(xùn)練效果做進(jìn)一步評(píng)估,此處推薦您選擇按量付費(fèi)。

    3. 開(kāi)始部署:這一步將展示您的所有部署配置和預(yù)估費(fèi)用,待您確認(rèn)所有信息后即可開(kāi)始部署。

  3. 開(kāi)始部署后,您可以在模型部署列表中查看模型的部署進(jìn)度、預(yù)估費(fèi)用和其他管理操作。有關(guān)部署費(fèi)用的詳細(xì)信息,請(qǐng)參考產(chǎn)品計(jì)費(fèi)。

一般情況下,模型部署時(shí)長(zhǎng)在幾十分鐘到幾個(gè)小時(shí)不等,由于阿里云百煉資源限制,部署可能會(huì)產(chǎn)生隊(duì)列,部署完成后,狀態(tài)將變?yōu)檫\(yùn)行中,運(yùn)行中的模型可被調(diào)用,用于模型評(píng)測(cè)及應(yīng)用調(diào)用。

說(shuō)明

小貼士:實(shí)例管理與性能優(yōu)化

什么是實(shí)例:

  • 簡(jiǎn)單定義:實(shí)例是運(yùn)行模型和處理請(qǐng)求的獨(dú)立計(jì)算單元,通常對(duì)應(yīng)一臺(tái)服務(wù)器、一塊GPU,或在容器化環(huán)境中對(duì)應(yīng)一個(gè)容器。

  • 實(shí)例用途:實(shí)例用于將模型加載到內(nèi)存中,接受用戶請(qǐng)求,執(zhí)行推理任務(wù)(如文本生成、分類等),并返回結(jié)果。

實(shí)例數(shù)量對(duì)性能的影響:

  • 響應(yīng)時(shí)間:增加實(shí)例數(shù)量能有效分擔(dān)負(fù)載,降低每個(gè)實(shí)例處理請(qǐng)求的時(shí)間,提高整體響應(yīng)速度。

  • 并發(fā)處理:更多實(shí)例可以并行處理更多請(qǐng)求,提高系統(tǒng)的并發(fā)處理能力。

  • 成本效益:增加實(shí)例數(shù)量能提高性能和用戶體驗(yàn),但成本可能增加,需要權(quán)衡。

管理部署任務(wù)

待您啟動(dòng)部署后,您新建的模型部署任務(wù)將出現(xiàn)在模型部署的列表里,其部署狀態(tài)將變更為部署中。此時(shí),您可點(diǎn)擊部署任務(wù)的查看操作瀏覽部署任務(wù)的配置。您可以點(diǎn)擊擴(kuò)縮容來(lái)變更計(jì)算資源的用量。您也可以隨時(shí)點(diǎn)擊下線來(lái)結(jié)束部署任務(wù)。

待部署完成后,其部署狀態(tài)將變更為運(yùn)行中。此時(shí)您訓(xùn)練的自定義模型已經(jīng)具備了推理調(diào)用的能力。您可以點(diǎn)擊去體驗(yàn),在模型體驗(yàn)頁(yè)面測(cè)試您的自定義模型推理效果。此時(shí),您可以使用模型評(píng)測(cè)對(duì)自定義模型的效果做評(píng)估。

模型評(píng)測(cè)

完成模型部署后,如需測(cè)試模型的效果,可在模型評(píng)測(cè)中進(jìn)行評(píng)測(cè)。對(duì)于本篇介紹的自定義模型,阿里云百煉提供了基線評(píng)測(cè)方法。基線評(píng)測(cè)預(yù)置多種常用的能力評(píng)測(cè)集及評(píng)測(cè)腳本,可自動(dòng)評(píng)測(cè)模型多種基本能力。

新建評(píng)測(cè)任務(wù)

  1. 登錄阿里云百煉控制臺(tái),在左側(cè)導(dǎo)航欄中,選擇模型工具 > 模型評(píng)測(cè)。這里展示了所有模型評(píng)測(cè)任務(wù)。

  2. 點(diǎn)擊創(chuàng)建評(píng)測(cè)任務(wù),您將遵循向?qū)瓿稍u(píng)測(cè)任務(wù)的配置:

    1. 評(píng)測(cè)方式:阿里云百煉提供了多種評(píng)測(cè)方式。對(duì)于自定義模型,請(qǐng)您選擇基線評(píng)測(cè)。

    2. 選擇模型:請(qǐng)?jiān)谙吕蛑羞x擇已部署的目標(biāo)評(píng)測(cè)模型。

    3. 選擇評(píng)測(cè)數(shù)據(jù):阿里云百煉預(yù)置了基線評(píng)測(cè)集(包括C-Eval/CMMLU等主流榜單評(píng)測(cè)集)對(duì)待測(cè)模型的各項(xiàng)基礎(chǔ)通用能力進(jìn)行自動(dòng)評(píng)測(cè)。您可以任選評(píng)測(cè)數(shù)據(jù),以此構(gòu)建您的所有評(píng)測(cè)數(shù)據(jù)。

    4. 開(kāi)始評(píng)測(cè):這一步將展示您的所有評(píng)測(cè)配置和預(yù)估費(fèi)用,待您確認(rèn)所有信息后即可開(kāi)始評(píng)測(cè)。

  3. 開(kāi)始評(píng)測(cè)后,您可以在模型評(píng)測(cè)列表中查看模型的評(píng)測(cè)進(jìn)度、預(yù)估費(fèi)用和其他管理操作。有關(guān)評(píng)測(cè)費(fèi)用的詳細(xì)信息,請(qǐng)參考產(chǎn)品計(jì)費(fèi)。

管理評(píng)測(cè)任務(wù)

當(dāng)評(píng)測(cè)開(kāi)始后,該評(píng)測(cè)任務(wù)的狀態(tài)將變更為執(zhí)行中隊(duì)列中,您可以隨時(shí)點(diǎn)擊中止來(lái)結(jié)束評(píng)測(cè)。待評(píng)測(cè)完成后,您可以點(diǎn)擊結(jié)果查看詳細(xì)的評(píng)測(cè)結(jié)果。您可以點(diǎn)擊刪除刪去一項(xiàng)評(píng)測(cè)任務(wù)。

后續(xù)操作

至此,本篇已經(jīng)介紹了自定義模型調(diào)優(yōu)、部署與評(píng)測(cè)的全生命周期管理。閱讀完本篇后,您可以自行創(chuàng)建一個(gè)自定義模型,并能夠在業(yè)務(wù)場(chǎng)景中調(diào)用該自定義模型。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多