小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

LLMs之RAG:解讀RAG主流的七類架構(gòu)

 處女座的程序猿 2025-01-01 發(fā)布于上海

LLMs之RAG:解讀RAG主流的七類架構(gòu)


RAG主流的七類架構(gòu)

原文地址:https:///weaviate_io/status/1866528335884325070

2024年12月11日,Weaviate(開(kāi)源向量數(shù)據(jù)庫(kù))在官方社交媒體帖子,發(fā)布了七種最流行的RAG架構(gòu)原理圖。從圖中可以看出,Retrieval-Augmented Generation(RAG)被劃分為多種架構(gòu),每種架構(gòu)在檢索與生成的結(jié)合方式上有所不同,適用于不同的場(chǎng)景需求。這些RAG架構(gòu)的多樣性展示了技術(shù)的發(fā)展趨勢(shì),針對(duì)不同應(yīng)用場(chǎng)景進(jìn)行了優(yōu)化設(shè)計(jì)。從簡(jiǎn)單的檢索生成到復(fù)雜的多模態(tài)、多代理協(xié)作,每種架構(gòu)都有其獨(dú)特的優(yōu)點(diǎn)和適用范圍。博主進(jìn)一步解讀,如下表格所示:

架構(gòu)名稱

核心原理

優(yōu)點(diǎn)

缺點(diǎn)

適應(yīng)場(chǎng)景

Naive RAG

基于文檔分塊,通過(guò)檢索機(jī)制獲取相關(guān)內(nèi)容,直接將結(jié)果輸入生成模型生成答案。

>> 文本分塊、檢索機(jī)制、生成模型

簡(jiǎn)單易實(shí)現(xiàn),計(jì)算成本低。

容易出現(xiàn)事實(shí)錯(cuò)誤或語(yǔ)義不一致,無(wú)法處理復(fù)雜的上下文管理任務(wù)。

基礎(chǔ)的問(wèn)答任務(wù),對(duì)精度要求不高,數(shù)據(jù)量較小的情況。

Retrieve-and-rerank

在基礎(chǔ)RAG上新增重排序模塊,對(duì)檢索結(jié)果重新排序優(yōu)化其相關(guān)性,確保生成模型輸入更加相關(guān)的上下文信息。

>> 初步檢索、重排序模型、生成模型

可以提高檢索結(jié)果的準(zhǔn)確性,減少噪聲數(shù)據(jù)的影響。

計(jì)算成本相對(duì)較高,需要設(shè)計(jì)有效的重排序算法。

高精度問(wèn)答,如法律文檔、技術(shù)文檔的精準(zhǔn)查詢和回答。

Multimodal RAG

支持多模態(tài)輸入(文本、圖像、視頻等),利用多模態(tài)嵌入和生成模型進(jìn)行檢索和生成。

>> 文本與圖像處理、模態(tài)融合

能夠處理和理解多模態(tài)數(shù)據(jù),適配能力強(qiáng),可提高生成結(jié)果的準(zhǔn)確性和豐富性。

實(shí)現(xiàn)復(fù)雜,計(jì)算成本高,需要大量的多模態(tài)數(shù)據(jù)。

涉及圖片、視頻等多模態(tài)數(shù)據(jù)的問(wèn)答,如電商推薦、圖像描述生成、視頻問(wèn)答。

Graph RAG

文檔表示為圖結(jié)構(gòu)(圖數(shù)據(jù)庫(kù)),通過(guò)圖節(jié)點(diǎn)和邊(圖神經(jīng)網(wǎng)絡(luò))的關(guān)聯(lián)挖掘文檔之間的語(yǔ)義和邏輯關(guān)系,強(qiáng)化上下文關(guān)系理解。

>> 圖數(shù)據(jù)庫(kù)、知識(shí)圖譜、語(yǔ)義關(guān)聯(lián)

可以有效地捕捉文檔之間的關(guān)聯(lián)關(guān)系,提高檢索結(jié)果的準(zhǔn)確性。

需要構(gòu)建和維護(hù)圖數(shù)據(jù)庫(kù),計(jì)算成本相對(duì)較高。

需要處理文檔之間關(guān)系的任務(wù),例如知識(shí)圖譜問(wèn)答、復(fù)雜關(guān)系推理(如醫(yī)學(xué)或科研領(lǐng)域)。適用于知識(shí)推理場(chǎng)景。

Hybrid RAG

結(jié)合多種檢索策略(例如關(guān)鍵詞檢索、語(yǔ)義向量檢索等)進(jìn)行檢索和生成。

>> 圖結(jié)構(gòu)、傳統(tǒng)檢索、知識(shí)融合

可以提高檢索結(jié)果的多樣性和覆蓋率。

實(shí)現(xiàn)復(fù)雜,需要協(xié)調(diào)多種檢索方法。

需要同時(shí)考慮多種檢索策略才能更好地滿足需求的場(chǎng)景。

Agentic RAG (Router)

利用路由機(jī)制,根據(jù)查詢動(dòng)態(tài)選擇檢索源和生成模型,針對(duì)性地生成響應(yīng)。

>> AI Agent、智能路由、資源選擇

動(dòng)態(tài)選擇能力強(qiáng),資源利用效率高,能夠應(yīng)對(duì)多變的任務(wù)需求。

路由策略設(shè)計(jì)較復(fù)雜,對(duì)任務(wù)分類準(zhǔn)確性依賴高。

多數(shù)據(jù)源、多任務(wù)類型場(chǎng)景,如需要跨API、數(shù)據(jù)庫(kù)和生成模型的集成應(yīng)用。

Agentic RAG (Multi-Agent)

利用多個(gè)AI Agent分別負(fù)責(zé)不同的檢索任務(wù)或數(shù)據(jù)源,多代理協(xié)作,每個(gè)代理專注于不同的數(shù)據(jù)源或任務(wù)(如搜索引擎、企業(yè)應(yīng)用、郵件系統(tǒng)等,然后將結(jié)果整合到一起生成答案。

>> 多智能體、任務(wù)分配、工具協(xié)作

高度模塊化,強(qiáng)大的并行處理多個(gè)檢索任務(wù),適應(yīng)性極高,高效率。

代理之間的協(xié)調(diào)較復(fù)雜,對(duì)系統(tǒng)設(shè)計(jì)和通信機(jī)制要求高。

超復(fù)雜的大規(guī)模任務(wù),需要多個(gè)代理協(xié)同完成的場(chǎng)景,例如多輪對(duì)話、復(fù)雜推理等。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    該文章已關(guān)閉評(píng)論功能
    類似文章