架構(gòu)名稱 | 核心原理 | 優(yōu)點(diǎn) | 缺點(diǎn) | 適應(yīng)場(chǎng)景 |
Naive RAG | 基于文檔分塊,通過(guò)檢索機(jī)制獲取相關(guān)內(nèi)容,直接將結(jié)果輸入生成模型生成答案。 >> 文本分塊、檢索機(jī)制、生成模型 | 簡(jiǎn)單易實(shí)現(xiàn),計(jì)算成本低。 | 容易出現(xiàn)事實(shí)錯(cuò)誤或語(yǔ)義不一致,無(wú)法處理復(fù)雜的上下文管理任務(wù)。 | 基礎(chǔ)的問(wèn)答任務(wù),對(duì)精度要求不高,數(shù)據(jù)量較小的情況。 |
Retrieve-and-rerank | 在基礎(chǔ)RAG上新增重排序模塊,對(duì)檢索結(jié)果重新排序優(yōu)化其相關(guān)性,確保生成模型輸入更加相關(guān)的上下文信息。 >> 初步檢索、重排序模型、生成模型 | 可以提高檢索結(jié)果的準(zhǔn)確性,減少噪聲數(shù)據(jù)的影響。 | 計(jì)算成本相對(duì)較高,需要設(shè)計(jì)有效的重排序算法。 | 高精度問(wèn)答,如法律文檔、技術(shù)文檔的精準(zhǔn)查詢和回答。 |
Multimodal RAG | 支持多模態(tài)輸入(文本、圖像、視頻等),利用多模態(tài)嵌入和生成模型進(jìn)行檢索和生成。 >> 文本與圖像處理、模態(tài)融合 | 能夠處理和理解多模態(tài)數(shù)據(jù),適配能力強(qiáng),可提高生成結(jié)果的準(zhǔn)確性和豐富性。 | 實(shí)現(xiàn)復(fù)雜,計(jì)算成本高,需要大量的多模態(tài)數(shù)據(jù)。 | 涉及圖片、視頻等多模態(tài)數(shù)據(jù)的問(wèn)答,如電商推薦、圖像描述生成、視頻問(wèn)答。 |
Graph RAG | 將文檔表示為圖結(jié)構(gòu)(圖數(shù)據(jù)庫(kù)),通過(guò)圖節(jié)點(diǎn)和邊(圖神經(jīng)網(wǎng)絡(luò))的關(guān)聯(lián)挖掘文檔之間的語(yǔ)義和邏輯關(guān)系,強(qiáng)化上下文關(guān)系理解。 >> 圖數(shù)據(jù)庫(kù)、知識(shí)圖譜、語(yǔ)義關(guān)聯(lián) | 可以有效地捕捉文檔之間的關(guān)聯(lián)關(guān)系,提高檢索結(jié)果的準(zhǔn)確性。 | 需要構(gòu)建和維護(hù)圖數(shù)據(jù)庫(kù),計(jì)算成本相對(duì)較高。 | 需要處理文檔之間關(guān)系的任務(wù),例如知識(shí)圖譜問(wèn)答、復(fù)雜關(guān)系推理(如醫(yī)學(xué)或科研領(lǐng)域)。適用于知識(shí)推理場(chǎng)景。 |
Hybrid RAG | 結(jié)合多種檢索策略(例如關(guān)鍵詞檢索、語(yǔ)義向量檢索等)進(jìn)行檢索和生成。 >> 圖結(jié)構(gòu)、傳統(tǒng)檢索、知識(shí)融合 | 可以提高檢索結(jié)果的多樣性和覆蓋率。 | 實(shí)現(xiàn)復(fù)雜,需要協(xié)調(diào)多種檢索方法。 | 需要同時(shí)考慮多種檢索策略才能更好地滿足需求的場(chǎng)景。 |
Agentic RAG (Router) | 利用路由機(jī)制,根據(jù)查詢動(dòng)態(tài)選擇檢索源和生成模型,針對(duì)性地生成響應(yīng)。 >> AI Agent、智能路由、資源選擇 | 動(dòng)態(tài)選擇能力強(qiáng),資源利用效率高,能夠應(yīng)對(duì)多變的任務(wù)需求。 | 路由策略設(shè)計(jì)較復(fù)雜,對(duì)任務(wù)分類準(zhǔn)確性依賴高。 | 多數(shù)據(jù)源、多任務(wù)類型場(chǎng)景,如需要跨API、數(shù)據(jù)庫(kù)和生成模型的集成應(yīng)用。 |
Agentic RAG (Multi-Agent) | 利用多個(gè)AI Agent分別負(fù)責(zé)不同的檢索任務(wù)或數(shù)據(jù)源,多代理協(xié)作,每個(gè)代理專注于不同的數(shù)據(jù)源或任務(wù)(如搜索引擎、企業(yè)應(yīng)用、郵件系統(tǒng)等,然后將結(jié)果整合到一起生成答案。 >> 多智能體、任務(wù)分配、工具協(xié)作 | 高度模塊化,強(qiáng)大的并行處理多個(gè)檢索任務(wù),適應(yīng)性極高,高效率。 | 代理之間的協(xié)調(diào)較復(fù)雜,對(duì)系統(tǒng)設(shè)計(jì)和通信機(jī)制要求高。 | 超復(fù)雜的大規(guī)模任務(wù),需要多個(gè)代理協(xié)同完成的場(chǎng)景,例如多輪對(duì)話、復(fù)雜推理等。 |