RAG可以用來做什么?——AIGC催生的產(chǎn)物

0 評(píng)論 931 瀏覽 1 收藏 8 分鐘

2020年,RAG的概念被提出;然后2022年ChatGPT之類的大模型開始興起,RAG在知道大模型的生成上起到了不小的作用。這篇文章,我們來了解下RAG的基本原理和使用場景。

AIGC爆火以后,應(yīng)運(yùn)而生的RAG到底都是什么?為什么會(huì)有這些產(chǎn)物呢?

拿大語言模型舉例來說,自身的能力很強(qiáng)大,但也存在一定的弊端,比如輸出的內(nèi)容太空太泛、輸出的內(nèi)容格式不符合預(yù)期、數(shù)據(jù)過時(shí)、在專業(yè)領(lǐng)域問題胡編亂造等情況,為了克服以上問題,第一種方式是微調(diào),不過生成模型依賴內(nèi)在知識(shí),即使做了微調(diào),還是無法解決幻覺問題。此外,實(shí)際場景中,信息、政策、數(shù)據(jù)實(shí)時(shí)都在更新,除非對(duì)模型進(jìn)行高頻的微調(diào),否則模型的訓(xùn)練速度永遠(yuǎn)趕不上外部信息更新的速度,而高頻微調(diào)成本就太高了。

在2020年,檢索增強(qiáng)生成RAG(Retrieval-Augmented Generation)的方法被提出,其主要作用類似搜索引擎,利用外部知識(shí)庫,找到與用戶提問最相關(guān)的知識(shí)或歷史對(duì)話,結(jié)合原始問題,創(chuàng)造信息豐富的Prompt,指導(dǎo)大模型(LLM)生成更準(zhǔn)確的輸出。

一、定義

是結(jié)合了檢索技術(shù)與生成式人工智能的技術(shù)框架,旨在利用外部知識(shí)增強(qiáng)模型的回答準(zhǔn)確性和上下文相關(guān)性。適用于需要高準(zhǔn)確性、領(lǐng)域知識(shí)和動(dòng)態(tài)信息的場景。

二、解決的問題

1. 知識(shí)更新不及時(shí)

數(shù)據(jù)過時(shí),對(duì)于大模型訓(xùn)練完成之后發(fā)生的最新事情,大模型難以給出答案。

2. 容易產(chǎn)生幻覺

如捏造事實(shí)、不按用戶指令生成回答。

出現(xiàn)幻覺的原因:訓(xùn)練知識(shí)的偏差(海量數(shù)據(jù)源中含錯(cuò)誤信息)、過度泛化的推理(把普通的模式推理用到了某些特定場景,以偏概全)、理解存在局限性(問題太難,在一些需要深入理解與復(fù)雜推理的任務(wù)重可能出錯(cuò))、缺乏專業(yè)領(lǐng)域的知識(shí)(沒學(xué)過,瞎編一個(gè)答案 )。

3. 數(shù)據(jù)安全問題

大語言模型沒有企業(yè)內(nèi)部數(shù)據(jù)和用戶數(shù)據(jù),如內(nèi)部數(shù)據(jù)上傳至云端進(jìn)行存儲(chǔ)和處理,就可能存在數(shù)據(jù)泄露的風(fēng)險(xiǎn),RAG就不需要將自有數(shù)據(jù)上傳至云端。

三、RAG基本原理

1.RAG原理如下圖:

基本流程步驟:知識(shí)庫準(zhǔn)備、嵌入模型、存入向量數(shù)據(jù)庫、查詢檢索、生成回答。

第一步:文檔分塊

知識(shí)庫可以是任意文本或集合,文檔內(nèi)容可能非常大,需要將長文本切分為多個(gè)小塊/段落進(jìn)行存儲(chǔ),以便高效處理和檢索信息(另外一個(gè)原因是在向量化階段,常見的文本編碼模型如Bert都有最長的文本輸入限制)。需注意分塊的尺寸,若分塊太小,雖然查詢更精準(zhǔn),但所需的召回時(shí)間更長;若分塊太大,則會(huì)影響查詢精準(zhǔn)度。

第二步:嵌入模型

將分塊后的文本轉(zhuǎn)化為向量形式,就能通過簡單的計(jì)算向量之間的差異性,來識(shí)別語義上相近的句子。

第三步:存入向量數(shù)據(jù)庫

將嵌入模型生成的向量數(shù)據(jù)存儲(chǔ)至向量數(shù)據(jù)庫。其優(yōu)勢主要是能根據(jù)數(shù)據(jù)向量的相似度,快速定位、檢索數(shù)據(jù),實(shí)現(xiàn)很多傳統(tǒng)數(shù)據(jù)庫無法實(shí)現(xiàn)的功能,如在電影中搜索浪漫的片段。

第四步:用戶查詢、檢索

用戶輸入的問題會(huì)被輸入到嵌入模型中,進(jìn)行向量化處理,然后系統(tǒng)會(huì)從向量數(shù)據(jù)庫中搜索與問題向量語義上相近的知識(shí)內(nèi)容或歷史對(duì)話記錄并返回,這就是檢索增強(qiáng)。

第五步:融合、生成回答

將上一步檢索到的相關(guān)內(nèi)容與用戶的提問相融合,構(gòu)建出一個(gè)Prompt(提示詞),將其輸入到大模型(LLM)中,由大模型(LLM)生成最終的結(jié)果并返回。

四、RAG應(yīng)用場景

1.問答系統(tǒng)

RAG根據(jù)檢索到的相關(guān)信息生成準(zhǔn)確答案,幫助人員更快獲取所需信息。如搭建企業(yè)內(nèi)部知識(shí)庫,新員工培訓(xùn)手冊查詢、公司規(guī)章制度查詢等。

2.智能客服系統(tǒng)

RAG可以結(jié)合產(chǎn)品資料知識(shí)庫、聊天記錄、用戶反饋等數(shù)據(jù),自動(dòng)為用戶提供更精準(zhǔn)的回答。

3.個(gè)性化系統(tǒng)推薦

RAG可以檢索用戶的購買記錄、瀏覽行為、個(gè)人偏好等數(shù)據(jù),生成個(gè)性化的產(chǎn)品和服務(wù)推薦,提高用戶滿意度和轉(zhuǎn)化率。

4.智能數(shù)據(jù)分析

RAG可以結(jié)合外部數(shù)據(jù)源,如數(shù)據(jù)庫、API、文件等,為用戶提供更便捷的數(shù)據(jù)分析服務(wù)。傳統(tǒng)企業(yè)的數(shù)據(jù)分析主要靠數(shù)據(jù)分析師,每天需寫大量的SQL語句進(jìn)行查詢,而在RAG支持下,企業(yè)員工能以自然對(duì)話的方式快速獲取數(shù)據(jù)。如門店店長直接用語音對(duì)話,“請(qǐng)幫我找出上周銷量排名前10,但本周銷量下滑最快的品類”,系統(tǒng)即可直接給出結(jié)果。

5.自動(dòng)化文檔處理

利用RAG自動(dòng)化文檔處理流程,如自動(dòng)生成合同、撰寫周報(bào)、總結(jié)會(huì)議紀(jì)要等,節(jié)省時(shí)間與人力成本。

五、一些拓展

1. RAG和知識(shí)圖譜的結(jié)合

以提升數(shù)據(jù)質(zhì)量為前提時(shí):可建立知識(shí)圖譜,來解決。嵌入模型雖然簡單,但無法有效捕捉實(shí)體之間的復(fù)雜關(guān)系和層次結(jié)構(gòu),所以導(dǎo)致傳統(tǒng)RAG在面對(duì)復(fù)雜問題時(shí),特別吃力。如用戶提問“《跨越鴻溝》這本書的主旨是什么”傳統(tǒng)RAG技術(shù)肯定是回答不出來的,但知識(shí)圖譜可以做到,因?yàn)槔弥R(shí)圖譜對(duì)數(shù)據(jù)集建立索引時(shí),會(huì)提取實(shí)體與實(shí)體之間的關(guān)系,這樣就構(gòu)建一種全局性的優(yōu)勢,從而提升RAG的精準(zhǔn)度。

但知識(shí)圖譜雖然強(qiáng)大,可惜成本太高,會(huì)大幅提升Token的消耗。

2. RAG與AI Agent

AI Agent本身和Rag是相輔相成的關(guān)系。Rag系統(tǒng)為AI Agent提供長期記憶能力,而AI Agent的規(guī)劃與反思也會(huì)為Rag系統(tǒng)提供非常好的規(guī)劃管理和路由能力。

Prompt與RAG的分享就到這里了,希望對(duì)你有所幫助,歡迎一起交流學(xué)習(xí)。

本文由 @不知名產(chǎn)品露 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!