RAG實(shí)踐篇(三):向量檢索的AI應(yīng)用,讓知識“活起來”

0 評論 1707 瀏覽 5 收藏 9 分鐘

向量檢索技術(shù)正在成為RAG智能問答的“隱形功臣”,讓很多企業(yè)/專業(yè)領(lǐng)域繁復(fù)龐大的知識庫真正“活起來”,而作為產(chǎn)品經(jīng)理,理解他的“有效”和“有限性”,能真正地將這個檢索技術(shù)為產(chǎn)品所用。

產(chǎn)品經(jīng)理小明收到一家大型科技公司的RAG項(xiàng)目需求:要構(gòu)建一個用于員工QA的智能chatbot產(chǎn)品。

公司希望這個產(chǎn)品既能回答常見的、標(biāo)準(zhǔn)的公司政策問題(如“如何申請出差津貼”、“公司的年假福利是什么樣的?”),同時又能應(yīng)對各類復(fù)雜的、非標(biāo)準(zhǔn)化問題(如“跨團(tuán)隊(duì)合作的最佳實(shí)踐是什么?”)。

作為產(chǎn)品經(jīng)理,小明與開發(fā)討論起技術(shù)實(shí)現(xiàn)。

開發(fā)摸著下巴,若有所思:“標(biāo)準(zhǔn)化問題還好說,但如果問題復(fù)雜,還是非標(biāo)準(zhǔn)化的。需要模型有更強(qiáng)的語義檢索能力,可以在知識庫里找到最合適用戶的答案。咱們就用向量檢索技術(shù)來做吧?!?/p>

聊到這里,小明也不免好奇,向量技術(shù)究竟是什么?它在RAG的實(shí)踐中起到什么作用?

這篇文章會介紹向量技術(shù)在RAG中的應(yīng)用,其核心概念、實(shí)踐流程以及在產(chǎn)品中的具體應(yīng)用場景。

一、向量:讓“文本”可以被計(jì)算

在機(jī)器學(xué)習(xí)領(lǐng)域,向量是一組用數(shù)字表示的數(shù)學(xué)對象,通常用于描述一個文本、圖像或其他數(shù)據(jù)的語義特征。這些數(shù)字是從深度學(xué)習(xí)模型中提取的,能夠捕捉文本或數(shù)據(jù)的含義,并用這種形式來表示語義關(guān)系。

你可以把“向量”想象成一個坐標(biāo)點(diǎn),處于一個高維空間中(比如3維空間、100維空間甚至更高)。在這個空間中,語義相似的內(nèi)容會靠得更近,而語義差異大的內(nèi)容則會距離更遠(yuǎn)。

例如,“如何申請年假?” 和 “怎么請假?”這兩個問題的表達(dá)方式是不同的,但語義非常接近。如果用向量表示,它們會被映射到一個高維向量空間中相鄰的區(qū)域,從而使得計(jì)算機(jī)知道它們含義相近。而“公司年假政策是什么?”和“跨團(tuán)隊(duì)合作的最佳實(shí)踐是什么?”,雖然語法結(jié)構(gòu)有點(diǎn)相似,但含義天差地別,在向量空間中會有較遠(yuǎn)的距離。

二、在RAG里的應(yīng)用

RAG主要通過“檢索 + 生成”兩個階段結(jié)合來處理復(fù)雜的問題,簡單來說,它的步驟可以概括為:

  1. 問題理解(Query Understanding) 用戶輸入問題后,系統(tǒng)首先通過自然語言處理模型將問題轉(zhuǎn)化為模型可理解的形式。
  2. 知識檢索(Knowledge Retrieval) RAG會利用檢索技術(shù)(如向量檢索或傳統(tǒng)關(guān)鍵詞檢索)從知識庫中提取與問題語義相關(guān)的內(nèi)容。
  3. 內(nèi)容生成(Answer Generation) RAG通過生成式AI模型(如GPT-4、Claude)將檢索到的內(nèi)容與用戶問題結(jié)合,生成自然語言回答。
  4. 答案輸出(Response Output) 最終生成的回答會以用戶可以理解的形式輸出。

由此可以看到,向量技術(shù)是語義檢索的核心。RAG需要從一個龐大的知識庫中找到與用戶問題最相關(guān)的內(nèi)容,然后再將這些內(nèi)容傳遞給模型進(jìn)行回答。而向量的作用是把用戶的問題知識庫內(nèi)容都轉(zhuǎn)化為高維語義向量,并通過數(shù)學(xué)方法找到兩者之間的距離。

具體應(yīng)用:

  • 向量化過程: 用戶輸入問題“年假如何申請?” → 轉(zhuǎn)化為向量 V1 知識庫中存儲的文本片段“年假申請流程:登錄HR系統(tǒng)申請” → 轉(zhuǎn)化為向量 V2 向量檢索通過計(jì)算 V1 和 V2 的距離,判斷它們的語義是否相關(guān),距離越近,匹配度越高。
  • 實(shí)際輸出: RAG通過向量檢索找到匹配的內(nèi)容后,將這段知識傳遞給生成模型,生成回答:“請登錄HR系統(tǒng),通過‘請假申請’模塊提交年假申請?!?/li>

三、亮點(diǎn)和局限

作為AI產(chǎn)品經(jīng)理,了解向量檢索的“能做什么”和“不能做什么”也很重要。

亮點(diǎn)

向量檢索的最大亮點(diǎn)是可以理解用戶輸入中的語義。要知道在傳統(tǒng)的關(guān)鍵詞檢索中,對復(fù)雜句式或詞語變形無法很好的處理。而向量檢索可以通過語義相似性輕松解決,比如用戶提問“我想請年假應(yīng)該怎么做?”,系統(tǒng)也能準(zhǔn)確理解,并返回相關(guān)內(nèi)容。

也正因此,它能更加游刃有余地處理非結(jié)構(gòu)化數(shù)據(jù),比如長文本、對話記錄等。而在企業(yè)的知識庫中,知識信息往往都是以文檔或長段落的形式存儲的。通過向量檢索,就可以將這些復(fù)雜內(nèi)容進(jìn)行語義分割,檢索出與用戶問題相關(guān)的段落。比如,當(dāng)一個員工想知道“跨部門協(xié)作有哪些最佳實(shí)踐?”時,系統(tǒng)可以直接從企業(yè)的管理文檔中把“跨部門協(xié)作”的有關(guān)段落提取出來就能回答。

局限

向量檢索的本質(zhì)是基于“相似度”的匹配,但相似度高并不等于答案相關(guān)性高。比如,用戶提了問題“年假申請需要哪些材料?”,由于知識庫里并沒有“年假申請材料”的相關(guān)知識。模型可能就會提供提供一段“年假政策”的內(nèi)容,因?yàn)檫@是它所能檢索到的“相似度”系數(shù)最高的內(nèi)容了。像這種“語義相似度高但不正確”的情況,就會影響用戶體驗(yàn)。

另外,由于向量檢索是基于語義相似度的匹配。而用戶的問題是橫跨多個領(lǐng)域或者多個主題的時候,語義的向量分布就比較“稀疏”。比如用戶提問“AI在醫(yī)療和教育中的應(yīng)用區(qū)別是什么?”。向量的相似度檢索可能只能找到“AI與醫(yī)療”或“AI與教育”單獨(dú)相關(guān)的內(nèi)容,但難以整合兩者的區(qū)別進(jìn)行回答。結(jié)果它就只會返回到單一行業(yè)進(jìn)行回答,而忽略問題的整體意圖。

結(jié)語

總體來說,向量檢索正在成為RAG智能問答的“隱形功臣”,讓很多企業(yè)/專業(yè)領(lǐng)域繁復(fù)龐大的知識庫真正“活起來”,而作為產(chǎn)品經(jīng)理,理解他的“有效”和“有限性”,能真正地將這個檢索技術(shù)為產(chǎn)品所用。

本文由 @AI 實(shí)踐干貨 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!