日韩欧美亚洲另类在线第十页,久久精品国产精品亚洲综合

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

發(fā)布

注冊 | 登錄

RAG-大模型的知識庫「外掛」｜兼?zhèn)涑杀九c效益的行業(yè)解決方案

2024-03-25

0 評論 5754 瀏覽 22 收藏

🔗 B端产品经理需要进行售前演示、方案定制、合同签订等，而C端产品经理需要进行活动策划、内容运营、用户激励等

RAG-檢索增強生成技術(shù)已經(jīng)可以看作是大語言模型應(yīng)用的核心技術(shù)之一，怎么理解RAG這項技術(shù)的價值和局限性呢？這篇文章里，作者做了梳理和總結(jié)，一起來看一下。

Hi，見字如面。

今天我們來聊一聊RAG-檢索增強生成這項技術(shù)應(yīng)用。

想象一下，如果大語言模型（LLM）能夠接入一個實時更新的知識庫，那它會給我們帶來一個什么樣的體驗？

當(dāng)它與醫(yī)療數(shù)據(jù)庫結(jié)合時，LLM成為醫(yī)生和護士的AI伙伴，可隨時提供精準(zhǔn)的診斷建議和患者的護理方案。
當(dāng)它與市場數(shù)據(jù)結(jié)合時，LLM成為金融分析師的虛擬助理，輔助分析市場走勢，并提出明智的投資策略。
當(dāng)它與企業(yè)知識庫結(jié)合時，LLM轉(zhuǎn)變?yōu)槠髽I(yè)的全方位AI助理，從自動化客戶服務(wù)到員工培訓(xùn)，再到銷售策略和市場洞察，助力企業(yè)實現(xiàn)智能化運營。

檢索增強生成（RAG，Retrieval-Augmented Generation）；

這項技術(shù)已經(jīng)被視為大語言模型應(yīng)用的核心技術(shù)之一，它有效地解決了大語言模型中誤導(dǎo)性的輸出問題、缺乏知識時效性的問題、以及特定領(lǐng)域?qū)I(yè)知識不足的問題。

一、什么是RAG？

簡單的說RAG就是給大語言模型外掛一個“實時可更新的知識庫”，是一種使用外部數(shù)據(jù)來提高LLM的準(zhǔn)確性和可靠性的技術(shù)。

B端究竟需要什么样的产品经理？

B端产品经理都是以提升供应侧的工作效率为目的，所以B端需求主要是以业务问题为导向。这个是B端产品比较重要的一点，B端产品是服务于一个主体 ...

要實現(xiàn)RAG的過程，一共可分為三步：

第一步：準(zhǔn)備數(shù)據(jù)

我們需要準(zhǔn)備好知識庫中所需要的文檔數(shù)據(jù)，并且將這些數(shù)據(jù)上傳至知識庫中。

此時，上傳的數(shù)據(jù)會由「嵌入模型-Embedding Model」進行向量化的處理，這個過程就是將文本內(nèi)容轉(zhuǎn)化為計算機理解的語言。

轉(zhuǎn)換后，再存儲在一個特定的數(shù)據(jù)庫中，這個數(shù)據(jù)庫通常被稱之為「向量數(shù)據(jù)庫-Vector Database」。

第二步：將用戶輸入的信息與知識庫的文檔進行匹配

用戶輸入一段文本時，這段文本也會被「嵌入模型」進行向量化處理；

然后計算機將用戶輸入的內(nèi)容與向量數(shù)據(jù)庫中的內(nèi)容進行【相似匹配】，從而找到數(shù)據(jù)庫中最相關(guān)的文檔內(nèi)容。

在匹配的過程中有一些優(yōu)化的技術(shù)方式，常見的就是ANN，近似最鄰近搜索（Approximate Nearest Neighbor, ANN）。

第三步：匯總信息與生成內(nèi)容

將匹配到的信息與用戶輸入的信息結(jié)合（這里涉及到一些預(yù)處理的過程，比如讓模型能夠區(qū)分哪些是用戶輸入的信息，哪些是檢索到的知識）；再將處理后的信息輸入給模型生成一個綜合回答。

輸出的內(nèi)容不僅包括文本，還附有相關(guān)的引用來源。

二、RAG的優(yōu)勢與局限

現(xiàn)在，你應(yīng)該對RAG的核心工作原理有了清晰地理解；接下來，讓我們進一步探討RAG的優(yōu)勢與局限。

優(yōu)勢方面，可以總結(jié)為以下四大優(yōu)勢：

1. 成本低且效益高

由于RAG技術(shù)是通過檢索現(xiàn)有的知識庫來增強模型的回復(fù)質(zhì)量，因此無需對模型（LLM）進行重新訓(xùn)練，就能夠提升模型的輸出質(zhì)量。

2. 增強模型輸出的可信度

RAG生成的回答可以附帶對應(yīng)的引用來源，用戶可以輕松驗證模型回答的準(zhǔn)確性，從而增加對模型輸出的信任。

3. 增強模型輸出的準(zhǔn)確性和專業(yè)性

通過檢索知識庫中的信息，可以有效減少模型作出錯誤判斷的可能性，并利用特定的知識和提示（Prompt)，可以滿足不同行業(yè)或用戶的定制需求。

4. 始終訪問最新的數(shù)據(jù)

知識庫可以實時更新，便于模型調(diào)用最新的信息和數(shù)據(jù)。這對于需要實時獲取最新信息的領(lǐng)域尤為重要，如教育、醫(yī)療和金融領(lǐng)域。

5. 最后敲個黑板

RAG技術(shù)雖然有以上顯著的優(yōu)勢，但它不是萬能的，只是錦上添花的一種手段，因為它主要是優(yōu)化了模型的輸入過程，通過豐富輸入信息的方式，來增強模型的輸出質(zhì)量。

但這項技術(shù)并不改變模型本身的推理能力，不會改變模型任何的參數(shù)。

如果模型本身的參數(shù)不足、在理解和推理上存在固有缺陷，單純用RAG技術(shù)也無法提高模型的輸出能力。

三、最后的話

這篇文章我們探討了RAG的技術(shù)原理、優(yōu)勢和其局限性，希望對你有所幫助和啟發(fā)。如果你有任何想法、疑問或者想要分享的經(jīng)驗，請隨時留言交流。

祝你在AI應(yīng)用的探索之路上充滿收獲和進步。

我是在野，歡迎關(guān)注，咱們下篇再見??

參考資料

《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》
《什么是檢索增強生成？》 from：NVIDIA-Blog

作者：在野在也，公眾號：在野在也

本文由 @在野在也原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于CC0協(xié)議

該文觀點僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App

分享偏見，終身成長同名公眾號&bilibili：在野在也

8篇作品 41064總閱讀量

?時代變了，電商產(chǎn)品經(jīng)理的能力模型也發(fā)生了變化，你跟上了么?

09-211166 瀏覽

?時代變了，電商產(chǎn)品經(jīng)理的能力模型也發(fā)生了變化，你跟上了么?

拼多多千萬美金砸給「美國春晚」，值得嗎？

02-142433 瀏覽

拼多多千萬美金砸給「美國春晚」，值得嗎？

B端产品设计思路：如何平衡大量客户需求

刚刚

為什么90%的人，都做不好管理

03-063985 瀏覽

為什么90%的人，都做不好管理

出海人，2023怎么活？

01-102837 瀏覽

出海人，2023怎么活？

抖音10大熱門變現(xiàn)項目，哪個適合你？

07-2610214 瀏覽

抖音10大熱門變現(xiàn)項目，哪個適合你？

評論

目前還沒評論，等你發(fā)揮！

小公司，无人指导，我如何通过自我学习掌握业务？

提升用戶感受與體驗，從品牌設(shè)定開始

02-214275 瀏覽
變化？解法？實踐？全渠道消費者數(shù)字化經(jīng)營二三事

09-261111 瀏覽
我做了14年的運營！才明白的全平臺“對標(biāo)賬號”尋找技巧和分析方法！首次無保留全公開！

10-1111047 瀏覽

18973人已学习13篇文章

社区运营该怎么做？

本专题的文章分享了社区运营的正确姿势。

12583人已学习15篇文章

浅谈互联网医疗

互联网医疗是医疗行业与互联网的综合应用，其以互联网及相关技术为载体和支撑，开展线下传统或线上衍生的医疗健康服务。本专题的文章分享了对互联网医疗的分析和见解。

12811人已学习13篇文章

仪表盘设计指南

通过仪表盘，用户可以查看并分析产品的数据和图表，还可以通过控件来控制数据的显示、过滤等功能。本专题的文章分享了仪表盘设计指南。

101777人已学习23篇文章

APP运营推广实操指南

做产品难，做运营更难，做APP运营推广难上加难。

52477人已学习14篇文章

产品思维那些事儿

现在业内很多人都强调产品思维，但它到底是什么？又有何用武之地呢？

37707人已学习13篇文章

论产品经理如何做市场调研

市场调研是帮助他们更好地了解自己、了解用户、了解市场。