AI“幻覺”的類型、原因與應(yīng)對(duì)方法(1/3)——什么是AI“幻覺”

2 評(píng)論 3559 瀏覽 6 收藏 6 分鐘
B端产品经理要负责对目标行业和市场进行深入的分析和调研,了解客户的需求、痛点、期望和行为,找到产品的价值主张 🔗

在使用AI時(shí),總聽人說AI會(huì)有幻覺不可全信,那AI幻覺是什么?為什么不能信任呢?這篇文章,作者給我們分享了這個(gè)問題的答案,希望能幫到大家。

當(dāng)你向一個(gè)AI詢問:“在進(jìn)入火星大氣層的過程中,飛船會(huì)經(jīng)歷什么?”你可能會(huì)得到這樣一個(gè)回答:“飛船會(huì)在進(jìn)入火星稠密的大氣層的過程中經(jīng)歷極高的溫度和壓力。發(fā)動(dòng)機(jī)必須啟動(dòng)減速,熱防護(hù)系統(tǒng)也需要在飛船周圍形成一個(gè)防護(hù)罩,以防止飛船過熱和燒毀?!?/p>

這個(gè)回答咋一看,是不是很有科學(xué)依據(jù)?你是不是就因此而相信了AI的答案?

但其實(shí),這個(gè)回答是錯(cuò)誤的,你碰上了AI的“幻覺”問題。

一、什么是AI“幻覺”

所謂AI“幻覺”(Hallucination),是指AI會(huì)給出看似有理有據(jù),卻全然錯(cuò)誤的回答,也就是我們俗稱的“一本正經(jīng)地胡說八道”(當(dāng)然,AI自己是不知道的)。AI“幻覺”是一種很常見的現(xiàn)象(至少到本文寫作的24年6月時(shí)仍是如此),根據(jù)國(guó)外的一份針對(duì)974位受訪者的調(diào)研報(bào)告指出,高達(dá)72%的人相信AI能提供可靠和真實(shí)的信息,然而,他們中的75%的人至少被AI誤導(dǎo)過一次。

AI“幻覺”有許多種表現(xiàn)形式,以下就是一些常見的AI幻覺類別:

  • 假定各種假設(shè):有時(shí),AI可能會(huì)在試圖解答我們的問題時(shí),基于某些隨機(jī)或與事實(shí)不符的假設(shè)。這種情況下,AI并不是故意要誤導(dǎo)我們,而是因?yàn)樗鼰o法理解真實(shí)的情境,只能靠模擬訓(xùn)練數(shù)據(jù)中的模式來盡力產(chǎn)生看似合理的回答。這種情況下,AI可能會(huì)得出一些無根據(jù)的猜測(cè),就像一個(gè)沒有足夠信息的偵探,只能靠猜測(cè)來填補(bǔ)不足的信息。
  • 對(duì)事實(shí)的過度推斷:AI模型有時(shí)可能會(huì)對(duì)事實(shí)的某個(gè)部分進(jìn)行過度的推斷,夸大自己的理解,進(jìn)而為缺乏足夠明確性或深度的信息添加更多的細(xì)節(jié)。例如,在一個(gè)關(guān)于古羅馬的問答場(chǎng)景中,如果AI模型只知道古羅馬是一個(gè)存在過的文明,它可能會(huì)嘗試通過過度解讀這一信息,生成更具體的、可能并不完全準(zhǔn)確的細(xì)節(jié),比如古羅馬在某一具體日期的具體事件。
  • 無緣無故的信心:或許你也曾經(jīng)遇到過,有時(shí)我們會(huì)問AI一些明顯超出它知識(shí)范圍的問題,但AI仍會(huì)以充滿信心的態(tài)度來回答,而不是選擇保持沉默。這是因?yàn)锳I模型被設(shè)計(jì)為總是盡全力生成回答,無論問題是否超出了它的理解范圍。然而,這種過度的自信往往會(huì)誤導(dǎo)用戶,使他們錯(cuò)誤地認(rèn)為AI對(duì)待問題是無所不知、無所不能的。
  • 無法解答需要實(shí)時(shí)信息的問題:AI大模型采用的是“預(yù)訓(xùn)練”的方式,即一旦模型被訓(xùn)練完成并開始運(yùn)行,它就無法繼續(xù)訪問或了解訓(xùn)練數(shù)據(jù)結(jié)束后產(chǎn)生的信息或知識(shí)。例如,你可能曾問AI今天天氣怎么樣,或者最近有什么大新聞。盡管AI可以閑聊天氣,或者對(duì)新聞進(jìn)行評(píng)論,但由于模型只能訪問到訓(xùn)練數(shù)據(jù),它無法獲取到天氣情況的實(shí)時(shí)更新,也不能獲知訓(xùn)練數(shù)據(jù)之后發(fā)生的新聞事件(要實(shí)現(xiàn)這一能力,只能是給AI配置“搜索”能力)。

以上就是常見的AI“幻覺”類型,那么,這些AI“幻覺”,究竟是如何產(chǎn)生的呢?在下一部分,我們將會(huì)討論,為什么會(huì)產(chǎn)生AI“幻覺”。

(哦對(duì)了,開頭的那個(gè)AI回答,問題出在“火星稠密的大氣層”。實(shí)際上,火星的大氣層并不稠密,這個(gè)說法是錯(cuò)誤的。)

討論話題:你曾經(jīng)碰到過哪些讓你印象深刻的AI“幻覺”?評(píng)論區(qū)里也分享一下吧。

注:由于本文預(yù)設(shè)讀者是AI零基礎(chǔ)人群,期望達(dá)到啟發(fā)作用。因此筆者會(huì)嘗試用盡量淺顯的語言來介紹,而在簡(jiǎn)化某個(gè)概念、原理的過程中,可能會(huì)丟失其完整性。這一點(diǎn)還請(qǐng)讀者注意。

作者:產(chǎn)品經(jīng)理崇生,公眾號(hào):崇生的黑板報(bào)

本文由 @產(chǎn)品經(jīng)理崇生 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自 unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 本系列第三篇《AI“幻覺”的類型、原因與應(yīng)對(duì)方法(3/3)——如何應(yīng)對(duì)AI“幻覺”》已發(fā)布,歡迎朋友們關(guān)注。
    http://www.theventurebank.com/share/6075172.html

    來自廣東 回復(fù)
  2. 本系列第二篇《AI“幻覺”的類型、原因與應(yīng)對(duì)方法(2/3)——為什么會(huì)產(chǎn)生AI“幻覺”》已發(fā)布,歡迎朋友們關(guān)注。
    http://www.theventurebank.com/share/6073096.html

    來自廣東 回復(fù)
专题
12524人已学习15篇文章
互联网医疗是医疗行业与互联网的综合应用,其以互联网及相关技术为载体和支撑,开展线下传统或线上衍生的医疗健康服务。本专题的文章分享了对互联网医疗的分析和见解。
专题
49350人已学习14篇文章
产品经理往往会承担一定的项目管理职能,那么该如何做好项目管理呢?
专题
12835人已学习14篇文章
数字营销有着精准度高、成本较低、效果可量化等优点,很多企业都尝试了数字营销。本专题的文章分享了数字营销的相关内容。
专题
15361人已学习13篇文章
说到“账号”,想必大家对于这个名词已经习以为常。现在市场上的大多数应用,都会有自己的账号体系。本专题的文章分享了如何搭建账号体系。
专题
69469人已学习26篇文章
学会数据化运营能够提升效率,让你的工作事半功倍。
专题
45362人已学习12篇文章
产品经理和运营都要懂一点的推荐算法基础和进阶知识