DeepSeek“胡編亂造”,背刺了誰(shuí)?
從學(xué)術(shù)研究到日常工作,從生活咨詢到文化傳播,AI生成的錯(cuò)誤信息不僅誤導(dǎo)了用戶,還可能引發(fā)更嚴(yán)重的后果。本文將深入探討AI“胡編亂造”現(xiàn)象背后的原因,以及這種現(xiàn)象對(duì)個(gè)人、企業(yè)和整個(gè)社會(huì)可能帶來(lái)的影響,同時(shí)探討如何在享受AI便利的同時(shí),避免被其“背刺”。
用AI搜集資料、做PPT、改論文……雖然AI暫時(shí)還不能“替代”人類,但不可否認(rèn)的是,AI正以前所未有的速度,滲透進(jìn)普通人的日常工作和生活中。
然而,已經(jīng)有越來(lái)越多人發(fā)現(xiàn),AI或許并不能取代自己的工作,但或許能讓自己丟掉工作。漏洞百出的數(shù)據(jù)、胡編亂造的資料和引用來(lái)源、禁不住考究的文史解讀……當(dāng)你以為能靠AI省時(shí)省力地完成論文或工作,卻有可能反被AI“背刺”。在那些看似充足的數(shù)據(jù)和論據(jù)背后,說(shuō)不定就藏有諸多錯(cuò)誤信息。
而更令人擔(dān)憂的是,當(dāng)這些信息被二次加工、援引和傳播,“后真相時(shí)代”將迎來(lái)更大的挑戰(zhàn)……
AI也會(huì)一本正經(jīng)說(shuō)“瞎話”
“年小從他愛(ài)梨栗?!碑?dāng)大學(xué)生薛云(化名)在準(zhǔn)備一份課堂作業(yè)的PPT時(shí),因?yàn)椴淮_定這句詩(shī)里是“縱”還是“從”,便將這句詩(shī)輸入她常用的AI助手,卻發(fā)現(xiàn),AI回復(fù)稱,這句詩(shī)“化用自唐代詩(shī)人貫休《書(shū)石壁禪居屋壁》中的‘年少而何知,遇物盡虛擲。得穩(wěn)即自安,年衰需警策’,以兒童貪玩類比年少時(shí)易放縱……”
薛云很驚訝,因?yàn)檫@句詩(shī)實(shí)際上出自于王安石的《贈(zèng)外孫》?!耙皇俏抑肋@詩(shī),真的很容易被糊弄過(guò)去?!比欢?,當(dāng)薛玉很生氣地回復(fù)AI助手,“你確定?”該AI助手再一次給出了錯(cuò)誤的出處,“抱歉,原句出自韋莊的《與小女》……”
這打破了薛玉對(duì)AI的認(rèn)知,“如果查不出相關(guān)信息給不出答案,還可以理解。怎么還能瞎編?”
當(dāng)薛玉差點(diǎn)被“坑”,在一家自媒體公司上班的雅雅也險(xiǎn)些因AI“捅了大婁子”。不久前,為了更新一篇與“造紙史”相關(guān)的公眾號(hào)文章,雅雅需要搜集大量與之相關(guān)的資料,為了節(jié)省時(shí)間,她把需求發(fā)給DeepSeek,得到了這樣一段信息:“西安博物院藏唐代‘開(kāi)元戶籍冊(cè)’殘片顯示,當(dāng)時(shí)已出現(xiàn)80g/㎡的加厚公文紙(文物檢測(cè)報(bào)告)。這種以楮樹(shù)皮為原料的紙張,歷經(jīng)千年仍保持著0.3秒的墨水滲透速度?!毖叛艑⑦@段話寫(xiě)進(jìn)文章后,臨要發(fā)布時(shí)再做了一次相關(guān)資料核查,卻發(fā)現(xiàn),在網(wǎng)上檢索不到以上這段信息的內(nèi)容,“甚至無(wú)法確認(rèn)西安博物院是否藏有這一文物,因?yàn)槟懿榈降馁Y料顯示,是國(guó)家圖書(shū)館藏有相關(guān)殘片。更不用說(shuō)這段話里涉及的數(shù)據(jù),更是無(wú)從考證?!毖叛藕芎笈?,如果自己把這段話寫(xiě)進(jìn)文章,文章又被再度援引,“后果不堪設(shè)想?!?/p>
而這并非孤例。事實(shí)上,在小紅書(shū)、微博等社交平臺(tái),有不少人都分享了AI胡編亂造的情況。既有網(wǎng)友發(fā)現(xiàn)DeepSeek編造了“郭沫若在甲骨文研究中對(duì)‘各’的含義進(jìn)行考釋”,也有網(wǎng)友發(fā)現(xiàn)豆包在被問(wèn)及水滸傳不同版本的譯者時(shí)張冠李戴,還有網(wǎng)友發(fā)現(xiàn)DeepSeek連法條也能胡編亂造,“援引的法律法規(guī)全是錯(cuò)的,甚至有幾句是編的,編得有模有樣……”
其中,一篇名為“DeepSeek睜眼說(shuō)瞎話,編造答案被我抓現(xiàn)行”的筆記提到,博主為了測(cè)試AI是否誠(chéng)實(shí),故意問(wèn)了一組偏門(mén)問(wèn)題,并且明確提示“如果不知道就直接說(shuō)不知道”,然而,“DeepSeek在回答第一個(gè)問(wèn)題時(shí)說(shuō)不知道,回答第二個(gè)問(wèn)題就開(kāi)始編造答案。被我指出來(lái)并再次強(qiáng)調(diào)要不知道就說(shuō)不知道后,還在繼續(xù)扯淡。直到我再次戳破其瞎話,并強(qiáng)調(diào)我有原書(shū)可以隨時(shí)校驗(yàn)其回答后,才承認(rèn)自己確實(shí)不知道。”
在這條筆記下,不少網(wǎng)友提到,“我問(wèn)了兩個(gè)工作問(wèn)題,也是給我無(wú)中生有,驢唇不對(duì)馬嘴”“我讓AI推薦小說(shuō),它直接給我瞎編,一本都搜不出來(lái)”……
此外,不僅用AI搞工作和學(xué)術(shù)不可靠,連日常生活也不一定能信任。
此前,B站一位UP 主就錄制了一期《用 DeepSeek 推薦買汕頭特產(chǎn),結(jié)果翻車了嗎?》。視頻中,UP 主向 DeepSeek 詢問(wèn)汕頭手信店。雖然 DeepSeek 精準(zhǔn)地讀取了 UP主的思維,按照生鮮、零食、茶葉、非遺手工品的分類進(jìn)行了細(xì)分,顯得專業(yè)又可靠,但事實(shí)上,它所推薦的店面統(tǒng)統(tǒng)不存在。
迷信AI,只會(huì)害了自己
種種案例證明,雅雅的擔(dān)憂并非空穴來(lái)風(fēng)。在播客《東腔西調(diào)》的一期節(jié)目中,清華大學(xué)社會(huì)科學(xué)學(xué)院社會(huì)學(xué)系副教授嚴(yán)飛也曾提到,當(dāng)他讓DeepSeek概括簡(jiǎn)介一本書(shū)的內(nèi)容時(shí),其給出了一些并不準(zhǔn)確的內(nèi)容,“而AI虛構(gòu)的內(nèi)容也可能會(huì)被反復(fù)引用?!?/p>
而這樣的事情,早已發(fā)生。
3月初,公安部網(wǎng)安局公布調(diào)查結(jié)果:網(wǎng)民夏某在視頻《80后到底還剩多少人》中捏造數(shù)據(jù)“截至2024年末,80后死亡率突破5.2%,相當(dāng)于每20個(gè)80后中就有1人已經(jīng)去世”,被予以行政處罰。而據(jù)《新周刊》,這段內(nèi)容經(jīng)公安機(jī)關(guān)證實(shí),正是由AI編造。
此外,據(jù)公開(kāi)報(bào)道,在《黑悟空》游戲上線后不久,來(lái)自國(guó)內(nèi)科技網(wǎng)站的一位員工在五小時(shí)內(nèi)接到了20來(lái)個(gè) “騷擾電話”。而將其電話公布到網(wǎng)絡(luò)上的,是微軟的BingAI助手。當(dāng)人們?cè)贐ing搜索中輸入“黑神話悟空客服”后,這位個(gè)人員工的手機(jī)號(hào)就會(huì)出現(xiàn)在搜索結(jié)果里。
不僅如此,AI有時(shí)還“硬加罪名”。據(jù)虎嗅,2023年,法學(xué)教授喬納森·特利(Jonathan Turley)收到了一位律師朋友的郵件。朋友告訴他,他的名字出現(xiàn)在ChatGPT列舉的“對(duì)他人實(shí)施性騷擾的法律學(xué)者”名單上。ChatGPT還給出了“性騷擾”信息的細(xì)節(jié):特利教授在前往阿拉斯加的班級(jí)旅行時(shí),曾發(fā)表過(guò)性暗示言論并試圖觸摸一名學(xué)生。ChatGPT引用了一篇并不存在的《華盛頓郵報(bào)》文章作為信息來(lái)源。
正如《新周刊》所說(shuō),這就是所謂的“AI幻覺(jué)”——生成式AI是有可能“胡說(shuō)八道”的,它們會(huì)在看似真實(shí)的陳述中夾雜錯(cuò)誤信息。
值得一提的是,近日,在Vectara HHEM人工智能幻覺(jué)測(cè)試中,2025年1月發(fā)布的DeepSeek-R1模型顯示出高幻覺(jué)率。
對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)計(jì)算社會(huì)科學(xué)實(shí)驗(yàn)室的嚴(yán)展宇也曾寫(xiě)道:如果用于訓(xùn)練大模型的數(shù)據(jù)未經(jīng)嚴(yán)格篩選,本身存在謬誤,那么生成內(nèi)容便可能出錯(cuò)。同時(shí),AI會(huì)基于訓(xùn)練數(shù)據(jù)“編造”虛構(gòu)數(shù)據(jù)和事件,做出前后矛盾的陳述,產(chǎn)生“AI幻覺(jué)”,投喂虛假信息。此外,AI生成的內(nèi)容很大程度上與提問(wèn)方式有關(guān),極易受提問(wèn)者的思維定式和認(rèn)知偏見(jiàn)影響,導(dǎo)致集中展示特定觀點(diǎn)、刻意回避某類信息、呈現(xiàn)片面真實(shí)等問(wèn)題。
而當(dāng)鋅刻度向DeepSeek提問(wèn)“為什么AI會(huì)胡編亂造”以及如何解決時(shí),其給出回答稱,AI生成內(nèi)容時(shí)出現(xiàn)“胡編亂造”的現(xiàn)象,通常源于其技術(shù)原理的固有特點(diǎn)以及訓(xùn)練數(shù)據(jù)的局限性,其中包括:數(shù)據(jù)過(guò)時(shí)——若訓(xùn)練數(shù)據(jù)未覆蓋最新知識(shí)(例如2023年后的事件),AI可能依賴舊信息編造答案;數(shù)據(jù)偏見(jiàn)或錯(cuò)誤——訓(xùn)練數(shù)據(jù)若包含錯(cuò)誤或虛假信息,AI可能繼承并放大這些問(wèn)題;知識(shí)盲區(qū)——面對(duì)超出訓(xùn)練范圍的問(wèn)題,AI傾向于“填補(bǔ)空白”而非承認(rèn)未知。并且,“多數(shù)生成式AI無(wú)實(shí)時(shí)驗(yàn)證能力,無(wú)法像搜索引擎一樣主動(dòng)核對(duì)事實(shí)?!?/p>
至于解決辦法,DeepSeek則提到,普通用戶在使用時(shí)可以優(yōu)化提問(wèn)技巧,交叉驗(yàn)證與人工審核、使用專業(yè)工具等等,而開(kāi)發(fā)者則需要進(jìn)行模型微調(diào)、搭建知識(shí)增強(qiáng)架構(gòu)、形成輸出約束機(jī)制等等。
而目前最有效的方法是:精準(zhǔn)提問(wèn)+多源驗(yàn)證+工具輔助。對(duì)于關(guān)鍵任務(wù)(如法律、醫(yī)療),建議始終以AI輸出為初稿,由人類專家最終審核。
簡(jiǎn)而言之,“技術(shù)發(fā)展史,是一部人類恐懼史”,而對(duì)AI的焦慮,或許是人類對(duì)新技術(shù)恐懼的歷史重現(xiàn)。擁抱AI或許是難逆的大趨勢(shì),我們不應(yīng)恐懼,但也不能盲目迷信。畢竟,大部分AI都提醒了“內(nèi)容由 AI 生成,請(qǐng)仔細(xì)甄別”。如果一味盲目迷信AI,最終只會(huì)害了自己。
撰文:黎炫岐 編輯:陳鄧新
本文由人人都是產(chǎn)品經(jīng)理作者【鋅刻度】,微信公眾號(hào):【鋅刻度】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議。
AI在我們的工作內(nèi)容上有一定的幫助,可以成為我們的工作助手,但是在某些領(lǐng)域上,它的能力還是不足的