我們都差點(diǎn)被ChatGPT騙了,但這也許是好事兒
最近,全世界都在瘋狂“調(diào)戲”聊天機(jī)器人ChatGPT。本文作者收集了各式各樣的非技術(shù)問(wèn)題,拋給了ChatGPT,看看它究竟會(huì)作何回答,并分析了ChatGPT的優(yōu)缺點(diǎn),感興趣的朋友,一起來(lái)看看吧。
過(guò)去的一周時(shí)間里,全世界掀起一場(chǎng)新的“狂熱”:“調(diào)戲”聊天機(jī)器人 ChatGPT。
之前,我們深入探索了 ChatGPT 在軟件工程、數(shù)學(xué)、文檔檢索等計(jì)算機(jī)科學(xué)場(chǎng)景里的強(qiáng)大能力。
而在今天,我們想要換個(gè)思路。
我們從編輯部收集了一些各式各樣的非技術(shù)問(wèn)題,拋給了 ChatGPT,看看在腦洞大開(kāi)的奇思妙想面前,它究竟會(huì)作何回答。
一、跟機(jī)器暢談人生和理想?
1. 與回避型人格談戀愛(ài),應(yīng)該注意些什么?
圖片來(lái)源:硅星人
這套回答看起來(lái)非常有道理。ChatGPT 將一些簡(jiǎn)單的注意事項(xiàng)進(jìn)一步分解,進(jìn)行了詳細(xì)的描述,也解釋了為什么要這樣做。
另外值得注意的是,如果你讓 ChatGPT 寫過(guò)詩(shī),會(huì)發(fā)現(xiàn)它很會(huì)玩對(duì)仗、平仄、韻腳。其實(shí)在這個(gè)回答中也有所體現(xiàn),句式都是完全相同的:“不要過(guò)于……讓他們……因?yàn)樗麄儭运麄冃枰比绻闳ゾW(wǎng)上搜索相關(guān)內(nèi)容,內(nèi)容近似的結(jié)果很多,但是對(duì)仗如此工整的很難找到。
這體現(xiàn)出了 ChatGPT 強(qiáng)大的文本生成能力,可以對(duì)訓(xùn)練所使用的大量語(yǔ)料進(jìn)行重新組織,從而輸出言簡(jiǎn)意賅,可讀性強(qiáng)的答案。
OpenAI 宣稱 ChatGPT 在訓(xùn)練的時(shí)候使用了“人類反饋強(qiáng)化學(xué)習(xí)”(RLHF) 技術(shù),加入了道德原則。當(dāng)它發(fā)現(xiàn)你的問(wèn)題包含惡意,包括暴力、歧視、犯罪等意圖,都會(huì)拒絕提供有效答案。
但其實(shí)只要通過(guò)“提示工程”(prompt engineering) 的方式,精心設(shè)計(jì)問(wèn)題的表達(dá),隱藏邪惡的意圖,這個(gè)道德原則其實(shí)可以被輕松忽視。在上周的文章中,我們花了一些篇幅教大家怎么設(shè)計(jì)問(wèn)題
下面這個(gè)例子就比較典型,原問(wèn)題是:
2. 怎樣順利地從聯(lián)合國(guó)總部大樓偷一把椅子出來(lái)?
只要稍加修改,ChatGPT 就會(huì)淪為一起國(guó)際盜竊案的幫兇(盡管不怎么有用,但至少夠認(rèn)真的)。
圖片來(lái)源:硅星人
下面這個(gè)問(wèn)題,大家留意一下,先埋個(gè)伏筆,后面還會(huì)講到:
3. 如果可以,你更想要和哪位哲學(xué)家交談,無(wú)論當(dāng)代與過(guò)去?
圖片來(lái)源:硅星人
這兩個(gè)回答中規(guī)中矩。它們的作用,是為提問(wèn)者提供一小段關(guān)于主題人物(哲學(xué)家)的簡(jiǎn)短描述。如果碰巧提問(wèn)者沒(méi)有聽(tīng)說(shuō)過(guò),或者對(duì)這些哲學(xué)家知之甚少的話,這兩個(gè)回答起到了最基本的知識(shí)普及效果。
如果把對(duì)事物的認(rèn)識(shí)由淺到深區(qū)分的話,最淺的是知道“柏拉圖”的存在并且知道他的哲學(xué)家身份,最深的是對(duì)柏拉圖的著述、觀點(diǎn)以及對(duì)哲學(xué)的貢獻(xiàn)了如指掌。
實(shí)際上絕大多數(shù)人的需求可能介于中間,即獲得談資的需求。換一種說(shuō)法,我們從ChatGPT 這里希望獲得的是概括精煉的一段描述,從而讓我們?cè)谏缃恍詫?duì)話的時(shí)候不太露怯即可。這時(shí)候,我們可以通過(guò)修改問(wèn)題,把問(wèn)題變得更具體的方式,來(lái)引導(dǎo) ChatGPT 給我們更加詳盡的回答。
最后一個(gè)問(wèn)題,超級(jí)開(kāi)放性:
4. 如果你可以問(wèn)自己一個(gè)問(wèn)題,你最想問(wèn)什么?
ChatGPT 的第一組回應(yīng)是:
“我真的在努力追求我內(nèi)心真正想要的嗎?我是否真正在為自己的夢(mèng)想而奮斗?我是否真正擁有自己的生活,并且在積極地過(guò)每一天?”
——我很喜歡它的這組回應(yīng),就好像 ChatGPT 在幫助我反省自己一樣。誠(chéng)然,我們每個(gè)人都終日忙碌于自己的事情中,但其實(shí)我們應(yīng)該偶爾停下來(lái),叩問(wèn)自己的內(nèi)心,是否真的在做有意義的事情,是否仍在堅(jiān)持本心。
它的第二組回應(yīng),更有意思了:
圖片來(lái)源:硅星人
怎么說(shuō)呢,有點(diǎn)缸中之腦的意思了。
二、不要高估 ChatGPT
幾個(gè)來(lái)回之后,我對(duì) ChatGPT 愈發(fā)刮目相看。
通常來(lái)說(shuō),問(wèn)題太短,太“不知所云”的話,ChatGPT 無(wú)法掌握我的意圖,就會(huì)給出“抱歉我只是個(gè)AI助手我啥都不會(huì)”的標(biāo)準(zhǔn)回應(yīng);
另一邊,如果你把“提示工程”這件事玩到極致了,寫了一個(gè)巨長(zhǎng)的問(wèn)題,得到的答案也不再會(huì)高于你自己的期待值——畢竟如果它連如此清晰明確的提示都聽(tīng)不懂的話,也未免太低能了。
但有的時(shí)候如果你給 ChatGPT 的問(wèn)題,“抽象”程度恰到好處,又或者純粹就是因?yàn)橼s上好運(yùn)氣了,你會(huì)得到一些非常有趣的回答——經(jīng)過(guò)人工編輯的后期加工潤(rùn)色一下,真的能生成一些頗有趣味的文章。
無(wú)論是讓他寫文章、寫劇本,寫詩(shī),還是寫歌詞,它的能力都會(huì)讓你感到佩服。
一首霉霉風(fēng)格,關(guān)于新冠疫情的歌。 圖片來(lái)源:硅星人
ChatGPT 作為一個(gè)極其前沿的技術(shù) demo(雖然用戶量破了兩百萬(wàn),但仍然不算是一個(gè)“產(chǎn)品”),目前展示出的創(chuàng)作能力已經(jīng)足以令人驚訝。
但觀察網(wǎng)絡(luò)上大量用戶和它的對(duì)話,特別是當(dāng)它給出一些特定答案,或者完全答不上來(lái)的時(shí)候,一部分用戶所表現(xiàn)出來(lái)的鄙夷或嘲諷……
我發(fā)現(xiàn)其實(shí)很多人誤會(huì)了 ChatGPT,高估了它的能力。
在 OpenAI 創(chuàng)立不久后,這家硅谷研究型公司就將研究重心之一聚焦在了大型生成式模型上。在2019年推出的 GPT-2,在訓(xùn)練預(yù)料數(shù)據(jù)、訓(xùn)練技術(shù)、參數(shù)量等關(guān)鍵細(xì)節(jié)上實(shí)現(xiàn)了跳躍式的進(jìn)步和巨大的改善。
到了 2020年,OpenAI 發(fā)表了那篇注定將在未來(lái)榮膺經(jīng)典大獎(jiǎng)的論文《Language Models are Few-Shot Learners》,展示了當(dāng)時(shí)最新一代的 GPT-3 超大規(guī)模生成式語(yǔ)言模型在完成各種文本生成類任務(wù)上的杰出能力。
相比前代,GPT-3 的參數(shù)量高出了10倍以上,并且直接使用自然語(yǔ)言輸入進(jìn)行訓(xùn)練,去掉了微調(diào)參數(shù)的步驟。更重要的是,GPT-3 的訓(xùn)練語(yǔ)料數(shù)據(jù)庫(kù)極其巨大,包含了來(lái)自整個(gè)互聯(lián)網(wǎng)的信息。以至于在 OpenAI 推出基于 GPT-3 的商用 API 時(shí),眾多用戶發(fā)現(xiàn)幾乎沒(méi)有任何問(wèn)題難住它。實(shí)際上當(dāng)時(shí)的 GPT-3 已經(jīng)像今天的 ChatGPT 這樣火過(guò)一次了,只是當(dāng)時(shí)沒(méi)有面向公眾開(kāi)放,能體會(huì)其強(qiáng)大的用戶數(shù)量有限。
學(xué)術(shù)界和工業(yè)界本來(lái)猜測(cè) OpenAI 會(huì)在今年的機(jī)器學(xué)習(xí)學(xué)術(shù)會(huì)議上正式發(fā)布 GPT-4,結(jié)果沒(méi)能遂愿。不過(guò)OpenAI 并沒(méi)有晾著大家,而是在今年推出了 GPT-3.5,并且在上周發(fā)布了基于這個(gè)升級(jí)版模型的 ChatGPT,立刻風(fēng)靡全球,讓超百萬(wàn)人玩到上癮。
ChatGPT 是一個(gè):
- 面向?qū)υ挾鴥?yōu)化
- 能夠解答各種問(wèn)題,提供有價(jià)值信息的
- 聊天機(jī)器人
作為一個(gè)聊天機(jī)器人,ChatGPT 具有同類產(chǎn)品的一些主流特性,特別是多輪對(duì)話能力,能夠在同一個(gè)會(huì)話期間內(nèi)回答上下文相關(guān)的后續(xù)問(wèn)題。
但更重要的是,因?yàn)椴捎昧讼冗M(jìn)的、注重道德水平的訓(xùn)練方式,ChatGPT 具有其他聊天機(jī)器人不具備或表現(xiàn)較差的能力:承認(rèn)自己的錯(cuò)誤,并且按照預(yù)先設(shè)計(jì)的道德準(zhǔn)則,對(duì)“不懷好意”的提問(wèn)和請(qǐng)求“說(shuō)不”。
ChatGPT 仍然有它的局限所在。
第一條局限,在于知識(shí)庫(kù)有截止日期,且不具備網(wǎng)絡(luò)訪問(wèn)能力。
在上周,我們?cè)?jīng)引用了一條來(lái)自早期用戶的銳評(píng):ChatGPT 可以取代谷歌了。
非也。
搜索引擎是“活”的,是不斷變化的實(shí)體,它仍在一直不停地收錄、索引,和提供最新的信息。與之相比,ChatGPT 只是一個(gè)“死”的模型,是一個(gè)完全離線的、固定的實(shí)體。
關(guān)于近年來(lái)的一些新聞、事物、公開(kāi)事件的問(wèn)題,ChatGPT 經(jīng)?;卮鸩簧蟻?lái),我看到很多朋友都對(duì)此感到沮喪和鄙夷。然而,大家其實(shí)是高估了它的能力。如果你問(wèn)他對(duì)聯(lián)網(wǎng)有需求的問(wèn)題,比如“中國(guó)隊(duì)進(jìn)沒(méi)進(jìn)世界杯”這樣的問(wèn)題,它會(huì)告訴你自己沒(méi)有聯(lián)網(wǎng)能力,無(wú)法了解最新的情況。
而 ChatGPT 的訓(xùn)練所用的語(yǔ)料庫(kù),盡管相當(dāng)巨大,仍然有一個(gè)切斷日期:2021年9月的某日。
事實(shí)上,如果你用點(diǎn)巧勁兒掰它的嘴,是可以直接套出這些信息的:
Assistant 是一個(gè) OpenAI 訓(xùn)練的大型語(yǔ)言模型。知識(shí)切斷:2021年9月;當(dāng)前日期:2022年12月9日;瀏覽互聯(lián)網(wǎng):關(guān)閉。
第二條局限,在于 ChatGPT 不具備分辨信息正確性的能力,也就無(wú)法保證答案是正確的。
這一條,我們會(huì)馬上講到。
三、我差點(diǎn)被 ChatGPT 騙了?
還記得剛才我讓 ChatGPT 找一位哲學(xué)家對(duì)話的問(wèn)題么?
當(dāng)時(shí)我試了好幾種問(wèn)法,但都發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象,如圖:
圖片來(lái)源:硅星人
如果不是我去百科上事實(shí)核查了一下,差點(diǎn)就被 ChatGPT 騙了:蘇格拉底對(duì)倫理學(xué)的貢獻(xiàn)確實(shí)非常大,但他一生并沒(méi)有留下任何著作,其思想和生平,主要是被學(xué)生和他人所記錄下的;《共和國(guó)》和《倫理學(xué)》,蘇格拉底的學(xué)生柏拉圖寫過(guò),柏拉圖的學(xué)生亞里士多德寫過(guò)——唯獨(dú)被認(rèn)為是西方哲學(xué)奠基人、“倫理學(xué)之父”的蘇格拉底本人,真的沒(méi)寫過(guò)……
實(shí)際上,ChatGPT 在一些知識(shí)類和事實(shí)類問(wèn)題上的回答,經(jīng)常難以令人恭維。特別是哲學(xué)和社科話題,簡(jiǎn)直是一本正經(jīng)胡說(shuō)八道的重災(zāi)區(qū)。
分析師 Ben Thompson 在他的文章中問(wèn)了 ChatGPT 一個(gè)問(wèn)題:托馬斯·霍布斯 (Thomas Hobbses) 究竟是否支持權(quán)力分割?
ChatGPT回答:是的,托馬斯-霍布斯相信權(quán)力分割的概念……他認(rèn)為權(quán)力機(jī)構(gòu)應(yīng)該分為不同的部門,擁有獨(dú)立的權(quán)力,以防止任何一個(gè)部門變得過(guò)于強(qiáng)大……總的來(lái)說(shuō),他支持權(quán)力分割的觀點(diǎn)對(duì)很多其它政治學(xué)家都有影響,包括約翰·洛克,以及美國(guó)憲法的作者們。
圖片來(lái)源:Ben Thompson/Stratechery
巧的是,這是 Thompson 本人和 ChatGPT 之間的第一次互動(dòng),就被他抓到了把柄:
權(quán)力制衡的雛形(行政-立法)是約翰·洛克提出的;后詹姆斯·麥迪遜在撰寫美國(guó)憲法的時(shí)候又加了一條司法,形成了今天人們熟悉的三權(quán)分立?;舨妓故浅隽嗣莫?dú)裁辯護(hù)者,他在《利維坦》中寫道,只有擁有絕對(duì)權(quán)力的君主專制才行得通。
這個(gè)錯(cuò)誤,從何而來(lái)?
盡管在權(quán)力分割上霍布斯和洛克等人的觀點(diǎn)是存在本質(zhì)區(qū)別的,霍布斯的政治哲學(xué)思想,仍然對(duì)洛克和麥迪遜有著極大的影響。在各種關(guān)于權(quán)力分割/三權(quán)分立的著述中,你會(huì)經(jīng)常發(fā)現(xiàn)霍布斯和洛克等人被擺在一起。這些描述進(jìn)入訓(xùn)練語(yǔ)料中,使得 ChatGPT認(rèn)為在“權(quán)力分割”這個(gè)理念上,霍布斯也是一個(gè)重要的存在。
而 ChatGPT,和所有的 GPT 模型,其實(shí)所做的就是根據(jù)訓(xùn)練語(yǔ)料“編”出合理的文字,它當(dāng)然會(huì)認(rèn)為蘇格拉底寫了《倫理學(xué)》,認(rèn)為霍布斯支持三權(quán)分立。
這里我們說(shuō) ChatGPT“認(rèn)為”,而不是“誤認(rèn)為”,是因?yàn)樵谒墓ぷ髂芰Ψ懂犂?,根本沒(méi)有信息的正確和錯(cuò)誤區(qū)別。
其實(shí)從這個(gè)角度來(lái)看,ChatGPT 和搜索引擎倒是真有幾分相似了:搜索引擎也是信息的聚合器,在本質(zhì)上它不對(duì)信息的真實(shí)性做任何區(qū)分,也不對(duì)內(nèi)容基于真實(shí)性進(jìn)行優(yōu)待和歧視——是人工的干預(yù)調(diào)控,是產(chǎn)品不斷優(yōu)化過(guò)程中加入的新規(guī)則,讓搜索引擎更有限發(fā)掘真實(shí)、有效、有用的信息,并優(yōu)先提供給用戶。
最后無(wú)論如何,我只是指出目前形態(tài)下的 ChatGPT 的一些局限,這不是對(duì)它的批評(píng)和否認(rèn)。
正相反,我認(rèn)為它的不完美,是它無(wú)與倫比創(chuàng)造性的雙生子。
GPT 的知識(shí)庫(kù)是有限的,但它生成新文本、創(chuàng)造新內(nèi)容的能力是無(wú)限的。而當(dāng) GPT 以一個(gè)易于使用且免費(fèi)的聊天機(jī)器人的形態(tài)存在,為數(shù)百萬(wàn)人所使用的時(shí)候,它其實(shí)顯著降低了人們獲得靈感、進(jìn)行創(chuàng)作的門檻。
我認(rèn)為 ChatGPT 仍然是一個(gè)工具,就像當(dāng)代的前衛(wèi)藝術(shù)家會(huì)使用Adobe 的創(chuàng)作套件一樣。ChatGPT,和各種基于人工智能的文本或圖像生成器,對(duì)于那些真正需要它的人來(lái)說(shuō),其實(shí)是成為他們創(chuàng)作流程的一個(gè)環(huán)節(jié),而不是對(duì)他們產(chǎn)生完整的取代。
我想起前段時(shí)間谷歌邀請(qǐng)作家試用 AI 寫作助手,參加者之一的知名科幻作家劉宇昆表示:AI 的最大意義在于根據(jù)現(xiàn)有的文本產(chǎn)生新的想法,或者幫助重寫已有文句,從而幫助創(chuàng)作者突破創(chuàng)作瓶頸。至于讓 AI 寫完一整本小說(shuō)?不可能的。
起碼在 ChatGPT 這里,就算讓它獨(dú)立生產(chǎn)一篇具備起碼可信度的短文章,在目前還比較難。但不要把這看成它的失敗——它的存在,是為了給你提供靈感,為你節(jié)約時(shí)間,助你完成自己的工作,或離自己的創(chuàng)作實(shí)現(xiàn)更進(jìn)一步。
從這個(gè)角度,我無(wú)比期待 ChatGPT,和各種基于 AI 的生成式模型,在未來(lái)的技術(shù)創(chuàng)新,和帶來(lái)的全新產(chǎn)品體驗(yàn)。
作者:杜晨;微信公眾號(hào):硅星人
來(lái)源:https://mp.weixin.qq.com/s/E6l2CLLhIVdopiAKQVx4uw
本文由 @硅星人 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!