對話ChatGPT:Prompt是普通人“魔法”嗎?
隨著ChatGPT等AI應(yīng)用模型、AI技術(shù)產(chǎn)品的出現(xiàn),Prompt這個概念,也出現(xiàn)在了眾人眼前,因為某種程度上,Prompt可以理解為控制AI的指令,可以在生成式AI的語境里發(fā)揮引導(dǎo)價值。具體如何解讀Prompt的存在與應(yīng)用?不如來看看本文的解讀。
在ChatGPT、Midjourney、Stable Diffusion等新事物的作用下,不少人或多或少聽說過Prompt的概念。
雖然OpenAI掀起的大模型浪潮再度刷新了人們對AI的認(rèn)知,但現(xiàn)階段的AI終歸還不是強(qiáng)人工智能,大模型里的“知識”存儲在一個隱性空間里,需要輸給AI正確的指令,也就是過去幾個月中頻頻被討論的Prompt。
有人將Prompt翻譯成“提示詞”,也有人翻譯為“激發(fā)詞”。再感性一些,就像童話故事里的魔法一樣,Prompt是AI時代的魔法,擁有它就擁有“巫師”一樣的能力。
一、Prompt是什么?
并不難理解Prompt的字面含義,可為何會出現(xiàn)Prompt這個概念?既然是ChatGPT炒熱的新名詞,不妨讓ChatGPT自己來回答。
這個回答中規(guī)中矩,但還是可以提取到一些有價值的信息:一,Prompt繼承了計算機(jī)編程里的命令行提示符,可以理解為控制AI的指令;二,在生成式AI的語境里,Prompt的價值在于引導(dǎo),而非計算機(jī)里的命令。
打個比方的話:大模型就像是人類的大腦,知識被存儲在神經(jīng)元聯(lián)接中,只有當(dāng)你遇到具體的問題時,就像“你最喜歡的食物是什么?”大腦才會給出確切的答案,Prompt等于是一個個具象的問題。由此產(chǎn)生了一種流行的說法,即提問比回答更重要。你使用ChatGPT所遇到的“邊界”,實際上是你自己的“邊界”。
但Prompt的價值體現(xiàn),并不在于ChatGPT代表的對話機(jī)器人,而是Midjourney為首的圖像生成類應(yīng)用。
簡單來說,你要告訴AI想要什么樣的圖,想要把自己腦海里的東西變成肉眼可見的圖案,需要幾十個單詞作為Prompt。哪怕只有一個提示詞的差異,AI所生成的圖像都可能有著質(zhì)的差別,怎么正確地給AI投喂Prompt,逐漸成了一門深奧的學(xué)問,并衍生出了提示語工程學(xué)(Prompt Engineering)的說法。
以至于在衡量大模型的能力時,出現(xiàn)了三個標(biāo)準(zhǔn):一是大模型的預(yù)訓(xùn)練水平;二是用來進(jìn)行預(yù)訓(xùn)練語料數(shù)量和質(zhì)量;三是提示語的水平。直接的例子就是外界對文心一言文生圖的質(zhì)疑,即使不考慮前兩個因素,單單在提示詞方面,就足以讓文心一言和Midjourney拉開幾條街的距離。
因為在文心一言上想要生成圖片,普遍給的指令是:幫我生成一張XXX(這也是百度官方的示例),解析為Prompt時注定只有幾個提示詞,遠(yuǎn)不足以表達(dá)腦海里想要的畫面;同樣的需求給Midjourney,可能是十幾個乃至幾十個提示詞,大模型可以更準(zhǔn)確地理解并輸出用戶想要圖案。
理解了這些差異,便不難讀懂Prompt走紅的原因。
目前大模型對算力的要求很高,以O(shè)penAI的DALL?E為例,生成一張圖片的收費約0.02美元,如果讓不懂Prompt的人去調(diào)用模型,大概率會浪費掉一次次算力。何況當(dāng)前想要生成滿意的圖片,需要不斷重復(fù)調(diào)整,能否熟練運用Prompt,直接左右了大模型所能釋放的生產(chǎn)力。
二、Prompt 還能賺錢?
利用信息差賺錢向來是最容易做的生意,生成式AI也不例外,Prompt作為AI時代的魔法,已然成了不少人用來“賺錢”的生產(chǎn)資料。
第一種:直接售賣Prompt。
國外已經(jīng)出現(xiàn)了PromptBase等明碼標(biāo)價的平臺,涉及Midjourney、Stable Diffusion、DALL?E、GPT等多個模型,而且適用的場景越來越細(xì)分,包括音樂創(chuàng)作、兒童插畫、油畫藝術(shù)、人物肖像等等,即便是不擅長整理提示詞的普通用戶,也可以直接復(fù)制Prompt生成相對不錯的作品。
其實國內(nèi)也有類似的現(xiàn)象,一些商家早已在電商平臺上兜售Prompt,也有一些人將Prompt做成面向垂直任務(wù)場景的應(yīng)用,比如AI 寫評語、AI寫郵件、AI翻譯等等,吸引剛需用戶按月付費使用。
第二種:用Prompt換流量。
國內(nèi)最早一批售賣AI課程的自媒體,多半將Prompt作為吸引用戶付費的籌碼;小紅書等年輕人扎堆的平臺上,早早出現(xiàn)了分享Prompt的筆記;B站、抖音等視頻平臺上,教用戶使用Prompt的教程已不可計數(shù)。
個中邏輯并不復(fù)雜。Prompt是駕馭AI的“咒語”,但提示詞本身并沒有版權(quán)效應(yīng),或許直接兜售Prompt可以快速變現(xiàn),終歸是不長久的買賣。將Prompt作為漲粉工具,趁機(jī)吸引到可觀的粉絲群體,在流量變相高度繁榮的互聯(lián)網(wǎng)江湖,無疑更符合市場規(guī)律,也是Prompt被廣泛討論的另一重誘因。
第三種:靠Prompt“找工作”。
正如前面所提到的,正確使用Prompt已經(jīng)是提升生產(chǎn)力的前提,不單單產(chǎn)生了提示語工程,還醞釀出了一批“提示詞工程師”(Prompt Engineer)。
國外一位名叫Riley Goodside的小哥,靠ChatGPT的Prompt快速漲粉,然后被硅谷獨角獸Scale AI聘請為“提示詞工程師”,據(jù)說年薪高達(dá)百萬人民幣;另一位名為Jason M. Allen的藝術(shù)家,則使用Midjourney贏得了Colorado State Fair周年藝術(shù)比賽……如果說計算機(jī)時代的能力密碼是編程,在生成式AI席卷全球的當(dāng)下,Prompt正悄悄成為數(shù)以萬計打工人“傍身”的工具。
至少就目前來看,程序員群體里已經(jīng)漸漸興起兩股風(fēng)潮:一類人瞄準(zhǔn)了OpenAI等大模型企業(yè)的API,想要坐在人工智能的副駕駛上創(chuàng)業(yè);另一類人打起了創(chuàng)造Prompt的主意,想要利用信息差賺到第一桶金。
倘若ChatGPT的出現(xiàn)當(dāng)真是所謂的iPhone時刻,圍繞Prompt的生意其實才剛剛開場。
三、Prompt 只是過渡?
相對應(yīng)的一個問題是,Prompt是否是人工智能大眾化不可或缺的一環(huán)?這個問題的答案直接影響著Prompt和Prompt Engineer的紅利周期。
Open AI 的 CEO Sam Altman曾公開表示:五年后,就不再需要 Prompt Engineering。也許在接下來的一段時間里,我們?nèi)孕枰崾菊Z,需要去創(chuàng)造 Prompt,但生成式AI的發(fā)展速度可能超乎想象,AI對人類的理解力遠(yuǎn)未觸達(dá)天花板。
可以佐證的是,第一代iPhone上市時還沒有App Store,僅預(yù)裝了瀏覽器、iPod、郵件等少量應(yīng)用,想要安裝其他應(yīng)用,需要在電腦上安裝iTunes,用USB線將iPhone連接到電腦……為了解決用戶體驗上的局限性,越獄工具和第三方應(yīng)用商店應(yīng)運而生,但在蘋果引入App Store后,越獄工具漸漸被丟進(jìn)了歷史的故紙堆。
同樣的問題詢問ChatGPT,答案似乎客觀了許多。
想要不用特定Prompt就能和AI流暢對話,ChatGPT認(rèn)為需要解決四個挑戰(zhàn):
- AI需要更好地理解語境和連貫性,哪怕用戶像《大話西游》里的唐僧一樣喋喋不休,或者語無倫次,AI也可以準(zhǔn)確理解用戶的意圖,這樣就不需要精確的提示詞,用自然語言進(jìn)行提問。
- AI需要有豐富的常識和推理能力,即根據(jù)特定的信息和場景做出合理的回應(yīng),而非像現(xiàn)在的模型那樣“對牛彈琴”,比如中文里的多義詞、不同場景下不同含義的語氣詞,非常考驗推理能力。
- AI需要理解和處理情感信息,這也是當(dāng)前AI研究的重心所在。人的情感可以有很多種表達(dá)方式,文字只是其中重要的一種。在大模型不斷向多模態(tài)演進(jìn)時,視覺和聲音是否也可以傳遞信息?
- AI需要有主動學(xué)習(xí)和適應(yīng)能力。主動學(xué)習(xí)是指AI系統(tǒng)在學(xué)習(xí)過程中,能夠主動選擇最具信息量的樣本進(jìn)行學(xué)習(xí),在數(shù)據(jù)稀缺的情況下做出更好的決策;適應(yīng)能力是指AI在面臨新的任務(wù)、場景或環(huán)境變化時,能夠自我調(diào)整并優(yōu)化其行為。
按照ChatGPT的標(biāo)準(zhǔn),在Prompt消失的時候,勢必已經(jīng)進(jìn)入到了強(qiáng)人工智能時代,目前還有很長一段距離。
Prompt及其衍生機(jī)會的消亡是一種歷史必然,在時間上仍有很大的不確定性,也許會很快出現(xiàn)另一場技術(shù)爆炸;也許AI會進(jìn)入新一輪的瓶頸期, Sam Altman的五年預(yù)期不過是“盲目樂觀”。
四、寫在最后
或許可以借用科技媒體《VentureBeat》的說法:現(xiàn)在已經(jīng)到了AI藝術(shù)的轉(zhuǎn)折點,未來的藝術(shù)家無論是自學(xué)成才還是科班出身,都需要有創(chuàng)造Prompt的能力,需要理解和學(xué)習(xí)數(shù)據(jù)科學(xué),以及大模型的工作原理。
進(jìn)一步延伸的話,需要有這些能力的絕不只是藝術(shù)家,任何職業(yè)、任何行業(yè)的工作都不可避免和AI協(xié)作,將人類的思考和需求注入給AI,不斷更新、創(chuàng)造Prompt,將是大多數(shù)人必須要掌握的一種技能,就像現(xiàn)在必須要用輸入法打字一樣。
作者:顧青云、ChatGPT;編輯:沈菲菲
來源公眾號:Alter聊科技(ID:spnews),主理人:Alter。
本文由@Alter 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!