AI的進(jìn)展不是太快,而是太慢
AI近些時(shí)日的強(qiáng)勢崛起讓許多人都意識到一件事——強(qiáng)人工智能時(shí)代即將來臨。本文以圖靈測試為切入點(diǎn),具體分析了AI的進(jìn)程看似快實(shí)際上在商業(yè)價(jià)值方面還不夠成熟。一起來看看吧!
從Altman辭職引發(fā)了出了Q*算法,然后好像引申出了一個(gè)結(jié)論:強(qiáng)人工智能要來了,但現(xiàn)實(shí)可能正相反,人工智能確實(shí)是有進(jìn)展,也有巨大的潛力和顛覆性力量,但整體上的進(jìn)展不是太快,而是太慢。
一、圖靈測試2.0:拋棄它但又要回到它
1950年的圖靈測試說的是當(dāng)一個(gè)人同不能看見的人與機(jī)器進(jìn)行問答,又不能區(qū)分那個(gè)是人那個(gè)是機(jī)器的時(shí)候,那么機(jī)器就算通過了圖靈測試。
現(xiàn)在在某些場景里,大模型確實(shí)可以通過圖靈測試,所以這版的圖靈測試是一個(gè)過期的測試方式,意義不大了。
但圖靈測試的基礎(chǔ)內(nèi)核是有價(jià)值的。它圈定一個(gè)場景,讓人工智能完成它,通過外部對此能否感知來判斷智能是不是足夠這點(diǎn)并未過時(shí),實(shí)際上是變的更加關(guān)鍵。
對圖靈測試進(jìn)行擴(kuò)展的話,我們可以在經(jīng)濟(jì)活動(dòng)中圈定一個(gè)職位或者場景,然后考察人工智能是否可以完成它,同時(shí)體驗(yàn)服務(wù)的一方并不知道這是人提供的服務(wù)還是機(jī)器提供的服務(wù)。如果人工智能可以做到了,那就是通過圖靈測試2.0,否則就不是。
二、為什么這是有意義的呢?
因?yàn)槌醮鷪D靈測試更像是測驗(yàn)一個(gè)活在虛擬空間的智能體,它不需要區(qū)分真實(shí)還是虛假,只要確保邏輯自洽,那就可以達(dá)成通過測試的目標(biāo),在這個(gè)過程中胡說八道是沒關(guān)系的。這是一個(gè)技術(shù)視角。
有個(gè)沒場面但其實(shí)很經(jīng)典的科幻電影叫《這個(gè)男人來自地球》,電影里面一個(gè)男人聲稱他是一個(gè)活了一萬四千年的穴居人,他見證了人類的歷史和文明的變遷,甚至與佛陀和耶穌有過交流。和他在一個(gè)屋子里的各位科學(xué)家嘗試用邏輯去驗(yàn)證他是不是扯淡,但結(jié)果發(fā)現(xiàn)純粹的坐在屋子里,這事是整不出真假的。在屋子里凌空來說,只要人知識足夠豐富,并且能保證邏輯自洽,你根本沒法分辨。而走出屋子立刻就不一樣了,其它的事實(shí)、反饋可以迅速的判斷真假。
類似的,人工智能是否真的智能是學(xué)術(shù)、技術(shù)問題,也是個(gè)商業(yè)問題,所以它必然要走出來禁受更大場景的考驗(yàn),不能是一個(gè)只能嘮嗑的語言模型。這時(shí)候就很有必要按同樣的思路,回到圖靈測試智能對比的內(nèi)核,對它進(jìn)行一下升級。
琢磨事:《AI能賺到錢了么?》中展開過這個(gè)問題,管它叫全場景覆蓋法,隨著人工智能關(guān)注度的提高,似乎越來越需要強(qiáng)調(diào)這個(gè)視角。因?yàn)槲覀冋麄€(gè)文明就是基于智能構(gòu)建的,所以看人工智能總是可以有無數(shù)多個(gè)視角,比如:一種是無錨點(diǎn)的幻想,這就什么都能干,類似一個(gè)想象中的超人,寫小說用的上;一種是純粹技術(shù)的視角,這種就大喜大悲,要么就是覺得這東西怎么可能有用(別看現(xiàn)在很火,其實(shí)過去十年AI的研究者大多是悲觀態(tài)度),要么就是每天看到各種進(jìn)展,覺得世界要被威脅了。
無錨點(diǎn)和尺度就很容易這么忽左忽右,但恰恰尺度本身才是本質(zhì)。
三、為什么說人工智能進(jìn)展其實(shí)是慢的
如果在技術(shù)圈子里面自己和自己比,其實(shí)進(jìn)步還是很大的,不管是過去的識別率還是這次的內(nèi)容生成,大模型都有了相當(dāng)?shù)倪M(jìn)步,但如果換到上面說的圖靈測試2.0的視角,你就會(huì)發(fā)現(xiàn)即使到今天,還是通過不了。很像一條無限接近的曲線,但就是沒有突破。
可以拿企業(yè)內(nèi)的分工進(jìn)一步舉列子,企業(yè)的典型崗位是:
- 職能:HR、財(cái)務(wù)、IT、行政、知識產(chǎn)權(quán)
- 產(chǎn)研:產(chǎn)品、研發(fā)、供應(yīng)鏈、測試、運(yùn)維
- 業(yè)務(wù):市場、銷售、售前、售后
每個(gè)崗位會(huì)橫縱進(jìn)一步細(xì)分,縱是指層級也就是我們常說的匯報(bào)路線,橫是指前端、后端、APP這類職責(zé)切分。
一個(gè)100~200人的產(chǎn)品公司里面差不多要有各種類似的崗位,這時(shí)候我們回到圖靈測試2.0的視角,哪部分現(xiàn)在的人工智能可以通過呢?
恐怕都通過不了,即使是進(jìn)展最大的編程。
編程的時(shí)候現(xiàn)在的人工智能完成不了需求模型向開發(fā)模型的映射,(現(xiàn)在確實(shí)可以讓1個(gè)人干2人的活),也就是說還是需要有人抽象出需求模型,把它變成prompt;其次是一旦出問題,修正就挑戰(zhàn)更大,因?yàn)檫@時(shí)候必須有整個(gè)程序的整體性認(rèn)識,對此的認(rèn)識則大概率是不準(zhǔn)的,這就導(dǎo)致改老的程序反倒是更吃力,需要一個(gè)有整體性認(rèn)識的人進(jìn)行協(xié)助,否則就改不對。
所以說基于大模型的人工智能通過不了圖靈測試2.0,通過不了商業(yè)價(jià)值的實(shí)現(xiàn)就有問題(通過了不一定沒問題)
所以結(jié)合場景視角,我們可以說雖然忙活了10幾年,但進(jìn)展遠(yuǎn)沒有想的那么快。現(xiàn)在OpenAI差不多調(diào)集了可能調(diào)集的所有資金來對此進(jìn)行沖刺,我們應(yīng)該真的希望他們能沖過去,而不是反過來。
能不能通過正是兩種局面:通過不了就像水庫一樣偶爾當(dāng)供水池用用,通過了蓄積的勢能就奔涌而下。
這類行業(yè)重構(gòu)第一步更可能是一種大折疊,內(nèi)卷到極致的折疊,然后才是新生。
四、大折疊
突然說折疊可能不好理解,我們拿過去的電商舉個(gè)例子:
電商肯定磕掉了傳統(tǒng)百貨,并且激發(fā)了外賣、直播帶貨等一系列新行業(yè)。但首先是折疊掉傳統(tǒng)百貨,后面才逐漸有現(xiàn)在大家集體帶貨的局面。
人工智能如果通過圖靈測試2.0,那會(huì)和這個(gè)類似,比如如果日常文案寫作全是人工智能,那在API上能創(chuàng)造的商業(yè)價(jià)值估計(jì)只有原來的幾千分之一,但會(huì)讓這個(gè)職位徹底走入歷史,此后才能創(chuàng)造新的角色和職位。
在這個(gè)折疊的過程中其實(shí)蘊(yùn)含著第二重挑戰(zhàn):可以折疊掉很多現(xiàn)有職位,但自己未必能成為一個(gè)良性的模式,并且持續(xù)發(fā)展。(如果真停在這兒就損人不利己的意思)
在Altman被逼走的短暫日子里順道出了一條消息:每一次對OpenAI的調(diào)用都會(huì)導(dǎo)致虧損。也就是說OpenAI是在一種脆弱平衡下在運(yùn)作,具體來說就是:全球的注意力吸引海量資本的模式,這中注意力和興奮點(diǎn)的走勢從反面解讀其實(shí)和龐氏騙局是一樣的(不是說AI是騙局,而是這種模式的特征很類似,包括數(shù)字貨幣)。這種趨勢下,關(guān)鍵的關(guān)鍵就是最后能不能兌現(xiàn)出真正的商業(yè)價(jià)值,然后才可能拉動(dòng)下一個(gè)循環(huán)。所有的龐氏騙局不是中間沒收益而是最終交待不上,預(yù)期值徹底踏空,然后迅速跌的什么也不是,并崩盤。
從這個(gè)角度看,AI要想構(gòu)建良性循環(huán):第一步需要通過圖靈測試,第二步需要激發(fā)新的正反饋模式。然后才是2000年的互聯(lián)網(wǎng),AI原生應(yīng)用的崛起,否則就都是前奏。從這個(gè)角度,就會(huì)覺得在這個(gè)時(shí)間點(diǎn)認(rèn)為AI發(fā)展太快是滑稽的。
當(dāng)然,這不單是是OpenAI幾個(gè)公司的問題,還牽涉到這次大量的創(chuàng)業(yè)項(xiàng)目。
扮演引擎角色的通用大模型如果過不了圖靈測試2.0,那基于它的各種嘗試結(jié)果就沒那么美妙。
五、潛在受害者
近來無意間看到了很多這一波很多創(chuàng)業(yè)項(xiàng)目的介紹,看完的感覺就是:如果最終大模型的智能峰值過不了圖靈測試2.0,那這些項(xiàng)目都會(huì)慢慢死去,像干涸的湖泊里的魚一樣。
這類事沒法舉具體項(xiàng)目來點(diǎn)評,我們凌空說一個(gè)作為例子,比如:我可能發(fā)現(xiàn),一個(gè)企業(yè)用多種平臺(tái),反復(fù)對齊數(shù)據(jù)特別費(fèi)人工,然后可以用RPA結(jié)合模型做出改善。這有沒有價(jià)值呢?有價(jià)值,但如果智能比例不夠,那創(chuàng)造的價(jià)值就不夠它自己消耗的,商業(yè)上不成立。
再比如我發(fā)現(xiàn)家里很多活,人不愿意干家務(wù),那有個(gè)機(jī)器人的話有沒有價(jià)值呢?有價(jià)值,但智能不夠,就干不出真正有用的產(chǎn)品。
順道說句,周末我去某活動(dòng)見幾個(gè)老朋友,就看到了幾個(gè)活動(dòng)中用的機(jī)器人,這簡直把我看的欲哭無淚。這類所謂的具身機(jī)器人和十幾年前根本沒有本質(zhì)進(jìn)展,還是一個(gè)底盤加個(gè)PAD,真有進(jìn)展的還真是智能音箱中花很多時(shí)間打磨的部分,即使很嘈雜語音識別的準(zhǔn)確率也還是可以了。
和上面類似的項(xiàng)目還很多很多,包括供應(yīng)鏈上為AI企業(yè)提供彈藥做芯片做數(shù)據(jù)的,每個(gè)人都想成為英偉達(dá),但如果通過不了圖靈測試2.0,也許會(huì)再有一家,但不會(huì)有再多了。
如果智能的峰值不能進(jìn)一步拉高,那這些產(chǎn)品就都會(huì)卡在某條線下,該花的錢一點(diǎn)也少不了,但就是不創(chuàng)造新價(jià)值。
從這個(gè)角度就更容易看到AI發(fā)展不是太快,而是太慢的真實(shí)含義。誰有多長的血條,一共又有多長的血條呢!
六、一點(diǎn)點(diǎn)形而上
現(xiàn)有經(jīng)濟(jì)體系里人其實(shí)是大號的工具,扮演這個(gè)角色的時(shí)間擠占比如家庭、生活上的時(shí)間。只有極少一部分人可以在這種工具角色中獲得樂趣,絕大部分人不是,但都需要工作,這就是之前說的異化,和摩登時(shí)代比是程度的差異。
而人、工具、組織模式構(gòu)成了一種能力上限,隨著對上限的追求越來越高,在里面的人腳下的傳送帶就轉(zhuǎn)的越快,表現(xiàn)為就是某些人越來越忙。
而當(dāng)人們一考慮會(huì)失去這樣一個(gè)自己不喜歡的角色時(shí),反倒是會(huì)更惶恐,因?yàn)橛幸环N經(jīng)濟(jì)臍帶被切斷的感覺。
這就是最有意思的地方,怎么才能在失去了不喜歡的東西后獲得喜悅?
人工智能是文明要素中的一種,提供了重構(gòu)過往社會(huì)結(jié)構(gòu)的力量,但也不是全部,基于它的進(jìn)展,我們也許可以更低成本的解決現(xiàn)在那些根本解決不了的問題,比如:貧窮與饑餓,它會(huì)提高整個(gè)社會(huì)的自由度,讓人更有解決問題的空間,重新進(jìn)行一種更高級的綜合。
在這點(diǎn)上我同意凱文凱利的觀點(diǎn):科技總是即帶來好的也帶來壞的,但總是好的多一點(diǎn)點(diǎn)。它至少增大了可能的空間。
從這個(gè)角度看,人工智能的發(fā)展也是慢的。
七、小結(jié)
在人工智能上,技術(shù)、社會(huì)性的想象、商業(yè)的判斷現(xiàn)在堆積到了一起,所以經(jīng)常出各種各樣的觀點(diǎn),但在當(dāng)前階段對人工智能做純技術(shù)解讀或者做純粹的社會(huì)性解讀意義未必很大,只有從商業(yè)角度才能更清楚的看到它這種瀕臨死亡和勃勃生機(jī)相疊加的矛盾態(tài),所以回到圖靈測試2.0應(yīng)該是有意義的。
專欄作家
琢磨事,微信公眾號:琢磨事,人人都是產(chǎn)品經(jīng)理專欄作家。聲智科技副總裁。著有《終極復(fù)制:人工智能將如何推動(dòng)社會(huì)巨變》、《完美軟件開發(fā):方法與邏輯》、《互聯(lián)網(wǎng)+時(shí)代的7個(gè)引爆點(diǎn)》等書。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
讓人受益匪淺,很有深度的文章,感謝作者的分享!
國外在忙著研發(fā),國內(nèi)在忙著吹捧內(nèi)斗,一個(gè)在玩技術(shù),一個(gè)在玩心眼兒