火爆全網(wǎng)的ChatGPT,早被資本盯上了,國內(nèi)有人剛?cè)诹?0億
ChatGPT,這個由OpenAI開發(fā)的大規(guī)模預訓練語言模型可謂是火遍全網(wǎng),用戶數(shù)量已突破100萬,免費公測版本的服務器都快就被熱情的測試用戶擠爆了。ChatGPT到底是什么?其背后的大規(guī)模預訓練模型是怎樣一條賽道,為何會受到眾多投資機構(gòu)的追捧?融資熱背后,又離真正大規(guī)模商用落地還有多遠?本篇文章就來一探究竟。
這幾天,一個名為ChatGPT的聊天機器人徹底破圈了,火遍全網(wǎng)。
它寫得了代碼,修復得了bug,還能幫你寫工作周報、寫小說、進行高考答題,甚至你還可以誘騙它規(guī)劃如何毀滅人類。
盡管市面上已經(jīng)有了大量的聊天機器人,但馬斯克仍然對此感嘆:“很多人瘋狂地陷入了ChatGPT循環(huán)中,我們離強大到危險的人工智能不遠了?!?/p>
這個看似無所不能的ChatGPT是由美國OpenAI開發(fā)的大規(guī)模預訓練語言模型,馬斯克曾是這家公司的創(chuàng)始人之一。
12月5日,OpenAI首席執(zhí)行官Sam Altman在社交媒體上發(fā)文表示,ChatGPT于上周三推出,截至目前已突破100萬用戶。
甚至免費公測版本的服務器很快就被熱情的測試用戶擠爆了。
聯(lián)想集團副總裁、聯(lián)想創(chuàng)投集團高級合伙人宋春雨告訴創(chuàng)業(yè)邦,AI預訓練大模型的出現(xiàn),成為了近三年以來AI算法創(chuàng)新最受關注的投資機會。
睿獸分析顯示,2022年以來,國內(nèi)大規(guī)模預訓練模型賽道出現(xiàn)多筆大額融資,單筆融資金額高達10億元,其中不乏聯(lián)想創(chuàng)投、君聯(lián)資本、啟明創(chuàng)投、創(chuàng)新工場等知名投資機構(gòu)。
被網(wǎng)友玩壞了的ChatGPT到底是什么?其背后的大規(guī)模預訓練模型是怎樣一條賽道,為何會受到眾多投資機構(gòu)的追捧?融資熱背后,又離真正大規(guī)模商用落地還有多遠?
AI如何攻破人類,發(fā)人深省的回答
AI教你怎么找男朋友
幫你寫份周報應付老板
試一下python寫個判斷閏年,還有詳細的解釋,不過看上去像是在某個程序網(wǎng)站抄的
AI是如何一本正經(jīng)地胡說八道的
一、“新晉網(wǎng)紅”ChatGPT到底是什么?
簡單來說,預訓練模型(Pre-trained Model)是前人為了解決問題所創(chuàng)造出來的模型。后人在解決類似問題的時候,無需再從零開始訓練一個新模型,而是可以利用此前在類似問題中訓練過的模型來解決現(xiàn)有問題。
與人們熟悉的語音助手不同,ChatGPT在與人們的對話中可以理解較為復雜的語句內(nèi)容,比如有多層語法嵌套的句子。同時,ChatGPT擁有一定聯(lián)系上下文理解語境的能力,可以針對一個問題不斷深入交流。令人驚訝的是,ChatGPT既能承認錯誤、質(zhì)疑不正確的前提,還能拒絕不恰當?shù)恼埱蟆?/p>
這就意味著,ChatGPT已經(jīng)可以實現(xiàn)圍繞某個話題,與人類展開一段談話討論的可能。
OpenAI官方稱,ChatGPT是在人類的幫助下創(chuàng)建并訓練的,人類訓練師對該AI早期版本回答查詢的方式進行排名和評級。然后,這些信息被反饋到系統(tǒng)中,系統(tǒng)會根據(jù)訓練師的偏好來調(diào)整答案。這是一種訓練人工智能的標準方法,被稱為強化學習。
據(jù)國盛證券研報,ChatGPT有著多達1750億個模型參數(shù),OpenAI主要使用的公共爬蟲數(shù)據(jù)集是有著超過萬億單詞的人類語言數(shù)據(jù)集。
該研報指出,ChatGPT在尋找答案、解決問題的效率上已經(jīng)部分超越了如今的搜索引擎。ChatGPT或許在未來會改變我們獲取信息、輸出內(nèi)容的方式,AIGC(AI生成內(nèi)容)有望成為數(shù)字經(jīng)濟時代驅(qū)動需求爆發(fā)的殺手級應用。
不過,ChatGPT也并非上知天文下知地理的“最強懂哥”。
據(jù)官網(wǎng)顯示,ChatGPT目前存在著一些局限性,包括有時會給出看上去正確但荒謬的答案、微調(diào)提問的方式會得到完全不同的答案、有時會反復使用某些句子等。
網(wǎng)友也發(fā)現(xiàn),ChatGPT有兩個明顯的缺點:輸入不能有錯,解釋不夠人性化。
所以,這個五天用戶突破百萬的模型突然遭到編程問答社區(qū)Stack Overflow的封禁。
目前,ChatGPT的研究團隊也表示將根據(jù)用戶反饋持續(xù)改進模型,未來還有很長的道路要走。
盡管如此,OpenAI依然被視為全球AI領域的頂級機構(gòu)。
OpenAI在2020年推出的上一代GPT-3在當時就被稱之為人工智能領域的一個重要里程碑。
在此之后,OpenAI也開始嘗試對GPT-3進行商業(yè)化。目前,OpenAI以API的形式向開發(fā)者客戶有償提供GPT-3模型,并根據(jù)token使用量來收費。目前,基于GPT-3產(chǎn)生的App已經(jīng)達到300多個。
今年大火的AI繪畫也與OpenAI密不可分。
最早,OpenAI曾推出一款DALL-E低代碼工具,用戶只要提出想法、輸入?yún)?shù),電腦就會自動生成藝術級別的畫作。在這一波AI繪畫熱潮中,還涌現(xiàn)了Midjourney、Stable AI等初創(chuàng)公司,有些公司已經(jīng)成為獨角獸。
正是預感到了大模型的巨大價值,在GPT-3推出的前一年,也就是2019年,微軟向OpenAI進行了高達10億美元的投資。
這也為微軟大力推進的云戰(zhàn)略吸引來了不少客戶。
例如,美國最大的汽車零售平臺CarMax利用OpenAI的開發(fā)工具把10萬條客戶評論直接進行了分析,根據(jù)客戶的表達情緒分類成正面、中性和負面,還提取了關鍵字摘要,對于公司的戰(zhàn)略決策起到了很大的幫助。
CarMax首席技術官甚至表示,如果沒有人工智能,這項工作靠人工編輯團隊需要耗費11年才能完成。
可以說,OpenAI帶給了人們巨大的想象空間。
二、融資火熱背后,離真正大規(guī)模商用還有多遠?
實際上,不僅是最近破圈的ChatGPT,近兩年國內(nèi)也迎來了“大練模型”和“練大模型”的軍備競賽熱潮。
其中,自然少不了行業(yè)巨頭和高??蒲袡C構(gòu)。
百度發(fā)布了產(chǎn)業(yè)級知識增強大模型“文心”(參數(shù)規(guī)模達2600億),并基于“文心”模型形成了產(chǎn)業(yè)全景圖。同時,華為聯(lián)合鵬程實驗室等也發(fā)布了“盤古”大模型,阿里巴巴達摩院發(fā)布了中文語言模型 PLUG。
此外,由北京智源人工智能研究院牽頭,匯聚清華、北大、人大、中科院和相關企業(yè)共同研發(fā)的超大規(guī)模預訓練模型“悟道”(悟道2.0參數(shù)規(guī)模達1.75萬億)也于2021年亮相。
“AI預訓練大模型的出現(xiàn),成為了近三年以來AI算法創(chuàng)新最受關注的投資機會?!甭?lián)想集團副總裁、聯(lián)想創(chuàng)投集團高級合伙人宋春雨表示,隨著超大規(guī)模AI預訓練模型的技術突破,在自然語言理解方面已經(jīng)展現(xiàn)出超高程度的可用性,簡而言之就是“機器真的懂人了”。
他認為,大規(guī)模預訓練模型是AI大數(shù)據(jù)要走的必然之路。從學術界和產(chǎn)業(yè)界的角度來看,AI和大數(shù)據(jù)技術的變化也會非常大。未來兩年、最多三年,AI將會有很大能力的提升。
回溯歷史,從最早Deep Learning到Alpha go,到Zero 自訓練,到Transformer,再到GPT-3, AI在突飛猛進的發(fā)展,并不斷落地在應用場景中,比如 AI制藥、預測化學分子都極大地提高了所在行業(yè)的生產(chǎn)力。
啟明創(chuàng)投合伙人周志峰也表示,人工智能過去10年發(fā)展集中在感知智能,特別是視覺和語音技術的突破。下一個十年,人工智能將走向認知智能,預訓練大模型是其核心技術推動力和關鍵基礎設施,讓AI吸收更多的知識去理解和思考,最終實現(xiàn)接近人類水平的認知。同時,預訓練大模型使得AI從依賴手工調(diào)參建模走向可大規(guī)模復制的工業(yè)化階段。
大規(guī)模預訓練模型被投資人看好,也直接反映在了投融資的熱度上。
睿獸分析顯示,2022年以來,尤其是下半年,大規(guī)模預訓練模型領域出現(xiàn)了多筆大額融資。
2月10日,瀾舟科技完成近億元Pre-A輪融資,由聯(lián)想創(chuàng)投、斯道資本共同領投,創(chuàng)新工場跟投。9月26日,智譜AI宣布獲得數(shù)億元B輪融資,由君聯(lián)資本和啟明創(chuàng)投聯(lián)合領投。11月7日,小冰公司宣布完成10億元新融資。12月6日,聆心智能完成數(shù)千萬元天使+輪融資,由連星資本領投,圖靈創(chuàng)投和智譜AI跟投。
這些企業(yè)均將商業(yè)落地作為融資后的發(fā)力重點,但其落地的側(cè)重點各有不同。
瀾舟科技研發(fā)的“孟子”模型,用更小的模型規(guī)模(10億參數(shù)量)實現(xiàn)了比肩超大模型的性能,能夠具備靈活的領域和場景適應能力,在機器翻譯、文本生成、行業(yè)搜索等場景更利于快速、低成本地落地。
2021年9月,瀾舟科技和傳神合作的第一個基于孟子預訓練模型的“任度”翻譯引擎正式發(fā)布上線,截至目前瀾舟科技已完成了各行業(yè)垂直領域20余個翻譯模型的開發(fā),覆蓋新聞、金融、汽車等領域。
聆心智能目前則主要側(cè)重于游戲、營銷、情感三個領域。
聆心智能在12月推出了圖靈世界的首個產(chǎn)品“AI烏托邦”,用戶可快速定制 AI 角色,只需要輸入簡單的角色描述,就可以召喚出相應人設的 AI ,與之進行深度對話,還可以命令AI完成相應的任務。
此外,聆心智能還打造了Emohaa情緒療愈機器人,并與精神心理平臺好心情達成合作,落地了國內(nèi)首款人工智能心理陪伴數(shù)字人;還與高端豪華電動車品牌Beyonca合作,打造了新一代智能駕艙助手。
新一輪融資公布當天,小冰公司啟動了對旗下人工智能數(shù)字員工(AI Being Employee)產(chǎn)品線的年度升級,其中之一就是加強大模型對話引擎。
據(jù)悉,目前小冰框架中運行了30萬名數(shù)字員工,包括萬科集團年度優(yōu)秀員工“崔筱盼”、紅杉中國首位虛擬分析師“Hóng”、虛擬歌手“洛天依”等。由小冰框架生成的“小堂妹”等數(shù)名虛擬主播,全網(wǎng)播放量均已破億。
盡管各家的“大煉模型”已經(jīng)在商業(yè)落地上取得了一些成績,但實際應用情況如何、能解決哪些實際問題仍然在遭受著用戶的質(zhì)疑。
平安科技前沿技術部門負責人王磊就曾公開指出,當前大規(guī)模預訓練模型在垂直領域存在“致命”問題。
他認為,大規(guī)模預訓練模型在垂直領域性能達不到要求的原因可能是:大規(guī)模預訓練模型的訓練語料庫規(guī)模很大,既包含了該領域的關鍵信息也包含了其他無關信息,使得模型缺少對關鍵信息的關注。同時,當前大規(guī)模預訓練模型的機制改進也很少涉及對關鍵信息的提取。
不同于網(wǎng)友在ChatGPT上的“自娛自樂”,大規(guī)模預訓練模型一旦商用,假如出現(xiàn)錯誤,或?qū)斐呻y以挽回的實際損失。這也是客戶最大的擔心之處。
特別是金融行業(yè)的客戶對上線模型的精度要求很高,不少場景直接使用預加載模型往往很難滿足需求。
有投資人也表示,“盡管可以通過置信度評估方法等方式來提升模型的靠譜程度,但距離商用真正意義上的‘好用’仍有很長一段路要走?!?/p>
作者:巴里;編輯:子鉞
來源公眾號:創(chuàng)業(yè)邦(ID:ichuangyebang),創(chuàng)新成長,創(chuàng)業(yè)興邦。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @創(chuàng)業(yè)邦 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!