谷歌急切迎戰(zhàn)ChatGPT,大模型之戰(zhàn)變數(shù)仍多

0 評論 2065 瀏覽 2 收藏 7 分鐘
🔗 B端产品经理需要更多地进行深入的用户访谈、调研、分析,而C端产品经理需要更多地快速的用户测试、反馈、迭代

谷歌于近日推出了多模態(tài)大模型Gemini,并對其能力做出了高度評價。那么,在Gemini出現(xiàn)之后,如何解讀當下的大模型競爭呢?這篇文章里,作者給出了他的看法,一起來看一下吧。

沉寂一年后,谷歌帶著它的多模態(tài)大模型Gemini(雙子座)高調(diào)殺回AI圈。

此前,谷歌曾憑借AlphaGo在全球掀起了一波AI浪潮。但新一輪AI浪潮的風(fēng)頭卻被ChatGPT搶走,谷歌迫切需要一款現(xiàn)象級AI產(chǎn)品來證明自己的實力,這也就不難理解,為何谷歌要冒著風(fēng)險在演示視頻中夸大自家大模型的性能。因為他們太想讓Gemini「看起來」優(yōu)于競品了。

從命名也能看出,谷歌對Gemini的功能寄予了超越人腦的厚望。官方稱Gemini是AI模型的巨大飛躍,其多項能力超過ChatGPT。自此,谷歌正式向競爭對手OpenAI和微軟宣戰(zhàn),爭奪人工智能霸主地位。AI圈最強終于不再是ChatGPT的獨角戲。

01

最強大模型之戰(zhàn)硝煙正濃。

作為應(yīng)對ChatGPT-4的殺手锏,谷歌在發(fā)布會上稱Gemini是其迄今為止規(guī)模最大、能力最強、最靈活的AI模型。不僅如此,谷歌稱Gemini是自己從頭開始構(gòu)建的多模態(tài)模型,更接近人類認識世界的方式。

不同于ChatGPT的逐步更新,谷歌一次性就發(fā)布了三種模式的Gemini,分別是Gemini Nano、Gemini Pro和Gemini Ultra。不同版本在性能上有著明顯差異,現(xiàn)在大家能用上的都是Gemini Pro,但在功能上能迎戰(zhàn)ChatGPT的是Gemini Ultra。

雖然宣傳視頻翻車,但Gemini的數(shù)據(jù)表現(xiàn)還是相當優(yōu)異。在運算效能方面,Gemini幾乎“吊打”GPT-4。Gemini Ultra在32個多模態(tài)基準測試中,其中30個測試集的性能超過當前SOTA結(jié)果。在數(shù)學(xué)問題、Python代碼任務(wù)、閱讀等方面,Gemini的性能都超過了此前最先進的水平。

在純文本問題上,Gemini是第一個在MMLU(大規(guī)模多任務(wù)語言理解)測評上超過人類專家的模型。Gemini的得分為90%,人類專家得分約為89%,而GPT-4在這類問題上的得分為86%;在多模式問題上,Gemini得分為59%,GPT-4得分為57%,Gemini的表現(xiàn)均為最佳。

除了在常規(guī)能力上全面超越GPT-4,Gemini最大的特色是多模態(tài),也就是可以同時識別和理解文本、圖像、音頻、視頻和代碼五種信息,用戶可以交錯添加文字、圖像、視頻等內(nèi)容,Gemini也可以輸出相應(yīng)交錯的文本和圖像。從一開始,Gemini就在不同模態(tài)上進行預(yù)訓(xùn)練,再通過額外的多模態(tài)數(shù)據(jù)進行微調(diào),這進一步提升了模型的有效性。

02

搶跑就一定能將優(yōu)勢保持到最后嗎?答案可能是:未必。

對于剛起步的大模型行業(yè)來說,行業(yè)格局未定,后續(xù)的競爭依然充滿變數(shù)。谷歌一開始在AI領(lǐng)域遙遙領(lǐng)先,最后卻淪為OpenAI的追趕者;ChatGPT一出現(xiàn)便技驚四座,現(xiàn)如今又被Gemini趕超……這樣的故事在不斷上演。谷歌視頻里演示的多模態(tài)能力,實際上在一年內(nèi)就能實現(xiàn)。但一年時間里ChatGPT也會不停迭代,到時候Gemini還會是ChatGPT的對手嗎?

谷歌的野心絕不止步于追趕,而是希望全方位碾壓。Gemini的發(fā)布不僅是為了與ChatGPT一較高下,背后潛藏的是一個更大的項目。除了Gemini,谷歌還發(fā)布了迄今為止最強大、最高效,并且可擴展的TPU系統(tǒng)——Cloud TPU v5p,專為訓(xùn)練尖端的AI模型而設(shè)計。新一代TPU將加速Gemini的發(fā)展,幫助開發(fā)人員和企業(yè)客戶更快地訓(xùn)練大規(guī)模生成式AI模型,開發(fā)出新產(chǎn)品和新功能。一個更可靠、可擴展的訓(xùn)練模型和最高效的服務(wù)模型,才是谷歌做出Gemini的重要目標。

這一戰(zhàn),谷歌布局深遠,奪回AI霸主的野心昭然若揭。面對已經(jīng)打出王炸的谷歌,對手OpenAI肯定不會坐以待斃,而OpenAI的絕招正是你根本猜不到它會出什么牌。最強大模型之爭,槍聲已經(jīng)打響。

03

大模型的競爭才剛開始,國產(chǎn)同行們要加把勁了。

這一年來,國內(nèi)發(fā)布比較知名的大模型有百度文心一言、阿里通義千問、騰訊混元、科大訊飛星火、商湯商量、字節(jié)跳動豆包、智譜AI-ChatGLM等。

表面上看各家大模型都各有優(yōu)勢,但其實都還處于起步階段,算法上還未取得突破性的成果,和國外大模型相比還有一定差距,Gemini的出現(xiàn)或許可以加速行業(yè)內(nèi)的優(yōu)勝劣汰,讓大量沒有足夠競爭力的產(chǎn)品加速出局,同時,它也啟發(fā)了國產(chǎn)大模型:與其跟進式研發(fā),不如將AI功能盡快賦能在已有的產(chǎn)品和服務(wù)之中,這樣反而成本更低、見效更快。

在大模型的競賽中,頭部選手的經(jīng)驗或多或少會被其他追趕者復(fù)用,這對后來者來說是寶貴的學(xué)習(xí)機會,只要保持住追趕的勢頭,就有超越的可能,這次是谷歌,下次又會是誰呢?

作者:Lime

來源公眾號:明晰野望(ID:MXYW-1688),銳眼看財經(jīng)野望大市場

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @明晰野望 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于 CC0 協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
15650人已学习15篇文章
汽车座舱的智能化,本质上是通过硬件+软件的手段,让汽车座舱具备人类“智能”的能力,使人与车直接协作更加安全高效。本专题的文章分享了智能座舱的产品模块解读。
专题
11913人已学习12篇文章
随着市场竞争的加剧,越来越多的企业为了提高内部管控的效率,开始自建或引入内部管理系统来提升公司的效率。本专题的文章分享了企业管理系统设计指南。
专题
12501人已学习15篇文章
互联网医疗是医疗行业与互联网的综合应用,其以互联网及相关技术为载体和支撑,开展线下传统或线上衍生的医疗健康服务。本专题的文章分享了对互联网医疗的分析和见解。
专题
11715人已学习11篇文章
考勤打卡系统几乎是每个公司的必备,是员工管理系统中的一个分支,常见的打卡方式有指纹打卡、人脸打卡、蓝牙打卡等等。本专题的文章分享了考勤打卡产品的设计指南。
专题
16662人已学习14篇文章
本专题的文章分享了拼团功能的设计指南。
专题
33232人已学习15篇文章
一起来看看别人家是怎么做用户增长的。