馬斯克發(fā)布Grok 3,具備防“蒸餾”技術(shù)
近日,埃隆·馬斯克的人工智能公司xAI發(fā)布了其最新旗艦?zāi)P虶rok 3,這一模型不僅在性能上實(shí)現(xiàn)了顯著提升,還引入了獨(dú)特的防“蒸餾”技術(shù)以保護(hù)知識(shí)產(chǎn)權(quán)。本文將深入探討Grok 3的技術(shù)亮點(diǎn)、應(yīng)用場(chǎng)景以及其對(duì)未來(lái)AI發(fā)展的潛在影響。
埃隆·馬斯克的人工智能公司xAI于周一晚些時(shí)候發(fā)布了其最新旗艦人工智能模型Grok 3,并為Grok的iOS和網(wǎng)絡(luò)應(yīng)用程序推出了新功能。
Grok是xAI對(duì)OpenAI的GPT-4和谷歌的Gemini等模型的回應(yīng),能夠分析圖像并回答問(wèn)題,并為馬斯克的社交網(wǎng)絡(luò)X上的多個(gè)功能提供支持。Grok 3已經(jīng)開(kāi)發(fā)了數(shù)月,并曾樂(lè)觀地計(jì)劃于2024年發(fā)布,但未能按時(shí)推出。
周一的發(fā)布顯得雄心勃勃。
xAI在孟菲斯的一個(gè)龐大數(shù)據(jù)中心中使用了大約20萬(wàn)個(gè)GPU來(lái)訓(xùn)練Grok 3。馬斯克在X上發(fā)布的一篇帖子中聲稱,Grok 3的開(kāi)發(fā)使用了比其前身Grok 2多10倍的計(jì)算能力,并采用了擴(kuò)展的訓(xùn)練數(shù)據(jù)集,其中可能包括法庭文件。
“Grok 3比Grok 2強(qiáng)大了一個(gè)數(shù)量級(jí),”馬斯克在周一的直播演示中表示?!斑@是一個(gè)追求絕對(duì)真理的人工智能,即使這種真理有時(shí)與政治正確相沖突?!?/p>
Grok 3實(shí)際上是一個(gè)模型家族。Grok 3迷你版是一個(gè)較小的版本,它以犧牲一些準(zhǔn)確性為代價(jià),能夠更快地回答問(wèn)題。目前,并非所有Grok 3的模型及相關(guān)功能都已上線(部分功能仍處于測(cè)試階段),但它們已于周一開(kāi)始逐步推出。
xAI聲稱,Grok 3在包括AIME(評(píng)估模型在數(shù)學(xué)問(wèn)題上的表現(xiàn))和GPQA(使用博士級(jí)別的物理、生物和化學(xué)問(wèn)題評(píng)估模型)的基準(zhǔn)測(cè)試中超越了GPT-4o。
根據(jù)xAI的說(shuō)法,Grok 3的早期版本還在Chatbot Arena中取得了具有競(jìng)爭(zhēng)力的評(píng)分。
Chatbot Arena是一個(gè)眾包測(cè)試平臺(tái),不同的AI模型相互競(jìng)爭(zhēng),用戶會(huì)投票選擇他們更喜歡的回答。總部位于倫敦和舊金山的Latent Labs將與制藥行業(yè)合作,設(shè)計(jì)合成蛋白質(zhì),這些蛋白質(zhì)可用于抗體治療等藥物中。
新推出的Grok 3模型有兩種變體:Grok 3 Reasoning和Grok 3 mini Reasoning,它們能夠像OpenAI的o3-mini和中國(guó)人工智能公司DeepSeek的R1這樣的“推理”模型一樣,仔細(xì)“思考”問(wèn)題。推理模型會(huì)在給出結(jié)果之前嘗試自我事實(shí)核查,從而避免一些通常會(huì)絆倒其他模型的陷阱。
xAI聲稱,Grok 3 Reasoning在多個(gè)流行的基準(zhǔn)測(cè)試中超越了o3-mini的最佳版本——o3-mini-high,其中包括一個(gè)名為AIME 2025的較新的數(shù)學(xué)基準(zhǔn)測(cè)試。
這些推理模型可以通過(guò)Grok應(yīng)用程序訪問(wèn)。用戶可以要求Grok 3進(jìn)行“思考”,或者對(duì)于更復(fù)雜的問(wèn)題,使用“超級(jí)大腦”模式,該模式會(huì)調(diào)用額外的計(jì)算能力來(lái)進(jìn)行推理。xAI將推理模型描述為最適合數(shù)學(xué)、科學(xué)和編程問(wèn)題。
馬斯克表示,為了防止知識(shí)提取(distillation)——一種AI模型開(kāi)發(fā)者從其他模型中提取知識(shí)的方法,Grok應(yīng)用程序中會(huì)隱藏一些推理模型的“思考”過(guò)程。最近,DeepSeek被指控通過(guò)提取OpenAI模型的知識(shí)來(lái)創(chuàng)建自己的模型。
Grok的推理模型支持了Grok應(yīng)用程序中的一個(gè)新功能——DeepSearch,這是xAI對(duì)OpenAI的深度研究工具(deepresearch)的回應(yīng)。DeepSearch會(huì)在互聯(lián)網(wǎng)和X平臺(tái)上掃描信息,并在回答問(wèn)題時(shí)提供一個(gè)摘要。
X平臺(tái)的Premium+訂閱用戶(每月50美元)將首先獲得對(duì)Grok 3的訪問(wèn)權(quán)限,而其他功能將被限制在一個(gè)名為SuperGrok的新計(jì)劃中。根據(jù)泄露的信息,SuperGrok的定價(jià)為每月30美元或每年300美元,它將解鎖額外的推理和DeepSearch查詢,并提供無(wú)限的圖像生成功能。
馬斯克表示,未來(lái)——大約在一周后——Grok應(yīng)用程序?qū)⒃黾印罢Z(yǔ)音模式”,為Grok模型提供合成語(yǔ)音。在此之后的幾周內(nèi),Grok 3模型將通過(guò)xAI的企業(yè)API提供,同時(shí)還將提供DeepSearch功能。
馬斯克還提到,xAI計(jì)劃在未來(lái)幾個(gè)月內(nèi)開(kāi)源Grok 2。
“我們的總體方法是,當(dāng)新版本完全推出后,我們會(huì)開(kāi)源上一個(gè)版本?!彼^續(xù)說(shuō)道,“當(dāng)Grok 3成熟且穩(wěn)定時(shí),可能在未來(lái)幾個(gè)月內(nèi),我們就會(huì)開(kāi)源Grok 2?!?/p>
兩年前馬斯克首次宣布Grok時(shí),他將這款人工智能模型定位為大膽、未經(jīng)篩選且反“覺(jué)醒”(anti-“woke”)——總體而言,它愿意回答其他AI系統(tǒng)不愿涉及的爭(zhēng)議性問(wèn)題。他在一定程度上兌現(xiàn)了這一承諾。例如,當(dāng)被要求使用粗俗語(yǔ)言時(shí),Grok和Grok 2會(huì)欣然從命,說(shuō)出你可能從未從ChatGPT那里聽(tīng)到的色彩斑斕的言辭。
然而,在Grok 3之前,Grok模型在政治話題上有所保留,并不會(huì)跨越某些界限。事實(shí)上,一項(xiàng)研究發(fā)現(xiàn),Grok在跨性別權(quán)利、多元化項(xiàng)目和平等問(wèn)題上傾向于左傾立場(chǎng)。
馬斯克將這種傾向歸咎于Grok的訓(xùn)練數(shù)據(jù)——公開(kāi)網(wǎng)頁(yè)內(nèi)容,并承諾要“將Grok調(diào)整得更接近政治中立”。目前還不清楚xAI是否已經(jīng)實(shí)現(xiàn)了這一目標(biāo),以及可能會(huì)帶來(lái)什么后果。(TechCrunch)
本文由人人都是產(chǎn)品經(jīng)理作者【AI新智能】,微信公眾號(hào):【AI新智能】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!