擊敗99.9%的程序員?OpenAI o3突然發(fā)布
在人工智能的浪潮中,OpenAI的最新力作o3模型系列以其卓越的性能和接近實(shí)現(xiàn)AGI(通用人工智能)的潛力,再次掀起了科技界的熱議。o3模型不僅在圖形邏輯推理基準(zhǔn)上取得了破紀(jì)錄的高分,更在全球知名的編碼競(jìng)賽平臺(tái)Codeforces上展現(xiàn)了超越前代o1的驚人實(shí)力。
一、從o1到o3,OpenAI的飛躍科技旋渦
經(jīng)歷了拖拖拉拉的12天技術(shù)分享直播活動(dòng),OPenAI終于在最后一天放出了大招。日前,OpenAI發(fā)布了下一代的推理模型o3,這是今年早些時(shí)候發(fā)布的o1推理模型的升級(jí)版本。
更準(zhǔn)確地說(shuō),o3是一個(gè)模型系列——就像o1一樣,同時(shí)有o3和o3-mini兩個(gè)版本,后者是一款更小的精簡(jiǎn)版模型,針對(duì)特定任務(wù)進(jìn)行了微調(diào)。
OpenAI聲稱,至少在某些條件下,o3模型可以接近實(shí)現(xiàn)AGI。
所謂AGI,即“通用人工智能”(artificial general intelligence)的縮寫,泛指能完成人類所能完成的任何任務(wù)的人工智能。OpenAI對(duì)此有著自己的定義:“在最具經(jīng)濟(jì)價(jià)值的工作上勝過(guò)人類的高度自主系統(tǒng)”。
那o3有多強(qiáng)大呢?按照OpenAI的說(shuō)法,o3模型在ARC-AGI圖形邏輯推理基準(zhǔn)上獲得了破紀(jì)錄的分?jǐn)?shù),低計(jì)算場(chǎng)景中,o3得分為75.7%,而在高計(jì)算測(cè)試中,它達(dá)到了87.5%——超過(guò)了標(biāo)志著達(dá)到人類水平的門檻85%。
最值得關(guān)注的是,在全球著名的編碼競(jìng)賽平臺(tái)odeforces評(píng)分中,o3取得了2727的評(píng)分,而o1評(píng)分僅為1891。
獵豹移動(dòng)&獵戶星空董事長(zhǎng)傅盛表示,伴隨著OpenAI o3的發(fā)布,人人都是程序員的時(shí)代馬上就要到來(lái)了,你再也不要因?yàn)椴粫?huì)Python、不會(huì)C++就不敢寫程序,只要說(shuō)出你的需求,大語(yǔ)言模型幫你寫程序。
作者|賈桂鵬
本文由人人都是產(chǎn)品經(jīng)理作者【科技旋渦】,微信公眾號(hào):【科技旋渦】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!