OpenAI推出“小”模型GPT-4o Mini,成本驟降,開始跟各位卷性價(jià)比了

0 評論 2246 瀏覽 4 收藏 9 分鐘

OpenAI的最新動態(tài)引起了人工智能領(lǐng)域的廣泛關(guān)注,其推出了全新小模型GPT-4o Mini,這是一款成本效益高的輕量級模型,旨在為開發(fā)者提供更加經(jīng)濟(jì)實(shí)惠的選擇。本文將詳細(xì)介紹GPT-4o Mini的特點(diǎn)、性能優(yōu)勢以及它對未來AI應(yīng)用開發(fā)和市場競爭的潛在影響。

今天,OpenAI忽然官宣推出全新小模型「GPT-4o Mini」,相當(dāng)于旗艦?zāi)P虶PT-4o的輕量經(jīng)濟(jì)版來供開發(fā)者使用。

此前,一些沒有足夠資金的開發(fā)者可能對GPT高昂的價(jià)格望而卻步,轉(zhuǎn)而選擇更便宜的模型,例如谷歌的 Gemini 1.5 Flash 或 Anthropic 的 Claude 3 Haiku來構(gòu)建應(yīng)用程序。而現(xiàn)在,OpenAI 也正式進(jìn)入了輕量級模型的市場。

作為OpenAI最具成本效益的小模型, GPT-4o Mini主打的就是便宜好用。價(jià)格為每百萬輸入15美分和每百萬輸出60美分(約等于一本2500頁的書)。比以前的前沿模型便宜一個(gè)數(shù)量級,比GPT-3.5 Turbo便宜60%以上。

性能上它比 GPT-3.5 Turbo更強(qiáng)大,在MMLU測試中得分82%,并在LMSYS機(jī)器人競技榜上打敗了GPT-4(0125版本)。

以上低成本、低延遲的優(yōu)點(diǎn)顯著擴(kuò)展了它基于AI的應(yīng)用范圍,為包括多API調(diào)用、大規(guī)模上下文處理、實(shí)時(shí)客戶互動等多種任務(wù)提供了一個(gè)經(jīng)濟(jì)高效的解決方案。

目前GPT-4o Mini支持文本和視覺輸入,未來將擴(kuò)展至音視頻。它擁有128K上下文窗口,每次請求最多可輸出16K標(biāo)記,知識庫更新至2023年10月。而且由于與GPT-4o共享改進(jìn)的分詞器,使其處理非英語文本的成本效益更高。

“2022年,當(dāng)時(shí)世界上最好的模型是 text-davinci-003。它比這個(gè)新模型差得多,而它的成本高了100倍?!?Sam Altman說,“最重要的是,我們認(rèn)為人們真的會非常喜歡使用這個(gè)新模型?!?/p>

一、一款具有卓越文本智能和多模態(tài)推理能力的小模型

根據(jù)OpenAI官方介紹,GPT-4o mini在學(xué)術(shù)測試中表現(xiàn)優(yōu)異,超越了GPT-3.5 Turbo等小型模型。它在文本智能、多模態(tài)推理和語言支持方面水平與GPT-4o相當(dāng)。在函數(shù)調(diào)用方面表現(xiàn)突出,有助于開發(fā)者創(chuàng)建能與外部系統(tǒng)交互的應(yīng)用。此外還顯著提升了長上下文處理能力,優(yōu)于GPT-3.5 Turbo。

具體幾項(xiàng)基準(zhǔn)測試得分來看:

文本和視覺推理任務(wù)上,GPT-4o mini在MMLU中得分為82.0%,相比之下Gemini Flash得分為77.9%,Claude Haiku得分為73.8%。

數(shù)學(xué)和編碼能力方面,GPT-4o mini也超過了市場上的所有輕量級小模型。在衡量數(shù)學(xué)推理的MGSM中,GPT-4o mini得分為87.0%, Gemini Flash得分75.5%,Claude Haiku得分71.7%。在編碼性能測試HumanEval中,GPT-4o mini拿下87.2%,而Gemini Flash和Claude Haiku分別為71.5%和75.9%。

來到多模態(tài)推理,GPT-4o mini在MMMU中再次以59.4%分奪冠,其對手 Gemini Flash得分56.1%,Claude Haiku得分50.2%。

二、新模型何時(shí)、何處可用?

現(xiàn)在,GPT-4o mini現(xiàn)已作為文本和視覺模型在Assistants API、Chat Completions API和Batch API中可用,并在未來幾天內(nèi)推出微調(diào)功能。如果開發(fā)者不想切換到 GPT-4o Mini ,仍可以通過 API 訪問 GPT-3.5 Turbo。OpenAI表示,GPT-3.5 將在某個(gè)時(shí)候從 API 中退役,但具體時(shí)間未定。

ChatGPT的所有免費(fèi)、Plus和團(tuán)隊(duì)用戶今天起就可以使用GPT-4o mini來取代GPT-3.5,企業(yè)用戶也將在下周開放。

對于渴望以低成本構(gòu)建 AI 應(yīng)用程序的開發(fā)者來說,GPT-4o Mini 的推出無疑為他們提供了另一個(gè)有力選擇。OpenAI已經(jīng)讓金融科技初創(chuàng)公司 Ramp 測試了該模型,使用 GPT-4o Mini 構(gòu)建了一個(gè)從收據(jù)中提取費(fèi)用數(shù)據(jù)的工具。電子郵件客戶端 Superhuman 也參與了測試并用它創(chuàng)建了一個(gè)自動建議郵件回復(fù)功能。

三、可能是小模型界的新晉最強(qiáng)戰(zhàn)將

OpenAI 并沒有透露GPT-4o mini 的具體大小,但表示它大致與其他小型 AI 模型(如 Llama 3 8b、Claude Haiku 和 Gemini 1.5 Flash)處于同一水平。OpenAI還稱GPT-4o mini 在速度、成本效益和智能上都全面碾壓行業(yè)領(lǐng)先的小模型。這也在 LMSYS.org 聊天機(jī)器人競技場的預(yù)發(fā)布測試中得到了驗(yàn)證。

GPT-4o mini 與其它小模型在性能與成本上的綜合比較。圖源:Artificial Analysis

“與同級別模型相比,GPT-4o mini 的輸出速度非???,中位輸出速度為每秒 202 個(gè)標(biāo)記,”Artificial Analysis 聯(lián)合創(chuàng)始人 George Cameron表示,“這比 GPT-4o 和 GPT-3.5 Turbo 快 2 倍多,是許多依賴速度用例的極佳選擇?!?/p>

Sam Altman在推文里說,GPT-4o mini 是朝著讓“智能便宜到無法測量”努力的重要一步。

而關(guān)于OpenAI 為何花了這么長時(shí)間才推出輕量模型,產(chǎn)品主管Olivier Godement表示,這是“純粹的優(yōu)先級”問題。因?yàn)楣緦W⒂趧?chuàng)建GPT-4這類更大更好的模型,這需要大量“人力和算力”。隨著時(shí)間的推移,OpenAI 注意到開發(fā)者急于使用較小的模型,因此決定現(xiàn)在是時(shí)候?qū)①Y源投入到構(gòu)建 GPT-4o Mini 上。

對于網(wǎng)友最關(guān)心的“什么時(shí)候才能開放語音模式”的問題,Sam Altman也給出了回復(fù):“7月晚些時(shí)候推出測試版,公眾訪問權(quán)限更晚些開放。

回到OpenAI這第一款小參數(shù)輕量模型 GPT-4o Mini 。Godement認(rèn)為, GPT-4o Mini 真正體現(xiàn)了OpenAI讓AI技術(shù)更廣泛可及的使命?!叭绻覀兿M?AI 能惠及世界的每一個(gè)角落、每一個(gè)行業(yè)、每一個(gè)應(yīng)用,我們就必須讓 AI 更加經(jīng)濟(jì)實(shí)惠?!?/p>

而除了達(dá)成惠及全球各地開發(fā)者和用戶的目標(biāo),讓AI不僅是大公司的專利,從企業(yè)運(yùn)營角度來說,進(jìn)軍小模型領(lǐng)域更能擴(kuò)大OpenAI產(chǎn)品的覆蓋范圍,在市場競爭中保持優(yōu)勢。

此舉也無疑會給Google、Anthropic等其他競爭者帶來壓力,發(fā)現(xiàn)自己好不容易站穩(wěn)的地盤又引來了OpenAI這個(gè)業(yè)內(nèi)王者入局。但對于普通用戶來說,這并非一件壞事。也許會刺激整個(gè)行業(yè)在小型高效模型方面的研發(fā)和創(chuàng)新,讓AI技術(shù)更加普及易用,從而豐富整個(gè)生態(tài)系統(tǒng)。

本文由人人都是產(chǎn)品經(jīng)理作者【硅星人】,微信公眾號:【硅星人Pro】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!