无码人妻久久一区二区三区99灬,午夜福利福利片亚洲自拍偷拍网

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

開通會(huì)員

發(fā)布

注冊(cè) | 登錄

OpenAI推出“小”模型GPT-4o Mini，成本驟降，開始跟各位卷性價(jià)比了

硅星人

2024-07-19

0 評(píng)論 2318 瀏覽 4 收藏

🔗 产品经理的不可取代的价值是能够准确发现和满足用户需求，把需求转化为产品，并协调资源推动产品落地，创造商业价值。

OpenAI的最新動(dòng)態(tài)引起了人工智能領(lǐng)域的廣泛關(guān)注，其推出了全新小模型GPT-4o Mini，這是一款成本效益高的輕量級(jí)模型，旨在為開發(fā)者提供更加經(jīng)濟(jì)實(shí)惠的選擇。本文將詳細(xì)介紹GPT-4o Mini的特點(diǎn)、性能優(yōu)勢(shì)以及它對(duì)未來AI應(yīng)用開發(fā)和市場(chǎng)競(jìng)爭(zhēng)的潛在影響。

今天，OpenAI忽然官宣推出全新小模型「GPT-4o Mini」，相當(dāng)于旗艦?zāi)Ｐ虶PT-4o的輕量經(jīng)濟(jì)版來供開發(fā)者使用。

此前，一些沒有足夠資金的開發(fā)者可能對(duì)GPT高昂的價(jià)格望而卻步，轉(zhuǎn)而選擇更便宜的模型，例如谷歌的 Gemini 1.5 Flash 或 Anthropic 的 Claude 3 Haiku來構(gòu)建應(yīng)用程序。而現(xiàn)在，OpenAI 也正式進(jìn)入了輕量級(jí)模型的市場(chǎng)。

作為OpenAI最具成本效益的小模型， GPT-4o Mini主打的就是便宜好用。價(jià)格為每百萬輸入15美分和每百萬輸出60美分（約等于一本2500頁的書）。比以前的前沿模型便宜一個(gè)數(shù)量級(jí)，比GPT-3.5 Turbo便宜60%以上。

性能上它比 GPT-3.5 Turbo更強(qiáng)大，在MMLU測(cè)試中得分82%，并在LMSYS機(jī)器人競(jìng)技榜上打敗了GPT-4（0125版本）。

以上低成本、低延遲的優(yōu)點(diǎn)顯著擴(kuò)展了它基于AI的應(yīng)用范圍，為包括多API調(diào)用、大規(guī)模上下文處理、實(shí)時(shí)客戶互動(dòng)等多種任務(wù)提供了一個(gè)經(jīng)濟(jì)高效的解決方案。

B端产品经理的能力模型与学习提升

B端产品经理面临的第一大挑战，是如何正确的分析诊断业务问题。这也是最难的部分，产品设计知识对这部分工作基本没有帮助，如果想做好业务分析诊断，必须具备扎实 ...

查看详情 >

目前GPT-4o Mini支持文本和視覺輸入,未來將擴(kuò)展至音視頻。它擁有128K上下文窗口,每次請(qǐng)求最多可輸出16K標(biāo)記，知識(shí)庫(kù)更新至2023年10月。而且由于與GPT-4o共享改進(jìn)的分詞器，使其處理非英語文本的成本效益更高。

“2022年，當(dāng)時(shí)世界上最好的模型是 text-davinci-003。它比這個(gè)新模型差得多，而它的成本高了100倍。” Sam Altman說，“最重要的是，我們認(rèn)為人們真的會(huì)非常喜歡使用這個(gè)新模型?！?/p>

一、一款具有卓越文本智能和多模態(tài)推理能力的小模型

根據(jù)OpenAI官方介紹，GPT-4o mini在學(xué)術(shù)測(cè)試中表現(xiàn)優(yōu)異，超越了GPT-3.5 Turbo等小型模型。它在文本智能、多模態(tài)推理和語言支持方面水平與GPT-4o相當(dāng)。在函數(shù)調(diào)用方面表現(xiàn)突出，有助于開發(fā)者創(chuàng)建能與外部系統(tǒng)交互的應(yīng)用。此外還顯著提升了長(zhǎng)上下文處理能力，優(yōu)于GPT-3.5 Turbo。

具體幾項(xiàng)基準(zhǔn)測(cè)試得分來看：

文本和視覺推理任務(wù)上，GPT-4o mini在MMLU中得分為82.0%，相比之下Gemini Flash得分為77.9%，Claude Haiku得分為73.8%。

數(shù)學(xué)和編碼能力方面，GPT-4o mini也超過了市場(chǎng)上的所有輕量級(jí)小模型。在衡量數(shù)學(xué)推理的MGSM中，GPT-4o mini得分為87.0%， Gemini Flash得分75.5%，Claude Haiku得分71.7%。在編碼性能測(cè)試HumanEval中，GPT-4o mini拿下87.2%，而Gemini Flash和Claude Haiku分別為71.5%和75.9%。

來到多模態(tài)推理，GPT-4o mini在MMMU中再次以59.4%分奪冠，其對(duì)手 Gemini Flash得分56.1%，Claude Haiku得分50.2%。

二、新模型何時(shí)、何處可用？

現(xiàn)在，GPT-4o mini現(xiàn)已作為文本和視覺模型在Assistants API、Chat Completions API和Batch API中可用，并在未來幾天內(nèi)推出微調(diào)功能。如果開發(fā)者不想切換到 GPT-4o Mini ，仍可以通過 API 訪問 GPT-3.5 Turbo。OpenAI表示，GPT-3.5 將在某個(gè)時(shí)候從 API 中退役，但具體時(shí)間未定。

ChatGPT的所有免費(fèi)、Plus和團(tuán)隊(duì)用戶今天起就可以使用GPT-4o mini來取代GPT-3.5，企業(yè)用戶也將在下周開放。

對(duì)于渴望以低成本構(gòu)建 AI 應(yīng)用程序的開發(fā)者來說，GPT-4o Mini 的推出無疑為他們提供了另一個(gè)有力選擇。OpenAI已經(jīng)讓金融科技初創(chuàng)公司 Ramp 測(cè)試了該模型，使用 GPT-4o Mini 構(gòu)建了一個(gè)從收據(jù)中提取費(fèi)用數(shù)據(jù)的工具。電子郵件客戶端 Superhuman 也參與了測(cè)試并用它創(chuàng)建了一個(gè)自動(dòng)建議郵件回復(fù)功能。

三、可能是小模型界的新晉最強(qiáng)戰(zhàn)將

OpenAI 并沒有透露GPT-4o mini 的具體大小，但表示它大致與其他小型 AI 模型（如 Llama 3 8b、Claude Haiku 和 Gemini 1.5 Flash）處于同一水平。OpenAI還稱GPT-4o mini 在速度、成本效益和智能上都全面碾壓行業(yè)領(lǐng)先的小模型。這也在 LMSYS.org 聊天機(jī)器人競(jìng)技場(chǎng)的預(yù)發(fā)布測(cè)試中得到了驗(yàn)證。

GPT-4o mini 與其它小模型在性能與成本上的綜合比較。圖源：Artificial Analysis

“與同級(jí)別模型相比，GPT-4o mini 的輸出速度非?？欤形惠敵鏊俣葹槊棵?202 個(gè)標(biāo)記，”Artificial Analysis 聯(lián)合創(chuàng)始人 George Cameron表示，“這比 GPT-4o 和 GPT-3.5 Turbo 快 2 倍多，是許多依賴速度用例的極佳選擇?！?/p>

Sam Altman在推文里說，GPT-4o mini 是朝著讓“智能便宜到無法測(cè)量”努力的重要一步。

而關(guān)于OpenAI 為何花了這么長(zhǎng)時(shí)間才推出輕量模型，產(chǎn)品主管Olivier Godement表示，這是“純粹的優(yōu)先級(jí)”問題。因?yàn)楣緦Ｗ⒂趧?chuàng)建GPT-4這類更大更好的模型，這需要大量“人力和算力”。隨著時(shí)間的推移，OpenAI 注意到開發(fā)者急于使用較小的模型，因此決定現(xiàn)在是時(shí)候?qū)①Y源投入到構(gòu)建 GPT-4o Mini 上。

對(duì)于網(wǎng)友最關(guān)心的“什么時(shí)候才能開放語音模式”的問題，Sam Altman也給出了回復(fù)：“7月晚些時(shí)候推出測(cè)試版，公眾訪問權(quán)限更晚些開放。

回到OpenAI這第一款小參數(shù)輕量模型 GPT-4o Mini 。Godement認(rèn)為， GPT-4o Mini 真正體現(xiàn)了OpenAI讓AI技術(shù)更廣泛可及的使命?！叭绻覀兿Ｍ?AI 能惠及世界的每一個(gè)角落、每一個(gè)行業(yè)、每一個(gè)應(yīng)用，我們就必須讓 AI 更加經(jīng)濟(jì)實(shí)惠?！?/p>

而除了達(dá)成惠及全球各地開發(fā)者和用戶的目標(biāo)，讓AI不僅是大公司的專利，從企業(yè)運(yùn)營(yíng)角度來說，進(jìn)軍小模型領(lǐng)域更能擴(kuò)大OpenAI產(chǎn)品的覆蓋范圍，在市場(chǎng)競(jìng)爭(zhēng)中保持優(yōu)勢(shì)。

此舉也無疑會(huì)給Google、Anthropic等其他競(jìng)爭(zhēng)者帶來壓力，發(fā)現(xiàn)自己好不容易站穩(wěn)的地盤又引來了OpenAI這個(gè)業(yè)內(nèi)王者入局。但對(duì)于普通用戶來說，這并非一件壞事。也許會(huì)刺激整個(gè)行業(yè)在小型高效模型方面的研發(fā)和創(chuàng)新，讓AI技術(shù)更加普及易用，從而豐富整個(gè)生態(tài)系統(tǒng)。

本文由人人都是產(chǎn)品經(jīng)理作者【硅星人】，微信公眾號(hào)：【硅星人Pro】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App