不怕模型混亂,OpenAI又推“全能?!盙PT-4.1,B端市場福音

鯨選AI
0 評論 1535 瀏覽 1 收藏 6 分鐘
🔗 B端产品经理需要更多地关注客户的商业需求、痛点、预算、决策流程等,而C端产品经理需要更多地关注用户的个人需求

OpenAI再推新模型GPT-4.1,性能更強、成本更低,能否成為B端市場的“全能選手”?從多模態(tài)能力到編程表現(xiàn),這款模型能否扛起商業(yè)化大旗?

不怕模型混亂,OpenAI又推“全能模”GPT-4.1,B端市場福音

OpenAI剛出官方博客,夸贊GPT-4.5是比 4 聰明10倍的模型,轉(zhuǎn)眼就又推出了GPT-4.1,還是非推理模型,還更便宜。

有網(wǎng)友評價:“GPT-4.5甚至還沒來及說再見!”而且這次沒說明,為何數(shù)字命名又倒退了?難道Altman也分不清 9.9 和 9.11 的大?。?/p>

言歸正傳,OpenAI最新發(fā)布的三個新模型是:GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。

  • GPT-4.1 是 OpenAI 最新旗艦大模型,具有更好的編程與寫作能力,支持最長 100 萬 token 上下文,適用于復(fù)雜任務(wù)。
  • GPT-4.1 Mini 是中端任務(wù)模型,性能接近GPT-4o,但成本降低 83%。
  • GPT-4.1 Nano 是OpenAI最快+最便宜模型的本地運行小模型,持 AI 智能硬件助手等邊緣應(yīng)用。

官方提到,4.1在編碼和指令跟蹤方面均有顯著提升,多模態(tài)能力提升巨大,實際上差不多提升了三分之一左右。

具體來說,GPT-4.1 被視為 GPT-4o 的全面升級版,具備更強的多模態(tài)處理能力、更大的上下文窗口(全部可處理 100 萬個 token),并且成本降低了 26%。

GPT-4.1 按延遲劃分的家庭智能

OpenAI又端出了一盤菜,琳瑯滿目的模型選擇,本質(zhì)上也沒有很大的差別,能力上也沒有拉開絕對差距。

實際上,Altman也意識到這一問題,宣稱GPT-5 將整合語音、畫布、搜索、Deep Research 等功能?!拔覀兊囊粋€核心目標(biāo)是通過創(chuàng)建能夠使用所有工具、知道何時需要長時間思考、并且適用于廣泛任務(wù)的系統(tǒng),來統(tǒng)一 o 系列模型和 GPT 系列模型?!?/p>

GPT-4.1有點GPT-5的影子了,意味著OpenAI也在嘗試初步解決模型雜亂這一問題。

這次推出 GPT-4.1,核心目標(biāo)就是逐步淘汰一些舊模型。

此前官宣GPT-4 將于 2025 年 4 月 30 日從 ChatGPT 中退役,由更強的 GPT-4o 完全替代。 GPT-4.1未來也許會正在逐步取代 GPT-4o,目前除了文生圖能力還沒有,4.1已經(jīng)全面超越了4o。

而GPT-4.5 的預(yù)覽版將于 7月14 日從 API 中下線,4.1成為主流To B服務(wù)模型,適用于大多數(shù)用戶和開發(fā)者,具有更強的性能和更低的成本。

鯨哥個人認(rèn)為,GPT-5不會順利在第三季度推出,年底能出現(xiàn)就算不錯了。

GPT-4.1可能是今年OPenAI扛大梁的模型,因此這款模型的能力邊界就值得關(guān)注。

在重要的 SWE-bench Verified 編程能力基準(zhǔn)測試中的得分比較,GPT-4.1 的任務(wù)完成率為54.60%,位列第四名。

看似成績不如Claude 3.7 sonnet、Gemini 2.5 Pro Exp這些老對手,但要注意第一名是不會發(fā)布的o3模型(未來直接融入GPT5一起發(fā)布)。

接下來研究4.1的多模態(tài)識別能力和代碼生成能力,鯨哥用第一時間免費上線 4.1 API的 Windsurf,輸入圖片讓其生成動態(tài)可視化網(wǎng)頁,這樣識圖能力和代碼生成能力都可以體現(xiàn)。

審美距Claude3.7還有距離

另一方面,GPT-4.1 nano API定價和 Gemini Flash 幾乎相同,這是針對Google的又一次狙擊。

夠用且便宜,這是OpenAI在模型進展不明顯的情況下,還要推出4.1的緣由,他需要4.1和競爭對手搶占市場,尤其是B端市場,接替3.5和4o mini。

像DeepSeek一樣追逐技術(shù)高峰,至今官網(wǎng)沒解決經(jīng)常崩潰的用戶體驗問題。OpenAI在GPT-5來臨前,還需要兼顧商業(yè)化。

而且,據(jù)悉OpenAI 計劃在新一代推理模型(o3、o4),整合跨學(xué)科知識整合能力,并對該模型收取高達(dá) 2 萬美元/月的費用,大約是普通 ChatGPT Plus 訂閱價格的 1000 倍。

顯然不是給普通用戶準(zhǔn)備的,這次GPT-4.1也沒第一時間上ChatGPT,讓C端用戶第一時間體驗。

期待GPT-4.1早日更新到ChatGPT,能力更強,月費也能更便宜。

本文由人人都是產(chǎn)品經(jīng)理作者【鯨選AI】,微信公眾號:【鯨選AI】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
15529人已学习16篇文章
随着互联网时代的蓬勃发展,互联网平台活动运营对于互联网企业业务十分重要。本专题的文章分享了如何做活动运营。
专题
12917人已学习15篇文章
知识付费是内容赛道上的一块高地,有着上百亿的市场规模。本专题的文章分享了关于对知识付费的观点。
专题
46235人已学习20篇文章
这些APP设计的细节和规范你都掌握了吗?
专题
16549人已学习13篇文章
本专题的文章分享了基础功能的实现原理和设计理解。
专题
19885人已学习13篇文章
本专题的文章分享了产品经理面试题和解答思路。
专题
15541人已学习12篇文章
虽然大厂们纷纷奔赴Web3.0,但是不少人还是对这个概念及相应生态一知半解。本专题的文章分享了对于web3的看法。