无码在线视频亚洲色图,国产精品白丝AV嫩草影院

搜索

APP

起點(diǎn)課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

開通會員

發(fā)布

注冊 | 登錄

大模型圈最新現(xiàn)狀：一半在用DeepSeek，另一半在玩“顏文字”？

硅星人

2024-12-30

0 評論 1319 瀏覽 2 收藏

在人工智能的大模型領(lǐng)域，東方的力量正在崛起，與西方科技巨頭形成激烈競爭。本文將帶您深入了解大模型圈的最新現(xiàn)狀，特別是DeepSeek和阿里通義千問開源的系列模型如何在全球AI模型性能榜單上嶄露頭角。

這兩天的大模型圈子，可謂是熱鬧非凡。

一邊，DeepSeek憑借其低成本、高性能的亮眼表現(xiàn)，吸引著無數(shù)目光，各路技術(shù)大牛紛紛點(diǎn)贊。

而另一邊，社交媒體和技術(shù)論壇上卻開始流行起各種奇特的“顏文字”，比如“QwQ”、“QVQ”，不明所以的人可能一臉懵，但懂行的人都知道，這指的正是阿里通義千問開源的系列模型。

今年9月，阿里發(fā)布通義千問新一代開源模型Qwen2.5系列，一口氣推出了從0.5B到72B參數(shù)的不同規(guī)模版本，覆蓋了各種應(yīng)用需求，成功躋身全球頂尖開源模型行列，多模態(tài)、多語言能力樣樣不落，成了不少企業(yè)和開發(fā)者的心頭好。

不僅如此，Qwen團(tuán)隊(duì)最近也動作頻頻，接連開源了幾款頗具亮點(diǎn)的 AI 模型，持續(xù)引發(fā)關(guān)注。

Qwen團(tuán)隊(duì)的命名風(fēng)格也是相當(dāng)“抽象”：QVQ，“兩眼瞪”；QwQ，像是鍵盤上不小心蹭了一下。

這是什么代碼世界的顏文字？

似乎技術(shù)大牛們在嚴(yán)肅的科研之余，偷偷藏了一點(diǎn)“皮”。

做了8年产品经理后，我是这么看产品经理的

我个人是从非常初级的产品经理做起，再到负责一个大产品的项目管理，现在有幸跳出了日常基础的工作更多的去看产品的PMF，product strategy...

查看详情 >

也許，Qwen的命名哲學(xué)就是：名字隨意，能打才是硬道理？

提起生成式 AI，大家的目光似乎總離不開大洋彼岸的科技巨頭：OpenAI、谷歌、Meta。

但最近，AI圈子里卻頻頻閃現(xiàn)一些來自東方的身影，比如DeepSeek和阿里的通義千問Qwen，它們正在各大AI模型性能榜單上攻城略地，成為焦點(diǎn)。

要知道，過去我們聊到國產(chǎn)大模型，總感覺帶著點(diǎn)“追趕者”的陰影。

但現(xiàn)在這樣的中國開源力量，正在用實(shí)力證明自己不再是看客，而是足以和OpenAI、Meta這些巨頭勁旅掰手腕的角色。

Hugging Face 2024 年年度盤點(diǎn)數(shù)據(jù)就很有意思：Qwen2.5-1.5B-Instruct 的下載量占比高達(dá) 26.6%，碾壓了Llama 3 和 Gemma這些明星開源模型。

下載量這東西，雖然不能完全等同于“最強(qiáng)實(shí)力”，但絕對是人氣的硬指標(biāo)。

Qwen2.5-1.5B-Instruct的超高下載量，證明了其在當(dāng)前時(shí)間節(jié)點(diǎn)上的廣泛應(yīng)用和高人氣，也反映出中國公司開發(fā)的開源大模型正在國際舞臺上展現(xiàn)出越來越強(qiáng)的影響力，實(shí)際上，Hugging Face平臺上 2023年下載量最高的開源模型，同樣來自中國社區(qū)，是智源研究院BGE-base。

對于Qwen的亮眼表現(xiàn)，國外網(wǎng)友也是喜聞樂見，甚至已經(jīng)開始玩梗了：扎克伯格可能正偷偷瞅著你用Qwen而不是 Llama?！?/p>

一、圣誕大禮包QvQ，首個(gè)開源多模態(tài)推理模型

網(wǎng)友們開始用上的包括Qwen團(tuán)隊(duì)送上的圣誕禮物：QVQ-72B-Preview。這是一款能夠分析圖像并進(jìn)行推理的全新開源模型。雖然還處于實(shí)驗(yàn)階段，但初步測試表明，它在視覺推理任務(wù)中表現(xiàn)相當(dāng)出色。

QVQ通過逐步思考來解決問題，類似于OpenAI的o1或Google的Flash Thinking等能夠“逐步思考”的模型。

用戶扔給它一張圖和一些指令，系統(tǒng)會分析信息，在必要時(shí)花時(shí)間進(jìn)行反思，并以每個(gè)預(yù)測的置信度分?jǐn)?shù)提供答案。

在底層架構(gòu)上，QVQ-72B-Preview 基于 Qwen 現(xiàn)有的視覺語言模型 Qwen2-VL-72B 構(gòu)建，并增添了思考與推理的能力，這使它成為首個(gè)此類開源模型。

開發(fā)者在Macbook Pro上運(yùn)行QVQ在基準(zhǔn)測試中，開源的QVQ全面超越了其前身Qwen2-VL-72B-Instruct，達(dá)到了與閉源模型如 OpenAI 的 o1 和 Claude 3.5 Sonnet 相近的準(zhǔn)確水平。

QVQ-72B-Preview 的基準(zhǔn)測試結(jié)果

在實(shí)際測試中，一位網(wǎng)友拍了一張紐約地鐵照片考驗(yàn)QVQ，并提問“如果我要去唐人街，我該在這站下車嗎？”用戶最終表示模型做出了正確的判斷，結(jié)合問題進(jìn)行了有效的推理。

二、獲陶哲軒點(diǎn)贊的開源推理模型QwQ

時(shí)間再往前推，2024年11月28日，Qwen團(tuán)隊(duì)還開源了一款專注于推理能力的AI模型 QwQ-32B-Preview。

這是Qwen團(tuán)隊(duì)發(fā)布的首個(gè)開源推理模型，旨在增強(qiáng)AI推理能力。

盡管參數(shù)量僅為32B，但在 GPQA、AIME、MATH-500 和 LiveCodeBench 等多個(gè)評測中，QwQ 都取得了不俗的成績，甚至在部分測試中超越了超越了o1。

QwQ具備深度自省能力，能夠質(zhì)疑自身假設(shè)并進(jìn)行深思熟慮的自我對話，從而解決復(fù)雜問題。

雖然QwQ目前還處于實(shí)驗(yàn)階段，但它展現(xiàn)出的強(qiáng)大分析能力和獨(dú)特的推理方式，已經(jīng)吸引了不少目光，甚至連數(shù)學(xué)界的大牛陶哲軒都公開點(diǎn)贊，說它的表現(xiàn)超越了以往的所有開源模型。

在 AIMO（AI 數(shù)學(xué)奧林匹克）挑戰(zhàn)賽中，Qwen 系列模型也成為了參賽者們最常用的模型之一，位列前三。

AIMO使用最多的模型排名前三均為Qwen

“開放權(quán)重、價(jià)格低、基礎(chǔ)能力突出，這樣的推理模型誰不喜歡呢”。

三、Qwen2.5-Coder：開源界的“代碼扛把子”？

Qwen2.5 系列的發(fā)布，尤其是 Qwen2.5-Coder 的亮相，在AI圈內(nèi)引發(fā)了一波討論。

盡管模型體積相對較小，但Qwen 2.5 Coder32B在HumanEval 等編程基準(zhǔn)測試中仍能與前沿模型相媲美。

有海外技術(shù)博主就吐槽，現(xiàn)在大家好像都盯著 OpenAI、谷歌、Anthropic 這些巨頭的動態(tài)，卻忽略了Qwen這個(gè)“狠角色”。人家可是第一個(gè)能跟Claude Sonnet和GPT-4o正面硬剛，還能在你電腦上本地運(yùn)行的開放權(quán)重模型。這可不僅僅是跑分好看而已，很多體驗(yàn)過的人都說“真香”。

相比之下，DeepSeek的模型雖然也很牛，但體積太大，本地跑起來有點(diǎn)費(fèi)勁（彼時(shí)deepseek v3還未發(fā)布）。Qwen2.5-Coder 的出現(xiàn)，對于開源社區(qū)來說絕對是個(gè)大新聞。

更良心的是，阿里還把技術(shù)報(bào)告完完整整地公開了，沒有藏著掖著，與社區(qū)共享這份成果。

還有開發(fā)者基于Qwen2.5-Coder做了AI 的視頻編輯器Video Composer，用戶可以通過拖放素材（如圖片、視頻和音頻），并使用自然語言，讓Qwen2.5-Coder生成新視頻（基于 FFMPEG 技術(shù)）。

四、滿足多樣化需求，全球化的Qwen

Qwen的另一大優(yōu)勢在于它的“平易近人”。

Qwen2.5 系列不僅面向技術(shù)專家或大型企業(yè)，它的設(shè)計(jì)初衷是讓廣大用戶都能輕松使用。

從資源受限設(shè)備適用的 0.5 億參數(shù)版本，到企業(yè)級應(yīng)用所需的 720 億參數(shù)版本，提供了豐富的選擇，滿足不同需求。

在日本，阿里云與東京大學(xué)初創(chuàng)企業(yè) Lightblue 合作，旨在提升其日語大型語言模型（LLMs）。Lightblue 借助阿里云的架構(gòu)及 Qwen LLM技術(shù)，對模型進(jìn)行了優(yōu)化，從而提高了東亞語言的準(zhǔn)確性。

知名投資人Coinbase前CTOBalaji Srinivasan也公開認(rèn)可了 Qwen 的多模態(tài)和多語言能力。現(xiàn)在，全球各地的工程師幾乎都可以輕松訪問Qwen的各類模型。

更難得的是，Qwen在處理多種語言方面表現(xiàn)出色，即使是一些全球AI訓(xùn)練數(shù)據(jù)比較少的“小語種”，比如緬甸語、孟加拉語和烏爾都語，它也能應(yīng)對。

相比之下，Meta的開源AI模型Llama主要還是針對英語應(yīng)用為主。

不少日本開發(fā)者在認(rèn)真研究 Qwen2.5 的技術(shù)報(bào)告

五、中國AI開源勢力崛起

Qwen等中國AI模型的崛起，為國內(nèi)企業(yè)提供了更多選擇和可能性。在當(dāng)前國際環(huán)境，意義更加凸顯。更關(guān)鍵的是，它們不僅僅是一個(gè)“備胎”選項(xiàng)，而是正在證明自己有實(shí)力與美國頂尖技術(shù)掰手腕。

Qwen的意義，也不僅僅體現(xiàn)在技術(shù)上，其背后代表的開放、協(xié)作，這說明中國在AI領(lǐng)域并沒有掉隊(duì)，反而通過開源展現(xiàn)出了強(qiáng)勁的競爭力。

事實(shí)證明，所謂的GPU限制并沒有阻礙中國 AI 的發(fā)展。如果這個(gè)勢頭保持下去，中國很有可能在LLM市場占據(jù)更重要的地位。

當(dāng)開源模型比 Meta（發(fā)布帶有特殊 Llama 研究許可的模型）還要開放，當(dāng)大家都能用上性能不輸甚至更強(qiáng)的開源模型時(shí)，誰會不樂于使用呢？

CNBC 近期也發(fā)文指出，中國在LLM方面取得了顯著進(jìn)展，Qwen、DeepSeek等模型在某些方面已經(jīng)超越了美國的競爭對手。

中國公司正積極擁抱開源模式，推動AI技術(shù)的發(fā)展和應(yīng)用，以促進(jìn)創(chuàng)新并擴(kuò)大全球影響力。

文章認(rèn)為，中國正在AI領(lǐng)域快速崛起，其AI模型已經(jīng)具備相當(dāng)?shù)膰H競爭力，并且正在努力構(gòu)建自主可控的AI生態(tài)。

Hugging Face的 CEO Clem在其2025年AI預(yù)測中甚至提到，中國將開始引領(lǐng)人工智能競賽，這主要得益于其在開源人工智能競賽中的領(lǐng)先地位。

Sam Altman最近在“感嘆”：復(fù)制相對容易，而做全新且有風(fēng)險(xiǎn)的事情極其困難。

不過他也表示，成功的個(gè)體研究人員理應(yīng)獲得贊譽(yù)，因?yàn)檫@“是世界上最酷的事”。

評論區(qū)里，Vaibhav Srivastav回應(yīng)到，公開的共享不應(yīng)被忽視，并點(diǎn)名Qwen和DeepSeek團(tuán)隊(duì)，他們同樣值得喝彩。

開放的心態(tài)，加上對工程實(shí)踐的重視，正在加速中國AI行業(yè)的發(fā)展。

曾經(jīng)被認(rèn)為會因半導(dǎo)體限制和計(jì)算能力受限而受阻的中國AI產(chǎn)業(yè)，正以開源模型為代表向世界證明，它有能力與全球頂尖水平同臺競技，并在全球范圍內(nèi)創(chuàng)造更大的價(jià)值。

作者｜周一笑

本文由人人都是產(chǎn)品經(jīng)理作者【硅星人】，微信公眾號：【硅星人Pro】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App

硅星人

硅（Si）是創(chuàng)造未來的基礎(chǔ)，歡迎來到這個(gè)星球。

218篇作品 775659總閱讀量

數(shù)據(jù)分析，如何助力用戶增長？

09-258853 瀏覽

朋友圈發(fā)布的神秘代碼，爆火的社交新平臺 Damus 是什么？

02-032713 瀏覽

产品经理难题：别人都在管理，我还在画原型，为何？

刚刚

中國數(shù)字音樂版權(quán)：從“獨(dú)家”時(shí)代，進(jìn)入“獨(dú)家首發(fā)”時(shí)代？

03-282096 瀏覽

廣告回暖，拯救大廠

09-161889 瀏覽

互聯(lián)網(wǎng)產(chǎn)品經(jīng)理能力矩陣：市場能力之市場調(diào)研

04-255006 瀏覽

評論

目前還沒評論，等你發(fā)揮！

B端产品经理面试，都需要注意那些细节（业务篇）

虛擬人落地，需走過“尷尬期”

08-064201 瀏覽
Costco成功學(xué)陷阱：低價(jià)只是幻影

09-282549 瀏覽
VR/AR/MR-空間交互設(shè)計(jì)之“界面布局”

11-223527 瀏覽

专题

17330人已学习18篇文章

车载HMI设计指南

本专题的文章分享了车载HMI设计指南，包括HMI的交互、设计、功能等方面的知识分享。

专题

17674人已学习13篇文章

如何搭建数据指标体系？

在精细化运营的过程中，为自己的产品搭建一套数据指标体系，对于促进产品和业务增长是至关重要的。本专题的文章分享了如何搭建数据指标体系。

专题

11637人已学习12篇文章

品牌方法论

任何理论都有它的局限性和前提条件，没有一种方法论是永远有效的。品牌方法论一直处在变化阶段，它随着时代发展的变化而变化。本专题的文章分享了品牌方法论。

作为产品经理，你多多少少得懂点技术。

作为一种软件开发工具，低代码平台一定程度上提升了企业的软件开发效率，适应了整体的数字化发展趋势。本专题的文章分享了关于低代码的讲解。

专题

35294人已学习18篇文章

怎么玩转社交电商？

借用别人家的经典案例，来扒一扒社交电商。

大模型圈最新現(xiàn)狀：一半在用DeepSeek，另一半在玩“顏文字”？

一、圣誕大禮包QvQ，首個(gè)開源多模態(tài)推理模型

二、獲陶哲軒點(diǎn)贊的開源推理模型QwQ

三、Qwen2.5-Coder：開源界的“代碼扛把子”？

四、滿足多樣化需求，全球化的Qwen

五、中國AI開源勢力崛起