騰訊終究還是出了大模型,測了下感覺還行

知危
1 評論 1820 瀏覽 7 收藏 7 分鐘
🔗 B端产品经理需要进行售前演示、方案定制、合同签订等,而C端产品经理需要进行活动策划、内容运营、用户激励等

就在昨天,騰訊也發(fā)布了自己的通用大模型——騰訊混元大模型,具體其表現(xiàn)如何?作者對其進行了體驗,并總結了相關體驗感受,與你分享。

今天,騰訊官宣亮相了混元大模型。

6 月中旬,騰訊曾推出了自己面向 B 端行業(yè)的 MaaS( Model-as-a-service,模型即服務 )解決方案,方案中包含了很多行業(yè)大模型,但沒有通用大模型。

現(xiàn)在,騰訊終究還是忍不住了。

這次,知危編輯部也想辦法獲得了混元大模型的體驗資格,下面就帶大家看看混元的能力。

首先是常規(guī)的對話,我們先看看多輪對話:

以上內容僅能展示連續(xù)對話,內容真實性無法驗證。

正常的問題是可以一直聊下去的( 與其他同行相同,混元也有最大連續(xù)對話數(shù)的限制 ),回答的內容也尚可,并且它會知道哪些信息可以說、哪些信息不可以說。

下面我們看看它提供方案的能力:

策略上沒有什么太大的問題,考慮得相對周到,還是有一定參考價值的。

再讓它生成一個演講稿:

覺得有些太正式官方了,讓他調整了一下:

混元的表現(xiàn)尚可,還是可以起到啟發(fā)或者生產力工具的作用的。

下面我們再看看它的語義理解能力:

當我們要求進一步解釋時,混元應對的也比較好:

除了常規(guī)的對話,混元還給出了比較豐富的 “ 特調 ” 應用,叫作 “ 靈感發(fā)現(xiàn) ”,囊括了各個場景下的諸多功能:

我們測試了一下社群營銷文案,剛好最近中秋節(jié)要到了,看到一些社群在發(fā)月餅團購文案,就讓混元也試了一下。

作為對比,我們先找了一下盒馬社群關于月餅的社群營銷文案看看大概什么樣:

混元的表現(xiàn)如下:

感覺味兒還是對的,隨便修修改改就能用。

除此之外,還有專門的代碼模式和代碼解釋器。

我們先讓混元生成了一段 2048 游戲的代碼:

然后再把它生成的代碼扔進它的代碼解釋器功能里,它解釋的還行:

好了,編輯部的測試大概就是這么多,總地感覺下來,混元的水平跟國內一線大廠持平,說不上驚艷,但也沒掉隊,執(zhí)行各種不同領域任務時的表現(xiàn)在 GPT-3.5 水平上下浮動。

自打 8 月 15 日《 生成式人工智能服務管理暫行辦法 》開始施行后,行業(yè)開始有了明晰的規(guī)范,已經有一批大廠的大模型獲得了全量面向公眾開放的資格。

這意味著行業(yè)迎來了一個成熟的時機:數(shù)量不設限的用戶可以更好地給大模型提供訓練資料,讓大模型更快成長。

所以,騰訊大模型的發(fā)布,極有可能是看中了這一點。

如此一來,最后一個一線大廠也加入了通用大模型的 “ 大亂斗 ” 中。

希望未來某一天,它們能卷出點讓人眼前一亮的東西。

作者:二筒;編輯:大餅

來源公眾號:知危(ID:BusinessAlert),提供敏銳、獨到的商業(yè)信息與參考,重點關注TMT、出海、新消費、新能源。

本文由人人都是產品經理合作媒體 @知危 授權發(fā)布,未經許可,禁止轉載。

題圖來自騰訊混元大模型官網

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 哈哈,8月20-22怎么會是周末

    來自重慶 回復
专题
12831人已学习11篇文章
需求评审会议对整个项目想影响至关重要,作为产品经理,应该如何完成需求评审呢?本专题的文章分享了如何高效完成需求评审。
专题
15620人已学习12篇文章
运费是电商的基础功能模块之一,承担着商品运费计算的作用。本专题的文章分享了如何设计运费规则。
专题
43018人已学习17篇文章
谈到互联网产品,我们不得不谈的就是它的盈利方式,这也是产品人经常会被问到的问题。
专题
37604人已学习20篇文章
“搜索功能”拆解:小功能,大细节。
专题
60468人已学习20篇文章
想转行做产品经理,这个专题值得一看,看看前人是怎么做到的。