24W29產(chǎn)品周報(bào) | AI大模型認(rèn)不出9.11和9.9哪個(gè)大,“京東超級18”將上線,餓了么升級發(fā)布“超級吃貨卡”

0 評論 1754 瀏覽 0 收藏 14 分鐘

這周二有用戶發(fā)現(xiàn),大模型無法分辨“9.11和9.9哪個(gè)大”的問題,隨即國內(nèi)外的大模型都被問了一遍,強(qiáng)如ChatGPT也翻車。有人在找樂子的同時(shí),也有人在考慮其中的原因——畢竟大模型的運(yùn)作原理現(xiàn)在還是黑盒,雖然OpenAI已經(jīng)破解,但理解起來還沒那么快。

接下來,大家關(guān)注的就是雷軍的演講。據(jù)悉已經(jīng)會(huì)發(fā)布一些小米的新品,具體消息還未可知。

其他新鮮的動(dòng)態(tài),請看本周周報(bào)。

一、值得關(guān)注

9.11和9.9哪個(gè)大?12個(gè)大模型8個(gè)都答錯(cuò),ChatGPT也翻車了

引發(fā)這一問題的是上周末國內(nèi)一個(gè)綜藝相關(guān)的熱搜。

7月13日,在最新一期的《歌手》公布的排名中,國內(nèi)歌手孫楠與外國歌手香緹莫的得票率分別是13.8%和13.11%,有網(wǎng)友質(zhì)疑排名有問題,認(rèn)為13.11%大于13.8%。隨后,關(guān)于13.8和13.11大小比較的話題沖上熱搜。

本周二,一道小學(xué)生難度的數(shù)學(xué)題難倒了一眾海內(nèi)外AI大模型。

9.11和9.9哪個(gè)更大?記者就此問題測試了12個(gè)大模型,其中阿里通義千問、百度文心一言、Minimax和騰訊元寶答對,但ChatGPT-4o、字節(jié)豆包、月之暗面kimi、智譜清言、零一萬物萬知、階躍星辰躍問、百川智能百小應(yīng)、商湯商量都答錯(cuò)了,錯(cuò)法各有不同。

首先是目前全球公認(rèn)第一梯隊(duì)的大模型ChatGPT,在被問到“9.11和9.9哪個(gè)大”時(shí)回復(fù)稱,小數(shù)點(diǎn)后面的數(shù)字“11大于9”,因此9.11大。

詢問月之暗面旗下kimi,它在比較小數(shù)部分時(shí)認(rèn)為,9.11的第一位小數(shù)是1,而9.9的第一位小數(shù)是0,錯(cuò)誤地給出了小數(shù),得出結(jié)論9.11更大。

詢問字節(jié)豆包,它不僅給出了答案,還舉了生活中的例子方便理解,單看似有理有據(jù)實(shí)則胡說八道。豆包舉例認(rèn)為,假設(shè)有兩筆錢,“9.11元比9.9元多0.21元”,并且測量長度時(shí)“9.11 米要比 9.9 米長”。從答案來看,幾個(gè)答對了的大模型解題過程都很相似。

以文心一言為例,成功地分開比較了整數(shù)部分和小數(shù)部分。

大部分大模型在問答中都錯(cuò)誤地比較了小數(shù)點(diǎn)后的數(shù)字,認(rèn)為9.11大于9.9.考慮到數(shù)字涉及的語境問題,記者將其限定為在數(shù)學(xué)語境下,如ChatGPT這樣的大模型也照樣答錯(cuò)。

關(guān)于此類事件,平臺(tái)有不少文章進(jìn)行了詳細(xì)的分析和討論:

《「13.11>13.8」沖上熱搜,一道題讓人類AI集體降智?所有LLM致命缺點(diǎn)曝光》

《大模型集體失智!9.11和9.9哪個(gè)大,幾乎全翻車了》

暑期赴港旅客00后占35%,酒店布局下沉市場成趨勢

步入7月,暑期旅游大幕正式拉開。

攜程數(shù)據(jù)顯示,截至7月15日,今年暑期境內(nèi)酒店的搜索熱度,相較2023年同期增長約20%。盡管個(gè)別旅游目的地出現(xiàn)下滑,但大部分熱門旅游城市的酒店消費(fèi)依舊火爆。國內(nèi)避暑與親子屬性的出游,占據(jù)暑期游主導(dǎo)位置;在免簽政策的利好之下,入境游今年增長強(qiáng)勁。

在出境游與國內(nèi)五線城市及縣域等下沉市場的分流下,部分傳統(tǒng)旅游目的地客流增速放緩,而酒店企業(yè)則加速拓展新興旅游市場,華北、華南、西南成為布局重點(diǎn)區(qū)域。

7月18日,由香港機(jī)場管理局、中國民航雜志社、在線旅游平臺(tái)去哪兒聯(lián)合舉辦的“人生第一張機(jī)票·飛香港”活動(dòng)在重慶江北國際機(jī)場拉開序幕。50名大學(xué)生接受香港機(jī)場管理局免費(fèi)贈(zèng)予的機(jī)票,從重慶飛往香港。

去哪兒數(shù)據(jù)顯示,截至7月18日,在去哪兒平臺(tái)上預(yù)訂暑期赴港的機(jī)票預(yù)訂量同比去年同期增長了近八成,相較2019年同期增長超過三成。其中,00后群體預(yù)訂占比達(dá)35%。

雷軍:7月19日舉辦第5次雷軍年度演講

雷軍在微博表示,“7月19日晚7點(diǎn),就是本周五晚上,我將舉辦第5次雷軍年度演講,主題是《勇氣》,講講造車的來龍去脈和這三年多跌宕起伏的故事。”

二、產(chǎn)品動(dòng)態(tài)

OpenAI發(fā)布最新技術(shù)研究,AI“黑盒”不再是難題!

7月18日凌晨,OpenAI在官網(wǎng)發(fā)布了最新技術(shù)研究——Prover-Verifier-Games。隨著ChatGPT在法律、金融、營銷等領(lǐng)域的廣泛使用,確保模型的安全、準(zhǔn)確輸出同時(shí)被很好理解變得非常重要。但由于神經(jīng)網(wǎng)絡(luò)的復(fù)雜和多變性,我們根本無法驗(yàn)證其生成內(nèi)容的準(zhǔn)確性,這也就會(huì)出現(xiàn)輸出“黑盒”的情況。為了解決這個(gè)難題,OpenAI提出了全新訓(xùn)練框架Prover-Verifier Games(簡稱“PVG”),例如,用GPT-3這樣的小模型來驗(yàn)證、監(jiān)督,GPT-4大模型的輸出,從而提升輸出準(zhǔn)確率以及可控性。

小冰AI數(shù)字員工升級:發(fā)布全新“零樣本”技術(shù)

小冰公司宣布全新的“零樣本”數(shù)字人(Zero-shot Xiaoice Neural Rendering,Zero-XNR)技術(shù)正式上線,并同步推出基于Z-XNR技術(shù)的全新普惠型數(shù)字員工產(chǎn)品,進(jìn)一步豐富小冰AI數(shù)字員工產(chǎn)品線。據(jù)介紹,新技術(shù)依托超千億大模型基座以及基于大模型構(gòu)建的數(shù)字人交互套件,將數(shù)字人所需的訓(xùn)練數(shù)據(jù)壓縮至“秒級”、使定制時(shí)間達(dá)到“立等可取”,而且生成的數(shù)字人能夠直接應(yīng)用于實(shí)時(shí)交互。

餓了么升級發(fā)布“超級吃貨卡”:無門檻、全平臺(tái)商家通用

繼昨日宣布平臺(tái)經(jīng)典活動(dòng)“猜答案免單”正式回歸后,餓了么再推出讓用戶省錢“新招”。7月17日,餓了么站內(nèi)公告,將全面升級平臺(tái)的“超級吃貨卡”玩法體系。據(jù)介紹,升級后的“超級吃貨卡”將為消費(fèi)者提供紅色和金色兩種類型:兩種超級吃貨卡均不設(shè)使用門檻,其中紅色超級吃貨卡紅包最高可漲至28元、金色超級吃貨卡全平臺(tái)商家可通用。

三、運(yùn)營動(dòng)態(tài)

美團(tuán)外賣內(nèi)測“省錢版”,“拼好飯”后再推低價(jià)產(chǎn)品

美團(tuán)外賣內(nèi)部將“高性價(jià)比”確立為一個(gè)重要方向,在產(chǎn)品層面圍繞該方向在美團(tuán)外賣app內(nèi)推出“省錢版”,它還有另一個(gè)說法叫“B版”。該項(xiàng)目由外賣事業(yè)部產(chǎn)品負(fù)責(zé)人崔宇青負(fù)責(zé),向外賣事業(yè)部負(fù)責(zé)人薛冰匯報(bào)。

美團(tuán)外賣客服人員回應(yīng)稱消息不實(shí),沒有“省錢版”這個(gè)說法。如果是內(nèi)測,也是點(diǎn)對點(diǎn)發(fā)給個(gè)別客戶,不會(huì)在多個(gè)城市進(jìn)行內(nèi)測。上述客服人員表示,美團(tuán)外賣確實(shí)進(jìn)行了低價(jià)產(chǎn)品的推廣,“拼好飯”已經(jīng)在全國范圍內(nèi)推廣。此外,公司還于近期升級了美團(tuán)外賣紅包等功能,但沒有“省錢版”?!叭绻?,我們會(huì)第一時(shí)間接到通知。

重金再砸低價(jià)策略,“京東超級18”將上線

從京東內(nèi)部人士處獲悉,京東零售將整合全站資源,做一個(gè)關(guān)于低價(jià)的持續(xù)性項(xiàng)目——“京東超級18”。該活動(dòng)自7月起,以月度為周期,固定在每月17日晚8點(diǎn)至18日全天,每期都會(huì)上線一些高價(jià)值產(chǎn)品,一口價(jià)18元。本月17日上線的首期活動(dòng),會(huì)有日常售價(jià)上萬元的產(chǎn)品套裝,還有茅臺(tái)等上千元產(chǎn)品。

記者進(jìn)一步了解到,與以往京東的大促活動(dòng)不同,此活動(dòng)售價(jià)18元的產(chǎn)品不會(huì)被“一口氣”放出,而是采用不定時(shí)、不定位置的方式分批上架,用戶需要時(shí)常瀏覽活動(dòng)頁面才有機(jī)會(huì)搶到。

這種營銷模式,京東也不是第一次嘗試。京東集團(tuán)創(chuàng)始人、董事局主席劉強(qiáng)東很多年前就帶團(tuán)隊(duì)推出過一檔類似活動(dòng),叫“月黑風(fēng)高”,當(dāng)時(shí)的活動(dòng)只在半夜進(jìn)行,主打的品類是3C數(shù)碼?;顒?dòng)是在6月不定期上線,需要用戶經(jīng)常上線瀏覽發(fā)現(xiàn)。

高德打車推出”防曬補(bǔ)貼”

近日,高德打車宣布在全國范圍內(nèi)推出“防曬補(bǔ)貼”,并匹配了有助于減少暴露在烈日下的貼心科技服務(wù),旨在讓廣大用戶即便在三伏天出行,也能擁有更好的體驗(yàn)。在此之前,高德打車也曾聯(lián)合合作網(wǎng)約車平臺(tái),在全國超360個(gè)城市發(fā)放6億元左右“清涼補(bǔ)貼”,與司機(jī)群體共同分擔(dān)夏季出車成本,以在暑期出行高峰期,更快更好地為乘客提供清涼舒適的出行服務(wù)。

哈啰順風(fēng)車推出訂單PK模式

哈啰順風(fēng)車推出訂單PK模式——在訂單匹配前,有意愿合乘的車主將先進(jìn)入PK程序,平臺(tái)將綜合接單距離、順路度、服務(wù)評價(jià)等指標(biāo),為乘客匹配最優(yōu)車主出行。

哈啰順風(fēng)車業(yè)務(wù)總監(jiān)陳浩透露,PK模式上線試點(diǎn)以來,用戶出行好評率上升了5%,車主平均接單距離和成本減少了約10%。

四、好文推薦

《互聯(lián)網(wǎng)招聘30年,一場卷效率的“戰(zhàn)爭史”》作者@表外表里

從早期的職位廣告版(Job Board)模式到如今的社交招聘和智能推薦,每一次技術(shù)革新和模式創(chuàng)新都極大地提高了招聘效率。然而,盡管技術(shù)不斷進(jìn)步,招聘行業(yè)依然面臨著匹配效率低下的挑戰(zhàn)。本文將回顧互聯(lián)網(wǎng)招聘的發(fā)展歷程,分析不同階段的招聘模式,并探討未來的發(fā)展趨勢。

《貝殼找房 x 網(wǎng)易傳媒IMC整合營銷傳播》作者@一個(gè)符號工作室

在這個(gè)快速變化的時(shí)代,大廠的光環(huán)似乎不再是唯一的職業(yè)歸宿。許多曾經(jīng)在互聯(lián)網(wǎng)巨頭中奮斗的人才,如今選擇了另一條路——自媒體。他們的故事,是關(guān)于勇氣、自由與重生的傳奇。從字節(jié)跳動(dòng)到小紅書,從運(yùn)營總監(jiān)到自由創(chuàng)業(yè)者,這些個(gè)體的轉(zhuǎn)變不僅是職業(yè)生涯的跳躍,更是對自我價(jià)值和生活方式的深刻探索。本文將帶您走進(jìn)這些大廠離職者的內(nèi)心世界,一探他們?nèi)绾卧跁缫爸袑ふ曳较?,在圍城中突破自我?/p>

《大廠離職做博主:是曠野也是圍城,也有人已經(jīng)后悔》作者@五環(huán)外OUTSIDE

本文作者分享了一個(gè)貝殼找房與網(wǎng)易傳媒IMC做的傳播案例,從預(yù)熱到后期神話,分事件營銷、內(nèi)容與效果營銷和渠道營銷三部分,給大家分享了整個(gè)事情的執(zhí)行經(jīng)過,供各位參考。

五、精彩問答

提問:為什么大部分評分系統(tǒng)初始值和封頂都是5?

很多有評分的初始值都是5分,用戶給差評就往下降,

如果一開始都是好評,又不會(huì)往6分漲,但是當(dāng)有1個(gè)差評,立馬往下降,為什么這么設(shè)計(jì)?

歡迎來圍觀:點(diǎn)擊此處,前往回答

 

本文值得關(guān)注、產(chǎn)品動(dòng)態(tài)、運(yùn)營動(dòng)態(tài)內(nèi)容,選取自快訊欄目匯總,信息源自央視新聞、新浪科技、界面、財(cái)聯(lián)社、澎湃新聞、每經(jīng)網(wǎng)等

問題來自人人都是產(chǎn)品經(jīng)理旗下問答平臺(tái) ——天天問,歡迎各位小伙伴前往交流、切磋~

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!