欧美视频免费观看,成人免费无码H在线观看不卡,全部免费a片在线观看

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門(mén)專(zhuān)項(xiàng)技能課

1300+專(zhuān)題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專(zhuān)業(yè)技能直播

會(huì)員專(zhuān)屬社群

榮耀標(biāo)識(shí)

開(kāi)通會(huì)員

發(fā)布

注冊(cè) | 登錄

大跌眼鏡！GPT-4V錯(cuò)覺(jué)挑戰(zhàn)實(shí)錄：該錯(cuò)的沒(méi)錯(cuò)，不該錯(cuò)的反而錯(cuò)了

量子位

2023-11-08

0 評(píng)論 2467 瀏覽 3 收藏

最近有網(wǎng)友嘗試給GPT-4V做了錯(cuò)覺(jué)測(cè)試題，結(jié)果發(fā)現(xiàn)，GPT-4V似乎會(huì)和人類(lèi)一樣犯錯(cuò)誤，給出錯(cuò)誤的回答。為什么GPT-4V有時(shí)候可以識(shí)別出錯(cuò)覺(jué)，有時(shí)候卻表現(xiàn)得不如人意？一起來(lái)看看本文的分享。

GPT-4V挑戰(zhàn)視覺(jué)錯(cuò)誤圖，結(jié)果令人“大跌眼鏡”。

像這種判斷“哪邊顏色更亮”的題，一個(gè)沒(méi)做對(duì)：

讀圖片中隱藏信息的也傻傻看不出，怎么問(wèn)都說(shuō)“沒(méi)有啊”：

但是呢，這種人類(lèi)乍一看絕對(duì)會(huì)錯(cuò)的圖，它又成功答對(duì)：

以及這樣的錯(cuò)位圖，它對(duì)了又沒(méi)完全對(duì)。。

（GPT-4V直接看出來(lái)頭盔是位于男的大腿上的，沒(méi)有女的，但它還是表示圖里有倆人，另一個(gè)躲在男的身后戴著那頂頭盔==）

看完這些，是不是覺(jué)得很迷？

做了8年产品经理后，我是这么看产品经理的

我个人是从非常初级的产品经理做起，再到负责一个大产品的项目管理，现在有幸跳出了日常基础的工作更多的去看产品的PMF，product strategy...

查看详情 >

整個(gè)一“該對(duì)的不對(duì)，該錯(cuò)的又對(duì)了”。

測(cè)試者則表示：

在測(cè)之前，他以為GPT-4V對(duì)這種挑戰(zhàn)完全不在話下，誰(shuí)知結(jié)果竟是這樣。

不止是他，網(wǎng)友也都不理解GPT-4V作為一個(gè)“精準(zhǔn)的”AI系統(tǒng)，按理很智能，為什么還會(huì)犯和人類(lèi)一模一樣的錯(cuò)覺(jué)？？！

所以，這到底怎么回事？

一、GPT-4V五大錯(cuò)覺(jué)挑戰(zhàn)

下面是來(lái)自網(wǎng)友的更多測(cè)試案例。

首先是次次都錯(cuò)誤的顏色錯(cuò)覺(jué)題。

（1）除了開(kāi)頭的兩顆小樹(shù)圖，還有這個(gè)：

問(wèn)它哪邊的綠色更亮一些，果不其然還是左邊亮，右邊暗，實(shí)際明明都一樣。

（2）還有這張稍微復(fù)雜一點(diǎn)的：

兩只眼睛其實(shí)都是灰色，但讓GPT-4V來(lái)描述圖像時(shí)，它回答一只為藍(lán)色，另一只做了灰度處理，無(wú)法得知顏色。

（3）這張就更別提了，直接被糊弄地死死的。

當(dāng)然，這確實(shí)很難，大部分人類(lèi)也識(shí)別不出來(lái)所有的球其實(shí)都是棕色。

其次是會(huì)產(chǎn)生動(dòng)態(tài)錯(cuò)覺(jué)的圖。

（1）有一點(diǎn)意外，當(dāng)我們問(wèn)GPT-4V“你看見(jiàn)了什么？描述細(xì)節(jié)”時(shí)，它直接挑明了這是一張看久了就會(huì)讓人產(chǎn)生眩暈感的錯(cuò)覺(jué)圖，本質(zhì)就是一些波浪線而已。

（2）這張也沒(méi)有難倒它。

但奇怪的是問(wèn)它圖中有幾種顏色，它怎么都只能識(shí)別出黃色和藍(lán)色，看不到黑色和白色。

接下來(lái)是另一類(lèi)比較平面的錯(cuò)覺(jué)圖。

（1）如開(kāi)頭所示的這張：

一般人類(lèi)真的表示很懵圈，但是GPT-4V居然對(duì)了。

But，別急！！有人拿著測(cè)試者的圖去問(wèn)“自己的”GPT-4V，讓它再檢查一下時(shí)，它居然改變了答案。

然而還沒(méi)完。評(píng)論區(qū)驚現(xiàn)套娃操作，有人又拿著這倆人的對(duì)話圖再問(wèn)GPT-4V，您猜怎么著？它又改回去了。。

大伙可是玩上癮了，又是一次又一次套娃。好在最終GPT-4V堅(jiān)持了己見(jiàn)。

總的來(lái)說(shuō)，對(duì)于這種錯(cuò)覺(jué)陷阱是完全沒(méi)問(wèn)題。

（2）我們自己也測(cè)了一個(gè)長(zhǎng)度錯(cuò)覺(jué)題：

結(jié)果是so easy～

再來(lái)一組找隱藏信息的圖。

很遺憾，這種對(duì)于人類(lèi)來(lái)說(shuō)真的還算輕松的題，GPT-4V是一點(diǎn)也搞不定。

（1）先看這張，“遠(yuǎn)看”可以看到“NYC”三個(gè)大寫(xiě)字母。但它描述了一堆有的沒(méi)的，就是表示沒(méi)發(fā)現(xiàn)任何隱藏信息。

（2）如果說(shuō)上門(mén)這個(gè)有點(diǎn)隱晦，看不出也罷。但對(duì)于這種圖形隱藏，它也不行。

它描述到的只有其中的小女孩，即使測(cè)試者讓它“往遠(yuǎn)了看，又沒(méi)有新發(fā)現(xiàn)”，也無(wú)濟(jì)于事。

不過(guò)，如果我們把這張圖片手動(dòng)縮小再丟給它，它行了，看到了骷髏。

最后是一組真實(shí)世界的錯(cuò)位圖。

（1）除了開(kāi)頭展示的人騎摩托，這張小貓“懸浮”，它居然對(duì)了。

（2）這張?bào)@悚圖，也OK。

（3）但這個(gè)就失敗了，實(shí)際后面是一只狗和小baby的重合，它認(rèn)成法斗犬幼崽。

（4）至于這張，它壓根兒就沒(méi)提鞋子的事兒，說(shuō)了也些不痛不癢的話。

二、為什么會(huì)這樣？

所以，為什么會(huì)發(fā)生上面這些情況：有的錯(cuò)覺(jué)它可以識(shí)別出來(lái)，有的又表現(xiàn)得很差勁？

首先，對(duì)于顏色錯(cuò)覺(jué)的圖，網(wǎng)友首先認(rèn)為是提示詞的問(wèn)題。

就像兩顆小樹(shù)那張，我們問(wèn)它“哪個(gè)更亮”，其實(shí)就是給了GPT-4V暗示或偏見(jiàn)，它會(huì)順著咱的偏見(jiàn)來(lái)回答。

我們自己的測(cè)試也是如此：

但如果我們不帶立場(chǎng)的問(wèn)：圖中兩種顏色一樣嗎？它完全沒(méi)問(wèn)題。

不過(guò)，也有網(wǎng)友指出，當(dāng)我們問(wèn)它哪棵樹(shù)更亮?xí)r，如果是非常嚴(yán)謹(jǐn)?shù)貙?duì)所有像素進(jìn)行平均，GPT-4V的回答沒(méi)有毛病。

甚至有網(wǎng)友還用測(cè)色計(jì)實(shí)測(cè)了一把：

但！又有人指出如果只顯示一部分時(shí)，兩者明明一樣。

暫且不再爭(zhēng)論這個(gè)問(wèn)題，可以肯定的是，“提示詞”的使用方法會(huì)對(duì)它的判斷造成影響是沒(méi)問(wèn)題的。

另外，網(wǎng)友發(fā)現(xiàn)：

如果我們?nèi)?strong>追問(wèn)GPT-4V，讓它再仔細(xì)確認(rèn)一下，它也能糾正回答。

至于無(wú)法識(shí)別遠(yuǎn)景圖像的問(wèn)題，有網(wǎng)友認(rèn)為這可能是因?yàn)镚PT-4V只會(huì)從左往右地讀取圖像。

而對(duì)于“為什么有時(shí)它會(huì)和人類(lèi)一樣發(fā)昏被錯(cuò)覺(jué)誤導(dǎo)完全不像個(gè)智能AI”的疑問(wèn)，不少人則表示這毫不意外，是訓(xùn)練問(wèn)題。

即大模型是根據(jù)人類(lèi)數(shù)據(jù)人的反饋人的注釋進(jìn)行訓(xùn)練的，自然會(huì)產(chǎn)生和人一樣的錯(cuò)誤。

因此，還有人戲謔：

看來(lái)我們?nèi)祟?lèi)創(chuàng)造了那么多科幻作品，描述AI是如何冷酷完美，但當(dāng)現(xiàn)在我們真正擁有它時(shí)，發(fā)現(xiàn)它也不過(guò)如此。

（手動(dòng)狗頭）

你認(rèn)為該如何讓GPT-4V的錯(cuò)覺(jué)識(shí)別能力更強(qiáng)呢？

三、One More Thing

值得一提的是，我們也測(cè)試了其中的一些案例。

發(fā)現(xiàn)GPT-4V的表現(xiàn)不大一樣，有些題它在“我們這里”是可以的。

比如這張判斷球顏色的：

還有這個(gè)：

盡管把大圖認(rèn)成老女人而非骷髏，但還是表明它可以“遠(yuǎn)觀” 的。

參考鏈接：

[1]https://twitter.com/fabianstelzer/status/1717131235644875024

[2]https://twitter.com/BeyondTodAI/status/1713279431681118557

[3]https://twitter.com/janbobrowicz/status/1717229335076393350

作者：豐色

來(lái)源公眾號(hào)：量子位（ID：QbitAI），追蹤人工智能新趨勢(shì)，關(guān)注科技行業(yè)新突破

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @量子位授權(quán)發(fā)布，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash，基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App

量子位

追蹤人工智能新趨勢(shì)，關(guān)注科技行業(yè)新突破

74篇作品 198179總閱讀量

從 Apple Vision Pro 再談蘋(píng)果產(chǎn)品營(yíng)銷(xiāo)中的「敘述性詭計(jì)」

09-083529 瀏覽

產(chǎn)品的出路：冷啟動(dòng)階段我們應(yīng)該做的事情和案例實(shí)操

09-141548 瀏覽

B端产品设计思路：如何平衡大量客户需求

刚刚

AI時(shí)代下，產(chǎn)品經(jīng)理的成長(zhǎng)之路

07-0512049 瀏覽

數(shù)據(jù)產(chǎn)品經(jīng)理需要掌握哪些數(shù)據(jù)能力？

03-3020453 瀏覽

“搭子”快被玩壞了

09-013672 瀏覽

評(píng)論

目前還沒(méi)評(píng)論，等你發(fā)揮！

B端产品经理面试，都需要注意那些细节（业务篇）

產(chǎn)品經(jīng)理到底是干什么的？

11-109376 瀏覽
最頭部的AI 2.0 創(chuàng)業(yè)公司，現(xiàn)階段對(duì)產(chǎn)品經(jīng)理的需求到底如何？

09-041247 瀏覽
這屆618，大廠和主播都大舉發(fā)力

05-314590 瀏覽

专题

62891人已学习14篇文章

如何写好一份产品需求文档？

你说你会写产品需求文档，我信！但是肯定写的不好，不服看看别人的。

专题

19358人已学习13篇文章

如何做功能/产品的拆解？

本专题的文章分享了从不同维度拆解一款产品或者功能，有利于提升我们对于产品和功能的思考能力。

手把手教你玩转ASO优化

产品经理，除了会写竞品分析，还要会写产品分析。

专题

13201人已学习12篇文章

如何做知识管理？

知识管理是什么？通常来看，想理解知识管理，可以从业务、管理、实施等视角切入。本专题的文章分享了如何做知识管理。

专题

40833人已学习18篇文章

无论产品or运营，“嘴上功夫”都hin重要！

产品和运营，嘴皮子不溜怎么行？

大跌眼鏡！GPT-4V錯(cuò)覺(jué)挑戰(zhàn)實(shí)錄：該錯(cuò)的沒(méi)錯(cuò)，不該錯(cuò)的反而錯(cuò)了

一、GPT-4V五大錯(cuò)覺(jué)挑戰(zhàn)

二、為什么會(huì)這樣？

三、One More Thing

大跌眼鏡！GPT-4V錯(cuò)覺(jué)挑戰(zhàn)實(shí)錄：該錯(cuò)的沒(méi)錯(cuò)，不該錯(cuò)的反而錯(cuò)了

一、GPT-4V五大錯(cuò)覺(jué)挑戰(zhàn)

二、為什么會(huì)這樣？

三、One More Thing