GPT-4o手寫板書以假亂真驚呆網(wǎng)友!殺死谷歌翻譯,代碼建模無所不能

0 評(píng)論 1067 瀏覽 1 收藏 13 分鐘

GPT-4o到底有多強(qiáng)?只有用過才能知道。這兩天,網(wǎng)友們不僅探索出了很多全新ChatGPT的炫酷用法,也逐漸開始意識(shí)到,這標(biāo)志這OpenAI將逐漸替代谷歌曾經(jīng)的地位,全面接管AGI時(shí)代。

隨著越來越多人開始試用GPT-4o,大家發(fā)現(xiàn)發(fā)布會(huì)上的demo真的只是冰山一角,官方后續(xù)發(fā)出的用例以及網(wǎng)友們的整活才是更精彩的部分。

生成手寫體文字

OpenAI聯(lián)創(chuàng)Greg Brockman今天po出一張GPT-4o生成的圖片,他興奮地宣布:

「僅用GPT-4o的圖像生成功能就可以探索很多東西。團(tuán)隊(duì)正在努力將這些內(nèi)容推向世界」

可以看到,這張圖片中,黑板上的手寫體達(dá)到了以假亂真的程度!

網(wǎng)友表示,看到這張圖片的一瞬間還以為是Greg講座現(xiàn)場的板書呢。

不知道筆跡專家看到了會(huì)作何感想,是否能讀解出這面黑板上「機(jī)器書寫」背后的人格特征呢?

看來GPT-4o不僅能模仿人類的語音語調(diào),連字體也開始向人類手寫體接近了。

1分鐘從屏幕截圖生成視頻游戲

推特網(wǎng)友從網(wǎng)上找了一張Breakout游戲的截圖,丟給ChatGPT并問它「你能把這個(gè)用Python編碼出來嗎?」

一分鐘之后,ChatGPT就生成了一份沒有bug、可以直接執(zhí)行的Python文件,完全復(fù)刻了截圖的效果。

而且Breakout這個(gè)游戲也是大有來頭,是一款1976年雅達(dá)利公司發(fā)行的街機(jī)視頻游戲,Steve Jobs和Steve Wozniak曾經(jīng)參與設(shè)計(jì)和開發(fā)工作。

用文字提示進(jìn)行3D建模

前幾天,有人曾經(jīng)放出用GPT-4o將平面圖片進(jìn)行3D重建的之后的效果,已經(jīng)十分驚艷。

但沒想到,GPT-4o生成3D效果甚至都不需要給它平面圖片,一段文字提示就夠了,比如下面這個(gè)用戶讓ChatGPT創(chuàng)建一個(gè)STL文件,建模一個(gè)有四條腿的桌子,并添加一些隨機(jī)特征。

ChatGPT不僅能給你渲染出的3D效果圖,還能馬上出一份原始的STL文件,就不用自己費(fèi)力從頭開始建模了。

這一版ChatGPT的更新就是瞄準(zhǔn)了個(gè)人AI助手的方向,工作狂Sam Altman最近在接受采訪時(shí),也分享了自己使用ChatGPT提高工作效率的方法。

他說,在電腦上工作時(shí),想搜索一些東西就不得不在頁面之間不斷切換。有了ChatGPT在旁邊,就可以「隨叫隨到」直接問它,讓自己能始終保持在專注的狀態(tài)。

一、GPT-4o vs. 谷歌翻譯

OpenAI的發(fā)布會(huì)展示了GPT-4o的實(shí)時(shí)翻譯能力,實(shí)現(xiàn)了英語和意大利語之間的無縫轉(zhuǎn)換,幾乎沒有響應(yīng)延遲,讓網(wǎng)友再次驚呼「翻譯要失業(yè)了」,這次連同聲傳譯行業(yè)也要一鍋端了。

與此同時(shí),也掀起了一場和谷歌翻譯之間的較量。

有網(wǎng)友表示「谷歌和三星在手機(jī)上開發(fā)過類似的功能,但是做得很爛。你必須要說得很慢,而且確保吐字清晰,不然識(shí)別出的文本就會(huì)一團(tuán)糟,也得不到正確的翻譯?!?/p>

谷歌翻譯到了要和大家說再見的時(shí)候了嗎?隨著OpenAI的語言能力不斷擴(kuò)展,這并非完全沒有可能。

GPT-4o使用了新的分詞器,不僅英語的效率更高(token減少了1.1倍),而且還提高了許多其他語言的使用效率。

Greg Brockman發(fā)文稱「我們還顯著提高了非英語語言的性能,包括改進(jìn)分詞器以更好地壓縮其中的許多語言」。

OpenAI現(xiàn)在支持50多種語言,從Greg Brockman放出的圖片中可以看出,包括阿拉伯語、俄語、印地語在內(nèi)的多種語言的token數(shù)量都得到了壓縮。

但是,OpenAI的翻譯功能也并非無懈可擊,有很多網(wǎng)友質(zhì)疑發(fā)布會(huì)上ChatGPT生成的意大利語聽起來有點(diǎn)奇怪。

于是有意大利用戶在線答疑,「其實(shí)這不是一種口音,只不過是AI語音在單詞之間插入了間隙。說英語時(shí)還好,但在意大利語中,這聽起來非常奇怪和呆板,因?yàn)樗鼣_亂了節(jié)奏?!?/p>

更要命的是,GPT-4o分詞器語料庫中,中文數(shù)據(jù)污染非常嚴(yán)重。

有老哥寫了個(gè)腳本篩選ChatGPT新詞表中最長的100個(gè)中文字符,結(jié)果發(fā)現(xiàn)里面大部分賭博網(wǎng)站廣告,剩下一小部分是色情網(wǎng)站廣告。

面對(duì)這種景象,網(wǎng)友不禁感嘆「為什么GPT-4o如此horny?」

既然這樣,還是多用GPT-4o「練習(xí)練習(xí)英語」吧。

二、「后瀏覽器世界」:ChatGPT后再無谷歌搜索

OpenAI同時(shí)發(fā)布了兩項(xiàng)成果:GPT-4o及其新的ChatGPT桌面應(yīng)用程序。有專家預(yù)測(cè),雖然 GPT-4o因其多模態(tài)而大放異彩,賺足了眼球,但桌面應(yīng)用程序才有可能真正挑戰(zhàn)谷歌主導(dǎo)地位,改變當(dāng)今互聯(lián)網(wǎng)的形態(tài)。

GPT-4o的主要特點(diǎn)是多模態(tài)和低成本的低延遲,實(shí)現(xiàn)了人機(jī)之間更自然的對(duì)話和交互,而且與GPT-4Turbo相比似乎有了模型能力和智能的增長。

但當(dāng)我們回顧幾年后的2024年5月13日時(shí),最重要的消息可能是ChatGPT桌面應(yīng)用程序。

ChatGPT桌面應(yīng)用程序?qū)⑾葘?duì)MacOS適用,隨后推出Windows版本,目前官網(wǎng)已發(fā)布了移動(dòng)端iOS和安卓系統(tǒng)的下載鏈接。

該應(yīng)用程序可以快速訪問ChatGPT,并且你可以選擇讓它「透視」你的屏幕,實(shí)現(xiàn)「看你所看」,還可以像使用ChatGPT一樣,和它實(shí)時(shí)語音交互。

這完全超出了傳統(tǒng)瀏覽器的功能想象,從瀏覽器進(jìn)入桌面,OpenAI邁出的這一小步,有可能是人機(jī)交互方式向前發(fā)展的一大步,OpenAI希望的,是完成一場「搜索革命」。

OpenAI希望擺脫瀏覽器并進(jìn)入桌面

瀏覽器是舊的互聯(lián)網(wǎng),萬維網(wǎng)的世界是谷歌的主場。

但OpenAI對(duì)這種舊的方式say no,它帶來是一種使用計(jì)算機(jī)和網(wǎng)絡(luò)的新方式——一個(gè)可以為用戶完成一切的助手,用戶需要什么,只需大聲說出來。

Sam Altman在他關(guān)于GPT-4o的博客文章中明確表示「對(duì)我來說,與計(jì)算機(jī)對(duì)話從來沒有感覺很自然,但現(xiàn)在情況發(fā)生了改變。隨著我們?cè)黾樱蛇x的)個(gè)性化功能、訪問你的信息、協(xié)助你采取行動(dòng),我真的看到了一個(gè)令人興奮的未來,我們能夠利用計(jì)算機(jī)做比以往更多的事情?!?/p>

ChatGPT桌面應(yīng)用程序可以獲取訪問麥克風(fēng)、攝像頭、文件、登錄信息以及用戶屏幕的權(quán)限,是「個(gè)人助手」的最佳位置。

有了這個(gè)「助手」,即使是智能手機(jī)用戶,也很難被谷歌和網(wǎng)絡(luò)所吸引。

在這種與計(jì)算機(jī)交互的新方式中,萬維網(wǎng)幾乎沒有立足之地。充其量,它充當(dāng)?shù)氖切畔⒌奶峁┱摺?/p>

事實(shí)上,OpenAI將自己定位為聊天機(jī)器人生態(tài)系統(tǒng)的看門人,它推出了「出版商優(yōu)選計(jì)劃」,正在把選定的媒體機(jī)構(gòu)發(fā)展成為合作伙伴,美聯(lián)社、Axel Springer、金融時(shí)報(bào)、世界報(bào)等媒體已加入該計(jì)劃。

如果OpenAI 成功(目前還無法確定),那么它對(duì)我們信息生態(tài)系統(tǒng)的市場影響力將遠(yuǎn)遠(yuǎn)超過今天的谷歌。

參考資料:

https://x.com/gdb/status/1790869434174746805

https://analyticsindiamag.com/openai-just-killed-google-translate-with-gpt-4o/

https://the-decoder.com/openais-most-important-message-isnt-gpt-4o-its-the-post-browser-world/

https://x.com/rowancheung/status/1790783202639978593

https://x.com/tianle_cai/status/1790109646205890723

https://x.com/sherwinwu/status/1790854473260388814

https://x.com/op7418/status/1790292330156863964

https://www.reddit.com/r/singularity/comments/1cse5j7/major_issue_discovered_in_gpt4o_the_new_optimized/

https://the-decoder.com/openai-thinks-it-knows-what-media-is-high-quality-and-thats-a-problem/

編輯:喬楊 庸庸

來源公眾號(hào):新智元(ID:AI_era),“智能+”中國主平臺(tái),致力于推動(dòng)中國從“互聯(lián)網(wǎng)+”邁向“智能+”。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @新智元 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!