上手嘗鮮Apple Intelligence:ChatGPT負(fù)責(zé)Intelligence,Apple負(fù)責(zé)失望
不少人購(gòu)買(mǎi)iPhone 16 都是沖著Apple Intelligence去的,但功能還沒(méi)更新,誰(shuí)也不知道表現(xiàn)怎么樣。在最新的iOS 18.2 的測(cè)試版中,終于可以體驗(yàn)這一部分功能。而作者的嘗試,可以給大家?guī)?lái)一些參考。
我有一臺(tái)可以用Apple Intelligence的iPhone 16pro,懂蘋(píng)果的人都知道這里面的門(mén)道有多深。
于是在10月24日蘋(píng)果推送iOS 18.2 的首個(gè)開(kāi)發(fā)者測(cè)試版后,我第一時(shí)間下載體驗(yàn)了這個(gè)最接近正式系統(tǒng)的版本。
這也是蘋(píng)果首次推送有ChatGPT的Apple Intelligence。
當(dāng)一切就緒,我體驗(yàn)了這次推送里的幾個(gè)核心功能,也是蘋(píng)果此前發(fā)布Apple Intelligence時(shí)重點(diǎn)畫(huà)餅的功能:
- 更聰明的Siri;
- 筆記應(yīng)用里的ChatGPT輔助寫(xiě)作;
- “相機(jī)按鈕”長(zhǎng)按喚起的Visual Intelligence;和
- 我最終并沒(méi)有體驗(yàn)的AI畫(huà)圖功能
01 “更聰明的Siri”
在Apple Intelligence里,Siri可以只通過(guò)叫它“Siri”喚起,而喚起時(shí)整個(gè)屏幕會(huì)有一個(gè)動(dòng)畫(huà)效果,像是被一道彩虹波紋劃過(guò),屏幕也會(huì)跟著微微顫抖幾下。
當(dāng)你用語(yǔ)音喚醒,波浪從底部蕩起。
當(dāng)你用開(kāi)關(guān)鍵喚醒,波浪從右側(cè)蕩漾開(kāi)來(lái)。
你基本可以在任何界面隨時(shí)喚起Siri。
這是個(gè)初看很高級(jí)的效果,不過(guò)也已經(jīng)在此前的一些iPhone之間的觸碰交互上出現(xiàn)過(guò)。
我試了試用語(yǔ)音讓Siri打開(kāi)一些app,完成截屏,“幫我寫(xiě)一個(gè)筆記,內(nèi)容是xxx”,它都可以快速響應(yīng)。已經(jīng)有了調(diào)用和直接操作app,尤其是自帶的app的能力。
而且,你現(xiàn)在可以跟Siri對(duì)話時(shí)說(shuō)的更自然,比如我在詢(xún)問(wèn)天氣時(shí),說(shuō)錯(cuò)了地名然后改正,它也可以理解。
但目前跨app的能力依然有限。
我嘗試讓它把正在播放的音樂(lè)分享給朋友,它回答:我做不到,我只能分享截屏,然后自顧自截取了屏幕,問(wèn)我,分享給誰(shuí)。
這就讓現(xiàn)階段更能夠體現(xiàn)Siri更聰明的那些地方,都來(lái)自它首次可以調(diào)用的ChatGPT。
你不需要有ChatGPT的賬號(hào),就可以在Siri里使用它。當(dāng)然,你也可以登陸你的賬號(hào),來(lái)留存記錄。沒(méi)有賬號(hào)似乎更符合蘋(píng)果的宣傳:在隱私層面更加安全。
ChatGPT提供的基本上是一個(gè)低配版GPT-4o的功能,你可以語(yǔ)音問(wèn)它,然后它會(huì)回答。比如需要提供菜譜,提供旅游計(jì)劃等。(這幾個(gè)是我看一些開(kāi)發(fā)者體驗(yàn)時(shí)用的例子,我也試了試,試的過(guò)程我一直在想,我為什么不打開(kāi)ChatGPT去里面完成這些任務(wù)呢?)
而且,當(dāng)你只是召喚Siri時(shí),Siri也會(huì)主動(dòng)問(wèn)你是否要請(qǐng)ChatGPT幫忙?;蛘吣阋部梢灾苯诱f(shuō):Siri,ask ChatGPT。
對(duì),走到庫(kù)克家門(mén)口敲門(mén)讓庫(kù)克出來(lái)然后告訴他,請(qǐng)幫我去找Sam Altman的即視感。
當(dāng)我讓Siri完成一個(gè)任務(wù):識(shí)別我屏幕上的內(nèi)容然后告訴我更多的信息時(shí),它問(wèn)我,可以把截圖發(fā)給ChatGPT么。然后它發(fā)送了截圖給ChatGPT。ChatGPT完成了回答。
但這類(lèi)任務(wù)的穩(wěn)定性有些奇怪,有幾次ChatGPT又說(shuō)它無(wú)權(quán)處理截圖。
而在我讓它完成另一個(gè)任務(wù)時(shí)——識(shí)別我在聽(tīng)的歌,然后告訴我更多關(guān)于這首歌的信息,基本證明了,蘋(píng)果沒(méi)有給ChatGPT直接接觸系統(tǒng)的權(quán)限,所以鏈條變成Siri聽(tīng),識(shí)別,然后問(wèn)我:可以發(fā)給ChatGPT幫忙么,然后ChatGPT出現(xiàn)。
我還試圖完成一個(gè)任務(wù),通過(guò)語(yǔ)音讓Siri把默認(rèn)搜索改成Google。這其實(shí)是一個(gè)典型場(chǎng)景——用自然語(yǔ)言來(lái)完成手機(jī)的設(shè)置。但Siri先是問(wèn)我是否可以請(qǐng)出ChatGPT幫忙,然后請(qǐng)出ChatGPT,給了我一個(gè)如何改設(shè)置的網(wǎng)絡(luò)搜索答案。
這種讓人無(wú)語(yǔ)的操作背后,蘋(píng)果的糾結(jié)更加明顯了——它似乎默認(rèn)了ChatGPT是更聰明的那一個(gè),遇到稍微復(fù)雜的難題就要找它,但同時(shí),它又處處防著ChatGPT,不給它在自己地盤(pán)上完全施展的空間。
于是,ChatGPT顯得很智能,而蘋(píng)果在里面參與的一切,都顯得讓人有些失望。
而且,這種糾結(jié)會(huì)持續(xù)下去,此前蘋(píng)果強(qiáng)調(diào)的隱私,與ChatGPT強(qiáng)調(diào)的用戶(hù)數(shù)據(jù)都要拿來(lái)訓(xùn)練模型之間的沖突如何解決,看起來(lái)也會(huì)是個(gè)更大的問(wèn)題。
02 筆記應(yīng)用里的ChatGPT輔助寫(xiě)作
筆記里的AI寫(xiě)作功能基本都由ChatGPT提供。
在下端的工具欄,有一個(gè)專(zhuān)門(mén)的按鈕。
點(diǎn)擊后出現(xiàn)一個(gè)新的AI操作界面。說(shuō)實(shí)話,也不太好看,因?yàn)楹驼麄€(gè)app完全是不同的風(fēng)格了,給人感覺(jué)是一個(gè)外來(lái)的強(qiáng)加的角色被喚醒了。
然后它的功能也很基礎(chǔ),像所有AI寫(xiě)作都有的那些:改寫(xiě),修正檢查,輸入你的Prompt等。除此之外,它還有總結(jié)、整理要點(diǎn)等模版功能,點(diǎn)擊后出現(xiàn)的結(jié)果不會(huì)在輸入?yún)^(qū)域,而是在這個(gè)操作板下方。
所以,顯得很擁擠。
而且,在UI上,AI寫(xiě)作時(shí)的效果,像是一個(gè)3歲兒童往你的屏幕上貼了個(gè)他最?lèi)?ài)的blingbling的長(zhǎng)條貼紙,下一秒出來(lái)的仿佛不是AI寫(xiě)的字,而是小馬寶莉。
我第一次在蘋(píng)果的實(shí)際產(chǎn)品體驗(yàn)上,找到了它那些自我感覺(jué)良好的中文翻譯給我的詭異感。
03 長(zhǎng)按“相機(jī)按鈕”喚起的Visual Intelligence
iPhone 16 pro系列多出來(lái)的那個(gè)相機(jī)控制按鍵,在發(fā)貨后被很多很多人詬病。幾乎所有使用過(guò)的人都會(huì)感慨為了提高拍照體驗(yàn)真的需要一個(gè)這東西么。
但看起來(lái)就像很多網(wǎng)友替蘋(píng)果爭(zhēng)辯的那樣,蘋(píng)果這個(gè)按鍵不是為了拍照,而是一個(gè)AI功能的啟動(dòng)按鍵。
這個(gè)設(shè)計(jì)在理論上確實(shí)很重要。
“按鍵”在AI硬件時(shí)代重新顯現(xiàn)出來(lái)它的意義——它可以減少用戶(hù)操作步驟,這和大模型帶來(lái)的交互潛力一致,蘋(píng)果的思路似乎是:一個(gè)“Siri”,一個(gè)增加的實(shí)體按鍵,前者對(duì)應(yīng)語(yǔ)音交互,后者對(duì)應(yīng)視覺(jué)。這兩個(gè)是大模型的最重要交互方式,各自必須在手機(jī)的機(jī)身上就有一個(gè)一鍵觸發(fā)的入口,避免任何劃動(dòng)屏幕等多余的動(dòng)作。就一步,這倆AI功能就要立刻開(kāi)始服務(wù)用戶(hù)。
這里面最關(guān)鍵的是,用戶(hù)對(duì)這倆功能的使用要足夠高頻,功能本身也要足夠強(qiáng)大。
當(dāng)你長(zhǎng)按相機(jī)按鈕后,就可以進(jìn)入Visual Intelligence的模式(我甚至懷疑,當(dāng)人們都放棄用這個(gè)鍵拍照后,它會(huì)變成Visual Intelligence的專(zhuān)屬鍵,然后單擊、雙擊、觸控劃動(dòng)等都會(huì)服務(wù)于對(duì)應(yīng)的視覺(jué)AI功能)。
在同樣的彩虹波浪動(dòng)效之后,屏幕出現(xiàn)一個(gè)拍照按鈕和兩側(cè)的兩個(gè)選項(xiàng):?jiǎn)朇hatGPT,和用Google搜。
這幾乎完美展示了蘋(píng)果在AI上的處境——自己地盤(pán)上的重要任務(wù),卻都交給了別人。
當(dāng)你點(diǎn)了Ask后,ChatGPT會(huì)不管你到底要ask什么,直接給你一個(gè)它看到的此刻的圖片的看圖說(shuō)話。
接下來(lái)是ChatGPT大顯神威的時(shí)刻。
我拍了一張照,并讓ChatGPT基于照片寫(xiě)一篇小作文。它快速做到了。
這一下子多了很多想象空間。視覺(jué)識(shí)別后,基于這些信息進(jìn)行接下來(lái)的任務(wù)。
而蘋(píng)果自身則依然有些拉垮,它的跨app能力還是沒(méi)有發(fā)揮作用。我讓它復(fù)制這篇小作文到筆記應(yīng)用,它卻開(kāi)始搜索互聯(lián)網(wǎng)。云端和端側(cè)模型能力的差距看出來(lái)了。
還有一個(gè)問(wèn)題是,我也不知道支持Apple Intelligence但沒(méi)有相機(jī)控制按鈕的iPhone 15們,要怎么啟用visual intelligence。蘋(píng)果會(huì)再單獨(dú)做個(gè)app,還是或者就直接不支持了??傊幐畹姆N類(lèi)又多了。
04 我沒(méi)體驗(yàn)AI畫(huà)圖功能,因?yàn)榈谝谎劬陀X(jué)得它太不蘋(píng)果了
看看這個(gè)升級(jí)后就會(huì)自動(dòng)出現(xiàn)的貓頭app的圖標(biāo),和它的界面。誰(shuí)會(huì)想到它是蘋(píng)果做的呢。
你可能的確可以用你的蘋(píng)果做一堆沙威瑪傳奇那樣的圖片出來(lái)。
但真的想要體驗(yàn)文生圖,圖生圖,甚至圖生視頻,有比這個(gè)app更好的選擇。
目前Apple Intelligence還有一些沒(méi)有推送的功能,其中在此前發(fā)布會(huì)里最令人期待的就是通過(guò)Siri識(shí)別iPhone屏幕上正在發(fā)生的一切事情,然后基于你的指令幫你完成任務(wù)。也就是一個(gè)超級(jí)Siri agent。
但它會(huì)在月底的正式推送中到來(lái)么?還是會(huì)如蘋(píng)果說(shuō)的“分階段”在未來(lái)推送?
沒(méi)人知道。
同樣沒(méi)人知道的是,蘋(píng)果的AI團(tuán)隊(duì)們是不是把精力都用在了開(kāi)發(fā)這個(gè)超級(jí)Siri agent上,才讓前面這幾個(gè)蘋(píng)果自己提供的AI體驗(yàn)有些拉垮讓人失望。
希望是這樣的。
希望,蘋(píng)果,大的在后面。
不然,這手機(jī)遲早有一天要改叫OpenAiPhone了。
作者|王兆洋 郵箱|wangzhaoyang@pingwest.com
本文由人人都是產(chǎn)品經(jīng)理作者【硅星人】,微信公眾號(hào):【硅星人Pro】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
國(guó)內(nèi)是咋個(gè)升級(jí)呀?想要體驗(yàn)AI intelligent功能的話~