深度解讀 | 蘋(píng)果眼中的AI OS應(yīng)該是怎么樣的?

2 評(píng)論 2689 瀏覽 4 收藏 13 分鐘

前段時(shí)間的WWDC,蘋(píng)果終于如愿以償公布了AI的相關(guān)消息。從iPhone、iPad到Mac,無(wú)不被生成式AI覆蓋。與安卓陣營(yíng)只是簡(jiǎn)單地把大模型塞進(jìn)手機(jī)里不一樣,這次蘋(píng)果用他們的做法告訴了大家,什么才是LLMs+OS的正確打開(kāi)方式。

在生成式AI的浪潮下,今年的蘋(píng)果開(kāi)發(fā)者大會(huì)WWDC 2024AI毫不意外的成為了大會(huì)絕對(duì)的主角。

從iPhone、iPad到Mac,無(wú)不被生成式AI覆蓋。大家早已期待的新 Siri 只是蘋(píng)果 AI 能力的一小部分,橫空出世的Apple Intelligence才是這次的重頭戲,從圖像到文本,從iPhone、iPad到Mac,Apple Intelligence讓蘋(píng)果全系產(chǎn)品有了史詩(shī)級(jí)升級(jí)。

相較于安卓廠商對(duì)于大模型的小打小鬧,只是簡(jiǎn)單將大模型作為Copilot塞進(jìn)手機(jī)里,除了更新語(yǔ)音助手外,就是找?guī)讉€(gè)還算能唬人的場(chǎng)景加上大模型的能力,最后還明目張膽將其定義為AI手機(jī),這次蘋(píng)果用他們的做法告訴了大家,什么才是LLMs+OS的正確打開(kāi)方式。

蘋(píng)果,重新定義了AI:Apple Intelligence!

01. Apple Intelligence是什么?

Apple Intelligence定義為iPhone、iPad和Mac的個(gè)人智能系統(tǒng),利用蘋(píng)果芯片的能力來(lái)理解和創(chuàng)建語(yǔ)言和圖像,以及跨應(yīng)用采取行動(dòng)。

蘋(píng)果 CEO 蒂姆?庫(kù)克說(shuō):蘋(píng)果的目標(biāo)一直是構(gòu)建以人為本,最為易用方便的個(gè)人設(shè)備,提升人們的生活效率。

在這個(gè)目標(biāo)下,蘋(píng)果提出了他們的AI產(chǎn)品理念:體驗(yàn)足夠強(qiáng)大、直觀易用、完全整合到系統(tǒng)體驗(yàn)中、個(gè)性化且保護(hù)隱私,于是他們基于蘋(píng)果自研的A 和 M系列芯片,走了一條自研本地大模型加三方云端大模型的策略。

在其他廠商瘋狂砸錢(qián)買(mǎi)GPU訓(xùn)練模型的時(shí)候,在想方設(shè)法將大模型塞進(jìn)手機(jī)存儲(chǔ)的時(shí)候,蘋(píng)果卻換了種做法,不卷大模型,不卷本地化,還能給用戶提供更好的使用體驗(yàn)!

這點(diǎn)就能看出來(lái),蘋(píng)果的出發(fā)點(diǎn)一直是為了提升用戶的生活體驗(yàn),他們明白自己做的是產(chǎn)品,而不是拿著錘子找釘子,死卷大模型。

庫(kù)克表示,Apple Intelligence 是蘋(píng)果創(chuàng)新的新篇章,將改變用戶使用產(chǎn)品的方式。蘋(píng)果獨(dú)特的方法結(jié)合了生成式人工智能和用戶的個(gè)人信息,能提供真正有用的智能服務(wù)。此外,Apple Intelligence 能夠以完全私密和安全的方式訪問(wèn)信息,幫助用戶完成對(duì)他們最重要的事情。這是蘋(píng)果獨(dú)有的 AI 體驗(yàn)。

先具體看看Apple Intelligence能做什么?

簡(jiǎn)單來(lái)說(shuō),跟錄音、GPS等一樣,蘋(píng)果將AI融入IOS系統(tǒng),為用戶和開(kāi)發(fā)者系統(tǒng)提供一系列原生AI能力??梢哉f(shuō),這些都是原生的人類 API。

文本工具writing tool

在蘋(píng)果的自帶的文本應(yīng)用如郵件、備忘錄、Safari瀏覽器、Pages、Keynote和三方應(yīng)用如微信、小紅書(shū)等中,提供文本潤(rùn)色、重寫(xiě),校對(duì),改寫(xiě)(如語(yǔ)氣變化)、總結(jié)和文本轉(zhuǎn)表格等能力。

在它的幫助下,無(wú)論是寫(xiě)文章、發(fā)帖,為用戶解鎖了提升寫(xiě)作和更有效溝通的新方式。

圖像工具

Image Playground,只需幾秒鐘即可生成素描、插圖、動(dòng)畫(huà)三種風(fēng)格。這些功能在系統(tǒng)中所有app都可用,包括Notes,F(xiàn)reeform,Keynote,Pages等等。

Image Wand可以將你的素描草圖轉(zhuǎn)換為 Notes 應(yīng)用中的相關(guān)圖像。使用手指或 Apple Pencil 在你的草圖周圍畫(huà)一個(gè)圓圈,Image Wand 會(huì)分析其周圍的內(nèi)容以產(chǎn)生互補(bǔ)的視覺(jué)效果。

還可以生成emoj表情等等。

Siri新升級(jí)

在Apple Intelligence的加持下,Siri變得更自然、更能理解我們了!

除了更好的自然語(yǔ)言理解和多輪交互外,Apple Intelligence還會(huì)為Siri帶來(lái)屏幕內(nèi)容感知功能,這樣,它就能理解屏幕上的內(nèi)容,執(zhí)行相應(yīng)的操作。

比如朋友發(fā)消息告訴你ta的新地址,你可以直接在信息對(duì)話中說(shuō),「把這個(gè)地址加入ta的聯(lián)系人名片中」。

最牛的來(lái)了,Siri也可以完成跨app操作。

例如“將我起草的電子郵件發(fā)送給 April 和 Lilly”,Siri 知道您引用的是哪封電子郵件以及它在哪個(gè)應(yīng)用程序中。當(dāng)然這些增強(qiáng)功能,也并不限于蘋(píng)果開(kāi)發(fā)的APP。

那如果復(fù)雜任務(wù)Siri無(wú)法用本地模型執(zhí)行,則會(huì)主動(dòng)詢問(wèn)是否可以叫ChatGPT處理,同時(shí)ChatGPT也被集成到了系統(tǒng)的writing tool中,可以改寫(xiě)潤(rùn)色等。

隱私保障

蘋(píng)果出了一個(gè)“私有云計(jì)算”的概念:“不得不上云運(yùn)作”的AI功能,將在使用蘋(píng)果芯片的專用服務(wù)器上啟用云計(jì)算模式,確保用戶數(shù)據(jù)的私密性和安全性。

02. Apple Intelligence背后的大模型

Apple Intelligence 由多個(gè)功能強(qiáng)大的大模型組成,這些模型專門(mén)用于輔助完成用戶的日常任務(wù),并可以根據(jù)用戶的當(dāng)前活動(dòng)進(jìn)行動(dòng)態(tài)調(diào)整。

這些模型可以分為三類:

本地模型(On-Device Language Model)

這部分包含3B的語(yǔ)言模型、擴(kuò)散模型DIffusion Model和用于Xcode的編程模型,另外還有用來(lái)做 RAG 的 Semantic Index (語(yǔ)義索引)和 App Intents Toolbox(應(yīng)用意圖工具箱)。

這些模型都針對(duì)日常的任務(wù)進(jìn)行了一系列的微調(diào),幫助用戶完成各種系統(tǒng)級(jí)的任務(wù)。

比如前面提到的文本工具的摘要、潤(rùn)色、改寫(xiě)、回復(fù)郵件、圖像生成、通知進(jìn)行優(yōu)先級(jí)的排序、跨應(yīng)用的交互等。

此外在這些微調(diào)模型之上有個(gè)適配器(Adapters),適配器是覆蓋在通用基礎(chǔ)模型上的一小批模型權(quán)重。它們可以動(dòng)態(tài)加載和交換,使基礎(chǔ)模型能夠針對(duì)手頭的任務(wù)即時(shí)進(jìn)行專門(mén)化。

簡(jiǎn)單來(lái)說(shuō)就是根據(jù)任務(wù)來(lái)給模型選擇合適的權(quán)重,讓模型輕松適應(yīng)不同領(lǐng)域?qū)<业慕巧?/p>

私有云計(jì)算(Server-Based language Model)

這個(gè)基于服務(wù)器的大語(yǔ)言模型,對(duì)于本地模型滿足不了要求的任務(wù),蘋(píng)果會(huì)傳到云端運(yùn)算。

為了確保數(shù)據(jù)的安全性,蘋(píng)果采用了私人云計(jì)算技術(shù)。每當(dāng)用戶的設(shè)備發(fā)起請(qǐng)求時(shí),它會(huì)通過(guò)一個(gè)端對(duì)端加密的通道與特定的私有云計(jì)算集群進(jìn)行連接。僅限于被指定的集群有權(quán)限解開(kāi)這些加密的請(qǐng)求數(shù)據(jù)。應(yīng)答數(shù)據(jù)發(fā)送回用戶后,相關(guān)信息不會(huì)被存儲(chǔ),且蘋(píng)果公司也不具備訪問(wèn)這些數(shù)據(jù)的能力。

第三方 LLMs

如果蘋(píng)果自己的大模型搞不定的任務(wù)怎么辦?

那就交給現(xiàn)在專門(mén)的模型廠商處理,專業(yè)的人做專業(yè)的事情嘛!

目前已經(jīng)接入了 OpenAI 的 GPT-4o,但按照蘋(píng)果的說(shuō)法,后續(xù)還會(huì)有更多家的模型接入,比如Gemini 等。

另外,考慮到國(guó)家政策,蘋(píng)果在不同國(guó)家地區(qū)的接入的大模型廠商可能不同,那Open AI和Meta的大模型肯定在國(guó)內(nèi)無(wú)法使用,沒(méi)有通過(guò)工信部備案,根據(jù)之前的傳聞,國(guó)內(nèi)首先接入的應(yīng)該就是百度的文心一言了!

03. App Intents:給開(kāi)發(fā)者的Framework

剛才講了,蘋(píng)果希望可以跨應(yīng)用完成用戶的需求,比如使用Siri就能直接完成郵件發(fā)送,圖像修改等,不需要進(jìn)入 app 里面,這個(gè)體驗(yàn)很絲滑流暢。

  1. 蘋(píng)果允許操作系統(tǒng)和應(yīng)用程序的所有部分通過(guò)「函數(shù)調(diào)用」進(jìn)行互操作;內(nèi)核進(jìn)程 LLM 可根據(jù)用戶查詢安排和協(xié)調(diào)它們之間的工作
  2. 無(wú)摩擦。蘋(píng)果以一種高度流暢、快速、always on 和上下文的方式全面集成這些功能。無(wú)需四處復(fù)制粘貼信息、提示工程等。還對(duì)用戶界面進(jìn)行了相應(yīng)調(diào)整。

但具體要怎么實(shí)現(xiàn)呢?那就得用到給開(kāi)發(fā)者提供的App intents工具,這又是一次操作系統(tǒng)廠商和開(kāi)發(fā)者的博弈戰(zhàn)。

App Intents 框架提供的功能可將三方的 app 操作、內(nèi)容與跨平臺(tái)的系統(tǒng)體驗(yàn)(包括 Siri、Spotlight、小部件、控件等)深度集成。借助 Apple Intelligence 和 App Intents 增強(qiáng)功能,Siri 會(huì)獲得在 app 內(nèi)和跨 app 執(zhí)行操作的能力。

如此,開(kāi)發(fā)者們可以允許用戶通過(guò)以下方式使用自己的產(chǎn)品:

  • 與Siri互動(dòng),也可以利用Apple Intelligence的個(gè)人環(huán)境感知和行動(dòng)能力
  • 通過(guò)Spotlight建議和搜索進(jìn)入產(chǎn)品,比如微信。
  • 等等。。

舉個(gè)例子,比如郵件應(yīng)用,他們通過(guò)App Intents框架向蘋(píng)果提供一個(gè)操作來(lái)表示某個(gè)意圖,比如發(fā)郵件或者刪除郵件。然后,用戶可以隨時(shí)要求Siri代表他們執(zhí)行這些意圖,無(wú)論此時(shí)有沒(méi)有打開(kāi)郵件應(yīng)用。

簡(jiǎn)單來(lái)說(shuō),蘋(píng)果一方面讓開(kāi)發(fā)者將意圖理解能力引入App中,方便Siri等調(diào)用App的功能,一方面又可以將Apple提供的文本、圖像等功能集成到App中。

這才應(yīng)該是AI OS真正干的事情!

本文由 @小布Bruce 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 關(guān)注了,多分享啊

    來(lái)自北京 回復(fù)
  2. 歡迎關(guān)注我的公眾號(hào):AI思,查看更多內(nèi)容

    來(lái)自北京 回復(fù)