從RayBan Meta起頭,聊聊智能眼鏡
大模型發(fā)展成熟之后,現(xiàn)在不少可穿戴設備都開始加入大模型。比如Meta RayBan的智能眼鏡。具體表現(xiàn)和使用場景如何?我們看看作者的分析。
眼下“百鏡大戰(zhàn)”非?;馃幔珿PT的視覺多模態(tài)也可以直接使用了,借此機會把自己對智能眼鏡的認知整理一下。按順序分為4個部分:
1.Meta RayBan的成功原因
2.市場替代選擇和產(chǎn)品替代選擇
3.智能眼鏡的定位和場景思考
4.從手機外設到新的計算終端
一、對Meta RayBan“出圈”的認知
Meta RayBan是因為RayBan的品牌、歐美市場的消費能力、優(yōu)異的基本功能達成的百萬級的銷量;AI只是興奮型需求,是產(chǎn)品演化方向的未來。
RayBan的影響力是成功的堅實基礎
RayBan是世界上最大的眼鏡品牌之一,占據(jù)高度分散的眼鏡市場5%的市場份額;在相對集中的太陽鏡市場,尤其是占比超過60%的北美、歐洲市場,RayBan是領頭羊,有著巨大的品牌影響力。
RayBan”時尚、年輕、高端“的品牌形象又牢牢的吸引著一代代的年輕群體,他們追求創(chuàng)新,也有足夠的付費能力,這樣的人群正是一種新形態(tài)的電子消費品的絕佳客群。
除此之外,眼鏡是以線下銷售渠道為主(占比超過8成),因為需要實際佩戴、體驗和對比,RayBan作為行業(yè)老大在線下的銷售渠道也是非常大的助力之一。
在此基礎上,Meta的產(chǎn)品定位和功能打磨撬動了市場
- 在產(chǎn)品的定位上,音頻、抓拍的功能特性和佩戴太陽鏡的場景(開車、戶外旅游等)達成了非常好的共振,沒有其他追求無謂創(chuàng)新的多余舉動,保證了整體的重量形態(tài)控制。(補充:個人認為太陽鏡更暢銷,我沒有找到直接的數(shù)據(jù),但是我看BestBuy的購物評價曬圖太陽鏡款的比例更大一些)
- 在功能體驗層面,通過實際用戶評價可以看到,大部分用戶評價的關心是拍照效果好、音頻素質(zhì)好,達成甚至超出用戶的預期。
- 進一步的延伸到價格,能夠稱為耳機、相機、墨鏡組合體的產(chǎn)品僅僅比墨鏡貴了50%,約100美金,正如上面提到的RayBan的用戶群體,他們非常愿意為之付費;Meta也有能力在保證良好的產(chǎn)品體驗的前提下壓低/甚至補貼來出售這款產(chǎn)品。
最后是AI,讓這款設備真正的充滿想象,但需要時間
- Meta雖然早早的預告了AI的能力,并且也有公開演示,但AI能力還剛剛開始推送,此外在可用區(qū)域外的使用非常困難,Reddit對應頻道下,最多的問題之一就是非可用區(qū)域如何使用AI(其他討論比較多的是照片視頻分享/遮擋LE等)。結(jié)合眼鏡已經(jīng)銷售的時間,AI作為期貨可能吸引了嘗鮮者,一定程度促進了銷售,但不是核心因素。
- 隨著模型能力的提升,Meta可以不斷的更新AI的能力,不斷的挖掘真正能夠使用和落地的場景,龐大的出貨量和活躍度就是智能眼鏡最好的試驗田。(順便,Meta在這個行業(yè)內(nèi)的投入是實打?qū)嵉?,各類實驗性的項目、嘗試都值得尊重)
所以,并不是給眼鏡加個攝像頭或者增加AI語音就可以賣出百萬臺,Meta RayBan的成功背后是精準的產(chǎn)品定位+過硬的功能體驗+品牌支撐。
二、Meta RayBan在替代哪些產(chǎn)品?
Meta RayBan或相似的智能眼鏡并不是一個完全破壞式的產(chǎn)品,而是很多功能進行組合的漸進式創(chuàng)新,隨著繼續(xù)出貨,它會在市場上替代哪些產(chǎn)品?會和哪些產(chǎn)品產(chǎn)生競爭呢?這也是發(fā)現(xiàn)其實際場景、尋找差異的方式。聲明:只考慮電子消費品,不考慮功能性眼鏡的部分。
很重要出發(fā)點是形態(tài),眼鏡會直接影響用戶的外貌,其他的電子消費品則沒有如此大的影響。實際中,眼鏡的樣式遠多于單一電子消費品的樣式,一個眼鏡店可能就有成百上千的眼鏡框供選擇。因此,眼鏡的形態(tài)天然帶來了較高的選擇、替代成本,用戶在需要佩戴眼鏡的場景下才更容易接受它。在眼鏡的重量、音頻、續(xù)航等達標的情況下,智能眼鏡對日常佩戴眼鏡的用戶很有吸引力,在日常工作/會議/運動等通用場景下都會更方便;而對其他人群,旅游/駕車/戶外運動等原本就要佩戴眼鏡(墨鏡/防風/滑雪鏡)的場景則可以幫助克服這一成本。
市場替代選擇1——藍牙耳機
全球藍牙耳機的年出貨量以億計,毫無疑問是一塊巨大的蛋糕。
在Meta RayBan的用戶中一個大的使用場景就是用它替代藍牙耳機,隨時隨地打電話/聽播客/聽音樂。Meta RayBan可以歸類到開放式耳機的形態(tài)下,這種形態(tài)近些年也在很好的增長,耳機使用時間上升,也讓很多用戶希望降低對耳朵的阻塞;同時,這一代的Meta RayBan也升級了第一代被詬病的音頻問題,達到了一個比較好的狀態(tài)。
另一個大家感知比較少的是Meta RayBan的麥克風陣列,我個人體驗時最震撼時刻是第一次使用眼鏡錄制再播放的時候,仿佛說話的人就在剛剛的那個位置,現(xiàn)有的手機/耳機去錄制都達不到同樣的效果。麥克風陣列也能更好的在各類場景(公共交通、嘈雜環(huán)境等)收音,如果是通話的場景能讓對方獲得更好的溝通體驗,對比Airpods的麥克風效果,這是非常好的升級。不過,日常通話中是對方聽到我們說話,所以感知可能不那么強。
產(chǎn)品替代選擇2——音頻眼鏡
音頻眼鏡是Meta RayBan的一個功能子集,國內(nèi)華為/米家的音頻眼鏡也早就存在,并占據(jù)極大的市場份額。據(jù)統(tǒng)計2022年這個市場的出貨量達到340萬副,今年國內(nèi)市場1-7月線上銷量7萬臺,華為占據(jù)近60%+的市場份額。兩相比較,Meta RayBan自去年發(fā)布以來就已經(jīng)達到了300萬副的銷量,要怎么剖析其中的原因呢?從我個人體驗兩款眼鏡的音頻效果角度來講,我并沒感覺到巨大的差異,那剩余的差異就在相機功能、品牌、市場消費能力上,具體各個因素能夠有多大的影響就見仁見智了。我傾向于認為RayBan的高端時尚品牌和歐美較強的消費能力起了更主要的作用,或許還有運氣成分也說不定。
同類的其實市場上還有AI音頻眼鏡,他們在音頻基礎上增加了AI能力,在現(xiàn)階段的AI能力下,沒有聚焦到具體的場景只是把對話能力加入,對產(chǎn)品走向大眾消費者幫助不大;作為初創(chuàng)品牌,號召力更是無法對比華為/小米,那其銷量的前景也很難說好。
產(chǎn)品替代選擇2——頭戴式相機
眼鏡上的攝像頭可以說和頭戴相機是同一個內(nèi)核,但是頭戴相機的品類并沒產(chǎn)生消費者市場,大部分人不知道有這種東西。可以從幾個角度觀察和對比,一方面,傳統(tǒng)做這個品類的廠商的技術能力、關注點可能有偏差,沒有考慮到這樣一個產(chǎn)品在頭上的“怪異”,追求高質(zhì)量帶來的大體積讓形態(tài)更怪異,繼而收縮成某些B端場景下的商品;另一方面,運動相機通過各類配件的組合,比如掛在脖子上、安裝在頭盔上、手持自拍桿,更加的靈活方便,直接吃下了這類產(chǎn)品的市場;再者,第一視角拍攝的需求并不是一個高頻、普適的需求,在少數(shù)場景里充滿想象、大部分場景里并不那么重要。相機角度,還有兩個大品類有一定的替代關系,通用場景的手機和垂類場景的運動相機。
市場替代選擇2——手機
在上一節(jié)我們其實圈定了用戶在需要佩戴眼鏡的場景下才更容易接受這它,在這些場景中,眼鏡相機提供了手機無法競爭一點就是抓拍,一個按鈕或一句語音的交互確實比拿出手機、打開相機、找到角度、拍攝的流程短非常多,這顯而易見。而另一個想聊的內(nèi)容是沉浸、第一視角、所見即所得這幾個概念,在這里沉浸是眼鏡的形態(tài)讓用戶不需要改變觀察場景/世界的方式,我的眼睛仍舊直接的看著環(huán)境,而不是透過手機屏幕,最典型的就是演唱會,想象一下就能感受到其中的差異,所以這是一個很重要的優(yōu)勢。延伸開來,手機拍攝可以調(diào)整角度、構(gòu)圖、是所見即所得,而眼鏡在沒有顯示的情況下并不是所見即所得(第一視角不能規(guī)避這一點,我認為大部分人拍攝完如果分享還是會在手機上審視一下效果);加上顯示有一定的幫助,但是總歸是隔了一層,從這一點來講各有優(yōu)劣。
市場替代選擇3——運動相機
對比運動相機,眼鏡+相機的2合1屬性是優(yōu)勢之一,Reddit RayBanMeta頻道分享的照片,涵蓋了跳傘、滑雪、騎行、過山車、賽車/水上摩托/沙地摩托、釣魚、演唱會等,這也可以以小見大,原本很多運動相機的使用場景在被眼鏡相機替代,所以不久的將來運動相機的廠商應該也會切入這個品類。
這樣比較下來,會發(fā)現(xiàn)Meta RayBan的產(chǎn)品定位非常精準,聚焦垂類場景(戶外,太陽鏡+抓拍+音頻),打造優(yōu)異的產(chǎn)品體驗(畢竟一代翻車了- -)。隨著出貨量和活躍度的提升,慢慢地加入AI能力,控制用戶預期,步步為營。
三、手機外設、多模態(tài)AI和實際場景
手機外設
智能眼鏡首先需要滿足眼鏡的形態(tài)、功能需求,需要控制極低的重量,現(xiàn)有的50g只是部分場景人群的可用門檻,脫離使用場景/人群的50g并無意義,對更大范圍的人群來說,應該需要更輕,目前并不值得樂觀?,F(xiàn)有技術條件下,小型化要么做功能取舍、要么降低功能質(zhì)量,耳機、相機、顯示屏這幾個最明顯的的選擇也就出現(xiàn)了,單一功能或者排列組合。羅列了一下對應設備當前的典型場景、小型化情況、實用性程度。
也是通過這個表格看到了Meta的選擇邏輯,發(fā)現(xiàn)寫著寫著就在猛吹Meta了,從智能眼鏡的角度確實最先拋棄的就是不成熟、價值低的顯示,而在AR/VR行業(yè)做了幾年的的誤區(qū)就是過于聚焦顯示,這是最應該調(diào)整的思考角度。
先做好手機外設是一段時間內(nèi)智能眼鏡的清晰定位,逐步覆蓋傳統(tǒng)眼鏡人群,蠶食一部分耳機/手表的市場,手表的健康/通知能力眼鏡上也有廠商在嘗試。這兩個品類的年出貨量如下:
當下的多模態(tài)AI
而這個過程中,反復提到眼鏡形態(tài),這將將是雙刃劍,離身體更近,要求卻更高,而多模態(tài)AI將會是最大的底牌。AI提問、智能翻譯、拍照答題、實時導航、語音記錄等等都是大家發(fā)布AI能力的時候經(jīng)常演示的場景,確實AI在每個場景里都是可用的;近期ChatGPT、谷歌還是豆包,也都更新了視覺能力,能夠直接打開攝像頭/屏幕共享并進行語音溝通。
所以哪些場景/功能和智能眼鏡搭配更好呢?有幾個基礎的值得考慮的點:
顯示:智能眼鏡短期內(nèi)的信息顯示效率不會太高,所以需要屏幕承載大量信息的場景應該規(guī)避。比如拍照答題,我們在學習過程中都是語言配合板書/多媒體/草稿紙來解題學習的,AI解題軟件其步驟解釋等可能需要半個手機屏幕處理,這種顯然并不適合用智能眼鏡來落地。
模型:前些天我也用ChatGPT測試了一下生活場景,具體過程如下:
也有很多UP主基于多模態(tài)做了很多的體驗嘗試,總的來看,大模型可能更擅長知識類的內(nèi)容,尤其是一些傳統(tǒng)的圖片搜索、對話講解等,但是日常生活中我們會問更多的什么問題呢?多步的生活類的問題還得不到大模型的良好支持,而很多工作/復雜問題或許更會在電腦/手機上進行。
場景:多模態(tài)AI的各類演示場景都是在提問,問模型會不會代碼、知不知道蠟筆小新、查去火車站需要多久,模型固然能夠回答的來,生活中也確實有這些問題,我們可以提問。但如果不聚焦并覆蓋實際的場景,只是演示功能點,只是告訴大家隨時可以問智能眼鏡任何問題,那就走向個極度碎片化、極度依賴模型能力的極端,更適合早期使用者。面向大眾,還需要聚焦。家里的小愛被問最多的是“開電視、“天氣如何”、“定個鬧鐘”,而Siri又被問什么呢?我記得之前有一個統(tǒng)計,現(xiàn)在完全找不到了。
更關心實際場景
前面的分析、對比、整理幫助我們更好的理清現(xiàn)狀和定位:
- 第一,眼鏡有外觀和佩戴成本,要用新價值克服它;
- 第二,眼鏡上耳機/相機/顯示能力都有一定的邊界限制;
- 第三,多模態(tài)AI有很多可能,但是目前的現(xiàn)狀并不完全成熟。
Meta RayBan用兩代產(chǎn)品給基礎功能劃定了及格線,比如電量使用時長、相機拍攝效果、音頻能力,同時也在各種社區(qū)關注到有用戶使用兩幅眼鏡輪流滿足全天使用、對MetaAI的嚴格限制和更新速度的吐槽、只支持豎屏視頻、期望導入之前預覽照片選擇性導入、各種連接問題等等,這些都是作為外設的基本場景需求,可以從Meta RayBan參考到很多,優(yōu)化改進。
繼續(xù)總結(jié)一下主要場景/人群:
- 墨鏡:Meta已經(jīng)驗證的場景,前面也一直反復在強調(diào)。這里補充一點,從境外主觀感受來講,歐美人幾乎人手一副墨鏡,而在國內(nèi)旅游對這一點感受并不強烈,所以國內(nèi)面向日常近視鏡的方向確實更可靠,但難度也更大。
- Be My Eyes:一個非常非常有意義的細分方向,科技向善。
- 騎行/戶外:近兩年可能騎行是其中的大類,無論是公路自行車還是摩托車,屬于多合一的典型場景,眼鏡的保護作用+拍攝方便沉浸+音頻/通知,挑戰(zhàn)在于多樣的形態(tài)需求(傳統(tǒng)的防風/滑雪其實各不相同)、還有電量和錄制時長的平衡、運動情境下的抖動優(yōu)化等。
- 博主:第一視角錄制對于開箱、探店、采訪類型的博主是個很好的補充選擇,主要考慮錄制的清晰度、時長以及和傳統(tǒng)拍攝設備素材之間的融合(畫面比例/分辨率等等)。
- 出境游:個人非常看好的垂類場景,面向的群體有一定的消費能力,基本的抓拍、翻譯或者導航的實用功能、AI問答科普,在這個場景內(nèi)都有需求,組合起來形成對場景的完整覆蓋。要是續(xù)航能夠有更好的解決辦法,非常有價值。
- ……未完待續(xù)
找準場景,不只是提供能力。
四、新的計算終端和未來
老羅在直播間提到的,人類工具發(fā)展史上,滿足同等功能的情況下,穿戴式設備一定會打敗便攜式設備;
iPhone初代發(fā)布會的定義,喬布斯說這是一臺三合一的設備:an iPod, a phone, and an Internet communicator
能夠做到更方便、更多功能這件事本身就是價值,存在的只是價值多大的問題,(謹記)前提是達成滿足大眾對功能的要求。
下面是放飛時間。
計算機的基本結(jié)構(gòu)是“輸入——計算——輸出”,計算的CPU從早期的電子管、晶體管到硅片集成電路后,物理底層就沒有發(fā)生大的變化,只是一直在降低計算的功耗;而在計算機的輸入輸出歷史上,成熟的模態(tài)只有三種,視覺、聲音、物理,這也是計算機發(fā)展的必然,畢竟這三個通路對應著一個人最大的信息輸入/輸出,觀察世界的眼睛、與同伴交流的耳朵/嘴巴、超級靈活的雙手。這三種模態(tài)各有優(yōu)劣:
圖片截自https://www.timoni.org/work/,推薦,非常好的文章和內(nèi)容
輸入的變革
穿孔卡帶、鼠標和圖形界面、十字按鍵和手柄搖桿、多點觸控屏幕,每一種硬件終端開拓市場的過程中都少不了與之匹配的高效的輸入手段,眼鏡發(fā)展成新一代的計算終端也必然不會缺少交互的革新。目前智能眼鏡的主要交互手段是語音和按鍵觸摸板,從前面各個交互方式的優(yōu)劣來看,語音并沒有辦法變成一個系統(tǒng)的主要交互手段,而按鍵觸摸板在如此小的面積下能夠支持的功能也非常有限,因此一定有一種更有效、更適合的交互手段還待發(fā)掘。
眼鏡是一個固定位置的穿戴設備,距離我們的手很遠,而手確實我們同計算機交互時最主要的輸出手段,因此人們也在不斷的探索手勢交互、控制器、腕帶、戒指等。逐個來看,控制器其實和眼鏡穿戴式的本質(zhì)相違背,第一個被Pass掉;手勢交互或者說自然交互,從感官上是強烈依賴觸覺的,裸手交互無論在視覺/聽覺上做多少文章,總是缺少了一個重要的感官維度,或許需要觸覺模擬手套等支持,厚重的手套就又一次和可穿戴相違背,要等待科技進步了;至于戒指,和眼鏡腿上的按鍵觸摸板類似,形成更寬的輸入通道還無法預見,而如果作為3DoF控制器的話,也受限于人小臂的精確程度/穩(wěn)定能力,并不好用;腕帶則替換或者說和手表融為一體,結(jié)合更深度的對神經(jīng)的感知,或許是一個方向,但是除了演示還沒有任何實際的產(chǎn)品。
如上一篇對智能眼鏡看法,我依舊會認為采集設備(相機/麥克風)+個人的AI Agent將會未來的核心輸入方式,加上跨設備的協(xié)同生態(tài),將會為我們帶來一種被動但又合乎心意的交互方式。正如老板秘書會安排好出差的航班/去機場的專車、團隊伙伴會在需要你參與時安排好會議,AI就像另一個你,擁有意圖理解、處理日常事務的能力,比如清晨醒來根據(jù)你的習慣播放一首音樂或播報你感興趣的新聞、出門時幫你計算時間自動叫車、發(fā)現(xiàn)到了會議時間而你還趕到的時候幫你自動和參與者說抱歉、健身運動的時候自動幫忙調(diào)整訓練課程等等。同時,智能眼鏡在很長時間內(nèi)不會讓我們不需要手機/電腦,而只是覆蓋我們更碎片化的一些需求,或者說生活的助手。
老生常談的顯示
輸入通道的拓寬需要龐大的算力,輸出通道亦是如此,無處不在的顯示并不是要求巨大的屏幕,而是經(jīng)過復雜計算后給到的精煉的、準確的顯示。煮粥的人看向煮粥的鍋只是想知道什么時間能好,那就顯示一個時間;準備喝粥的人還不知道是什么粥,那就顯示是什么粥、什么時間,既不會標準化的顯示各種信息,也不會在不合適的地方/時間顯示,只和我關心的事情相關。與此同時,也是舒適的顯示,并不是懸掛在眼前的屏幕,也不會不停的抖動,可見的未來是一種與我們的日常生活融為一體的輕信息顯示;更遠的時間才會是更豐富的、更生動的信息載體(這些技術會在MR/VR設備上不斷成長,在特定場景使用,最終再完成小型化的蛻變)。期待這樣的一天的到來。
比特比原子更便宜
或許在遙遠的未來算力真的無處不在又足夠廉價,那一切顯示都可以是虛擬的。所有人的T恤在物質(zhì)層面都是一樣的,每個人個性化的部分都將通過虛擬的方式疊加,可以隨時更換自己的皮膚,隨時交易,永遠不會有物理意義上的折舊,真正將基本的物質(zhì)功能需要和情緒個性化的需求分離開。細思恐極。
寫完后發(fā)現(xiàn),文章里把Meta和RayBan的順序搞反了,其實RayBan在前面,嗯,很有道理。emmm…
道阻且長,但改變終會發(fā)生,未來總會到來。
本文由 @等待XR的春天 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務
- 目前還沒評論,等你發(fā)揮!