智能語音時代到來,誰在定義新時代AI?

6 評論 4937 瀏覽 12 收藏 13 分鐘

編輯導(dǎo)語:智能音箱市場已經(jīng)有多個玩家進入瓜分,阿里、小米、百度等都交出了各自的智能語音“答卷”。只是,當下的智能音箱是否真的足夠“智能”?玩家們又該如何定義當前市場,搭建合理的智能生態(tài)?本文作者做了對應(yīng)解讀,一起來看看吧。

概要

人工智能技術(shù)風靡多年,比起唬人的虛幻概念,智能音箱是為數(shù)不多進入尋常百姓家的真實商品。不算太高的價格、簡單易用的功能,讓它迅速占據(jù)普通人的客廳和床頭。如同重復(fù)過很多遍的故事那樣,智能音箱從初創(chuàng)走向成熟、從固有模式中尋求變革,且依舊沒有停下探尋著未來的步伐。

  1. 滿足用戶交互需求,語音識別不斷成熟;
  2. 豐富產(chǎn)品功能范圍,高端和智能化破局;
  3. 從分散走向整體,自建智能硬件生態(tài)。

新一代交互終端、深入家庭空間的流量入口、環(huán)境智能化的開啟者……這些都是智能音箱的別稱,但當你問小度或者小愛一個問題時,得到的回答可能卻是“對不起,我沒有聽懂你在說什么”。

作為邁向智能家居的先導(dǎo)產(chǎn)品,智能音箱背負著太多概念,但現(xiàn)有的技術(shù)和功能是否能夠支撐起這些概念,卻被打上一個大大的問號。

三足鼎立的阿里、百度、小米,試圖瓜分市場的新品牌,智能音箱市場未來何在?激烈廝殺后,哪些功能仍有可能的增長空間?

一、滿足用戶交互需求,語音識別不斷成熟

2014年,亞馬遜發(fā)布首款智能音箱Echo,兩周內(nèi)出貨量破百萬臺。隨后,多家互聯(lián)網(wǎng)科技公司下場,智能音箱市場陷入混戰(zhàn)。2017年,小米在生態(tài)大會上發(fā)布智能音箱產(chǎn)品“小愛同學(xué)”,智能音箱產(chǎn)品的戰(zhàn)火燃到中國市場。

五年后的今天,小愛同學(xué)、小度小度和天貓精靈走入千家萬戶,占據(jù)的市場份額已超過95%,三足鼎立的態(tài)勢已然形成。但能否回答“主人”的問題,智能音箱們?nèi)孕枞Q于要求是否復(fù)雜、語法是否正確、發(fā)音是否標準。

實際上,現(xiàn)有的更多用戶傾向于讓家中的小愛同學(xué)或是天貓精靈完成機械性的指令。這些機械系指令包括唱歌、開燈、定時等,因為指令明確且往往只有一兩個詞匯,智能音箱很少會在完成這些指令時犯錯。

而對于稍復(fù)雜的指令,由于語音識別和NLP(自然語言處理)的不成熟,無論是用戶輸入的信息被機器識別,還是識別后的文本進行處理和理解,對于現(xiàn)有的智能音箱來說仍舊存在困難。尤其是中國市場方言的存在,為語音識別帶來了更大的困難。

2011年,微軟提出的基于上下文相關(guān)深度神經(jīng)網(wǎng)絡(luò)和隱馬爾科夫模型,使智能語音算法得到長足優(yōu)化。從海外市場看,以谷歌、微軟、亞馬遜為代表的巨頭已經(jīng)開發(fā)出具備人類級別的語音識別系統(tǒng),以深度神經(jīng)網(wǎng)絡(luò)算法取代傳統(tǒng)模型后,語音識別的單詞錯誤率每年下降約18%。

相比于早期的智能音箱,海外廠商在語音識別和流暢度上層面上進行了技術(shù)精進,中國的智能音箱廠商也在交互和識別層面進行了大量探索和創(chuàng)新。

在交互領(lǐng)域,第一次讓一問一答的生硬場景發(fā)生改變的,是小度智能音箱于2018年6月首次發(fā)布的極客模式(連續(xù)對話技術(shù))。極客模式實現(xiàn)了人與智能音箱連續(xù)對話,改善了此前人機交互中無法多輪對話、多次重復(fù)喚醒的體驗和回答生硬等問題。

而2019年出現(xiàn)的全雙工免喚醒能力,則實現(xiàn)了“一次喚醒,多輪交互”,還能在與他人對話的同時互不干擾地實現(xiàn)人機交互,進一步提升音箱的理解和表達能力,擴大應(yīng)用場景。

此后,國內(nèi)頭部智能音箱品牌都在交互形式多樣化上展開了探索,如2020年3月份,小愛同學(xué)開始將手勢控制運用到新推出的Redmi小愛觸屏音箱上??梢灶A(yù)見,除了愈加精準的識別能力,多模態(tài)交互也可能成為未來人機交互的主流。

二、豐富產(chǎn)品功能范圍,高端和智能化破局

根據(jù)艾瑞咨詢2021年報告,智能音箱用戶使用量最高的功能是播放音樂,占比達69%;其次是詢問天氣、播報新聞、播放故事和設(shè)定鬧鐘。這些被高頻使用的功能,都是國內(nèi)智能音箱在誕生之初就具備的。

因此,智能音箱的根本性技術(shù)需要革新,基礎(chǔ)功能外的新增長點也需要發(fā)掘。自誕生以來沒有明顯突破的智能音箱,亟待顛覆性的新技術(shù),讓用戶改變“新奇有趣”的初印象,用更嚴肅的目光看待產(chǎn)品。因此,產(chǎn)品分離出兩條進化路線。

一部分產(chǎn)品選擇向高端進軍,追求音質(zhì)和品質(zhì)。

比如2019年,華為與帝瓦雷聯(lián)手推出了華為Sound系列高端智能音箱,近日其還將發(fā)布新品Sound Joy,采用4單元2分頻聲學(xué)系統(tǒng),包括柔性絲質(zhì)材質(zhì)的球頂形振膜和輕量化碳纖維復(fù)合振膜。小米2021年則與哈曼卡頓合作,發(fā)布了旗下首款高端音箱Xiaomi Sound。

另一部分產(chǎn)品則注重提升智能化體驗。

首先,知識體系的構(gòu)建是觸發(fā)智能音箱新功能的嘗試。對于百度來說,在搜索模型中運用的海量用戶行為信號和算法能力,可以成為小度音箱算法調(diào)優(yōu)的基礎(chǔ);而百科、百家號等體系沉淀下的文本內(nèi)容,則能夠成小度小度回答問題時的海量召回池。

從場景上看,教育場景也確實是新的增長點,智能音箱的助教、育兒功能一直是廠商的重要宣傳點。特別是近兩年疫情影響下在線教育加速普及,智能音箱廠商加速相關(guān)布局。華為小精靈兒童智慧屏、天貓精靈CC10等產(chǎn)品,主打賣點都定在了教育功能。

其次,越來越多帶屏音箱出現(xiàn)在市場。小度系列通過帶屏音箱實現(xiàn)銷量反超,阿里和小米最新的產(chǎn)品形態(tài)同樣是觸屏音箱,如天貓精靈V10、小米小愛觸屏音箱Pro 8。智能音箱從語音交互走向語音視覺交互,說明智能語音技術(shù)的發(fā)展還未抵達顛覆性時刻,文字/視覺/觸覺的交互形態(tài)或許是突破技術(shù)瓶頸的捷徑,也可能是觸發(fā)新場景、新功能的動力。

這些嘗試同樣打開了新的消費場景,如果說語音交互可以提供播放音樂、對話類的娛樂功能;那么屏幕的出現(xiàn)則為智能音箱打開了游戲、影音、閱讀的更多可能性,只要有對應(yīng)的內(nèi)容資源支持,理論上其體驗與平板電腦無異。

受制于原有的有限功能和場景,音箱廠商一直在尋求突破口。產(chǎn)品存在的優(yōu)化空間即是增長動力,也正是“干掉”試錯的自己后,智能音箱才能迎來新生。

三、從分散走向整體,自建智能硬件生態(tài)

智能音箱的主要功能包括語音交互、內(nèi)容服務(wù)、互聯(lián)網(wǎng)服務(wù)和智能家居控制四個部分,語音交互和智能家居控制功能的實現(xiàn),使智能音箱成為全屋智能的入口。因此,對于頭部公司來說,智能音箱僅僅是其智能化宏大版圖的先行者。

雖然,動輒上千元的配套設(shè)施勸退大量普通消費者,但成套智能家居系統(tǒng)并非停留在概念層面。事實上,包括全季、亞朵、秋果在內(nèi)的商務(wù)連鎖酒店早就以智能音箱為核心,建立起一整套智能居住系統(tǒng),智能音箱們聯(lián)結(jié)起的智能化家居版圖正逐漸滲透進市場。

隨意走進一家商場里的小米之家,烤箱、空氣凈化器、電視擺在顯眼位置,讓人誤以為置身于一家微型電器城,小愛同學(xué)和其他智能家居產(chǎn)品的聯(lián)動效應(yīng)依托于成熟的配套體系,強大、完善的硬件生態(tài)鏈體系也為小米智能音箱產(chǎn)品創(chuàng)造了良好的競爭優(yōu)勢。

具體來看,在小米的整個生態(tài)中,其“1+4+N”AIoT戰(zhàn)略就是將小愛同學(xué)作為交互中心,將小米空調(diào)、烤箱、掃地機器人、洗衣機、臺燈、冰箱等種類繁多的家電,納入同一個家庭智能系統(tǒng)中。

而對于供應(yīng)鏈優(yōu)勢不那么明顯的百度和阿里來說,發(fā)揮互聯(lián)網(wǎng)頭部企業(yè)的優(yōu)勢,依托外部強大的智能設(shè)備合作網(wǎng)是其發(fā)力的重點,它們依托外部強大的智能設(shè)備合作網(wǎng)絡(luò),將智能音箱接入更多非品牌旗下的智能設(shè)備。

2021年,天貓精靈官方公布的接入品牌超過1000個,智能產(chǎn)品超過5000款,可連接智能家居設(shè)備超2億;小度智能音箱可連接家電品牌超200家。

中國智能音箱行業(yè)的三大龍頭紛紛推動智能音箱生態(tài)鏈功能形成,可見產(chǎn)品生態(tài)鏈形成對于智能音箱需求促進起著重要作用。而從另一面看,智能家居的體驗升級與入口設(shè)備的進化緊密相關(guān),音箱不得不更多地承擔起“聯(lián)結(jié)”的智能。

從這個層面上看,智能音箱與音箱漸行漸遠,作為智能家居的入口之一,智能音箱正在以全新的產(chǎn)品形態(tài)面向消費者。

面對未來的智能家居以及更多的智能場景,智能音箱或許只是一個進入的通道。但是否能夠打破電子設(shè)備、消費電器、移動設(shè)備之間的壁壘,使它們能夠充分融合、互通,更容易地共享資源,將是智能音箱要背負的更重要的責任。

 

本文由 @新盟財經(jīng) 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. ai時代正在到來,誰能定義誰也說不清,但我們都受這個紅利

    回復(fù)
  2. 智能語音會發(fā)展的越來越好的,這是一個趨勢,而且他可以給人們帶來更多的便利。

    來自浙江 回復(fù)
  3. 智能音箱有時候確實挺有幫助的,市場前景非??捎^。

    回復(fù)
  4. 面對未來的智能家居以及更多的智能場景,智能音箱只是一個進入的通道

    來自吉林 回復(fù)
  5. 說實話,我從好久以前就種草了小愛同學(xué),但是到現(xiàn)在也還沒有購買,感覺找不到一個必須需要它的理由

    來自福建 回復(fù)
  6. 智能產(chǎn)品也有局限性感覺,比如捕捉信息太過敏感,比如靠近一下,就有反應(yīng)了哈哈。

    來自江蘇 回復(fù)