NLP方法論(1):如何尋找語音交互的業(yè)務(wù)場景?

5 評(píng)論 4936 瀏覽 37 收藏 23 分鐘

如何尋找語音交互的業(yè)務(wù)場景?作者從自己實(shí)際工作實(shí)踐出發(fā),總結(jié)分享了相關(guān)經(jīng)驗(yàn)。希望能夠在你進(jìn)行語音交互場景設(shè)計(jì)時(shí),提供一些方向和思路。

這是一個(gè)創(chuàng)業(yè)者的復(fù)盤,主要內(nèi)容分為兩個(gè)部分。

  1. 一個(gè)創(chuàng)業(yè)者成長的心路歷程——心路日記
  2. 如何尋找語音交互業(yè)務(wù)場景——干貨思考

繪聲繪色地講故事和枯燥嚴(yán)謹(jǐn)?shù)厣疃人伎紗栴},咱們切換著來,但是最終為標(biāo)題服務(wù)——如何尋找語音交互的業(yè)務(wù)場景。

一個(gè)創(chuàng)業(yè)者成長的心路歷程——心路日記(1)

筆者進(jìn)入AI領(lǐng)域,從事NLP相關(guān)的工作,已經(jīng)超過18個(gè)月的時(shí)間了。如果算上我們的真9-9-6強(qiáng)度,走過的彎路,做過的那些項(xiàng)目經(jīng)驗(yàn)廣度與深度,沒法算。

剛切入AI行業(yè),耳濡目染熟悉了語音交互的優(yōu)勢和特性,比如:

  • 解放雙手,懶人最愛;
  • 使用門檻低,會(huì)普通話就能用;
  • 交互自然,沒有什么學(xué)習(xí)成本;
  • 一句話就能搞定需求;
  • 如果一句話不行,那就兩句?三句?

彼時(shí)外部環(huán)境也特別好,彼時(shí)各媒體,產(chǎn)業(yè),融資層面的大環(huán)境,一片欣欣向榮,此處也不累述了。

從實(shí)際的發(fā)展趨勢上來看,未來注定是萬物互聯(lián)的世界,幾乎任何硬件都可以搭配麥克風(fēng)、揚(yáng)聲器和WIFI模塊三件套,且可穿戴智能硬件出貨量特別大……語音是最為自然的交互形態(tài),一定會(huì)出現(xiàn)在我們生活中,一切都似乎特別美好。

過往18個(gè)月,大家定期就會(huì)圍坐一個(gè)圈,開頭腦風(fēng)暴會(huì)議,思考有哪些場景適合語音交互?從普羅大眾的高頻剛需到特定行業(yè)的細(xì)分場景,大家輪流發(fā)言,想到哪里是哪里,不打斷不評(píng)價(jià),每時(shí)每刻都在尋找創(chuàng)業(yè)場景。

過往18個(gè)月,頭腦風(fēng)暴了上百個(gè)想法,推演過程中拍死了幾十個(gè)想法,留下幾十個(gè),因?yàn)楦鞣N原因半途而廢掉十幾個(gè)技能,最后留下了十幾個(gè)技能,一看后臺(tái)數(shù)據(jù),有些表現(xiàn)好,有些表現(xiàn)糟糕。

過往18個(gè)月,每當(dāng)有新的語音交互技能被做出來,便迫不及待的在自己的朋友面前吹牛逼,秀產(chǎn)品DEMO,“Hey,這是我新做出來的東西,要不要看看!”

當(dāng)我在朋友面前如同開發(fā)布會(huì)一樣的一波嘴炮鋪墊以及熟練操作之后,我非常欣賞且享受對方面部流露出來那種wow的驚奇感,對方興奮的表情停留在我的腦海中至今難忘,以我對朋友的了解,他情商一般般且沒有討好我的必要且并不是表演專業(yè)且無需做出照顧我心情的表現(xiàn),由此我推斷這是一個(gè)真實(shí)的表情流露,朋友的這種表現(xiàn)像雞血一樣刺激我又回到辦公室瘋狂努力加班。

心中想著,“尼瑪創(chuàng)業(yè)就是要比快,哥們要趕快做出來,顛覆!革命!劃時(shí)代!改變世界!讓我們?yōu)閴粝胫舷?!?/p>

有的時(shí)候我在想,是不是自己的銷售能力比較強(qiáng),就我那個(gè)朋友給我的表現(xiàn)來看,我開發(fā)布會(huì)在演示產(chǎn)品環(huán)節(jié)的部分一定給力,差不離也有錘子科技發(fā)布會(huì)的那種wow,!再來一遍!理解萬歲!的效果。

當(dāng)技能上線后,一看數(shù)據(jù),相當(dāng)多的技能用戶嘗鮮完畢后,就擱置在那里,就是無法形成使用習(xí)慣,甚為不解的我,自然是開展了用戶面對面的訪談?wù){(diào)研工作,拿到的反饋是,這個(gè)剛開始確實(shí)是感覺挺新鮮,有點(diǎn)意思,但是后續(xù)我就是忘記使用了。

熟悉不?嘗鮮型體驗(yàn),還是根本就是個(gè)僅能打動(dòng)自己的偽需求?

心中的疑惑,由“做什么技能”改成了“為什么我們做出的技能,演示的時(shí)候挺有意思,但是后續(xù)用戶不會(huì)用?”

單單用“用戶習(xí)慣難以改變,很多人接受不了新的東西”來為自己開脫,恐怕太偷懶。

過往18個(gè)月,筆者面對投資人科普、演示、教學(xué)、展望如果給我什么什么條件那么我們就極其有機(jī)會(huì)做到怎樣怎樣可謂經(jīng)驗(yàn)豐富,附帶各種銷售話術(shù),投資人也會(huì)在我的話術(shù)套路下,流露出我前面朋友一樣wow的驚奇感興奮感,只求對方能夠給我們投錢擴(kuò)張,不著急投錢等等看的話能連接一些合作資源也成啊。

給B端客戶演示的時(shí)候,效果也差不多,雖然他們比較興奮,我也一度享受,可是時(shí)間長了,我也有點(diǎn)疲勞,這些事做久了提升的是自己的銷售能力,對自己的專業(yè)精進(jìn)并沒有太大的用,說得多了自己就會(huì)陷入稟賦陷阱,即,手里拿著錘子看什么都是釘子。

現(xiàn)在回顧過往,那些半途而廢的,那些上線后數(shù)據(jù)不好的,都是財(cái)富。即,我能給很快的判斷出:哪些業(yè)務(wù)場景需要語音交互,哪些業(yè)務(wù)場景根本就是偽需求。

如何尋找語音交互業(yè)務(wù)場景——干貨思考(1)

創(chuàng)業(yè)自然是從找方向開始,一開始是做產(chǎn)品分析及市場調(diào)研。

分析競品功能,分析友商情況,分析各種硬件的出貨量,分析自己的優(yōu)勢劣勢,分析國內(nèi)外的各個(gè)語音技能有哪些,什么受歡迎,什么技能可以直接帶來錢的回報(bào),或用戶增長等等,分析各個(gè)技能的實(shí)現(xiàn)方案,我們能做到什么程度,人力、資源投產(chǎn)比……

當(dāng)然最重要的是,總得確立方向,做出點(diǎn)東西來。

筆者M(jìn)ECE之后,總結(jié)歸類,市面上所有的語音交互技能都分為下面四個(gè)大類別。

【語音&工具】門檻太低,且?guī)缀鯖]什么技術(shù)含量。巨頭做了,小公司還跟著做,那是一點(diǎn)機(jī)會(huì)都沒有。

實(shí)際上,我們練手了幾個(gè)工具型的技能,有一些交互設(shè)計(jì)上的微創(chuàng)新,但是微創(chuàng)新沒有用,你會(huì)接受投資人那個(gè)老套而經(jīng)典的拷問,如果大廠開始抄你,你怎么辦?且用戶也不會(huì)因?yàn)楣ぞ呱系奈?chuàng)新而買單。

【語音&內(nèi)容】技術(shù)含量較低,即搜索、點(diǎn)播、操控行為,本質(zhì)上拼得是接口資源,用戶根本不在意是使用語音還是點(diǎn)觸找到內(nèi)容,內(nèi)容才是核心。

實(shí)際上,我們能夠做到更好的數(shù)據(jù)表現(xiàn),即用戶怎么說,AI都能理解,但是沒有接口給我們調(diào)用,因?yàn)闆]有播放版權(quán),用戶根本不買賬。

【語音&游戲】本質(zhì)上也是一種互動(dòng)性較強(qiáng)的內(nèi)容,依賴個(gè)人天賦,游戲創(chuàng)作能力,添加語音交互的這一新的操控維度,未來擁有比較多的想象空間。

實(shí)際上,猜歌詞、成語接龍屬于偽多輪,就算發(fā)明出幾種變種模式,抄襲也容易沒有什么壁壘。而語音互動(dòng)小說,也苦于沒有好劇本創(chuàng)作(這事拼天賦),好聲優(yōu)太貴成本太高,一直沒怎么投資源,內(nèi)部屬于試驗(yàn)品。另外的和傳統(tǒng)手游結(jié)合的這里不方便展開講,沒做的原因是資源投入過大,一直未動(dòng)手。

【語音&服務(wù)】才是真正意義上的多輪表現(xiàn),非內(nèi)容創(chuàng)業(yè),不過分依賴天賦,容易找到高頻剛需,比較考驗(yàn)對自然語言處理的理解,擁有一定的技術(shù)門檻。

唯有語音連接服務(wù),各種條件考量下來,C端B端G端均有需求,故而成為了我們選擇的方向。敲黑板,劃重點(diǎn),簡單總結(jié):

【語音&游戲】成本高,依賴稟賦的內(nèi)容生意,投產(chǎn)比風(fēng)險(xiǎn)較大。

【語音&服務(wù)】相對而言,是更為廣闊,落地容易且穩(wěn)妥的選擇。

所有的單輪都沒太大機(jī)會(huì),大廠跟進(jìn)抄襲太容易。

所有做內(nèi)容搬運(yùn),但交互形式不創(chuàng)新的,都沒機(jī)會(huì)。

只有多輪,巨頭還沒做到的,跟進(jìn)較難,才是創(chuàng)業(yè)公司的出路所在。

第一輪篩選確定方向后,接下來是第二層篩選,選擇哪個(gè)細(xì)分領(lǐng)域。

一個(gè)創(chuàng)業(yè)者成長的心路歷程——心路日記(2)

往前推演十幾年,智能手機(jī)未普及的時(shí)候,大家都是使用鍵盤和鼠標(biāo)尋求服務(wù)。移動(dòng)互聯(lián)網(wǎng)的從興起到如今,人類目前高頻剛需幾乎已經(jīng)被各個(gè)APP占用了,他們共同的交互方式是點(diǎn)觸的形式。而在未來,語音交互由于其特性,一定存在一席之地。

有相當(dāng)一段時(shí)間里,心中也是抱著,使用新的語音交互體驗(yàn)方式,去顛覆一切舊的用戶行為的心態(tài)。

至今自己做什么事,或者觀察其他人做什么事,也在琢磨,能不能讓語音發(fā)揮作用,這種習(xí)慣保持至今。

過往我們走了太多的彎路,現(xiàn)在看起來很愚蠢的討論,這些方案點(diǎn)子試錯(cuò),曾經(jīng)花費(fèi)了我們太多的時(shí)間,而這些東西如今在我看來,幾乎很快就能通過知識(shí)框架推演出有無機(jī)會(huì),實(shí)現(xiàn)難度幾何。

幾乎每個(gè)行業(yè)的從業(yè)者都會(huì)為自己的領(lǐng)域找到價(jià)值,而每個(gè)從業(yè)者都能隨隨便便列舉各種語音交互的優(yōu)勢,但是光認(rèn)知優(yōu)勢沒有用,明白局限才是我們的篩選漏斗,否則即使你做出來,局限處理不好,用戶也不會(huì)買單。

在某些大會(huì)上,某些路演上,看著臺(tái)上的人舉例子說語音交互的場景。

我早上出門比較著急,一邊收拾小孩手忙腳亂的,這個(gè)時(shí)候我可以用語音叫個(gè)車。

我一邊開車,想到公司就能喝到熱咖啡,這個(gè)時(shí)候我可以用語音搞定。

剛剛下飛機(jī),雙手拎著東西,想通過語音發(fā)微信,打電話。

這種例子,完全是基于自己的角度,先把自己置入一個(gè)困境強(qiáng)行制造需求,然后提供解決方案。上述的三個(gè)業(yè)務(wù)場景真要抬杠,太容易了,但沒必要。

解決方案是好,但是用戶一定會(huì)用么?進(jìn)入了困境用戶會(huì)想起這種解決方案么?習(xí)慣如何培養(yǎng)?想要成為一個(gè)內(nèi)行,不光是要看優(yōu)勢,還要理解局限,才能夠運(yùn)用自如,而不是一味強(qiáng)求使用語音解決。

擱在以前的我們,只能提煉出“臥室、客廳、車內(nèi)”這三種場景,提煉出“雙手被占用”,因?yàn)樾袠I(yè)就是這樣做的,且如此提供服務(wù)的。這種不夠抽象,且無法體現(xiàn)出提煉語音交互關(guān)鍵點(diǎn)的描述,只會(huì)固化我們的思維。

我們應(yīng)該了解語音交互的特性后去篩選適合的業(yè)務(wù)場景,而不是先制造困境場景然后尋找語音解決。

如何尋找語音交互業(yè)務(wù)場景——干貨思考(2)

下面是我總結(jié)出來的語音交互對比圖形界面交互的優(yōu)勢和缺陷。

其中白色塊是特點(diǎn),綠色塊是優(yōu)勢,灰色塊是缺陷。

且,理解缺陷非常非常非常重要!他能幫助你避開無數(shù)業(yè)務(wù)設(shè)計(jì)大坑。

有興趣的,可以看我的另外一篇文章《一篇文章深入理解VUI和GUI的優(yōu)劣對比》我會(huì)把鏈接放在文末。

結(jié)合語音交互的優(yōu)勢和缺陷,下圖是我提供的一個(gè)業(yè)務(wù)場景篩選漏斗。

基于上述,我們可以得出的使用場景有:臥室、客廳、廚房、衛(wèi)生間、車內(nèi)、私人辦公室、滑雪場、隧道內(nèi)、病床上……

然后是具體場景最常用做什么事情,語音交互能夠帶來更好的方案。而不是具體的場景強(qiáng)行做某事?;诖诉M(jìn)行發(fā)散。(臥室、客廳、車載不列舉了,沒啥意思)

  • 跑步的時(shí)候,騎車的時(shí)候,想切歌,接或者打電話。
  • 廚房里面有點(diǎn)播做菜視頻,買廚房用品的需求。
  • 醫(yī)院的衛(wèi)生間和病床上,病人移動(dòng)不便,使用語音交互是沒有壓力的。
  • 滑雪場上穿著滑雪服,相當(dāng)多時(shí)候需要用到通訊設(shè)備進(jìn)行交流。
  • 光線不好的隧道內(nèi),甚至是地下管道,穿著工作服,使用手機(jī)不方便時(shí)。
  • 快遞/外賣小哥,騎車和送貨,雙手經(jīng)常被占用,公共場合使用語音無壓力。

這樣類似的場景完全符合上面的篩選漏斗里面提煉的條件。

而不僅僅是大家一窩蜂做的“臥室、客廳、車內(nèi)”。

具體容易固化思維;抽象易于發(fā)散思考。希望各位讀者能夠明白其價(jià)值。

用戶使用語音的前提。一個(gè)是不得不,一個(gè)是更便捷。我更希望大家從更便捷的角度去考慮,而不是不得不,所有的不得不,人類都有辦法。

通過第一層場景選擇后,第二層是業(yè)務(wù)選擇,判斷哪些更合適。

用戶非常熟悉,簡單明確的業(yè)務(wù),意味著“閉著眼睛就能搞定”,簡單明確,不需要圖形界面確認(rèn)。

一句話需求就能夠返回結(jié)果,是最爽的語音交互狀態(tài)。

決策壓力小,相對標(biāo)準(zhǔn)的服務(wù),意味著很多的默認(rèn)選項(xiàng),用戶可接受度較高。

我們來看下面幾個(gè)案例

廚房買蔬菜就不太合適,是因?yàn)槭卟耸欠菢?biāo)品,品類和新鮮程度存在太多的人為主觀接受及條件篩選。但買醬油就可以,最多加一個(gè)品牌作為復(fù)合查詢條件,并且商品的尺寸大小無所謂,決策壓力較小。很多的人買其他的調(diào)料(醋、鹽、雞精等)幾乎也沒什么品牌需求,能用就行。即標(biāo)準(zhǔn)品,用戶接受默認(rèn)選項(xiàng)。

同理,訂麥當(dāng)勞/KFC/漢堡王、星巴克/瑞幸,喜茶/奈雪/一點(diǎn)點(diǎn),甚至是煙和酒等標(biāo)準(zhǔn)品服務(wù)就相對容易,因?yàn)闆Q策壓力小,品質(zhì)和服務(wù)可控。

同理,出行相關(guān)的服務(wù),酒店之間的服務(wù)差別實(shí)在太大,飛機(jī)次之,火車最容易,就相對而言更容易立即呈現(xiàn)結(jié)果。

訂機(jī)票/酒店的業(yè)務(wù)還算好,至少流程明確,決策路徑較短,最難搞的就是,用戶不知道自己要什么。用馬爸爸好幾年前的話說“每晚有1700萬人逛淘寶,啥都不買?!?br />

衣服鞋帽或者外賣餐食就屬于典型的用戶需求不明確,一句話雖然能夠搞定結(jié)果,但是展示的結(jié)果,用戶一定不滿意,除非你拿到用戶的個(gè)人數(shù)據(jù),和過往的喜好選擇,那么才可以提升精準(zhǔn)度。如果不精準(zhǔn),而用戶使用語音換來換去,效率就非常低了。

在有些事情上,用戶本來就是挑挑揀揀的心態(tài)。用《梁寧產(chǎn)品思維30講》的話來說,“大明”用戶明確需求,而“笨笨”用戶不明確,需要逛來逛去,還喜好挑挑揀揀,這種情況,就不太適合使用語音交互。

所以電商是存在語音交互的可能性的,但是要有這個(gè)層面的理解,才方便做篩選,否則就會(huì)出現(xiàn)尷尬。

同理,出行,金融,教育,醫(yī)療,游戲、線下生活服務(wù)同樣可以基于此篩選場景。

筆者負(fù)責(zé)任的說,任何業(yè)務(wù)都可以有語音交互的解決方案,只是看合適不合適。

綜上,創(chuàng)業(yè)公司在選擇業(yè)務(wù)場景的時(shí)候,通過上述條件要素篩選,更容易篩選機(jī)會(huì)。

階段性完結(jié)

筆者基本上已經(jīng)對得起當(dāng)初文章標(biāo)題所述,如何選擇語音交互的業(yè)務(wù)場景。

首先是,如何做大方向選擇,每個(gè)方向都沒錯(cuò),但是要結(jié)合自身公司的優(yōu)勢去判斷,就好,比如,喜馬拉雅,做【語音&內(nèi)容】絕對是自身稟賦。

接下來使用2層篩選清單去選擇做什么場景,基于場景選擇做什么業(yè)務(wù)。

具體容易固化思維;抽象易于發(fā)散思考。做到精準(zhǔn)的抽象,又很難,希望各位讀者能夠明白其價(jià)值。

場景和業(yè)務(wù)明確后,也還存在如何交付的過程,畢竟產(chǎn)品設(shè)計(jì)方案有太多種,只要是從業(yè)者就能給出方案,但方案之間也存在優(yōu)劣好壞。

故后面的命題是:如何通過語音交互革新體驗(yàn),提升用戶使用價(jià)值。

出于文章定位原因,本文階段性結(jié)束。

我們都知道那個(gè)著名的公式:用戶價(jià)值=(新體驗(yàn)舊體驗(yàn))替換成本。前段時(shí)間讀《俞軍產(chǎn)品方法論》時(shí),更是加深了理解。

我們?nèi)绾吾尫臕I的能力去革新體驗(yàn),盡量提升(新體驗(yàn))的價(jià)值。同時(shí)用戶(替換成本)是什么,如何降低?如何兩頭用力,最大化創(chuàng)造用戶價(jià)值?

引用本文開頭提及的:“過往18個(gè)月,頭腦風(fēng)暴了上百個(gè)想法,推演過程中拍死了幾十個(gè)想法,留下幾十個(gè),因?yàn)楦鞣N原因半途而廢掉十幾個(gè)技能,最后留下了十幾個(gè)技能,一看后臺(tái)數(shù)據(jù),有些表現(xiàn)好,有些表現(xiàn)糟糕?!?/p>

有些技能是再怎么折騰,也還會(huì)糟糕的,有些則是通過一些調(diào)整,可以使其變得更好。

一個(gè)語音技能,能被C端B端G端所認(rèn)可接受,一定會(huì)經(jīng)過大量的篩選迭代,留存下來的是價(jià)值,那些沒留存下來的,推理過程中被拍死的,半途而廢的,數(shù)據(jù)表現(xiàn)糟糕的技能,經(jīng)過思考,總結(jié)、復(fù)盤也會(huì)積累財(cái)富。

這個(gè)財(cái)富有一個(gè)別名,叫做認(rèn)知。

認(rèn)知不夠,就算發(fā)現(xiàn)某些場景,也會(huì)認(rèn)為司空見慣理所當(dāng)然,跟那些被蘋果砸中的果農(nóng)沒有任何區(qū)別。

#相關(guān)閱讀#

VUI 與 GUI,不同場景下的優(yōu)劣對比

#專欄作家#

飯大官人,微信公眾號(hào):fanfan19860403,人人都是產(chǎn)品經(jīng)理專欄作家。《游戲運(yùn)營:高手進(jìn)階之路》作者,不折騰會(huì)死星人,擅長游戲&AI的領(lǐng)域。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于 CC0 協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請登錄
  1. 我當(dāng)前的公司就有點(diǎn)類似于文章中說的狀態(tài):迫切尋求語音技術(shù)在商用服務(wù)機(jī)器人上的使用,導(dǎo)致很多功能都是讓自己處在一個(gè)不得不使用語音的窘境后二產(chǎn)生的。殊不知這種情況發(fā)生的概率太小。 現(xiàn)在重新看這個(gè)文章,實(shí)際上自己已經(jīng)經(jīng)歷過一次這樣的場景,只不過之前是參與者,現(xiàn)在是主導(dǎo)者。

    來自廣東 回復(fù)
  2. 不太明白的一點(diǎn)是
    不得不 就是強(qiáng)痛點(diǎn) 強(qiáng)痛點(diǎn)就有商機(jī) 不是這樣嗎?

    來自上海 回復(fù)
    1. 作者強(qiáng)調(diào)的應(yīng)該是,不應(yīng)該臆想一個(gè)用戶的困頓場景,然后再拿出語音的解決方案。
      而應(yīng)該從方案的優(yōu)勢點(diǎn)出發(fā),去匹配適用的場景。更好用,用戶會(huì)主動(dòng)選擇。
      所謂的不得不,用戶并不一定會(huì)想到的是語音解決,還有可能是喊他兒子用手機(jī)打車,或放下東西自己點(diǎn)餐等等。
      同樣是一個(gè)場景的打車需求,“不得不用“和“語音更好用”的感知。乃天差地別

      來自北京 回復(fù)
  3. 非常喜歡作者的文章
    認(rèn)知深刻,條理性跟邏輯強(qiáng)

    來自廣東 回復(fù)
  4. 結(jié)構(gòu)化思考:按類別歸納語音業(yè)務(wù)場景;
    產(chǎn)品思維:用戶->場景->需求;
    用戶思維:理解用戶、才能理解用戶的需求;

    來自浙江 回復(fù)