把導(dǎo)游掛在耳朵上:人工智能在旅游場(chǎng)景中的應(yīng)用

6 評(píng)論 7105 瀏覽 50 收藏 19 分鐘

旅游場(chǎng)景下應(yīng)用人工智能有美好的前景,同時(shí)也有很多問題亟待解決。

語(yǔ)音交互被視為人工智能時(shí)代的重要入口,而家庭又是一個(gè)噪音較少、網(wǎng)絡(luò)穩(wěn)定、需求明確而有限的場(chǎng)景,所以各大廠商都想搶占這一入口。今年以來各大智能音箱促銷大戰(zhàn)此起彼伏,促銷力度一浪接著一浪,從小愛mini的99元,到天貓精靈方糖的89元,到叮咚mini的79元。低價(jià)新奇的智能音箱銷量可觀,教育了大眾,更多的人也實(shí)實(shí)在在的接觸到了人工智能。

本文從旅游場(chǎng)景用戶需求出發(fā),暢想一下人工智能在這一場(chǎng)景下的應(yīng)用。

一、旅游場(chǎng)景

傳統(tǒng)的旅游人群去景區(qū)主要是看房子,看看樹,看看山,看看景。

自然景區(qū)無可厚非,游客就是領(lǐng)略自然風(fēng)光,看看名山大川;但是到了人文景區(qū),比如故宮、天壇,絕大多數(shù)人都只有一個(gè)大概的認(rèn)識(shí),知道這是古代皇帝住的地方,這是古代皇帝祭祀的地方。轉(zhuǎn)了一會(huì),發(fā)現(xiàn)房子到處都一樣,逐漸的失去了新鮮感,失去了興趣。旅游不過也就是我去過那里了,打過卡了。

人們?nèi)ト宋木皡^(qū)的意義在哪?

大家都會(huì)說感受傳統(tǒng)文化,感受革命精神,感受歷史的氣息。那這種感受到底是什么?如何感受?

這里的核心是意義感。

如果游客知道他站的那個(gè)地方在幾百年前發(fā)生了什么事,這些事為什么會(huì)發(fā)生,甚至這件事或者事里的人他還知道,那這種感覺就更強(qiáng)烈了。游客可以想象在這個(gè)地方發(fā)生這件事的景象,而自己在旁觀,這時(shí),游客就感受到了強(qiáng)烈的歷史感,可能還多了些夢(mèng)幻。

所以,讓游客在旅游過程中有意義感,真正感受到歷史,可能唯一的方式,就是及時(shí)了解相關(guān)故事,而且故事細(xì)節(jié)越多越好,展示方式越形象越好。其實(shí)景區(qū)一直都知道這個(gè)問題的存在,也一直在著手解決這個(gè)問題。

告訴你康熙在武英殿智擒鰲拜這個(gè)故事讓你產(chǎn)生聯(lián)想(上圖),比僅僅讓你看武英殿這個(gè)建筑(下圖)要有意義得多

景區(qū)的方案

為論述方便,先定義下本文中的景區(qū)和景點(diǎn),下文會(huì)經(jīng)常出現(xiàn):

  • 景區(qū):具備相應(yīng)的旅游設(shè)施并提供相應(yīng)的旅游服務(wù)的獨(dú)立管理區(qū)。比如故宮,頤和園,天壇都是景區(qū)。
  • 景點(diǎn):景區(qū)內(nèi)的一處景觀。比如故宮中的太和殿,武英殿、坤寧宮、御花園都是一個(gè)個(gè)景點(diǎn)。一個(gè)景區(qū)內(nèi)包含多個(gè)景點(diǎn)。

一般景區(qū),在入口處會(huì)有介紹整個(gè)景區(qū)的石板,里面的每個(gè)景點(diǎn)旁,有介紹每個(gè)景點(diǎn)的石板。上面有名稱以及簡(jiǎn)介,告訴你歷史由來、相關(guān)的人和事,可你要多加了解就要站在那耐著性子讀完。真實(shí)的場(chǎng)景是,游客已經(jīng)走得很累了,曬得或凍得不行了,你還要讓他在一個(gè)看不清字的石板上看故事,用戶體驗(yàn)可想而知。

更先進(jìn)的方案是自動(dòng)導(dǎo)覽工具,近年來才開始在景區(qū)普及。大多為手機(jī)APP,可以根據(jù)地理位置判斷你走到了哪個(gè)景點(diǎn),一旦檢測(cè)到你進(jìn)了某個(gè)景點(diǎn)的觸發(fā)范圍,就可以自動(dòng)觸發(fā)語(yǔ)音講解。這種方式能讓游客將了解文化/故事這一需求通過聽的方式滿足,眼睛就集中在觀賞上,兩個(gè)感官得到的信息互相對(duì)照,比在石板上看故事好了很多。

但是,問題依然明顯:

  • 所觸發(fā)的講解基本上就是直接讀出石板上的字。
  • 你不能對(duì)這種方式觸發(fā)的講解明確加以控制。你得明確的到某個(gè)景點(diǎn)的觸發(fā)范圍,但你又不知道具體的觸發(fā)范圍在哪,你又不知道一個(gè)景點(diǎn)會(huì)不會(huì)有語(yǔ)音導(dǎo)覽(除非你掏出手機(jī)或講解器看一下)。
  • 定位準(zhǔn)確度還有待提升。
  • 它每次觸發(fā)就是從頭到尾念一遍,根本不管你是不是正在和別人說話,如果哪里沒聽明白或是想重聽,那就還要掏出手機(jī),重新播放,或者去百度。在旅游中碰到不懂的地方再去動(dòng)手查資料,想想就很煩。
  • 手機(jī)開著自動(dòng)導(dǎo)覽,超級(jí)費(fèi)電(主要是因?yàn)槎ㄎ唬?/li>

上圖是一個(gè)典型的自動(dòng)導(dǎo)覽APP界面

除了更了解景點(diǎn)本身,另一個(gè)在景區(qū)里的高頻需求是找衛(wèi)生間和買水的地方。傳統(tǒng)方式就是放眼四處看、問工作人員、找牌子。當(dāng)然,現(xiàn)在導(dǎo)覽APP中都有相關(guān)的標(biāo)注,甚至有些APP還提供導(dǎo)航功能,方便了不少。

總結(jié)一下,游客在景區(qū)內(nèi)的主要需求:

  1. 了解某個(gè)景點(diǎn)的具體故事
  2. 知道該如何游覽景區(qū)(路線規(guī)劃)
  3. 找服務(wù)設(shè)施(衛(wèi)生間、賣水和食物的地方、休息處等)
  4. 娛樂(聊天、小游戲等)

這些問題,如果可以在一個(gè)移動(dòng)智能設(shè)備上解決,這個(gè)設(shè)備,目前看來,可能是智能耳機(jī)。

智能耳機(jī)

智能耳機(jī)就是把耳機(jī)加入人工智能,通過這個(gè)設(shè)備,你能用語(yǔ)言和外界自由的交換信息。

為什么是語(yǔ)音交互?

Mary Meeker在2016年互聯(lián)網(wǎng)趨勢(shì)報(bào)告中分析指出(如下圖),語(yǔ)音交互有下面幾個(gè)核心價(jià)值:

  • 解放雙手
  • 更快得到結(jié)果
  • 有趣/酷
  • 避免某些設(shè)備輸入困難和讓人眼花繚亂的菜單

預(yù)計(jì)應(yīng)用場(chǎng)景為:

  • 隨身場(chǎng)景(19%),相關(guān)載體為手機(jī)、手表、手環(huán)、耳機(jī)等
  • 汽車場(chǎng)景(36%),相關(guān)載體為整車系統(tǒng)、后視鏡、行車記錄儀等
  • 家庭場(chǎng)景(43%),相關(guān)載體為電視、音箱、空調(diào)、臺(tái)燈等
  • 辦公場(chǎng)景(2%),不知道會(huì)不會(huì)是錘子TNT……


海銀資本王煜泉認(rèn)為:

語(yǔ)言是人類擁有的一項(xiàng)偉大的進(jìn)化產(chǎn)物,使得我們協(xié)作的效率和復(fù)雜程度大大提升。在機(jī)器不能達(dá)到人類智力水平的時(shí)候,我們只好遷就機(jī)器,用機(jī)器能懂的方式和它交流。但是當(dāng)機(jī)器逐漸具備了理解人類的能力時(shí),我們就應(yīng)該回歸到對(duì)自己來說最有效,也最自然的溝通方式,就是語(yǔ)音。

總之,語(yǔ)音交互更自然、效率更高,在旅游場(chǎng)景下的應(yīng)用就是隨身場(chǎng)景的一種,在這一場(chǎng)景下,最好的載體就是耳機(jī)。

戴著智能耳機(jī)去旅行

1.展開想象的翅膀

基于上面的種種需求(加粗部分),我們?nèi)绻豢紤]技術(shù)實(shí)現(xiàn),只是想象的話,那電影《她》(Her,導(dǎo)演:Spike Jonze)里面的機(jī)器人一定是最佳選項(xiàng)了。

她是一個(gè)同時(shí)具有人類情感,并且能瞬間獲取信息并給出反饋的AI,如果你在旅游的時(shí)候帶著她(其實(shí)就是戴著耳機(jī)),她可以給你講解,給你指路,對(duì)你噓寒問暖,同時(shí)你們也可以閑聊,把你的看法和感受告訴她,反正她一定是你喜歡的樣子。

《她》劇照(右耳智能耳機(jī))

甚至造出來生活中你最樂意相處的人(見《黑鏡》第二季第一集),讓一個(gè)完全真實(shí)的“人”來陪你,可這樣要不要多買門票呢?

2.現(xiàn)實(shí)一點(diǎn)

拋開科幻不談,在可預(yù)見的未來,結(jié)合上面加粗部分需求我們或許能得到這些體驗(yàn):

(1)用戶靈活提問,讓智能耳機(jī)充當(dāng)導(dǎo)游(了解某個(gè)景點(diǎn)的具體故事)

這是在景區(qū)內(nèi)最核心的需求,讓用戶通過介紹和故事得到意義感。比如在故宮,用戶走到太和殿前,直接就可以和智能耳機(jī)說:

用戶:介紹一下太和殿
耳機(jī):……明清兩朝,太和殿均是用來舉行各種典禮的場(chǎng)所,如皇帝登基、冊(cè)立皇后、命將出征出征等。清初,太和殿還是舉行殿試的場(chǎng)所,乾隆四十五年后改在保和殿……
用戶:皇帝怎么登基???
耳機(jī):……先要由禮部的官員分別到天壇、先農(nóng)壇、太廟告知祖先?!爸?xí)r,鳴鐘鼓,皇帝袞服御奉天門。”明朝的皇帝只有在特別盛大的儀式中才穿黃色的袞服,他們?nèi)粘K┑氖呛谏C龍形的常服……

還可以基于用戶定位,比如用戶站在太和殿前:

用戶:牌匾上寫的是什么字?。?br /> 耳機(jī):牌匾上是建極綏猷四個(gè)字,寓意為:天子承擔(dān)上對(duì)皇天、下對(duì)庶民的雙重神圣使命,既須承天而建立法則,又要撫民而順應(yīng)大道。
用戶:那對(duì)聯(lián)呢?
……

用戶可以開放性的問自己想知道的問題,在耳機(jī)回答的過程中,用戶還可以根據(jù)自己感興趣的點(diǎn),繼續(xù)追問下去。

難點(diǎn):開放性問題,AI要在場(chǎng)景中以非??斓乃俣日业阶銐蚝线m的答案,這在目前看來還是很難的。

因?yàn)橥粋€(gè)問題在不同的場(chǎng)景下用戶想要的答案會(huì)很不同,比如上面那個(gè)“皇帝怎么登基???”,如果是一個(gè)學(xué)歷史的學(xué)生問這個(gè)問題,那他是想得到一個(gè)詳細(xì)的答案,可能包括詳細(xì)的流程,細(xì)化到穿什么衣服,什么人要做什么事,為什么要做這些事,等等(當(dāng)然要耳機(jī)提供這種答案是很扯的了,還是對(duì)一臺(tái)TNT說靠譜)。

有的人,可能就是想知道每一步做什么,三言兩語(yǔ)就說清楚了。在旅游的這個(gè)場(chǎng)景下,可能用戶想要的是一個(gè)一兩分鐘的簡(jiǎn)短介紹。這種一兩分鐘的介紹怎么找,如果沒有現(xiàn)成的要怎么辦?

我們是不斷提高人工智能快速檢索信息,然后再造出適合當(dāng)下場(chǎng)景回復(fù)的能力?或者,有一個(gè)公司把每個(gè)部分(包括歷史典故、構(gòu)建經(jīng)歷、文化等)都編成適合旅游這個(gè)場(chǎng)景下的高質(zhì)量講解,這些講解組成了一個(gè)信息源,人工智能只要檢索相關(guān)數(shù)據(jù)庫(kù)就可以了。這,可能會(huì)成為旅游場(chǎng)景下的得到。

(2)幫助規(guī)劃線路

通過對(duì)用戶本人的了解,通過簡(jiǎn)單的詢問和交流,可以規(guī)劃出合適的旅游路線。同時(shí),在游玩途中,可以記住用戶行走的路線,并根據(jù)關(guān)門時(shí)間、旅游計(jì)劃、景區(qū)內(nèi)人流分布等,規(guī)劃后續(xù)的最佳路線。

(3)幫用戶找服務(wù)設(shè)施

比如用戶想找衛(wèi)生間:

用戶:這周圍哪里有衛(wèi)生間?
耳機(jī):最近的衛(wèi)生間距您500米,您要現(xiàn)在出發(fā)嗎?
用戶:現(xiàn)在就去
耳機(jī):好的,您右拐一直走……左拐……

難點(diǎn):是否可以在耳機(jī)中放置傳感器,讓智能耳機(jī)知道用戶面向哪個(gè)方位。

(4)娛樂

在景區(qū)內(nèi),可以有語(yǔ)音版的貼吧、留言墻、彈幕墻,游客們可以抒發(fā)感想、說出游覽趣事、吐槽,這些內(nèi)容可以基于關(guān)鍵詞或位置,其他人通過說出關(guān)鍵詞,或走到相關(guān)位置,收聽相關(guān)內(nèi)容、語(yǔ)音點(diǎn)贊。

其他比如歌曲、相聲、有聲書等內(nèi)容,現(xiàn)在就可以滿足。

(5)其它體驗(yàn)

  1. 出門時(shí),查到用戶計(jì)劃去的景區(qū)是否賣水和食物,甚至提前警告景區(qū)內(nèi)的相關(guān)商品價(jià)格,讓用戶提前做好準(zhǔn)備。
  2. 旅行中不可避免的翻譯問題。

3.再現(xiàn)實(shí)一點(diǎn)

開放域問題的解答對(duì)AI來說很難,短期內(nèi),我們可以做一個(gè)個(gè)skill,相當(dāng)于手機(jī)上的APP,來滿足旅游場(chǎng)景下的主要需求。這個(gè)skill可以專門針對(duì)旅游這一場(chǎng)景,把功能限制在四個(gè)主要的需求上,這樣就可以把語(yǔ)言理解限制在有限的幾個(gè)意圖中,同樣,每個(gè)意圖下的關(guān)鍵詞和話術(shù)的組合是有限的。

通過窮盡這些組合,我們可以得到旅游場(chǎng)景下的有限域問答系統(tǒng),這樣,就可以較出色完成任務(wù)。

這個(gè)領(lǐng)域短期內(nèi)可能會(huì)呈現(xiàn)如下幾種模式:

  1. 一個(gè)skill內(nèi)有所有的景區(qū)內(nèi)容,智能耳機(jī)收到相關(guān)問題,并判斷用戶是在旅游場(chǎng)景下(可以根據(jù)地理位置和問題關(guān)鍵詞判斷),就會(huì)調(diào)用這個(gè)skill,去查找相關(guān)的回答。相當(dāng)于你對(duì)小愛音箱說“紅豆”,它會(huì)自動(dòng)認(rèn)為你想聽這首歌,然后打開QQ音樂,為你播放這首歌。這種模式下,公司可以自己做內(nèi)容,也可以做成平臺(tái),讓用戶或者第三方產(chǎn)生內(nèi)容,問題是,怎么讓平臺(tái)上的內(nèi)容生產(chǎn)者有動(dòng)力持續(xù)輸出優(yōu)質(zhì)內(nèi)容。
  2. 或者,每個(gè)景區(qū)只專注于做自己的skill,只滿足自己景區(qū)的需求。游客每去一個(gè)景點(diǎn),都可以在門前的牌子上看到喚醒這個(gè)景區(qū)skill的喚醒詞,說了這個(gè)喚醒詞,在這個(gè)景區(qū)旅游的過程中都可以調(diào)用相關(guān)能力。

4.基礎(chǔ)性問題

(1)續(xù)航問題:

如果把計(jì)算和數(shù)據(jù)傳輸都放到耳機(jī)上,續(xù)航可想而知。

  • 一種較好的方案是耳機(jī)只負(fù)責(zé)數(shù)據(jù)傳輸,將語(yǔ)音識(shí)別、處理、生成回答、合成語(yǔ)音等都放到其他設(shè)備上,比如手機(jī)?!端分械慕鉀Q方案類似這種。
  • 也可以將智能耳機(jī)的電池倉(cāng)放入芯片,作為智能中樞,這樣可以每次使用一個(gè)耳機(jī),另一個(gè)耳機(jī)在充電,同時(shí)可以有不間斷的智能體驗(yàn)。

Apple AirPods

(2)反饋時(shí)間:

反饋時(shí)間會(huì)對(duì)語(yǔ)音交互體驗(yàn)造成很大影響。你問人工智能一句話,等了半天沒有反應(yīng),過了好長(zhǎng)時(shí)間突然說了句話,很是嚇人。反饋時(shí)間受數(shù)據(jù)傳輸速度和計(jì)算速度影響。

  • 數(shù)據(jù)傳輸速度:即將到來的5G會(huì)讓數(shù)據(jù)傳輸速度上一個(gè)新臺(tái)階。
  • 計(jì)算速度:是更嚴(yán)重的問題,要在較短時(shí)間內(nèi)將語(yǔ)音識(shí)別、處理、生成回答、合成語(yǔ)音都搞定。就使用小愛同學(xué)的體驗(yàn)來看,在多次語(yǔ)音交互后,有明顯的發(fā)熱,說明這些處理過程還是很耗內(nèi)存的。如果說了幾句話,耳機(jī)或者手機(jī)變得特別燙,那還怎么用。

(3)區(qū)分說話對(duì)象:

用戶獨(dú)自旅游的時(shí)候智能耳機(jī)最好一直處在這個(gè)skill中,這樣能快速而準(zhǔn)確的應(yīng)答用戶需求,而不是用戶每問一個(gè)問題就要說一句喚醒詞。

但如果幾個(gè)人結(jié)伴同行,互相聊天時(shí)智能耳機(jī)總是在搭茬,而且還都是它聽不懂你在說啥,這時(shí),每次單獨(dú)喚醒會(huì)有更好的體驗(yàn)。那是否這個(gè)skill要有兩種模式呢?

總結(jié)

旅游場(chǎng)景下應(yīng)用人工智能有美好的前景,同時(shí)也有很多問題亟待解決。目前情況下,下個(gè)APP還是較好的解決方案。

喜歡旅游的朋友可以去App Store或者應(yīng)用寶下個(gè)大雁導(dǎo)游體驗(yàn)下,就醬~~~<

 

本文由 @吹個(gè)大氣球 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自 unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 騰訊搜狗和新東方投資的三毛游APP,在這塊智能體驗(yàn)上已經(jīng)做得非常不錯(cuò)了

    回復(fù)
  2. 看到我畫的圖了 ??

    來自浙江 回復(fù)
    1. 您說的是語(yǔ)音核心價(jià)值那個(gè)嗎?那個(gè)圖流傳好廣范

      來自北京 回復(fù)
  3. 好吧,看到了

    來自上海 回復(fù)
  4. 感覺這是個(gè)好點(diǎn)子,市面上已經(jīng)有這類app嘛

    來自上海 回復(fù)