一文看懂語音技術商業(yè)化邏輯:對品牌意味著什么 ?

1 評論 4409 瀏覽 12 收藏 36 分鐘

語音技術,對品牌意味著什么?

基于語音的技術將對許多行業(yè)產(chǎn)生巨大影響,在短短兩年內,預計50%的搜索將基于語音技術。

該項技術的普及率可能因用戶的年齡、地理位置和讀寫能力而有所不同,但一些市場和平臺已擁有很高的滲透率,而全球10%的搜索已經(jīng)是基于語音的搜索。

在這一領域將會出現(xiàn)新的贏家和輸家,而現(xiàn)有品牌將需要考慮到在收購過程中失去對消費者對話的控制的影響,這加大了在競爭中脫穎而出的難度。

然而,語音界面為各品牌提供了前所未有的機會,讓它們能以一種極為強大的新方式與消費者進行互動,而目前來說,很少有品牌利用到了這一點。

當前廣泛使用的功能在范圍和用途上均受到限制。就開發(fā)創(chuàng)新的內容和體驗,以及全新的服務來說,現(xiàn)下各品牌仍有機會。

那些能在此情景下崛起的品牌,在提升市場份額方面處于有利地位。此外,市面上有許多工具,讓用戶可以用最低限額的投資來輕松地進行語音實驗。

我們的建議是盡快開始一項服務設計和聲音試驗的低投資計劃,可能還要與市場推廣活動相結合,以便讓你的品牌充分利用這項技術所帶來的機遇。

我們所說的“語音”是什么意思?

在本文的語境中,我們對“語音”的定義是自動化的語音服務。它涵蓋了從交互式文字到實用工具內的所有信息,內置于定制的硬件設備,以及手機和云端應用內的各種應用,可通過品牌產(chǎn)品或人工智能行業(yè)內的幾大公司的虛擬助手來進行訪問。

很多關于基于語音的技術的宣傳都圍繞著智能音箱的普及(75%的美國家庭預計在2020年均擁有智能音箱),以及音響附帶的“語音助手”?,F(xiàn)在已有幾個公司允許第三方直接整合旗下的智能助理,有點像智能手機上的應用。

此外,需要注意的是,不論是上文提及的還是其他語音助手也可以在其他硬件(通常是手機和平板電腦)上使用,人們可通過手機應用和深度操作系統(tǒng)集成來使用,但也可以通過定制硬件設備,甚至是網(wǎng)站來使用語音助手。

從許多方面來看,語音和機器人背后的技術都是一樣的,但二者之間在生態(tài)系統(tǒng)和影響這兩方面的差異足以使語音技術成為一個非常重要的領域。

語音簡史

基于語音的交互界面已經(jīng)存在了幾十年,盡管它們最具影響力的方面一直是客戶服務電話。大多數(shù)與語音相關的系統(tǒng)都遭遇了各種各樣的問題,從語音識別到復雜的生態(tài)系統(tǒng)。

五年前,行業(yè)領先的語音識別技術的準確率僅為75%左右,機器學習技術、系統(tǒng)和硬件的最新發(fā)展,使得最好的語音識別系統(tǒng)的準確率提高到了95%到97%。

不斷接近并跨過這一認知門檻成了當前語音產(chǎn)業(yè)繁榮的最大因素。人類識別口語詞匯的準確率約95%,并能使用語境來糾正錯誤。對于大多數(shù)用戶來說,任何具有較低識別準確率的自動化系統(tǒng)都會讓他們失望,因此這在商業(yè)上并不可行。

機器學習在意圖推導方面的相關發(fā)展(后文另作解釋),這也是產(chǎn)業(yè)繁榮的一個巨大貢獻因素。幾年前,這一功能的商業(yè)系統(tǒng)已經(jīng)跨過了類似的門檻,并推動了機器人產(chǎn)業(yè)的繁榮;語音其實就是無文字版本的機器人。

機器人本身也已經(jīng)存在了幾十年,但處理自然語言的能力,而不是簡單地識別關鍵字,才帶來了基于對話的互動,這反過來又推動了相關平臺和服務近期的爆炸式增長。

在當前的語音技術領域,虛擬自動化助理的崛起首屈一指。盡管Siri(以及其他一些不太知名的語音助理)已經(jīng)推出多年,但Alexa和谷歌助理的崛起預示著一種更廣泛的平臺方式。

這些新出爐的助手會在一系列設備上推廣整個生態(tài)系統(tǒng)和功能,Alexa可以控制你的燈光,告訴你當天的會議是什么,并幫助你烹飪食譜上的菜品。

語音技術只是炒作嗎?

當然不是。的確,人們對語音技術的大肆宣傳,就像之前的3D打印和其他“改變我們生活方式的技術”的過度炒作一樣,但通過語音界面與計算機進行互動的趨勢將會持續(xù)下去。

除此之外,還有一系列極具說服力的統(tǒng)計數(shù)據(jù),例如,超過20%的移動搜索已經(jīng)是基于語音的搜索,并且,預計到2020年,這一比例將上升到50%?;蛟S更有趣的是,這些統(tǒng)計數(shù)據(jù)背后有一些原因也許更值得我們去探討。

在科技圈,人們經(jīng)常說,未來初次上網(wǎng)的10億人中的大部分,其受教育水平很低,還很可能是文盲,因為“不發(fā)達”國家的人們也開始接觸互聯(lián)網(wǎng)。對于這些群體來說,視頻和聲音或許是最重要的,而且聲音可能是他們能接觸到的唯一雙向媒介。

此外,iPad效應還揭示出,即使是非常年幼的孩子,還握不住鼠標時也能與觸摸屏互動,而語音交互甚至能更快、更直觀與孩子互動(一旦有人可以說話),而且毫無疑問將成為幾年內某些功能的主要交互方式。

此外,也值得考慮到這其中涉及到的風險和利益,尤其是谷歌和亞馬遜這兩家分別在廣告收入和發(fā)掘新產(chǎn)品方面最強大的公司。亞馬遜進軍語音市場的舉動,已經(jīng)對谷歌的利潤產(chǎn)生了明顯的影響,因為它使得搜索業(yè)務走出了網(wǎng)頁和谷歌廣告的覆蓋范圍,這也解釋了為什么谷歌要努力讓旗下的谷歌助手取得成功。

為了自身利益,谷歌可以利用他們現(xiàn)有的25億臺Android設備。隨著數(shù)字的不斷增長,你可以理解,到2021年預計將會有75億個已安裝使用的語音助理。在某些方面,對隱私和安全的擔憂會慢慢地被采納,我們將在本文的后續(xù)部分對此進行探討。

反對語音技術的一個常見言論是,對著設備大聲說話,尤其是在公共場合會讓人覺得怪異或者是尷尬(尤其是年齡大一點的人會這樣覺得,我們指的是20歲以上的人)。

BBH公司的觀點是,這些標準很快就會改變。例如,十年前,在大多數(shù)情況下,把手機放在餐桌上簡直是天方夜譚,如今,這可能是一種專注的表現(xiàn)(取決于細微差別),或者在某些情況下,在吃飯時接聽電話或寫短信也是可以接受的。

應用場景

語音正在迅速為產(chǎn)品和服務的技術接觸點的融合創(chuàng)造一個空間。從許多方面來看,這并不令人驚訝。使用我們的聲音進行交流的速度是打字的3倍,而且說話比打字要容易得多。

盡管它帶來了一種全新的社會規(guī)范,但這是一件很簡單的事情,用戶只要用30分鐘就可以輕松地享受這個全新的界面。

在某些情況下,聲音可以輕而易舉地打敗非語音輸入方式,比如手是濕的或者兩只手都空不出來,比如做飯和洗澡,或者眼睛只能專心干一件事時,比如駕駛,還有其他一些對于我們來說需要一定程度上使用我們的雙手和眼睛的事情。在這些情況下,使用語音輸入顯然更加輕松。

盡管語音在可預見的未來不太可能完全取代文本,但它無疑會對許多與技術相關的領域產(chǎn)生重大影響,尤其是電子商務和搜索領域。

對市場和品牌的影響

這為各品牌和新的加入者提供了參與語音體驗的機會。電子商務行業(yè)的一個全新的、廣泛使用的系統(tǒng)總是具有巨大的顛覆性,目前還無法詳細了解語音對品牌的影響。

首先要考慮的三大因素之一是,許多交互將完全在平臺上進行,減少或移除了搜索營銷的機會。其次,基于對話的互動并不能很好地支持項目列表,這意味著助理們通常會推薦單件商品,而不是向用戶展示選項。最后,在很多情況下,整個購買過程將會在沒有視覺刺激的情況下進行。

所有這些因素目前都受到了廣泛關注,但可以肯定的是,這將對品牌帶來巨大的影響(特別是快速消費品行業(yè)的品牌),尤其是當這三大因素與其他因素相結合,如亞馬遜目前作為市場和自有品牌供應商的雙重身份在電子商務業(yè)的主導地位。

目前正在討論的兩種有可能解決這些新挑戰(zhàn)的策略是,要么向平臺推銷,比如確保亞馬遜、谷歌等向用戶推薦你的產(chǎn)品,或試圖大幅提升品牌認知度,讓用戶通過名字而不是產(chǎn)品類別在平臺上尋找你的產(chǎn)品。例如,英國人說“胡佛”就意味著“吸塵器”,或美國人使用“施樂(Xerox)”就是說的 “復印”。

在接下來的幾年里,許多品牌將會出現(xiàn)在語音平臺上。它們可以采取任何形式,從提供實用工具的服務,或減輕客戶服務的負擔,到通信和營銷還有娛樂。

由于語音界面的會話特性、缺乏有保證的視覺效果以及在感覺溝通中語境所扮演的角色,很少或沒有品牌會完全依賴于語音。它不會取代社交、電視、印刷品和網(wǎng)絡,而是成為這些平臺的補充因素。

同樣值得注意的是,不論哪一個品牌,都有一小部分用戶不能說話或聽到聲音,對于他們來說,只有語音界面無法訪問(盡管像Google Assistant這樣的平臺也有視覺界面)。

從理論上講,語音技術為品牌提供了一個前所未有的機會,可以以一種私人的、甚至是親密的方式與消費者建立聯(lián)系,在所有潛在的品牌接觸點中,沒有一個能有語音那樣的潛力,能大規(guī)模地與消費者建立深厚的人際關系。

與此同時,現(xiàn)有的助理平臺都給想要在某種程度上實現(xiàn)情感聯(lián)系的品牌提出了一些嚴肅的問題。

谷歌助理為各品牌提供了最為豐富的平臺機會,但相比谷歌自有品牌來說依然還是有區(qū)別,而亞馬遜Alexa則對品牌有額外的限制。話雖如此,語音技術的確代表了一個全新的擁有一些引人注目的品牌特征的渠道,盡管其缺點可能代表著一個提升品牌認知度的重要機會。

語音帶來的類人特征

眾所周知,人們把人類的特征分配到他們的所有互動中,但是這種現(xiàn)象在口語對話中尤其明顯,這是如此,人們會對語音助理產(chǎn)生感情。超過三分之一的普通用戶希望自己的助手是人,四分之一的人則對自己的助理產(chǎn)生過幻想。

基于語音的服務首次允許品牌完全構建代表它們的實體的特征。與選擇品牌代言人相比,這一過程的深度和廣度都是相似的,重要的是要考慮代表品牌或服務的聲音的各個方面。

設計語音界面時值得考慮的因素包括:(虛擬)說話者的性別、種族和年齡,以及他們的口音。也許可以有多種不同的聲音,但這就提出了一個問題,即如何選擇使用哪一種聲音。也許是通過提供的服務或者客戶來源(如果知道的話)或其他數(shù)據(jù)點。

另一個有趣的因素是虛擬角色與用戶和品牌的關系。語音助理是否像主人一樣?是一個顧問?也許是家庭成員之一?是否代表了品牌本身?或者它是以第三方的身份談論品牌?在它說“我來幫你查一下”時,這是否意味著你可以使用與助理本身截然不同的品牌核心服務?

當然,還有一些技術因素需要考慮,這取決于你所創(chuàng)建的服務和它所依賴的平臺,在這平臺上你也許根本不可能創(chuàng)建一個定制的語音,或者平臺上可能存在著對定制化可能性的限制。下文將對此進行更詳細的探討。

在某些情況下,你甚至有可能探索更豐富的因素,比如聲音的音質和一些“柔和”的方面,比如語言所帶來的溫暖。

最后,值得注意的是,語音機器人與單獨的用戶進行的是雙向對話,這些對話完全是由品牌所控制的,在對話中,沒有人會有糟糕的一天,或者感到疲憊。

語音服務設計

無論是基于實用性、娛樂性還是其他特征,在構建基于語音的服務時,一些核心因素都會發(fā)揮作用。這些因素導致為品牌打造全新服務的情況并不少見。顯然,重要的是要考慮到?jīng)]有屏幕對用戶體驗產(chǎn)生的影響。

舉個例子,在一個語音界面上,搜索結果的列表讓人很難滿意。你可以做一個實驗,大聲讀出谷歌搜索結果的第一頁就行。這意味著,用戶體驗往往更“受引導”,而較少依賴用戶去選擇,盡管也存在著很多其他的含義。

考慮到這一點,我們也要注意到,越來越多的語音平臺用戶可能擁有他們和語音助手都能訪問的屏幕,要么是內置在設備中(比如Echo Show),要么是通過智能手機或生態(tài)系統(tǒng)的屏幕,比如谷歌助理。雖然不能完全依賴這些屏幕,但它們可以用來豐富用戶體驗。

另一個重要的因素是界面的對話性質,這對服務設計的細節(jié)產(chǎn)生了巨大的影響,但也可能意味著用戶可選擇有高比例內容的選擇服務,或者至少是通過決策矩陣進行線性旅行是有意義的。此類界面往往對復雜的流程極為有利,因為在這些過程中,基于屏幕的界面往往會變得混亂并讓人感到困惑。

最后,和社交一樣,周圍環(huán)境對于用戶訪問語音服務的方式非常重要。如果他們正在使用手機時,他們可能在公共場所或家中,他們也許匆忙也許悠閑,所有這些都會影響到服務質量。如果用戶通過智能音響訪問該服務,他們很有可能在家,但可能會有其他人在場,這就再次影響了服務的細節(jié)。

一般來說,非常適合于使用語音的服務在范圍上通常是有限的,并且只能提供給用戶很少的交互。更復雜的現(xiàn)有服務通常需要人工智能工具來進一步簡化它們的訪問過程,然后才適合使用語音進行訪問。

語音技術優(yōu)化因素

在過去的兩三年里,隨著基礎技術達到了重要的臨界點,語音技術的前景發(fā)生了巨大的變化。從谷歌、亞馬遜到IBM和三星,許多大型科技公司似乎都在語音領域提供了服務,但它們各自提供的服務存在巨大差異。

1.設備和環(huán)境

需要指出的是,許多設備的確擁有超越語音功能的能力。一般來說,智能音箱只播放聲音,但當它們在向用戶顯示它們在聽和回應的時候也會有燈光,這也因此有助于引導對話。

更新后的Alexa設備,比如Echo Show和Echo Spot,現(xiàn)在可以通過內置的屏幕和攝像頭傳送信息,而谷歌助理在智能手機上最常用的功能是,默認情況下,屏幕會用文本來顯示對話。

在智能手機和其他一些設備上,用戶可以選擇通過文本而非語音來進行整個對話,這將改變他們接收到的輸入類型,以及輸出中會出現(xiàn)的細微差別。

基于屏幕的會話界面正在快速發(fā)展,還包括交互式模塊,如列表、幻燈片、按鈕和支付界面。很快,語音控制助手也將可以使用附近的聯(lián)網(wǎng)電視來補充會話界面,不過在這里展示的內容與智能手機界面不同。

應該清楚的是,除了廣泛的可用功能外,影響語音交互的另一個主要因素是周圍環(huán)境。用戶可能是在個人設備上,也可能是在共享的公共空間中使用語音助理,比如廚房或辦公室,這將影響他們進行舒適交互的方式。

2.平臺和生態(tài)系統(tǒng)

① 亞馬遜Alexa

也許最著名的英美語音服務是亞馬遜的Alexa,一開始可以通過Echo音箱設備來訪問,但支持訪問的亞馬遜和第三方硬件也越來越多。

亞馬遜在市場上擁有相當大的先發(fā)優(yōu)勢(72%的智能音箱市場份額),而且這可以說是亞馬遜Echo系列設備的商業(yè)成功,這些設備所支持的其他公司提供的服務最近數(shù)量激增。

Alexa是一個面向消費者的平臺,可以讓品牌廠商創(chuàng)造消費者可以安裝的“技能”。終端用戶可以通過一個配套應用來配置Alexa。除此之外,用戶還可以在應用商店中安裝來自第三方的“技能”。

一項安裝的技能就可以讓終端用戶向Alexa詢問一些特殊的額外問題,這些問題能顯示出該技能所提供的服務,例如,“Alexa,我的銀行存款余額是多少?”

目前,在所有市場中,Alexa的技能數(shù)量約為2萬,2016年底這一數(shù)字還只有6000。

盡管目前許多技能的使用率極低,但亞馬遜最近推出了融資模式,以繼續(xù)激勵第三方開發(fā)者加入其生態(tài)系統(tǒng)。

據(jù)估計,到2017年底,Alexa設備的銷售量大約有3200萬臺(在第四季度時約為2000萬),毫無疑問,這個平臺的覆蓋范圍很廣,但Alexa技能的模式和亞馬遜的整體市場戰(zhàn)略的結合讓各品牌方處于亞馬遜的控制之下。

② 谷歌助理(Google Assistant)

就在亞馬遜推出Echo音箱一年后,谷歌在2016年5月推出了這款Google Home設備,這款設備內置谷歌助理。谷歌一直在積極地向消費者和合作伙伴以及品牌推銷其谷歌助理(以及家用硬件設備)。

谷歌已經(jīng)占據(jù)了15%的智能音箱市場份額,是前一年的兩倍,而智能手機語音助理的市場份額為46%,預計到2022年這一比例將上升到60%。

谷歌的智能助理也在以不可思議的速度更新,新功能層出不窮,可以說,它已經(jīng)在給用戶和第三方開發(fā)者提供功能方面領先一步了?;蛟S最有趣的是,與其他產(chǎn)品相比,谷歌助理在品牌整合方面采取了一種有趣而不同的方式,正如Actions on Google這樣的應用平臺。

通過這個平臺,品牌不僅可以開發(fā)服務,還可以開發(fā)整個會話界面,包括他們所提供服務的語音輸出。用戶不需要安裝第三方應用,只要直接要求與這些應用對話即可,就像有人會要求總機或接待員與某個特定的人通話一樣。一旦與某款應用進行對話,用戶就可以通過基于谷歌助理的語音界面使用身份驗證、允許通知、切換設備和支付等功能。

通過將谷歌助理與Android緊密結合,這個平臺擁有巨大的潛力;目前有25億臺使用中的Android設備。該軟件也可為第三方硬件制造商使用,進一步提升了該生態(tài)系統(tǒng)的潛力。

③ 微軟小娜(Cortana)

每一臺Windows 10設備都裝載了微軟小娜,其月活躍用戶數(shù)達到了驚人的1.45億人次(用戶可能主要是通過XBox訪問),但微軟對Cortana的推廣和更新要低于谷歌和亞馬遜對旗下產(chǎn)品的推廣和更新力度。Cortana提供了類似于Alexa的“技能”界面,但它的開發(fā)時間相對較晚,在核心功能和可用整合數(shù)量方面也尚不及Alexa。

盡管微軟小娜在智能音響設備上的份額很小,但微軟龐大的整體用戶群,以及它在與工作相關的軟件和游戲生態(tài)系統(tǒng)中占據(jù)的主導地位,確實讓Cortana在市場上擁有了強大(并且不斷增長)的存在感。

④ 百度DuerOS

百度可以說開創(chuàng)了語音界面的最新潮流,它結合了突破性的技術和龐大的用戶群,以及不同的文化和社會經(jīng)濟傾向,更偏向于使用語音技術而非文字技術。

百度最近發(fā)布了DuerOS(新一代對話式AI操作系統(tǒng)),這是一個讓第三方硬件開發(fā)者打造自己的語音驅動設備的平臺,通過“百度大腦”提供了一套用于各種用途的人工智能平臺(其中很多都涉及語音功能)。目前,大多數(shù)消費者通過百度僅支持中文的服務與其語音技術進行互動(即沒有第三方整合)。

⑤ Siri、Bixby和Watson

蘋果的Siri和三星的Bixby都是語音助手,目前支持在特定設備上使用,也可以在制造商的生態(tài)系統(tǒng)中使用。這兩種語音助手都不能被稱為平臺,因為它們不提供第三方訪問來創(chuàng)建服務。

目前,這兩個語音助手的市場份額都是有限的,因為可支持的手機數(shù)量有限,但它們有使用門檻,且語音識別準確率也較低,使得它們在與其他助手的對比中顯得很有限。IBM的Watson也許是最有效的工具,可以被看作是品牌可以用來創(chuàng)建定制服務的一套工具。

3.內容和服務

在為基于語音的對話界面設計服務時,需要考慮很多因素;這些因素均在上文提到過,會影響可用的功能范圍。

① 效用

目前可用的大部分語音服務都是實用型工具,它們可以通過其他方法獲得簡單的功能。既有更普通的功能(播放特定的廣播電臺或聽新聞),也有更具未來感的(在電視上調整燈光或播放特定的電影),還能訪問特定于供應商的功能,比如點一份披薩或者叫一輛出租車。

許多品牌開始在這一領域提供服務,從家庭自動化或類似于WeMo、Plex或Philips Hue這樣的小企業(yè),到更廣泛使用的服務,如Uber和Dominos,但有趣的是,這一領域還有提供創(chuàng)新服務的大品牌。例如,梅賽德斯和現(xiàn)代都允許用戶啟動自己的汽車,并在不同的語音助理平臺上預熱汽車。

② 娛樂

各種各樣的游戲、笑話和音效庫都可以從所有的主要平臺獲得,這些平臺來自于各種各樣的提供商,這些提供商要么是平臺提供商本身(比如谷歌或亞馬遜),要么是小公司或個人開發(fā)者。不過,有少數(shù)幾個品牌開始更多地嘗試這一平臺的可能性。例如,Netflix和谷歌推出了《陌生人的伴侶》第2季,而BBC最近為Alexa制作了一段互動小說。這一領域的娛樂項目潛力尚未得到開發(fā),只是處于初步探索階段。

③ 工具

有許多工具可以用于構建語音服務,以及相關的(通常基于人工智能)的功能??偟膩碚f,基于云計算的服務就算不免費也很廉價,而且易于使用。一些嚴肅的項目可能需要人們自行開發(fā)定制解決方案,但這對于大多數(shù)需求來說都有些多余。

對所有可用工具的完整介紹不在本文涵蓋的范圍之內,但值得注意的工具有IBM的Watson Services、谷歌的Speech API和DialogFlow,以及微軟的認知服務(Cognitive Services)。

所有這些都意味著,原型設計和實驗可以快速、低成本地完成,而生產(chǎn)就緒的應用程序也可以在一個使用模型上進行成本估價,這種模式在小范圍內是非常劃算的。

④ 語言合成

有關于各品牌尤其值得注意的是,其圍繞語音合成的選擇,因為這些都是終端用戶與之互動的品牌的一部分。如果提供的服務有一個靜態(tài)的、有限的、針對所有用戶輸入的可能響應,那么就有可能使用錄制好的語音。在某些情況下,這種方法可以進行擴展,與記錄并剪切結合的方法一同使用。

對于擁有廣泛輸出的服務,生成的聲音是唯一可行的方法,但即使是這種情況,也有多種選擇。有很多免費的、或多或少的“計算機”聲音可供使用,但我們建議探索其他的方法去創(chuàng)建像衛(wèi)星導航一樣的語音合成系統(tǒng)。

機器學習技術的快速發(fā)展,讓生成的語音聽起來非常真實,甚至像真人一樣,這值得關注。這一技術目前還沒有普及,但谷歌已經(jīng)在美國使用Wavenet來輔助谷歌助理,而Adobe也正在開發(fā)一個類似的項目。

語音背后的技術

人們所說的“聲音”其實是一套不同的技術,它們需要一同運作。值得注意的是,Speech To Text是處理一些音頻和輸出文本的“語音識別”組件。

近年來,這一領域取得了巨大的進步,以至于一些系統(tǒng)在不同的條件下比人類更擅長于語音識別。據(jù)報道,今年6月,谷歌系統(tǒng)的準確率達到了95%(與人類相同,比4年的準確率上升了20%),而百度則被認為擁有語音識別最準確的系統(tǒng),其準確率在97%以上。

每個特定服務的核心都是意圖推導,一組基于計算出一條文本暗示潛在用戶意圖的技術集合,這將用戶請求與該服務能夠提供的響應相匹配。

機器人和機器人平臺的數(shù)量最近的增長(和炒作)與這項技術有關,而且?guī)缀跛械恼Z音系統(tǒng)都是加入語音識別的機器人,這項技術至關重要。有許多平臺提供了這種功能(尤其是IBM Watson,以及免費的DialogFlow)。

另一套重要的語音相關技術是語音合成。實現(xiàn)這一目標的方法有很多,而且這些選項與特定語音服務的功能密切相關。本文前面已經(jīng)探討了與此相關的工具和選擇,但是它們的成本和質量都存在著巨大差別,因為基于服務的范圍和可以提供給用戶的輸出類型存著著差異。

隱私問題

與其他數(shù)字服務相比,創(chuàng)建語音優(yōu)先服務需要多加考慮。首先也是最重要的一點是,用戶的隱私受到越來越多的關注,因為用戶的音頻記錄被發(fā)送并經(jīng)常存儲在平臺和/或品牌那里。

根據(jù)對用戶提供服務的方式,這可能只是一個涉及平臺的問題,也可能是該品牌需要直接解決的問題。

最近,C4 Show《名人搜索》引發(fā)了對Alexa的強烈抵制,因為用戶們直接看到了存儲的錄音有被泄露的危險。也有人擔心錄音具有的“永遠”的存儲能力,盡管主要的平臺一再試圖向用戶保證,只有從關鍵字開始的短語才會被記錄下來并被發(fā)送到云端。然而,就像大多數(shù)事情一樣,合理的價值交換是最安全的方式。從本質上講,應當確保產(chǎn)品的實用性或娛樂性。

本文前面提到的另一個注意事項是,可能你的品牌暫未提供語音優(yōu)先界面的正確服務,或者至少是服務可能需要進行改動以完全適合這種格式。我們在研討會上發(fā)現(xiàn),品牌語音服務最有趣的用例往往需要向全新領域擴展?;蛟S最有趣的是,這個領域允許收集關于使用該服務的用戶的一整套全新的有趣的數(shù)據(jù),除了實際的音頻記錄,新環(huán)境中使用的新服務應該會帶來有意思的新想法。

對品牌的建議

我們相信,從長遠來看,許多品牌將受益于通過語音界面提供部分或全部的核心數(shù)字服務,而且最近的技術擴散在中短期內創(chuàng)造了機會。

一個很好的起點是開始將語音平臺加入到數(shù)字服務的長期規(guī)劃中。理想情況下,品牌應該從長遠角度規(guī)劃整體的語音(或語言助理,包括機器人)策略。這將包括哪些服務最適合這些不同類型的媒體,以及它們如何與客戶服務、客戶關系管理、社交和廣告功能互動,以及衡量工作進展的路線圖。

短期來看,我們認為品牌應該進行試驗,用現(xiàn)成的工具快速制作原型產(chǎn)品,甚至創(chuàng)造出短期的產(chǎn)品,或許還要與營銷活動相結合。重點關注這些試驗的關鍵領域應該是,整體品牌風格、語調和客戶服務腳本如何轉化為語音角色,以及用戶如何應對這種角色的變化。

這種試驗可以結合使用輕量級的語音優(yōu)先服務設計來服務于營銷活動,但也能用于建立一套完整的指導和學習工具,為未來的核心品牌服務所使用。

 

選自:medium;編譯:網(wǎng)易智能;參與:Rosie

來源:微信公眾號:網(wǎng)易智能(ID:smartman163)

本文由 @網(wǎng)易智能 授權發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉載。

題圖來自,基于CC0協(xié)議

更多精彩內容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!