一個(gè)智能外呼機(jī)器人的誕生
導(dǎo)讀:AI經(jīng)過(guò)近幾年的快速發(fā)展,融入越來(lái)越多的業(yè)務(wù)服務(wù),誕生了許多觸手可及的產(chǎn)品,給眾多行業(yè)賦能提效,也給普通消費(fèi)者帶來(lái)了不一樣的產(chǎn)品體驗(yàn)。相信很多同學(xué)都接聽(tīng)過(guò)機(jī)器人打來(lái)的電話,如基金推薦、外賣(mài)提醒、賣(mài)房推銷(xiāo)等,高效、穩(wěn)定的外呼給商家側(cè)提升了極大的效率。那么,這種智能外呼機(jī)器人產(chǎn)品是如何落地的呢?
一、產(chǎn)品架構(gòu)
首先來(lái)看看整體的產(chǎn)品架構(gòu):
- 技術(shù)基礎(chǔ):智能外呼機(jī)器人核心是AI的基礎(chǔ)技術(shù),賦予產(chǎn)品識(shí)別語(yǔ)音、語(yǔ)義理解、合成語(yǔ)音的能力,簡(jiǎn)單來(lái)說(shuō)就是如何準(zhǔn)的確地識(shí)別客戶所表達(dá)的意思,一般稱(chēng)作識(shí)別意圖。而另一方面,F(xiàn)s、sip構(gòu)建的話務(wù)服務(wù)賦予產(chǎn)品對(duì)外通話的能力,可以撥通客戶的手機(jī)進(jìn)行交流。
- 資源許可:構(gòu)建的機(jī)器人服務(wù)需要耗費(fèi)一定的資源,一般將整個(gè)過(guò)程分為話務(wù)、TTS、ASR、機(jī)器人方面的資源。如果要完成完整的外呼服務(wù),一般是1:1的關(guān)系。如果是saas產(chǎn)品,可以將整個(gè)許可打包成一個(gè)商品出售。按這樣區(qū)分可以清晰劃分產(chǎn)品框架,后續(xù)的運(yùn)維、擴(kuò)容也十分方便,也利于計(jì)算成本、產(chǎn)品定價(jià)。
- 話務(wù)模塊:話務(wù)模塊是管理話務(wù)能力方面的功能,語(yǔ)音通訊、錄音等。
- 語(yǔ)音服務(wù):該模塊是管理語(yǔ)音方面的能力,包括ASR服務(wù)、TTS服務(wù)。也會(huì)有一些產(chǎn)品將這些能力納入話務(wù)模塊。
- 算法模塊:算法模塊是外呼機(jī)器人的核心能力,需要完成數(shù)據(jù)的處理、模型的構(gòu)建與訓(xùn)練等,讓機(jī)器人具備識(shí)別能力。
- 對(duì)話管理:機(jī)器人識(shí)別客戶的意圖之后,需要做出一定的回應(yīng)。怎么說(shuō)、說(shuō)什么由對(duì)話管理去控制。
- 運(yùn)營(yíng)管理:基于上述模塊的協(xié)作完成一個(gè)外呼服務(wù)的構(gòu)建,對(duì)于業(yè)務(wù)人員來(lái)說(shuō)則需要在運(yùn)營(yíng)層面去管理外呼名單、外呼策略等,讓機(jī)器人運(yùn)轉(zhuǎn)起來(lái)。
對(duì)產(chǎn)品有全局的架構(gòu)思維,有助于全面地看待問(wèn)題,無(wú)論是產(chǎn)品設(shè)計(jì)還是后續(xù)的運(yùn)營(yíng)都是很有幫助的。
二、業(yè)務(wù)流程
智能外呼,簡(jiǎn)單來(lái)說(shuō)就是模擬人的對(duì)話能力,教會(huì)機(jī)器人去識(shí)別語(yǔ)音內(nèi)容,然后根據(jù)內(nèi)容做出應(yīng)答。在運(yùn)營(yíng)管理發(fā)起外呼動(dòng)作,整體的業(yè)務(wù)流會(huì)經(jīng)過(guò)以下幾個(gè)步驟:
1.由話務(wù)服務(wù)出局通話請(qǐng)求,撥通客戶的電話后,收集客戶語(yǔ)音并實(shí)時(shí)返回至語(yǔ)音服務(wù)模塊;
2.語(yǔ)音服務(wù)將客戶的語(yǔ)音經(jīng)過(guò)ASR處理,輸出客戶的文本給到算法模塊;
3.算法模塊經(jīng)過(guò)算法分析,識(shí)別客戶的意圖,了解客戶想表達(dá)的意思。有一點(diǎn)需要注意的是,不一定非要語(yǔ)音才能分析意圖,比如客戶靜默太長(zhǎng)時(shí)間,可輸出一個(gè)靜默的意圖,讓機(jī)器人再次喚醒客戶對(duì)答。也不一定是對(duì)文本內(nèi)容直接分析,比如機(jī)器人未播完話術(shù)時(shí)被客戶打斷,這時(shí)候應(yīng)該輸出一個(gè)打斷的意圖,停止播報(bào),讓客戶說(shuō)完再識(shí)別。各種各樣的情景,跟人與人之間的對(duì)話情景對(duì)應(yīng);
4.得到客戶的意圖后,對(duì)話控制根據(jù)對(duì)話流程,輸出機(jī)器人需要對(duì)答的內(nèi)容。對(duì)答文本流轉(zhuǎn)至TTS合成語(yǔ)音(如果文本不涉及變量,可以一次性保存為錄音,不占用TTS資源),或者調(diào)用已錄好的音頻,傳至話務(wù)服務(wù)模塊,對(duì)客戶輸出語(yǔ)音。然后再次得到客戶語(yǔ)音,循環(huán)這個(gè)過(guò)程直至結(jié)束后將對(duì)話數(shù)據(jù)返給外呼管理模塊,進(jìn)行后續(xù)的分析。
三、產(chǎn)品設(shè)計(jì)
1. 話務(wù)服務(wù)模塊
依托于FS強(qiáng)大的拓展性,搭建一個(gè)電話軟交換平臺(tái),可對(duì)接運(yùn)營(yíng)商的sip線路,也可用網(wǎng)關(guān)設(shè)備搭建話務(wù)中心,提供呼叫控制、資源分配、錄音、計(jì)費(fèi)等能力。一般大企業(yè)會(huì)有獨(dú)立的話務(wù)服務(wù),專(zhuān)供需要的業(yè)務(wù)系統(tǒng)接入,而自建外呼服務(wù)或者構(gòu)建saas產(chǎn)品則需要從0到1去搭建了。
2. 語(yǔ)音服務(wù)模塊
ASR、TTS是基礎(chǔ)底層技術(shù),自研成本非常高,而且經(jīng)過(guò)長(zhǎng)期的發(fā)展也很成熟,市面上有科大、阿里云、騰訊云等廠商的服務(wù)。一般有兩種模式,一種是接入云服務(wù),按調(diào)用次數(shù)收費(fèi),如果有開(kāi)放的開(kāi)發(fā)環(huán)境建議使用這種模式,可以隨時(shí)升級(jí)調(diào)優(yōu)。另外一種是買(mǎi)斷服務(wù),購(gòu)買(mǎi)完整的語(yǔ)音服務(wù),包括模型、資源,一般在較為封閉的開(kāi)發(fā)環(huán)境使用,比如銀行業(yè)務(wù)。但這種模式成本較大,而且調(diào)試升級(jí)不方便。
3. 對(duì)話管理
對(duì)話管理是智能外呼機(jī)器人產(chǎn)品的核心模塊,涉及VUI設(shè)計(jì)、話術(shù)管理等。VUI設(shè)計(jì)是指語(yǔ)音交互流程,就是機(jī)器人的應(yīng)答邏輯,是機(jī)器人的主心骨。我對(duì)于VUI的設(shè)計(jì)主要有以下幾個(gè)步驟:
1)梳理外呼業(yè)務(wù)的主流程
產(chǎn)品必定會(huì)有一個(gè)流程,以期望客戶按我們的設(shè)計(jì)走,完成一定的動(dòng)作,達(dá)到業(yè)務(wù)目標(biāo)。所以在設(shè)計(jì)前應(yīng)當(dāng)梳理清楚我們要做的是什么業(yè)務(wù),業(yè)務(wù)涉及什么環(huán)節(jié),業(yè)務(wù)目標(biāo)又是什么。以一個(gè)信用卡欠款催收為例:
2)歸納意圖
在業(yè)務(wù)運(yùn)轉(zhuǎn)過(guò)程找中,會(huì)遇到哪些情況,然后歸類(lèi)起來(lái),形成一個(gè)意圖,代表客戶反饋給機(jī)器人的狀態(tài)??蓪⒁鈭D分為三種類(lèi)別:通用意圖、業(yè)務(wù)意圖、QA。
- 通用意圖:顧名思義就是整個(gè)人機(jī)對(duì)話環(huán)節(jié)都可能會(huì)發(fā)生的情況。咱們可以想想現(xiàn)實(shí)中打電話,對(duì)方可能會(huì)正在忙沒(méi)法接電話,可能信號(hào)不好聽(tīng)不清等等,可以歸納出“正忙、聽(tīng)不清”的意圖;
- 業(yè)務(wù)意圖:與業(yè)務(wù)相關(guān)的情況,比如客戶表示是不是本人、已還清欠款等情況,可歸納出“是本人、非本人、已還款”的意圖;
- QA:通用意圖以及業(yè)務(wù)意圖是固定的,在實(shí)際運(yùn)營(yíng)中會(huì)有些頻率不高或者未想到的語(yǔ)料,可以在線上添加QA語(yǔ)料,然后在后臺(tái)經(jīng)過(guò)關(guān)鍵詞提取、預(yù)定訓(xùn)練方式實(shí)現(xiàn)模型建設(shè),可減少算法投入成本,也比較靈活。如果某個(gè)QA出現(xiàn)頻率高,可以考慮增加一個(gè)通用意圖或者業(yè)務(wù)意圖。
確定意圖后,有助于我們梳理流程框架:
3)編寫(xiě)對(duì)話劇本
確定了環(huán)節(jié)、意圖后,還是比較零散的信息,典型的對(duì)話場(chǎng)景是怎么樣的?實(shí)際的對(duì)話流又是怎么體現(xiàn)的?這時(shí)候可以借助對(duì)話劇本去模擬人機(jī)對(duì)話。如果客戶按推薦的流程走,并完成了目標(biāo),稱(chēng)之為愉悅路徑。如果客戶沒(méi)有按推薦的流程走,無(wú)法完成外呼目標(biāo),則成為非愉悅路徑。
舉個(gè)例子:
編寫(xiě)對(duì)話劇本其實(shí)就是梳理主流程、異常分支如何處理,尤其是非愉悅路徑,通話環(huán)境的情況很復(fù)雜,各種不在目標(biāo)內(nèi)的情況要做好處理。
4)設(shè)計(jì)對(duì)話跳轉(zhuǎn)邏輯
經(jīng)過(guò)對(duì)話劇本的編寫(xiě),VUI有了雛形,接下來(lái)需要整合成一個(gè)完整的流程。對(duì)于VUI,我理解為一個(gè)龐大的決策樹(shù),在某個(gè)節(jié)點(diǎn),根據(jù)客戶的反饋決定往哪個(gè)分支走,主體設(shè)計(jì)是環(huán)節(jié)+意圖+跳轉(zhuǎn)。
對(duì)話的跳轉(zhuǎn)邏輯設(shè)計(jì)是個(gè)十分復(fù)雜的過(guò)程,需要反復(fù)推敲跳轉(zhuǎn)是否合理,是否符合業(yè)務(wù)場(chǎng)景,是否覆蓋了常見(jiàn)的情況。從開(kāi)場(chǎng)白到完成業(yè)務(wù)目標(biāo)會(huì)有多種分支,而且有時(shí)候跳轉(zhuǎn)較多,單純看路徑會(huì)比較抽象,可以借助對(duì)話劇本具象化。另外建議設(shè)置好結(jié)束點(diǎn),路徑設(shè)計(jì)不宜過(guò)長(zhǎng),機(jī)器人沒(méi)法像人這么靈活,對(duì)話輪次過(guò)多反而會(huì)阻礙業(yè)務(wù)目標(biāo)的達(dá)成。如果某個(gè)意圖出現(xiàn)頻率高,而且處理方式是一致的,可以提煉出來(lái)作為一個(gè)全局節(jié)點(diǎn)。
5)設(shè)計(jì)話術(shù)
確定了對(duì)話跳轉(zhuǎn)邏輯后,需要明確每個(gè)節(jié)點(diǎn)機(jī)器人的應(yīng)答話術(shù)。話術(shù)內(nèi)容的設(shè)計(jì)也很考究,基本原則是通用化、封閉化。應(yīng)答內(nèi)容盡量通用化,往主流程引導(dǎo),兜住未知的情景,復(fù)雜的內(nèi)容引導(dǎo)客戶去確認(rèn)。雖然AI大大提升了效率,但是還沒(méi)有達(dá)到可以處理全部開(kāi)放化的情景,比較適合做標(biāo)準(zhǔn)化的工作。舉個(gè)例子,你想確認(rèn)客戶的地址是否正確,不應(yīng)該去問(wèn)”請(qǐng)問(wèn)您所在的地級(jí)市是哪里“,答案千千萬(wàn)萬(wàn),而且asr識(shí)別不準(zhǔn),可行性可想而知,倒不如改為”請(qǐng)問(wèn)您是在xxx地方嗎?“,這樣范圍可控。
參照對(duì)話跳轉(zhuǎn)邏輯設(shè)計(jì)每個(gè)節(jié)點(diǎn)話術(shù),包括環(huán)節(jié)+客戶意圖+機(jī)器人話術(shù)+跳轉(zhuǎn)節(jié)點(diǎn):
經(jīng)過(guò)5個(gè)步驟的思考以及設(shè)計(jì),對(duì)話管理模塊的功能已完成,產(chǎn)品展示層面比較多的是畫(huà)布的模式,可以自由組合各個(gè)環(huán)節(jié)、節(jié)點(diǎn)以及話術(shù)。但VUI設(shè)計(jì)是復(fù)雜性的功能,不建議普通客戶去操作,交由專(zhuān)業(yè)人員管理,或者采用模板的方式推廣。
4. 算法模塊
VUI里面涉及的意圖是由算法分析出來(lái)的,建議在意圖設(shè)計(jì)的環(huán)節(jié)也保持與算法的同事溝通。算法模型是核心資產(chǎn),也是產(chǎn)品護(hù)城河。目前市面上會(huì)有廠商提供NLP服務(wù),但作為核心能力,建議采用自研,契合自身業(yè)務(wù)去構(gòu)建算法能力。智能產(chǎn)品需要眾多的語(yǔ)料去完善其模型,即使產(chǎn)品上線后也需要不斷去調(diào)優(yōu),一套完整的算法優(yōu)化流程尤為重要。
作為產(chǎn)品經(jīng)理,重點(diǎn)關(guān)注其中的標(biāo)注結(jié)果,核對(duì)分類(lèi)是否正確、是否存在與產(chǎn)品設(shè)計(jì)違背的地方、是否可以達(dá)到可用的效果,這樣可以減少效果與最終目標(biāo)的不適應(yīng)情況。另外還有需要關(guān)注模型校驗(yàn)的結(jié)果是否符合預(yù)期,生產(chǎn)對(duì)客的效果如何。
雖然AI技術(shù)很強(qiáng)大,但也不是無(wú)敵,也要看與各個(gè)技術(shù)的配合度以及局限性。語(yǔ)音機(jī)器人特別依賴ASR的準(zhǔn)確率,曾經(jīng)踩過(guò)一個(gè)坑,詢問(wèn)客戶的所在地,以判斷是否可辦理金融業(yè)務(wù),但ASR對(duì)短句的轉(zhuǎn)譯能力差,無(wú)法精準(zhǔn)轉(zhuǎn)寫(xiě),導(dǎo)致識(shí)別準(zhǔn)確率很低,效果很不理想。如果前期關(guān)注到ASR的局限性,就很有可能會(huì)規(guī)避這個(gè)問(wèn)題。
算法能力的構(gòu)建涉及多個(gè)角色、多個(gè)流程以及持續(xù)性優(yōu)化,如果業(yè)務(wù)比較成熟,可以搭建一套運(yùn)營(yíng)后臺(tái)系統(tǒng)去支撐這部分工作,發(fā)現(xiàn)熱點(diǎn)知識(shí)、拒識(shí)等內(nèi)容,實(shí)行標(biāo)注質(zhì)檢工作等。
5. 運(yùn)營(yíng)管理
經(jīng)過(guò)各個(gè)模塊的搭建,已經(jīng)具備了機(jī)器人外呼能力、識(shí)別能力、對(duì)答能力,運(yùn)營(yíng)管理模塊就負(fù)責(zé)如何使用機(jī)器人,根據(jù)業(yè)務(wù)需要設(shè)計(jì)各種外呼策略,比如重?fù)?、定時(shí)外呼、防騷擾等。
四、結(jié)語(yǔ)
智能外呼機(jī)器人是AI落地較為廣泛的產(chǎn)品,涉及了多個(gè)領(lǐng)域的知識(shí),也需要多種角色參與,因此需要掌握的東西比較多,很考驗(yàn)產(chǎn)品的整合能力。同時(shí)也是十分重運(yùn)營(yíng)的產(chǎn)品,不是搭建完成就完事了。如果功能建設(shè)完成了,我認(rèn)為只是從0到0.5,要達(dá)到真正的對(duì)客效果,還需要持續(xù)優(yōu)化,采集更多的語(yǔ)料去豐富意圖、提升識(shí)別效果等。
以上為本人的一點(diǎn)經(jīng)驗(yàn)之談,歡迎大家一起交流。
本文由 @骨灰級(jí)小白 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來(lái)自u(píng)nsplash,基于CC0協(xié)議。
剛才我接到移動(dòng)的智能外呼,和它聊了30秒才發(fā)現(xiàn)是機(jī)器人。
發(fā)現(xiàn)之后我嘗試不去正面回答它的問(wèn)題,嘗試轉(zhuǎn)移話題,結(jié)果發(fā)現(xiàn)它居然能無(wú)縫銜接我轉(zhuǎn)移的話題,雀氏厲害
智能外呼,簡(jiǎn)單來(lái)說(shuō)就是模擬人的對(duì)話能力,科技真的越來(lái)越發(fā)達(dá)了
技術(shù)是第一生產(chǎn)力~
智能外呼機(jī)器人真的需要進(jìn)一步優(yōu)化,我們一起來(lái) 學(xué)習(xí)吧
智能外呼機(jī)器人是AI落地較為廣泛的產(chǎn)品,涉及了多個(gè)領(lǐng)域的知識(shí),也需要多種角色參與,因此需要掌握的東西比較多,很考驗(yàn)產(chǎn)品的整合能力”這句話說(shuō)得好難
其實(shí)對(duì)產(chǎn)研來(lái)講落地過(guò)程都是一樣的,只不過(guò)要操心的事情會(huì)多一些