智能外呼系統(tǒng)怎樣更“擬人化”?
隨著AI技術(shù)的發(fā)展,智能外呼系統(tǒng)正在逐漸解決機(jī)械重復(fù)的問題,提高人工客服的效率。但在實(shí)際工作中,智能外呼系統(tǒng)還是面臨著重重困難。本文作者基于自己的工作經(jīng)驗(yàn),對智能外呼系統(tǒng)設(shè)計(jì)提出了自己的一點(diǎn)思考。
在AI技術(shù)中,基于AI能力的營銷、客服系統(tǒng)算是比較能落地的應(yīng)用場景。從調(diào)研到項(xiàng)目落地,本人也是有幸完整參與了一個智能外呼的項(xiàng)目,當(dāng)然期間也踩了不少坑。
本文將嘗試著用自己的理解,對系統(tǒng)重新梳理一遍,也算是對這段經(jīng)歷的復(fù)盤和總結(jié)。若是寫得淺薄,還望見諒~
一、AI外呼系統(tǒng)的構(gòu)成
智能外呼業(yè)務(wù)流程圖(PS:客服系統(tǒng)也類似,只是由用戶主動呼入)
智能外呼、智能客服功能繁多,系統(tǒng)設(shè)計(jì)復(fù)雜,這里也只能是想到哪,寫到哪。簡單地將系統(tǒng)歸類一下,整個系統(tǒng)圍繞著通話的三條線展開(兩個終端和一個通信過程)。
終端中用戶端的核心是對用戶的管理,也就是常用的CRM系統(tǒng)。而AI端,則是圍繞著AI機(jī)器人的設(shè)計(jì)、優(yōu)化去設(shè)計(jì)。
通信過程,由呼叫系統(tǒng)實(shí)現(xiàn),包括通話的撥打、接聽、掛機(jī)、轉(zhuǎn)接等,也包括通話線路的管理、配置。
1. 呼叫系統(tǒng)
呼叫系統(tǒng)是一種針對電話的軟交換解決方案,通過呼叫系統(tǒng),電話機(jī)器人才能與用戶通信設(shè)備進(jìn)行通話。
機(jī)器人、呼叫中心、終端間簡單的關(guān)系圖
呼叫系統(tǒng)由來已久,經(jīng)過這么多年的發(fā)展,其功能已經(jīng)十分完善和穩(wěn)定。
在AI驅(qū)動的公司里,也會采用FreeSwitch之類的開源系統(tǒng)進(jìn)行自研。但是這個只有在有相應(yīng)技術(shù)棧(C++),對呼叫系統(tǒng)有開發(fā)經(jīng)驗(yàn)積累時可以去嘗試。
因?yàn)?,對于呼叫系統(tǒng)的租戶來說,呼叫系統(tǒng)最關(guān)鍵的就是高效和穩(wěn)定。要想進(jìn)行商業(yè)化,就必須保證呼叫系統(tǒng)的高并發(fā)和穩(wěn)定,這是一切的前提條件。
除去FreeSwitch之外,也可以購買第三方成熟的呼叫系統(tǒng),例如國外比較有名的Genesys等。
購買成熟的呼叫系統(tǒng),一個是系統(tǒng)本身已經(jīng)比較穩(wěn)定、功能齊全,該踩的坑前人已經(jīng)幫忙全部踩過。還有就是減少研發(fā)成本,尤其是對于AI型公司來說,無需為呼叫系統(tǒng)再浪費(fèi)研發(fā)資源和時間。
在呼叫系統(tǒng)中,會有一些專用名稱,不是這個圈子的一般很難理解,例如坐席、線路、并發(fā)等。
坐席:
主要是軟電話,一般也叫SIP電話。每個客服人員的賬號會綁定一個坐席,擁有坐席之后,即可通過電腦在線進(jìn)行撥打、接聽電話。
線路:
可以理解為外呼時用到的主叫號碼,通常為一批號碼的集合,號碼的類型很多,手機(jī)卡、中繼線等等,有不同的接入方式。
線路資源會根據(jù)運(yùn)營商時常變動,所以通常由專門的線路商去維護(hù)和運(yùn)營。線路會被很多業(yè)務(wù)共用,只能外呼,不能呼入。為便于區(qū)分,這條線路下的所有號碼會有相同的歸屬地,撥打的是類似的業(yè)務(wù)。
例如:北京教育線,便表示外顯是北京,主要撥打教育營銷相關(guān)的業(yè)務(wù)。
當(dāng)然上述主要針對的是外呼場景,呼入場景只需要向運(yùn)營商購買穩(wěn)定的線路即可。
并發(fā):
指同時間可以進(jìn)行幾路通話。并發(fā)受限的因素較多:呼叫系統(tǒng)性能、機(jī)器人配置數(shù)量、線路資源。
- 呼叫系統(tǒng)性能:這是個技術(shù)問題,當(dāng)高并發(fā)時,服務(wù)端無法處理,容易造成漏接、無響應(yīng)等各種問題,并影響接聽率。
- 機(jī)器人配置數(shù)量:這個主要是種收費(fèi)模式,按機(jī)器人并發(fā)量進(jìn)行收費(fèi)。
- 線路資源限制:簡單理解為線路中實(shí)際可外呼的sim卡限制(實(shí)際上很多種類型),算是種物理限制,只能多找一些線路,沒有其他辦法。
2. AI機(jī)器人
嚴(yán)格地來說,AI機(jī)器人就是一整套回應(yīng)的話術(shù),內(nèi)容包括核心的對話流程和知識庫。根據(jù)業(yè)務(wù)的不同,采用不同的技術(shù)方案。
1)兩類業(yè)務(wù)場景
在業(yè)務(wù)上粗略地可分為兩種場景:呼出場景、呼入場景。
呼出場景:
主要是電話營銷、通知等業(yè)務(wù)。
大部分的呼出電話都是陌拜電話,例如教育培訓(xùn)、股票投資、醫(yī)療保險,都是廣撒網(wǎng)的方式大量外呼。這些電話本身就是對用戶時間的一種侵占,對用戶來說沒有意愿來配合進(jìn)行問答,隨時都可能被用戶提前掛機(jī)。
總的來說,呼出場景的特點(diǎn)是:話術(shù)簡單,單通價值低,用戶不配合。針對此類場景,機(jī)器人采用的堆關(guān)鍵詞的方式即可實(shí)現(xiàn)。
呼入場景:
主要是業(yè)務(wù)查詢、預(yù)訂等業(yè)務(wù)。
常見的呼入場景,例如有10086。之前撥打10086,使用的是IVR模式,需要按鍵操作,現(xiàn)在已經(jīng)可以語音直接查詢話費(fèi)信息。由于是用戶主動呼入,帶有明確的目的,對電話機(jī)器人的容忍度相對較高。而機(jī)器人核心價值是幫助用戶完成任務(wù),在無法識別等情況下,可與用戶確認(rèn),方便明確意圖。
總結(jié)一下,呼入場景的特點(diǎn)是:業(yè)務(wù)穩(wěn)定,單通價值高,用戶配合。此類場景,就需要用到Rasa之類的聊天機(jī)器人框架,利用意圖識別、實(shí)體提取完成任務(wù)。PS:呼入場景,類似于智能音箱。
2)電話機(jī)器人和在線機(jī)器人對比
本質(zhì)上電話機(jī)器人與在線客服機(jī)器人相同。區(qū)別在于輸入端一個是語音,一個是文本。
語音信息包含著更多無用的信息,文本要比語音更加精準(zhǔn)和高效。當(dāng)然語音中包含的語氣、語速、情緒等也有部分價值,例如可以用來判斷男女。
電話機(jī)器人由于需要先ASR(語音識別),轉(zhuǎn)成文本之后,再NLP(語義理解),而在線機(jī)器人是直接進(jìn)行NLP處理。因此,在最終的理解效果上,電話機(jī)器人的準(zhǔn)確性會差一些。
3)語音輸入的難點(diǎn)與方案
語音輸入的難題,便是上文中所羅列的,這里不再贅述。這些難題不是目前技術(shù)可以解決的,或者說解決成本很高。這里就簡要列舉一些方案,具體需要在實(shí)際場景中多次嘗試,才能得出最優(yōu)方案。
方言問題:
最直接的方案是采用方言的ASR識別引擎。針對方言的ASR識別,在科大訊飛、阿里云等基礎(chǔ)服務(wù)商都有提供。
問題是:第一,方言種類多,而一般識別引擎只能識別部分使用范圍廣的方言,如四川話、粵語;第二,不知道該用哪套識別引擎,用戶范圍廣,在接通前都是未知的;第三,比較貴,商用成本高。
另一種是笨辦法,但是也有效。通過人工巡檢,將ASR識別結(jié)果中的擬聲詞、錯別字、近似詞都作為關(guān)鍵詞積累起來,積累越多,越容易被識別。
噪音識別問題:
噪音可分為人聲噪音和環(huán)境噪音。
常見的人聲噪音例如:周圍有人在說話、電視劇的聲音等。由于設(shè)備的限制,沒辦法利用麥克風(fēng)陣列等硬件去判斷遠(yuǎn)近場,因此沒有什么特別好的解決方案,畢竟電話的音頻就只有8000Hz、單聲道、16位。
環(huán)境噪音,在呼叫系統(tǒng)中就可以用濾波器、譜減法等方式降噪,還可以聲音切片的長度。
例如:正常說話單個字的時長都大于200ms,過濾掉短促的噪音。此外,在送往ASR之前,還可以利用AI進(jìn)行一次噪音識別,過濾之后再送往ASR識別。而ASR識別引擎本身也具備過濾噪音的功能。具體的實(shí)施方案可根據(jù)實(shí)際效果、商業(yè)化角度去搭配組合。
語氣詞、口頭禪:
例如:嗯——這可能只是在組織語言時的停頓或者是傾聽時禮貌性的反應(yīng),但會被識別成肯定的意思。
此類情況比較常見,在人工巡檢過一批錄音后,發(fā)現(xiàn)作為語氣詞的情景次數(shù)要大于作為肯定的情景次數(shù)。
因此,第一步是將單字的“嗯”、“哦”等詞從意圖中剔除,保留“嗯好的…”等更明確表達(dá)該意圖的詞。
第二步則是在AI對話時候,盡量不要讓用戶開放式回答,而是引導(dǎo)用戶回答,比如用“是不是”、“可以嗎”等結(jié)尾,潛移默化地影響用戶回答“是”、“不是”、“可以”等指令明確的詞。
打斷、表達(dá)不清:
這個問題比較難表述,繼續(xù)舉個栗子:
假設(shè)AI詢問兒童年齡,用戶回答:“噢……我小孩4歲”,中間停頓了一下。在正常邏輯中,為讓AI快速響應(yīng),在用戶回答停頓的時候,已經(jīng)執(zhí)行下一流程。因此,這時AI可能會忽略用戶后半句有價值的對話。
該問題往往容易使AI漏掉關(guān)鍵信息,同時也影響通話體驗(yàn),給人生硬的感覺。針對該問題,目前是通過規(guī)則去控制,通過人工對通話記錄的總結(jié),制訂處理規(guī)則。如什么情況下允許打斷、什么條件下替換為上節(jié)點(diǎn)意圖,這些都需要在實(shí)際場景中不斷總結(jié)優(yōu)化。
4)話術(shù)設(shè)計(jì)
機(jī)器人的對話設(shè)計(jì)有很多配置方式。底層基本都是Taskflow的模式,是類似于流程圖,將多個節(jié)點(diǎn)連接起來。這種方式能夠逐漸讓問題的范圍收斂,處理復(fù)雜的業(yè)務(wù)對話。
節(jié)點(diǎn):
節(jié)點(diǎn)主要是針對輸入的內(nèi)容進(jìn)行意圖判斷,最后根據(jù)判斷分流給下一個節(jié)點(diǎn)。
在智能設(shè)備中經(jīng)常會提及一個詞叫“技能”,通過技能,可以完成特定的指令。節(jié)點(diǎn)也類似于技能,不過在通話場景下,范圍會比技能還要大一點(diǎn)。
- 針對語音進(jìn)行判斷,即“技能”,可通過關(guān)鍵詞、實(shí)體提取等方式判斷意圖。
- 針對按鍵進(jìn)行判斷,也就是IVR,這是電話獨(dú)有的功能,用戶可以準(zhǔn)確地輸入數(shù)字,不用擔(dān)心ASR識別錯誤,在核對用戶身份證信息等場景下特別有用。
- 針對系統(tǒng)數(shù)據(jù)進(jìn)行判斷,此時不需要用戶輸入,是由系統(tǒng)根據(jù)已有信息直接給出判斷結(jié)果,如上一條中的身份證信息判斷。
流程組:
在常見的銷售、客服話術(shù)中,通常可以分為開場白、業(yè)務(wù)介紹、業(yè)務(wù)處理、結(jié)束語幾個階段。為了方便話術(shù)設(shè)計(jì)和后期優(yōu)化,也會根據(jù)此類分發(fā)去設(shè)計(jì)節(jié)點(diǎn)流程,并用流程組作為階段進(jìn)行分隔。
5)AI效果優(yōu)化
衡量一個AI機(jī)器人的好壞,要看它最終帶來的收益和成本。
在呼出場景中,需要讓AI最終意向率到達(dá)或者略小于人工水平,畢竟每一通電話、每一個號碼都是成本的。
在呼入場景中,則需要關(guān)注問題解決率、客戶滿意度等。必要時刻還是得使用人工坐席兜底,因此還需要關(guān)注人工介入情況。
優(yōu)化話術(shù)效果,主要通過錄音巡檢和分析每個節(jié)點(diǎn)的識別率、掛機(jī)率,為節(jié)點(diǎn)補(bǔ)充關(guān)鍵詞、說法集,也會嘗試不同的說話方式,具體的有時間再細(xì)講。
就目前而言,純AI接聽的完成率與人工接聽對比,還是有一定差距。因此真正適合純AI的應(yīng)用場景還是比較少,適合用在呼叫量大、內(nèi)容單一的場景,如:電話通知、催收M0。
在其他場景下,還是以AI+人工配合更為合適。AI負(fù)責(zé)前期簡單的對答,過濾和分流部分用戶,再由人工更靈活地解決問題。等到收集足夠多的說法集,歸納完善的話術(shù)之后,由 AI逐步接手,將人工后撤到下一節(jié)點(diǎn),層層后撤,減少人工投入。
3. CRM系統(tǒng)
每一通電話記錄都會經(jīng)過CRM分析用戶意向、最終通話結(jié)果。CRM系統(tǒng)基于業(yè)務(wù),主要負(fù)責(zé)對客戶的管理和跟進(jìn),整個CRM系統(tǒng)主要可分為3個方向:
- 對人員的管理:包括銷售、客服坐席的增刪改查和業(yè)務(wù)報(bào)表。
- 對客戶的管理:涉及到客戶信息、通話的意向度、完整跟進(jìn)記錄、狀態(tài)的流轉(zhuǎn)。
- 對資源的管理:這里的資源可以包括線路的管理運(yùn)營、話術(shù)設(shè)計(jì)和優(yōu)化。CRM系統(tǒng)較為常見,這里就不再多說,根據(jù)實(shí)際需求,進(jìn)行調(diào)整和功能擴(kuò)充即可。
二、主要競爭對手
圖為當(dāng)時做競品分析時,歸納的競品公司
在智能外呼這個賽道,直接競爭的是兩類企業(yè):傳統(tǒng)的軟件提供商和以AI為核心的科技公司。
客服軟件提供商在客服系統(tǒng)、呼叫中心等產(chǎn)品上深耕多年,有相當(dāng)完善的產(chǎn)品矩陣和客戶資源,對客戶需求、實(shí)施解決方案都是經(jīng)驗(yàn)豐富。
AI型科技企業(yè),則是垂直切入外呼場景,依托自身的AI技術(shù),對單一場景進(jìn)行單點(diǎn)突破,鞏固自身的技術(shù)壁壘。只是就目前來看,AI技術(shù)的瓶頸還未突破,對智能對話、通話體驗(yàn)的改變不大。
除了上述兩類企業(yè)外,百度云、阿里云、騰訊云之類的云服務(wù)商,利用自身優(yōu)勢,將技術(shù)集成到開放平臺中,形成完整的行業(yè)解決方案。為企業(yè)提供ASR、NLP、TTS、呼叫系統(tǒng)甚至是線路等基礎(chǔ)技術(shù)服務(wù),降低了技術(shù)門檻,企業(yè)不需要特別的技術(shù)儲備,即可搭建出自己的系統(tǒng),可以說是一種降維打擊。
PS:事實(shí)上AI驅(qū)動的企業(yè),完善自身技術(shù)后,也在逐步開放AI能力,提供技術(shù)服務(wù),為其他企業(yè)賦能。
而研究聊天機(jī)器人的企業(yè),在NLP技術(shù)的研究和積累頗多,也容易快速切入。
三、核心競爭力
雖然說是AI機(jī)器人,核心亮點(diǎn)是AI。但是,在實(shí)際應(yīng)用中真正利用到AI技術(shù)的并不多。
- ASR:除非自身有足夠多的語料和研發(fā)能力(還要考慮研發(fā)成本、更新維護(hù)能力),否則ASR大多都是通過科大訊飛、阿里云等大平臺進(jìn)行識別。
- NLP:這個是一個技術(shù)核心,不過就目前的提升效果,通過填充關(guān)鍵詞之類的笨辦法也能達(dá)到相同效果。
- TTS:在實(shí)際語音播放中,除了變量等必須由TTS合成外,大部分話術(shù)都可通過提前人工錄音的方式完成,且播放效果比TTS還要好。
個人認(rèn)為AI機(jī)器人的核心,不在于AI,而是基于業(yè)務(wù)場景的話術(shù)??蛻舨粫P(guān)心技術(shù)如何先進(jìn),而是看最終的接聽效果。當(dāng)一個話術(shù)調(diào)整成接近人工坐席效果時,那么在這個業(yè)務(wù)場景可以說是形成了壁壘,拓展相似業(yè)務(wù)會更有優(yōu)勢。
本文由 @jessi 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
大佬,可以講解一下CTI的信令和媒體流的運(yùn)行流程嗎?
NLP:這個是一個技術(shù)核心,不過就目前的提升效果,通過填充關(guān)鍵詞之類的笨辦法也能達(dá)到相同效果。
對于這段話,我有異議。NLP的能量是關(guān)鍵詞根本無法比擬的,目前自然語言理解方面也大大降低了成本,相似問法語義的擴(kuò)展支持度也很好。只是NLP研發(fā)門檻高,以至于很少能讓客戶發(fā)現(xiàn)NLP真正的價值。試想一下,中華文字博大精深,哪是幾個關(guān)鍵字就能搞定的。
在實(shí)際落地過程中除非和合作伙伴深度合作,不然會發(fā)現(xiàn)枚舉、正則對結(jié)果提升更快更容易。
通過多個實(shí)踐項(xiàng)目落地,nlp的價值在不斷放大,正則也不是完全放棄,只是在能量級上還是有差距的。
多年nlp對話領(lǐng)域經(jīng)驗(yàn)告訴你,多輪對話領(lǐng)域,正則比純模型好用。原因很簡單:確定性。在項(xiàng)目交付過程中便與和客戶解釋并維保。
部分認(rèn)同。但,確定性不代表覆蓋率,需要人肉堆無數(shù)條數(shù)據(jù),本身客戶也不太能接受,若需要提高確定性,是可以設(shè)置較高的閾值,除非行業(yè)要求0錯誤,還是以行業(yè)要求來定義。(也是多年nlp對話領(lǐng)域經(jīng)驗(yàn)告訴我的)
就實(shí)際應(yīng)用來說,純關(guān)鍵字(正則)的優(yōu)勢比較突出,nlp的語義發(fā)散在呼叫場景應(yīng)用中產(chǎn)生了很多負(fù)面效果。正則的缺陷也很明顯,無法覆蓋實(shí)體類的表達(dá)。長遠(yuǎn)意義看,應(yīng)當(dāng)針對呼叫的場景特性設(shè)置更合適的語義規(guī)則,而不是沿用智能客服的那種算法。
后半段同意,需要針對具體場景選擇更合適的方案,而不是一刀切!但不可否認(rèn),nlp的能量級是遠(yuǎn)超正則的。
哈哈哈哈,有幸看到一個從20年聊到22年的話題,來自23年的小弟加入討論。正則非常好用,快速服務(wù)客戶落地業(yè)務(wù)我選擇正則,并且在業(yè)務(wù)taskflow不是那么明確的情況下(大多數(shù)情況下都是需要調(diào)整的),正則也可以快速迭代業(yè)務(wù)能力。但對于業(yè)務(wù)較為穩(wěn)定,且客戶價值較大或者具備標(biāo)桿的行業(yè)就非常值得應(yīng)用NLP能力了,效果的提升不是正則可比的。另外就是也可外呼機(jī)器人公司的特點(diǎn),如果在深挖某垂域,NLP能力必不可少,甚至需要構(gòu)建圖譜,問答庫,通用技能等高階能力。
最后:GPT真強(qiáng),產(chǎn)品層面將GPT能力接入業(yè)務(wù),對一般NLP(就指非特大模型吧)和正則能力降維打擊,哈哈哈哈,希望接口不要太貴。
大家都是跨年溝通的,不曉得24年我能收到回復(fù)不
跨年回復(fù),我來了!現(xiàn)在有了大模型,一切都變了,大模型充滿期待,但同時也存在落地的難度,尤其是本地部署,如何大小模型配合使用,相得益彰呢~(正在研究大模型落地實(shí)踐中路過~~)
GPT效果是真不錯,有了GPT要啥正則,要啥相似問,告訴它要干啥,理解能力超強(qiáng)
可以分享一下競品分析嗎?