AI產(chǎn)品經(jīng)理必知的兩類ChatBot詳解
編輯導(dǎo)語:對話機(jī)器人(ChatBot)目前已應(yīng)用在眾多領(lǐng)域,但還有一些AI產(chǎn)品經(jīng)理對其概念沒有一個系統(tǒng)化的認(rèn)知。作者在文中對兩類ChatBot進(jìn)行了詳解,與你分享。
對話機(jī)器人(ChatBot),以自然語言的方式和用戶進(jìn)行交互,從而完成咨詢、客服、助理、娛樂等用戶訴求,目前已經(jīng)應(yīng)用在很多領(lǐng)域。
本文主要介紹兩類應(yīng)用最廣的ChatBot:FAQChatBot和多輪對話ChatBot,包括這兩類ChatBot的適用場景和構(gòu)造模塊。
第一類:FAQChatBot
FAQ(Frequently Asked Questions) ChatBot,從英文全稱可以看出來,是將一些頻繁用到的問題和答案對整理好,形成知識庫。
當(dāng)用戶提問時,將用戶的問題和知識庫的眾多問題進(jìn)行匹配,匹配完成后,將匹配到的知識庫問題對應(yīng)的答案,返回給用戶,如下圖所示:
為了匹配更精準(zhǔn),在構(gòu)建知識庫時,可以多設(shè)置幾個擴(kuò)展問題,如下表所示,在疫情期間,為了快速構(gòu)建一個FAQ ChatBot,提高問題匹配精準(zhǔn)度,可以這樣構(gòu)建知識庫:
當(dāng)我們的目標(biāo)是快速構(gòu)建一個基于常用知識的咨詢時,就可以用FAQ ChatBot,例如打造一個公司內(nèi)部的入職咨詢、報銷指南。
總結(jié)一下,F(xiàn)AQ ChatBot 的目的是:將企業(yè)的各種知識有效管理起來,采取一問一答的單輪對話方式,為用戶提供咨詢服務(wù)。
該方法的優(yōu)點是建設(shè)快,質(zhì)量可控、準(zhǔn)確率高,其缺點是泛化能力比較弱。隨著不斷迭代,知識庫的更新很大程度依賴于人工,不能自主提升自己的泛化能力。
第二類:多輪對話ChatBot
當(dāng)面臨更加復(fù)雜的問題時,例如用戶想要完成訂餐、訂票等任務(wù),需要進(jìn)行多輪陳述,才能完成用戶的訴求。
一方面,用戶在對話過程中可以不斷修改或完善自己的需求;另一方面,當(dāng)用戶的陳述的需求不夠具體或明確的時候,機(jī)器也可以通過詢問、澄清或確認(rèn)來幫助用戶找到滿意的結(jié)果。
對于這樣的多輪對話,ChatBot架構(gòu)如下:
下面,我們配合下面這個預(yù)訂會議室的例子,來理解多輪對話ChatBot架構(gòu)的各個模塊:
1. NLU(Natural Language Understanding)
NLU的目的是,完成對用戶指令的理解。
所以NLU模塊的輸入是用戶指令,輸出主要采用DIS的表示結(jié)構(gòu),D代表Domain(領(lǐng)域), I代表Intent(意圖),S代表Slot(槽位)。
(有些情況下沒有Domain,直接輸出為Intent)
Domain、Intent和Slot都是產(chǎn)品經(jīng)理根據(jù)需求預(yù)先定義好的。不同的業(yè)務(wù)場景會定義不同的DIS。
對于這個預(yù)訂會議室的例子,可以定義DIS如下:
2. DM(Dialog Management)
對話管理DM控制著人機(jī)對話的過程,是ChatBot的核心。
在對話過程中,對話機(jī)器人系統(tǒng)會不斷根據(jù)當(dāng)前的對話狀態(tài)和用戶行為,決定下一步應(yīng)該采取的最優(yōu)動作,從而完成整個對話任務(wù)。
因此,在這個過程中,DM主要完成以下兩個任務(wù):
(1)維護(hù)&更新對話狀態(tài)(dialog state tracking, DST)
根據(jù)之前的狀態(tài)和用戶的輸入,維護(hù)一份最新的對話狀態(tài)。
(2)產(chǎn)生系統(tǒng)決策(dialog strategy)
根據(jù)DST中的對話狀態(tài)做出系統(tǒng)決策,決定下一步做什么。
如上圖,對于當(dāng)前的會議室預(yù)訂實例,當(dāng)用戶表達(dá)了想預(yù)訂906會議室,當(dāng)前的最新對話狀態(tài)為:
此時,系統(tǒng)做出決策:對話補全。因此,系統(tǒng)繼續(xù)追問用戶:您想預(yù)約什么時間段?
用戶對此反饋:明天上午9點到11點。
系統(tǒng)根據(jù)此時最新的反饋和剛才的對話狀態(tài)狀態(tài),產(chǎn)生新的系統(tǒng)決策,并更新狀態(tài)。
更新后的狀態(tài)為:
在這個案例里,DM的輸入輸出如下圖:
在產(chǎn)生系統(tǒng)決策時,DM一般會利用以下兩種策略:
(1)意圖重入:當(dāng)從當(dāng)前的用戶行為中分析不出意圖時,會將上一輪的意圖重入。
例如“我還想定一個下午兩點到四點的”,單憑這一句話,無法得出用戶的意圖,則將上一輪查詢的“會議室預(yù)訂”意圖進(jìn)行重入。
(2)領(lǐng)域重入:當(dāng)意圖重入匹配度較低,則會采用領(lǐng)域重入。
3. NLG(Natural LanguageGeneration)
當(dāng)DM做出和用戶交互相關(guān)的系統(tǒng)決策時,需要NLG模塊配合,生成自然語言,和用戶完成交互。
當(dāng)用戶預(yù)訂會議室成功后,DM模塊將預(yù)訂成功的信息傳給NLG模塊:
NLG模塊則根據(jù)預(yù)設(shè)的模版或其他生成算法,以自然語言方式反饋給用戶結(jié)果:
總結(jié)一下,多輪對話與單輪對話的不同在于,攜帶前幾輪對話的上下文信息,可以完成更復(fù)雜的任務(wù),也使得對話過程更加智能。
本文由 @躺平看星星 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于 CC0 協(xié)議
大佬方便加個v嘛。我是ai領(lǐng)域的小渣渣,v:lele150661