做了20+個(gè)AI多輪對(duì)話項(xiàng)目后的總結(jié)

JM
7 評(píng)論 21708 瀏覽 92 收藏 24 分鐘

編輯導(dǎo)語(yǔ):隨著科技的進(jìn)步和普及,AI 產(chǎn)品逐漸走進(jìn)了大眾的視野,從手機(jī)語(yǔ)音助手到各類智能音箱,AI 技術(shù)不僅方便了我們的生活,還逐漸改變了我們的習(xí)慣。本文作者在做了20+個(gè)AI多輪對(duì)話項(xiàng)目后,為我們總結(jié)了這篇文章。

在AI走進(jìn)大眾視野的這幾年,我們或多或少的都會(huì)接觸到一些AI的產(chǎn)品,你去咨詢天貓客服,一開(kāi)始肯定是個(gè)機(jī)器人接待你的;你接到一個(gè)電話問(wèn)你是否需要買保險(xiǎn)、辦信用卡或貸款,可能對(duì)方就是一個(gè)機(jī)器人;當(dāng)然最常見(jiàn)的就是智能音箱。

以天貓精靈為例:

  • 用戶:天貓精靈
  • 天貓精靈:主人,您說(shuō)
  • 用戶:放一首逃跑計(jì)劃的《夜空中最亮的星》
  • 天貓精靈:好的,馬上為您播放這首好聽(tīng)的歌。

看起來(lái)很不錯(cuò)的樣子,但是如果用戶接著說(shuō)“幫我換成新褲子的《沒(méi)有理想的人不悲傷》”。

不好意思,這時(shí)天貓精靈是不會(huì)響應(yīng)你的。因?yàn)樘熵埦`在上一輪回復(fù)完用戶的話之后,就結(jié)束了對(duì)話。想要再次跟她對(duì)話,必須喊“天貓精靈”再次喚醒后,才能繼續(xù)對(duì)話。

以上這種每次只能進(jìn)行一輪對(duì)話的模式,我們稱之為“單輪對(duì)話”。其實(shí)目前大多數(shù)機(jī)器人都是單輪對(duì)話的模式。比如說(shuō)閑聊:

  • 用戶:你好
  • 機(jī)器人:你也好呀
  • 用戶:我今天很開(kāi)心
  • 機(jī)器人:看到你這么開(kāi)心,我也是很開(kāi)心呀
  • 用戶:我相信我的明天會(huì)更好
  • 機(jī)器人:你是最棒的,加油
  • …….

這里可能你又會(huì)問(wèn)了,這不是連續(xù)的對(duì)話嗎,怎么會(huì)是單輪呢?

是的,因?yàn)檫@些對(duì)話,每一輪之間都是相互獨(dú)立,上下文之間沒(méi)有關(guān)聯(lián)關(guān)系,我們暫時(shí)稱之為單輪對(duì)話。與單輪對(duì)話相對(duì)的概念是多輪對(duì)話。

舉例:

  • 用戶:幫我訂個(gè)去深圳機(jī)票
  • 機(jī)器人:請(qǐng)問(wèn)您哪里出發(fā)呢?
  • 用戶:上海出發(fā)
  • 機(jī)器人:好的,上海出發(fā),那您要幾點(diǎn)出發(fā)呢
  • 用戶:明天晚上8點(diǎn)左右
  • 機(jī)器人:好的,為您找到明天晚上8點(diǎn)左右,從上海到深圳的機(jī)票有這些。
  • …….

是的,這就是多輪對(duì)話,也是本文主要討論的內(nèi)容。如果說(shuō)NLP是AI界皇冠上的明珠,那么多輪對(duì)話就是NLP界皇冠上的明珠。由此可見(jiàn)多輪的話的江湖地位。

由上面例子,跟單輪對(duì)話的對(duì)比,引出了對(duì)多輪對(duì)話的定義。

一、什么是多輪對(duì)話

1.?多輪對(duì)話的定義

定義:根據(jù)上下文內(nèi)容,進(jìn)行連續(xù)的,以達(dá)到解決某一類特定任務(wù)為目的的對(duì)話。

這里有3點(diǎn):

  1. 上下文:機(jī)器人的每次出話,都是跟上文有強(qiáng)關(guān)聯(lián)關(guān)系的;
  2. 連續(xù)性:一個(gè)完整的對(duì)話內(nèi)可進(jìn)行多次連續(xù)的對(duì)話交互;
  3. 某一類特定問(wèn)題:這里主要是限定下討論范圍,討論的是一個(gè)封閉域內(nèi)的問(wèn)題,一個(gè)完整的對(duì)話,只負(fù)責(zé)處理一個(gè)特定的任務(wù)。比如說(shuō)訂機(jī)票是一個(gè)特定的任務(wù);訂外賣是一個(gè)特定的任務(wù);查天氣也是一個(gè)特定的任務(wù)。

2.?多輪對(duì)話跟機(jī)器人的關(guān)系

多輪對(duì)話跟機(jī)器人的關(guān)系圖:

通常來(lái)說(shuō),一個(gè)全能型的對(duì)話機(jī)器人是由很多個(gè)類型的機(jī)器人組成的,比如說(shuō)閑聊機(jī)器人、任務(wù)機(jī)器人、問(wèn)答機(jī)器人。而一個(gè)任務(wù)機(jī)器人內(nèi)又可以包含多個(gè)多輪。

3.?多輪對(duì)話和多輪對(duì)話平臺(tái)的關(guān)系

那怎么來(lái)實(shí)現(xiàn)多輪對(duì)話呢?市面上各大廠家的做法是開(kāi)發(fā)一個(gè)用于構(gòu)建多輪對(duì)話的平臺(tái)。有了這樣的平臺(tái),你就可以構(gòu)建出你想要的對(duì)話流程。

多輪比較擅長(zhǎng)處理的兩類經(jīng)典任務(wù):

  1. 分類任務(wù)(如上左圖),用戶的表達(dá)屬于分支的哪一類,每一類應(yīng)該走什么分支。
  2. 信息收集/查詢類任務(wù)(如上右圖),需要向用戶收集哪些必要信息,如查航班,需要收集出發(fā)地、目的地、出發(fā)時(shí)間3個(gè)必要信息。

如果把多輪對(duì)話比作一輛汽車的話,那多輪對(duì)話平臺(tái)就是一個(gè)組裝車間,底層的各類AI工具,就相當(dāng)于汽車的零部件,因此我們可以在對(duì)輪對(duì)話平臺(tái)內(nèi),用各種的工具,來(lái)組裝出你想要的對(duì)話邏輯。

這里你可能想說(shuō),這個(gè)哪里智能了,不就是我們實(shí)現(xiàn)定義好的流程嗎?是的,它確實(shí)并沒(méi)有你想象中的那么智能,沒(méi)有你想象中的那樣通過(guò)大量的數(shù)據(jù)就能自己學(xué)習(xí)出一個(gè)流程,也沒(méi)你想象中的那樣機(jī)器可以自己生成新的答復(fù)話術(shù)。

但是它確實(shí)能解決很多工業(yè)上的問(wèn)題,特別是一些比較固定的流程,比如說(shuō):

  • 電銷,機(jī)器人詢問(wèn)用戶是否感興趣;這里機(jī)器人最重要的事情不是促成下單,而是篩選有意向的用戶。比如說(shuō)用戶說(shuō)感興趣,甚至是跟機(jī)器人多聊幾句,就會(huì)被標(biāo)識(shí)為感興趣,然后后面就會(huì)有人工客服來(lái)跟進(jìn)了。
  • 自助服務(wù),傳統(tǒng)的IVR是通過(guò)按鍵的形式來(lái)識(shí)別用戶的意圖的(充值服務(wù)請(qǐng)按1,業(yè)務(wù)辦理請(qǐng)按2…..),那智能機(jī)器人可以直接識(shí)別并理解用戶的自然語(yǔ)言來(lái)提供服務(wù)(如用戶可以直接說(shuō):我要查詢?cè)捹M(fèi))。
  • 滿意度回訪,機(jī)器人通過(guò)電話回訪來(lái)收集用戶對(duì)服務(wù)的滿意度情況,是否滿意、不滿意原因是什么,有什么改進(jìn)意見(jiàn)等等。
  • 疫情期間人員基本情況調(diào)查,如收集用戶是否有從武漢回來(lái)、有沒(méi)有接觸從武漢回來(lái)的人,有沒(méi)有發(fā)燒、流鼻涕等信息。

這些固化的流程完全可以用機(jī)器人來(lái)完成,大大減少人力成本。相比于人,機(jī)器人可以一天24小時(shí),同一時(shí)間多線路給多個(gè)人撥打電話。

二、多輪對(duì)話平臺(tái)由哪些功能模塊組成

1.?按流程的執(zhí)行順序分

1)進(jìn)入多輪對(duì)話任務(wù)的條件

比如識(shí)別到有訂票的意圖,則進(jìn)入到訂機(jī)票的多輪對(duì)話任務(wù)中;也可以通過(guò)關(guān)鍵字、指令等方式進(jìn)入到多輪對(duì)話任務(wù)中。

2)機(jī)器人的應(yīng)答話術(shù)

即用戶的每一個(gè)動(dòng)作(query),機(jī)器人應(yīng)該用什么話術(shù)去應(yīng)答。

目前任務(wù)類型的對(duì)話通常話術(shù)都是預(yù)設(shè)的,基本不會(huì)是生成式的。因?yàn)槿蝿?wù)性對(duì)話容錯(cuò)率很低,寧可答不上,也不能答錯(cuò)。生成式的應(yīng)答話術(shù),更多是在閑聊機(jī)器人中,因?yàn)殚e聊容錯(cuò)率相對(duì)比較高。

3)流程流轉(zhuǎn)條件的設(shè)置(if)

4)滿足條件執(zhí)行動(dòng)作的設(shè)置(then)

條件設(shè)置和動(dòng)作設(shè)置是整個(gè)流程的核心思想,整個(gè)對(duì)話流程都是按:如果條件是什么…那么執(zhí)行什么動(dòng)作…的格式設(shè)置。

5)退出多輪對(duì)話任務(wù)的條件

最后,這個(gè)對(duì)話肯定是不能永遠(yuǎn)繼續(xù)下去的,需要設(shè)置結(jié)束對(duì)話的條件,比如說(shuō)常見(jiàn)的有以下幾種情況:

  • 任務(wù)已經(jīng)完成結(jié)束,比如說(shuō)已經(jīng)收集完需要收集的信息;
  • 用戶主動(dòng)要求轉(zhuǎn)人工結(jié)束,比如說(shuō)用戶跟機(jī)器人聊不下去了,要求要人工服務(wù);
  • 用戶長(zhǎng)時(shí)間未回復(fù)結(jié)束,比如說(shuō)機(jī)器人出話后,用戶10分鐘內(nèi)沒(méi)有響應(yīng)就自動(dòng)結(jié)束。

2.?按流程設(shè)置和文本解析(語(yǔ)義理解)分

按另外一個(gè)維度,可以把多輪對(duì)話分為流程設(shè)置和文本解析(語(yǔ)義理解)。

1)流程設(shè)置–設(shè)定對(duì)話的流轉(zhuǎn)邏輯,如是什么,那就做什么

(如下圖,如果是肯定回復(fù)那就跳轉(zhuǎn)到A節(jié)點(diǎn),如果是否定回復(fù)就跳轉(zhuǎn)到B節(jié)點(diǎn))這一塊邏輯判斷跟AI沒(méi)有什么關(guān)系。

2)文本解析(語(yǔ)義理解)–理解用戶說(shuō)的話是什么

(如上圖,如果用戶說(shuō)“我是他媽媽”,機(jī)器人怎么知道這是屬于否定回復(fù),這就是文本解析要做的事情),也是整個(gè)多輪對(duì)話的核心。

文本解析工具主要分類兩大類:信息收集、文本分類。

1)信息收集

收集信息的方式主要有兩種:對(duì)話里收集、對(duì)話外收集。

  • 對(duì)話里收集:用各種解析器在對(duì)話內(nèi)容中解析出所需信息,比如說(shuō)時(shí)間解析器收集時(shí)間、地址解析器收集地址、電話號(hào)碼解析器收集電話號(hào)碼等。
  • 對(duì)話外收集,即不是通過(guò)對(duì)話內(nèi)容來(lái)收集的,而是通過(guò)其他數(shù)據(jù)交互方式獲取的,比如說(shuō)通過(guò)手機(jī)定位,來(lái)獲取用戶的位置信息;通過(guò)賬號(hào),來(lái)獲取用戶的基本信息等等。

2)文本分類

對(duì)話中的文本分類,通常又分為兩大類:有較完整的句子結(jié)構(gòu)類文本、超短文本。

  • 有句子結(jié)構(gòu)類文本(someone want to do something)描述了一個(gè)比較完整的意圖。有主謂賓這樣的句子結(jié)構(gòu)。比如說(shuō)意圖、FAQ,就是有句子結(jié)構(gòu)的文本類型。
  • 超短文本,沒(méi)有句子結(jié)構(gòu)的,比如說(shuō);好的、可以、ok、行。常見(jiàn)的處理這類型超短文本的解析工具有:語(yǔ)言分類器、選擇解析器。

除了是否有句子結(jié)構(gòu)外,兩類型的文本分類解析工具的應(yīng)用場(chǎng)景也不一樣。有句子結(jié)構(gòu)類文本解析工具,是全局的應(yīng)用。比如說(shuō)“我要轉(zhuǎn)人工服務(wù)”,可以做出一個(gè)意圖,不管在流程的哪個(gè)節(jié)點(diǎn),用戶表達(dá)了這樣的意圖,都可以識(shí)別。

超短文本類解析工具,是局部應(yīng)用的,是強(qiáng)依賴上線文的。比如說(shuō)用戶單獨(dú)說(shuō)一句“不是的”,如果沒(méi)有上下文,是沒(méi)有意義的。

機(jī)器問(wèn)“請(qǐng)問(wèn)您是深戶嗎”,用戶可以回復(fù)“不是的”;

機(jī)器問(wèn)“請(qǐng)問(wèn)您是深圳高校學(xué)生嗎”,用戶可以回答“不是的”;

因此同樣“不是的”,在不同的地方表達(dá)的意思是不一樣的,只有聯(lián)系上文,才能確定明確的含義。

解析工具直接決定了多輪對(duì)話平臺(tái)能力的上限,而決定解析工具能力又可以分為兩層:基礎(chǔ)技術(shù)層、產(chǎn)品層。

  • 基礎(chǔ)技術(shù)層:取決于NLP的能力,包括分詞、詞性標(biāo)注、NER識(shí)別、詞法分析、句法分析、情感分析、句子相似度等底層的能力。
  • 產(chǎn)品層:有了強(qiáng)大的NLP能力,那能不能把這些技術(shù)落地,包裝成實(shí)際的解決方案,去解決實(shí)際的場(chǎng)景問(wèn)題,就是考驗(yàn)底層技術(shù)產(chǎn)品化的能力了。

三、多輪對(duì)話平臺(tái)目前的存在的問(wèn)題

1. 解析工具與場(chǎng)景的不默契

1)例子1

  • 用戶:幫我訂一張機(jī)票
  • 機(jī)器人:好的,請(qǐng)問(wèn)你要從哪里出發(fā)呢
  • 用戶:深圳明天會(huì)下雨嗎

問(wèn)在哪里出發(fā)后,我們往往會(huì)調(diào)用一個(gè)地址解析器來(lái)解用戶接下來(lái)說(shuō)的話,用戶回復(fù)“深圳明天會(huì)下雨嗎”,這時(shí)會(huì)抽到地址【深圳】,那機(jī)器人就理解為出發(fā)地是【深圳】了。

解析器確實(shí)沒(méi)有問(wèn)題,解出了地址【深圳】,但是解出的地址是不是符合上文需要填充的槽位,這時(shí)機(jī)器人就無(wú)能為力了,因?yàn)榻馕銎髦还芙馕?,不管業(yè)務(wù)。

2)例子2

  • 用戶:幫我查詢電費(fèi)
  • 機(jī)器人:請(qǐng)問(wèn)你要查幾月份的呢
  • 用戶:8

問(wèn)是幾月份,我們往往會(huì)在這個(gè)時(shí)候調(diào)用一個(gè)時(shí)間解析器來(lái)解用戶接著說(shuō)的話,用戶只回復(fù)“8”,這時(shí)時(shí)間解析器解不出結(jié)果,因?yàn)闀r(shí)間解析器只能解“8月”、“8號(hào)”等等這個(gè)帶單位的時(shí)間。純說(shuō)一個(gè)數(shù)字,機(jī)器人就懵掉了。

從上面兩個(gè)例子就可以看出,解析工具跟實(shí)際應(yīng)用場(chǎng)景的隔閡,導(dǎo)致了運(yùn)用起來(lái)不夠靈活,主要矛盾點(diǎn)體現(xiàn)在:

  • 如果解析工具跟場(chǎng)景分割開(kāi),就會(huì)出現(xiàn)以上的問(wèn)題;
  • 如果解析工具跟場(chǎng)景緊密關(guān)聯(lián),那通用性就比較差,這樣會(huì)導(dǎo)致這個(gè)解析工具僅適用于某個(gè)場(chǎng)景,而無(wú)法遷移到其他場(chǎng)景。

2. 解析工具與解析工具之間不默契

舉例:

  • 用戶:幫我訂一張機(jī)票
  • 機(jī)器人:好的,請(qǐng)問(wèn)你要從哪里出發(fā)呢
  • 用戶:深圳明天會(huì)下雨嗎

還是以上面例子為例,首先來(lái)了解幾個(gè)概念:

  • 主流程與輔助問(wèn)答:這個(gè)多輪的主流程就是收集訂機(jī)票所需要的槽位,輔助問(wèn)答是只在主流程的過(guò)程中用戶可能會(huì)問(wèn)些相關(guān)的問(wèn)題,如“怎么退票”、“深圳明天天氣怎么樣”。機(jī)器人回答完輔助問(wèn)答之后,會(huì)繼續(xù)回答主流程,繼續(xù)收集槽位信息。
  • 信心分:是指解析工具,匹配到結(jié)果的分?jǐn)?shù)值。假設(shè)分?jǐn)?shù)值是從(0–100),假設(shè)信心分高于80分機(jī)器人就采納。
  • 中控優(yōu)先級(jí):是指取解析工具結(jié)果的優(yōu)先順序,比如說(shuō)解析工具A的優(yōu)先級(jí)大于解析工具B,那解析工具A和B解析結(jié)果的信息分都是90分,那機(jī)器人會(huì)優(yōu)先取A的結(jié)果。

ok,了解了上面的概念之后,我們?cè)倩剡^(guò)來(lái)看這個(gè)例子。

用戶說(shuō)了:深圳明天會(huì)下雨嗎?

會(huì)有兩個(gè)解析工具解到結(jié)果,假設(shè)地址解析工具得到的信心分是90分,意圖解析工具解到的【查天氣】意圖的信心分也是90,但是由于地址解析工具屬于主流程,優(yōu)先級(jí)高于查天氣意圖,因此機(jī)器人最后選擇的是前者。因此機(jī)器人的動(dòng)作是把【深圳】當(dāng)作了出發(fā)地填入槽位。

因此,從這里可以看到有兩個(gè)問(wèn)題:

  1. 人為事先設(shè)定的死死的規(guī)則,是沒(méi)辦法應(yīng)對(duì)在自然對(duì)話中無(wú)窮無(wú)盡的場(chǎng)景。因此機(jī)器人的決策機(jī)制不能全由預(yù)設(shè)規(guī)則決定,應(yīng)該是要結(jié)合實(shí)際的數(shù)據(jù),比如說(shuō)可以針對(duì)單個(gè)節(jié)點(diǎn)做訓(xùn)練,A類數(shù)據(jù)出A回復(fù);B類數(shù)據(jù)出B回復(fù)。
  2. 解析工具與工具之間沒(méi)有建立連接,它們之間各自評(píng)分,相互之間沒(méi)有通訊,沒(méi)有協(xié)作關(guān)系。如果解析工具之間先經(jīng)過(guò)討論,再給出結(jié)果,是不是會(huì)有更好的效果呢,就比如說(shuō),識(shí)別到查天氣的意圖之后,意圖工具會(huì)告訴地址解析工具,這里的【深圳】是只深圳的天氣,可能不是你想要的出發(fā)地,你要再考慮下。這只是一個(gè)腦洞,但值得我們?nèi)ド钏肌?/li>

3. 機(jī)器人的回復(fù)話術(shù)是非生成式的

這里先理清一對(duì)概念:

  • 預(yù)設(shè)式話術(shù):話術(shù)提前設(shè)定,不會(huì)改變
  • 生成式話術(shù):機(jī)器人根據(jù)場(chǎng)景的各變化因素,而創(chuàng)造出的話術(shù)

舉例:

  • 機(jī)器人問(wèn)題1:請(qǐng)問(wèn)你平均每天運(yùn)動(dòng)有超過(guò)30分鐘嗎?
  • 用戶:我平均每天至少跑步1小時(shí)
  • 機(jī)器人問(wèn)題2:請(qǐng)問(wèn)你會(huì)經(jīng)常熬夜嗎?

機(jī)器人的話術(shù)已經(jīng)被事先死死的設(shè)定了,問(wèn)完問(wèn)題1,就問(wèn)問(wèn)題2。沒(méi)有根據(jù)用戶的話做出一些反饋,就會(huì)顯得很生硬。

假設(shè)能這樣:

  • 機(jī)器人問(wèn)題1:請(qǐng)問(wèn)你平均每天運(yùn)動(dòng)有超過(guò)30分鐘嗎?
  • 用戶:我平均每天至少跑步1小時(shí)
  • 機(jī)器人問(wèn)題2:那你很自律啊,這么說(shuō)你應(yīng)該不會(huì)經(jīng)常熬夜吧?

這樣不但能對(duì)用戶的回答做出響應(yīng),還根據(jù)用戶前面說(shuō)的話來(lái)調(diào)整問(wèn)題2的問(wèn)法。這就是非生成式回答無(wú)法達(dá)到的效果,這也是機(jī)器人比較死板的原因。

4. NLP理解的維度比較局限

舉例:

還記得她嗎,在采訪中她說(shuō)“我已經(jīng)用了洪荒之力了”。如果你只看文字,你能理解她里面所表達(dá)的是滿意的情緒嗎?

正常人與人的對(duì)話,一般會(huì)根據(jù)語(yǔ)調(diào)、文字、表情、動(dòng)作等維度,組合起來(lái)理解對(duì)話所表達(dá)的內(nèi)容。但是目前大多數(shù)的多輪對(duì)話平臺(tái)都是只以【文字】單一維度來(lái)做解析處理,即使很多平臺(tái)都亮出了自己在ASR環(huán)節(jié)的情緒理解有多么強(qiáng)大,但真正跟多輪平臺(tái)運(yùn)用起來(lái)是隔離開(kāi)的,訓(xùn)練數(shù)據(jù)只是轉(zhuǎn)譯成文本的形式訓(xùn)練,而不是直接拿語(yǔ)音去訓(xùn)練。

不同語(yǔ)氣的“呵呵”,表達(dá)的意思是不一樣,有的是開(kāi)心,有的是諷刺。如果丟失了語(yǔ)調(diào)的維度,那解析的結(jié)果肯定是會(huì)失真的。

4. 使用門檻高,優(yōu)化難度大

在以用戶體驗(yàn)為王的時(shí)代,如果你操作一個(gè)軟件或APP,你還要看它的說(shuō)明書(shū),甚至看了說(shuō)明書(shū)還不會(huì)操作,那你肯定會(huì)瘋掉。

沒(méi)錯(cuò),多輪對(duì)話操作平臺(tái)就是一個(gè)看了說(shuō)明說(shuō)還不會(huì)用平臺(tái),通常需要經(jīng)常專業(yè)的培訓(xùn)才會(huì)使用,因此是有很高的使用門檻的,而且邏輯能力不好人,還真做不來(lái)。

除了操作門檻高,后續(xù)的優(yōu)化也不靈活。不是說(shuō)像我們想象中的那么簡(jiǎn)單,加點(diǎn)數(shù)據(jù),標(biāo)注下就能解決的。比如說(shuō)機(jī)器人詢問(wèn):你是馬先生嗎?

你一開(kāi)始想到的用戶可能的回答是兩類:肯定回復(fù)(是的、我是)、否定回復(fù)(不是、打錯(cuò)了)。但是上線后,你會(huì)發(fā)現(xiàn)還有很多類型的回復(fù):中性回復(fù)【怎么啦、你說(shuō)】、式有關(guān)系人【我是他老婆、我是他兒子】、反問(wèn)【你是誰(shuí)呀、是機(jī)器人吧你】

每增加一個(gè)分類,就要重新在流程圖里增加分支,從新設(shè)定規(guī)則等等,并非直接加點(diǎn)數(shù)據(jù)重新訓(xùn)練就能解決問(wèn)題了。

四、多輪對(duì)話平臺(tái)未來(lái)的發(fā)展方向是怎樣的

1. 在目前的框架下去優(yōu)化

前面大篇幅討論了,目前多輪對(duì)話平臺(tái)的核心是解析工具,因此我覺(jué)得未來(lái)的優(yōu)化方向也是在解析工具上面,比如說(shuō):

  • 怎么讓解析工具通用,然后又可以跟特定的場(chǎng)景緊密結(jié)合在一起;
  • 怎么讓解析工具之間的協(xié)作更加高效,更加合理;
  • 怎么讓后期優(yōu)化延伸性更加廣,讓機(jī)器有條不紊的接納更多的分類。

2. 用新的框架去解決問(wèn)題

目前的做法是對(duì)話流程、對(duì)話分支是由人工搭建的,這種方式對(duì)數(shù)據(jù)的利用率是非常低的。只是根據(jù)對(duì)話記錄,人為整理出對(duì)話流程,而對(duì)話之間的上下文關(guān)系是不參與到模型訓(xùn)練的。機(jī)器人不會(huì)隨著人機(jī)對(duì)話量的增加而變得更加聰明。

未來(lái)的優(yōu)化方向一定是最大化的利用數(shù)據(jù),比如說(shuō)通過(guò)給機(jī)器輸入大量的對(duì)話記錄,機(jī)器能夠?qū)W習(xí)出對(duì)話之間的邏輯關(guān)系,然后自己能學(xué)習(xí)出一個(gè)對(duì)話流程。

最后,用一句話總結(jié)下目前的多輪對(duì)話平臺(tái):在解決固定化流程的問(wèn)題上,確實(shí)能降低人力成本,但是對(duì)話比較死板,要想做到向人與人之間的自然交流,還有很長(zhǎng)的路要走。

AI人,一起加油吧!

 

本文由 @Jimmy 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于CC0協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 我們公司目前做多輪對(duì)話采集

    回復(fù)
  2. 多輪對(duì)話的最佳體驗(yàn)應(yīng)該是電影《She》中那種對(duì)話方式,陪伴式的語(yǔ)音服務(wù)未來(lái)的發(fā)展空間還是很大的。

    來(lái)自安徽 回復(fù)
  3. 現(xiàn)狀確實(shí)這樣。都懷疑到要不就不接三方了,自己開(kāi)發(fā)。

    來(lái)自北京 回復(fù)
  4. AI還有很長(zhǎng)的一段路要走。但當(dāng)哪一天機(jī)器人能跟人對(duì)答如流了,是不是意味著機(jī)器人就有了自己的思想?細(xì)思恐極啊。

    來(lái)自廣西 回復(fù)
  5. 沒(méi)錯(cuò),多輪對(duì)話操作平臺(tái)就是一個(gè)看了說(shuō)明說(shuō)還不會(huì)用平臺(tái),通常需要經(jīng)常專業(yè)的培訓(xùn)才會(huì)使用,因此是有很高的使用門檻的,而且邏輯能力不好人,還真做不來(lái)。—–精髓了,目前我們做的就是這樣,一個(gè)做了多輪會(huì)話三年多的人,深有感悟

    來(lái)自上海 回復(fù)
  6. 寫的太好了,還沒(méi)想到對(duì)話機(jī)器人里面還有這些類型的區(qū)分。也想請(qǐng)教一下,現(xiàn)在市面上看到的提供能力的公司,任務(wù)型對(duì)話機(jī)器人哪家做得更好一些?

    來(lái)自上海 回復(fù)
    1. 同問(wèn)

      來(lái)自河南 回復(fù)