從開放域機器人構(gòu)建出發(fā),聊聊如何與機器人吹水

0 評論 4023 瀏覽 17 收藏 35 分鐘

作者從自己的實際工作出發(fā),以兒童機器人場景為例,從多個角度對如何構(gòu)建閑聊機器人進行了闡述,并分享了與機器人“吹水的”價值、方式方法以及背后原理。

一、機器人概述

機器人按照對話方式,可以分為“問答機器人”、“任務對話機器人”、“開放閑聊機器人”。但機器人的落地使用過程中,往往需要不同作用的機器人進行結(jié)合。

拿電器類客服機器人舉例來說,會有如下對話:

用戶:“包安裝嗎”

機器人:”我們是包安裝的哦,親“

以上是我們最常見的問答場景,機器人通過檢索方式,找出query對應的answer返回給用不。

再比如:

用戶:“我要查物流”

機器人:“您要查詢的是哪個訂單”(提供訂單A&訂單B&訂單C)

用戶:選擇A

機器人:該貨品目前已經(jīng)由順豐發(fā)出。

在以上場景中,機器人需要通過多輪方式完成查物流的任務。

這就像咱人一樣,在工作中,不僅需要有決策和解決問題的能力,還需要有日常溝通能力,任何一項都是不可或缺的。

由于工作中接觸了各類機器人,對于開放域聊天內(nèi)容的感觸比較深的是,閑聊本身在機器人的場景中,作用會相對弱一些,但大部分時候,又屬于機器人的基本能力,屬于典型的“得不到的永遠在騷動,得到的有恃無恐”。

而目前市面上的機器人介紹文檔,一方面關(guān)于閑聊的內(nèi)容不多,絕大部分是任務型和檢索性的文章;另一方面,閑聊的介紹更偏向于技術(shù)實現(xiàn)方式。但小七我認為,想要做好開放域聊天,其實不能只考慮技術(shù)實現(xiàn),而應該從產(chǎn)品本身出發(fā)。

所以今天,小七結(jié)合之前做開放域機器人的實操過程,主要以兒童機器人場景為例子,從不同角度來闡述如何構(gòu)建閑聊機器人,跟著我燥起來!

二、吹水的價值

閑聊,俗稱“吹水”。朋友間吹水,講究開心就好。所以,閑聊是一個雙方都帶有情感訴求的過程,可以是解悶逗樂,也可以是哭訴慰藉。

基于此,如果用戶與機器人進行閑聊互動,必定是希望機器人能引起其情感的共鳴和變化。如下對話是用戶跟“小愛同學”(小米音箱)的對話:

用戶:小愛同學,放個屁

robot:矮油,人家是女孩紙,怎么會做這么羞羞的事情。既然主人想要聽放屁,我就勉為其難放一個,放的不好可不許怪我哦。

噗~~

用戶在這次對話中,讓小愛同學放屁,純粹是逗樂找趣。同時,機器人的反應也是有一定套路,讓用戶感受到,這是一個可以給自己帶來樂趣的朋友。

當一個朋友情商特別高,能夠在自己傷心時給予安慰,無聊時帶來樂趣,開心時互相分享,任何一個人都會很感激有這樣的益友,讓人離不開。

比如用戶面前有一個娛樂機器人,前者習慣性會以人與人交流的形式來進行對話。這時候,機器人不能而不是“直男”,顧著解決問題,也應該是一個情商高的朋友,感知用戶的情感,并在回復時伴隨著相應的情感,讓用戶感受到樂趣和溫度。

只有這樣子,用戶才能與機器人做更多交互,提高用戶粘性,而不是“仰天嘲笑出門去,AI都是智障人”?

三、如何吹水

用戶如果有意和機器人扯犢子吹水,必然會有”像人“的期望值。這個標準說起來簡單,做起來相當?shù)秒y,畢竟nlp技術(shù)還真沒達到完全理解人類的水平。

如果我們換個角度,如《西部世界》中所講,機器人如果擁有了記憶,便開始進化成有意識的生物了。同樣的,對于【像人】(類似有意識)這個狀態(tài),我們可以抽象出一些特質(zhì),機器人如果擁有了這些特征后,能讓用戶覺得還不錯,愿意聊下去。

那以下是筆者從過往做閑聊機器人過程中所抽象出的特質(zhì),下面會一一做介紹。

1. 人設(shè)一致性

(1)人設(shè)一致性的意義

每個社會人都有自己統(tǒng)一的人設(shè),包括身份、性別、形象、性格、愛好等,人與人之間也是基于這個“本”在對話。即使是路上的陌生人問路,也會先根據(jù)對方的形象、性別稱呼,比如路上經(jīng)常有人找我問路,都會說:“你好,帥哥”。而這稱呼,本身就是一個人物設(shè)定的表現(xiàn)。如果一個人人設(shè)不一致,有時候東,有時候西,那要么是這個人太戲精,要么就是神經(jīng)錯亂,比如下面這個人:

A:你是誰

B:我是來自廣東的產(chǎn)品經(jīng)理

A:那你平時工作都在干嘛

B:我在畫建筑設(shè)計圖,敲代碼,修空調(diào)。

A:(這恐怕是個假的產(chǎn)品經(jīng)理吧)

機器人也一樣,需要立個人設(shè)在用戶前面,才能讓后者有真實感,安全感。如果機器人沒有人設(shè),會讓聊天變得異常怪異。有時候回答不上來、有時候亂回答,有時候上句不接下句,用戶會認為亂七八糟,溝通不了。就如Cathy Pearl在《語言用戶界面設(shè)計》中所說:“人物模型的一致性,使人們能夠在與它們溝通時得以預測接下來會發(fā)生什么”。

(2)設(shè)計方式

那我們要如何設(shè)定機器人的人設(shè)呢?平時我們要了解一個人,一般會從其背景信息出發(fā),如名字、家鄉(xiāng)、職業(yè)、愛好等;其次,通過其談吐舉止,也可以了解一個人的性格特征。

關(guān)于機器人的背景,我們需要給到它一個故事?!段鞑渴澜纭分?,每個機器人都有自己的身份和劇本。但用戶會問機器人的哪些背景信息呢?事實是,不大可能枚舉出一個人的所有背景信息,就連人都可能忘了自己很多以前的事兒。

這里我們可以從日常提問(高頻問題)入手。以兒童機器人為例,在我們之前做的項目中,從線上交互數(shù)據(jù)看出,咨詢機器人背景信息的query占了所有交互數(shù)據(jù)的10%以上。這類問題包括:

  • 機器人的身份是什么?姓名、年齡、生日、星座、家鄉(xiāng)等
  • 機器人的能力是什么?
  • 機器人的愛好是什么?
  • 機器人的家庭背景、社交背景是怎么樣的?

另一方面,我們需要設(shè)計機器人的性格特點,以此來體現(xiàn)其談吐。性格特點可以是風趣、自信、忠誠,亦或是調(diào)皮、溫暖、腹黑。

最終我們可以有這么一個故事:

我們要創(chuàng)造一個兒童機器人,叫小七,男生,獅子座,關(guān)鍵很帥,來自泰坦星永恒一組,由于星球瀕臨滅絕,爸爸媽媽送他到了地球,所以他留在地球和人類愉快地生活。小七性格幽默,樂于助人,但有時候也有些腹黑,教育小朋友。

(3)產(chǎn)品舉例

筆者也找了市面上做botframework的平臺,這類產(chǎn)品的側(cè)重點主要在于技能定制及模型訓練,而對于人設(shè)很少涉及。后面發(fā)現(xiàn)以下兩個平臺有相關(guān)設(shè)定,其中:圖靈機器人涉及到的屬性有性別、年齡、星座、爸爸媽媽;海知涉及的屬性包括姓名、性別、生日、喜好和爸爸媽媽。人設(shè)內(nèi)容不多,但這類機器人基礎(chǔ)配置,還是必不可少的。

圖靈機器人人設(shè)頁面:

海知ruyi機器人人設(shè)頁面:

2. 語言風格設(shè)定

(1)意義與設(shè)計方式

語言風格首先要符合人設(shè)特點。幽默的性格,機器人的回復就需要搞笑輕松一些,若是嚴謹?shù)男愿瘢瑱C器人說話就需要嚴肅。想象一下,一個在法院的政務機器人,當你問它你會啥的時候,它說會泡妞撩妹,那場面真的會難以控制。

比如前面提到的小七喜歡掉書袋,那我們可以在小孩子玩游戲很久之后,提醒小朋友需要休息一下,然后看看書,或者引導其來學習古詩詞。

確定了語言風格之后,就需要將這種性格特點體現(xiàn)在機器人的對話中。我們可以從用戶所有query中,抽象高頻場景進行針對性設(shè)定,使得機器人人設(shè)和說話風格一致,更像一個人在聊天,這也是我們最終的預期效果。

而在這個過程中,為了讓機器人顯得更加擬人化,我們也嘗試加入了一些類似口頭禪的feature,比如有的人習慣以“呃”來開始,有的人喜歡說“然后”來銜接。

(2)產(chǎn)品舉例

在以往例子中,我們所發(fā)現(xiàn)的其中一個高頻場景是:用戶會重復問同一個問題(不知道是不是都是一些智能程度檢驗師在聊天,尷尬)。這種情況是極不建議機器人一直是單一回復,那就成了一個對話復讀機了。而微軟小冰對于用戶這種互動,結(jié)合了她自己的人設(shè)和語言風格來回應(比如:撒嬌、傲氣)。

我們可以探索下微軟小冰的策略:

小冰的策略是,針對同個問題,給出不同的回復。若用戶重復太多次,小冰會有情緒的變化,慢慢地顯得不耐煩,并且開始責怪用戶,到最后干脆不回答了,直到用戶說其他內(nèi)容,就回復“你終于不說重復的話啦~”。從中我們可以看出,小冰的語言是很活動調(diào)皮并且較為傲嬌的。

也只有這樣豐富的語言體現(xiàn),用戶才更相信對面是個可以聊天的朋友,而不是一個無聊的智障機器人。

3. 個性化

(1)個性化意義

如同政治課本中的一句話:世界上不會有完全一樣的葉子。即使如雙胞胎,也會有各自的個性。我們過往發(fā)生的每件事情,讓我們形成了特有的世界觀,價值觀,人生觀。三觀決定了每個人的思想不同,而語言是思想的折射,從而讓每個人談吐都是與眾不同的。

相應的,機器人也應該有自己的過往記憶,從而形成自己與眾不同的三觀。 這樣,每個機器人都是個性化的,就跟我們不同性格的朋友一樣。

(2)設(shè)計方式

當然,如果要記住所有的事情,對于機器人來說是困難的,也會顯得沒有意義,畢竟人也有記性差的時候。那機器人需要有什么記憶呢?除了剛才的背景信息,最重要的,是要記住它的主人,即用戶。

也就是說,機器人需要能記住自己主人相關(guān)的信息,包括姓名、性別、愛好等方面,甚至某些過往的交互行為。這樣,當某個用戶A擁有了一款能記住機子的機器人,即使市面上有其他機器人,對用戶來說,這個機器人小伙伴都是獨一無二的。

那要記住用戶,首先得有個收集用戶畫像的過程。這各場景就跟男生想要了解妹紙一樣,要么是自己主動了解(撩),要么是自己通過細心觀察(備胎式方案),被動了解。

1)主動了解型

如果機器人想主動去了解用戶,就需要找準時機,否則會顯得十分突兀,甚至讓用戶產(chǎn)生防備心理。

一般來說,最好的時機,應該是兩個朋友相互了解的時候。具體我們可以看以下例子:

用戶:你叫什么名字呀?

機器人:我叫小七。主人你呢?

用戶:我叫小八,你好呀。

機器人:你好,小八。我知道自己主人叫啥了,好開心!

用戶:你會做什么呢?

機器人:唱歌跳舞,啥都會呢。小八,你平時喜歡干什么呢?

用戶:我也喜歡唱歌呢。

機器人在這樣的互動中,能夠了解到用戶的興趣愛好,并記憶下來。而用戶也會覺得這個機器人真的像自己的玩伴,從而更愿意與其玩下去。

2)細心觀察型

當然,如果機器人能夠細心留意用戶以往說的話,也可以從中了解很多信息,從而做出很驚艷的交互表現(xiàn)。比如:

(早上)

用戶:早上好

機器人:早上好,小八。今天周末天氣很好,小八有打算去哪里玩嗎?

用戶:今天要跟爸爸媽媽去動物園。

機器人:聽起來很棒呀。要玩得開心哦

(晚上)

用戶:晚上好。

機器人:小八呀,今天去動物園玩了一天,能跟我講講都玩了什么了嗎

用戶:我今天看了斑馬、獅子、孔雀。。。。

機器人:好像很好玩呀。下次小八帶著小七一起去,好不好

機器人不僅能記憶,而且記性也好,讓小朋友感覺真的有在關(guān)注自己,也讓家長相信機器人確實是一個好陪伴,讓孩子不會孤單。

通過這樣的記憶,讓每個機器人都成為特有的存在。每個小朋友都有陪伴自己成長的專屬的玩伴。

P.S.當家里有兩個小朋友的時候,如果希望機器人能夠記住用戶是誰,我們也可以通過聲紋識別方式記住不同用戶的名稱。

4. 主動引導

(1)意義

一個相對智能的吹水機器人算是擺在這里了。但事實告訴我們,如果只是這樣,用戶不會一直和他聊下去。市面上很多機器人會宣稱自己有很多能力,可以陪伴小孩子,還可以教小朋友數(shù)學、英語等等。咱先不說這些能力有沒有用,好不好玩,到底能不能被用戶觸發(fā),才是首要考慮的問題。

想象一下,兩個人在聊天,永遠是其中一方在找話題,另一方只是在附和,就算話癆也不可能永遠有話題。而且,用戶往往不知道要和機器人聊啥,尷尬的氣氛會讓前者失去聊下去的興趣。所以,通過機器人主動引導來找話題,從而讓用戶不斷來聊天,便顯得尤為重要。

(2)設(shè)計方式

設(shè)計主動引導的時候,產(chǎn)品經(jīng)理需要講究策略,主要解決三個關(guān)鍵點:內(nèi)容、時機、話術(shù)。

1)引導內(nèi)容

選擇引導什么內(nèi)容,這個取決于機器人的能力和定位,比如一個寓教于樂的機器人,應該多讓小朋友做數(shù)字游戲、詩詞游戲等互動。同時,機器人如果學習(上線)了一些新的能力,也需要及時引導用戶來體驗,保證用戶的活躍度。

2)引導時機

對于時間點的問題,我們可以選擇在開頭、過程中以及結(jié)尾三個timing去觸發(fā)。

比較常見會在用戶喚醒機器人時候去引導其體驗能力,如下case便是小度音箱在過年期間的能力引導,會在用戶開始閑聊之后,直接推薦響應技能。

user:小度小度,晚上好

小度:晚上好呀。先來看看明天的天氣吧,稍后還有精彩節(jié)目等著你哦~

小度:明天天氣xxxxx

小度:我為您整理了一些收聽率很高的節(jié)目,聽聽看吧,覺得不喜歡可以跟我說“換個臺”

但如果每次都在喚醒時引導就會顯得特別生硬。我們想象一下,兩個朋友在扯皮吹水,一般是從一個話題突然想到其他話題就開聊了。同理,用戶跟機器人聊天,也應該允許雙方聊著聊著就扯到其他話題的。

我們也不必在所有聊天內(nèi)容中去想辦法做話題引導。首先,應該找出用戶的高頻聊天場景中,比如小朋友會經(jīng)常讓機器人講笑話,講完后就可以引導做其他寓教于樂的游戲。當然,實際情況不可能如此簡單暴力,觸發(fā)條件需要做權(quán)重計算,包括用戶各類技能的觸發(fā)次數(shù)、其他引導場景的觸發(fā)頻率、歷史引導的用戶反饋(如用戶說:我不喜歡)等。

最后就是在結(jié)尾的timing做引導,也就是當雙方都陷入沉默的尷尬氣氛的時候。拿小米音箱舉例,由于是全雙工喚醒,當用戶每隔15s沒有說話,則會主動引導一次,連續(xù)三次引導無果才會退出喚醒狀態(tài)。比如:“主人你去哪兒了?告訴你哦,我最近新學了一項技能,要不要跟我一起玩呢”。這樣可以引起用戶聊下去的興趣,開始新的話題,保證cps的數(shù)據(jù)上漲。

3)引導話術(shù)

至于最后的引導話術(shù),因為不同場景的話術(shù)是不一樣的,所以要保證與我們先前講的語言風格一致,至少不能讓一個很嚴肅的學霸型機器人突然撒嬌說:“跟人家聊點別的東東嘛~”

5. 趣味性

所謂好看的皮囊千篇一律,有趣的靈魂萬里挑一。說到底,一個chatbot如果不好玩,再怎么折騰也沒用。另一方面,聊天機器人始終是一個To C的產(chǎn)品,通過運營好玩的內(nèi)容,保證活躍和留存是相當重要的。這往往能給到用戶意想不到的驚喜,從而產(chǎn)生持續(xù)對話的興趣。

如何讓閑聊變得好玩,就不得不提小冰的套路了。一方面,小冰日常會更新技能,不斷刺激用戶去體驗;另一方面,也會在各種聊天中皮一皮,讓用戶相信這是個有趣的“朋友”,比如上文提到的對于用戶故意使壞,一直重復單句的場景。

再比如,小冰曾經(jīng)更新一個“讀心術(shù)”的技能,也就是在15個問題之內(nèi)猜出用戶心里想的人物是誰。利用ID3決策樹等算法先將人物及特征作為訓練樣本,再讓小冰反問用戶,為每個特征分類,最后選中用戶的“心上人”。

通過這一個個的小游戲,可以讓用戶不斷產(chǎn)生愉悅感及下次的期待感,朋友之間也是這樣,總有一些共同話題和興趣活動,才能讓雙方成為知己。

之前設(shè)計閑聊機器人時,小七也設(shè)定了某些套路策略。比如情人節(jié)前后的土味情話,每天用戶開始進行互動的時候,以主動消息的方式來發(fā)土味情話。當時每天的土味情話在情人節(jié)期間還是帶來了不少的留存和活躍的。在實現(xiàn)方式上也比較簡單,直接利用規(guī)則設(shè)定即可,ROI還是挺高的。

user:打開聊天女仆

bot:主人你好呀。啊,你有沒有聞到什么味道?

user:沒有啊/什么味/…

bot:怎么你一出來空氣就甜炸了啊

同樣的,兒童機器人更需要這樣的趣味性和新鮮感,畢竟兒童天性就是“喜新厭舊”。如果小玩伴每天都是玩同樣的游戲,說同樣的話,到最后一定“沒朋友”。所以可以加入寓教于樂的兒童游戲,日常更新的兒童笑話,兒童故事,來吸引小朋友的注意,讓孩子喜歡上這個玩伴。

6. 情感

根據(jù)馬斯洛的需求層次理論,情感和歸屬(love and belonging)的需要是極為強烈的,缺乏該需求的人,往往會因為沒有感受到身邊人的關(guān)懷,而認為沒有價值活在這世界上。而對于開放域聊天機器人,市場往往會將其定位為陪伴,以提供一定程度的情感需求。因此,如何讓機器人感知用戶的喜怒哀樂并做情感陪伴,就有很大的必要性了。

這里分為兩塊,其一是如何識別用戶情緒;其二是機器人如何做情感反饋。

(1)情緒識別

我們暫不討論情感識別的技術(shù)識別,而是從產(chǎn)品側(cè)分析機器人要識別哪些情緒,從數(shù)據(jù)角度,就是劃分哪些數(shù)據(jù)作為情感分類。

情感有很多種,態(tài)度上有喜歡和討厭,心情上有悲傷和快樂,人際上有疏遠和冷漠,等等。選擇哪些情感場景做反饋,主要取決于兩點:

  1. 機器人定位:比如兒童陪伴場景,機器人對用戶的大部分情緒都應該有敏感的識別,才能讓兒童感受到陪伴的意義;而法律機器人的閑聊場景,很多情感問題可以不用太注重,機器人選擇統(tǒng)一回復即可。
  2. 機器人回復內(nèi)容的顆粒度:比如在兒童場景中,小朋友罵了臟話,其實不需要了解具體罵的啥內(nèi)容,都應該先引導小朋友文明用詞,所以臟話內(nèi)容的分類不需要太細,只要是臟話就做統(tǒng)一回復即可。

(2)情感反饋策略

當知道了用戶開心、失望還是憤怒的情緒之后,身為“朋友”的機器人就需要有所回應。針對不同的情緒分類,機器人可以有不同的策略。這里我們可以列一下兒童場景中集中回復策略:

用戶生氣(說臟話):小朋友不可以說臟話哦,這樣我就不想跟你玩了,我只想跟文明的小孩做朋友呢~(教育策略)

用戶生氣(無臟話):怎么了?有人惹你不開心了嗎?沒事,有小七陪著你舒緩心情呢~不如跟我一起聽首好聽的兒歌放松放松吧(引導兒童場景)

用戶失落:主人,成長路上有不開心的事情,也會有開心的事情呢~至少小七一直陪著主人。對咯,我剛聽了一個笑話,可笑死我了,我也讓主人開心一下吧~(引導笑話場景)

用戶害怕:主人你抱著我,就沒啥好怕的了,我們一起變勇敢!

用戶開心:主人開心,小七就更開心啦。但是,但是,你要陪小七讀詩詞的呢,不要忘了哦~(引導詩詞場景)

總而言之,機器人的情感陪伴的最終效果,應該是真正做到:不許騙我、罵我,要關(guān)心我;別人欺負我時,你要在第一時間出來幫我;我開心時,你要陪我開心;我不開心時,你要哄我開心。嗯,最佳損友!

7. 特別說明:敏感詞處理

根據(jù)2017年國家頒布的《網(wǎng)絡(luò)安全法》第47條和68條的規(guī)定,企業(yè)要保證自己的網(wǎng)絡(luò)運營平臺內(nèi)容安全,若出現(xiàn)敏感詞等違規(guī)行為將會收到行政處罰,甚至被勒令停業(yè)整改。而作為聊天機器人的產(chǎn)品設(shè)計者,需要保證機器人不亂說話,否則牽連成本巨大。

所以一般我們會設(shè)計一個敏感詞庫,并且做日常維護更新。有了敏感詞庫之后,我們來看機器人的回復語料來源,主要由三種渠道:(1)人工添加;(2)網(wǎng)上爬??;(3)自動生成。對于(1)(2),我們會考慮在錄入回復的地方做敏感詞過濾;而對于自動生成的回復,一般會在生成回復的時候,過濾掉敏感詞。

嗯,做個聰明的機器人,知道什么該說,什么不該說。

四、吹水是怎么練成的

這一章主要聊的是機器人的實現(xiàn)方式,除非是算法類的產(chǎn)品經(jīng)理,其他AI產(chǎn)品經(jīng)理的重點還在于用戶場景,所以這塊我們簡單聊一下即可(畢竟說了好多了,在這段感情中累了)。

1. 檢索式閑聊實現(xiàn)

基于對話式檢索的閑聊主要使用匹配句子相似度的方式,比如先將用戶消息及對話庫的分類轉(zhuǎn)換為句向量,再計算兩者之間的余弦距離以得到語義相似度,最終將相似度最高的分類對應回復話術(shù)返回給用戶。

想要轉(zhuǎn)換為句向量,由詞向量通過監(jiān)督方法或者無監(jiān)督方法獲得?,F(xiàn)在主流的詞向量模型有Word2Vec、BERT等。當獲得了詞向量之后,可以通過各類模型獲得,如CNN、跳躍思維向量、快速思維向量。

整體流程可以概括為:

(1)將query做分詞等預處理,再通過Word2Vec、BERT等模型將分詞結(jié)果轉(zhuǎn)化為詞向量,再利用快速思維向量、跳躍思維向量等方式獲取句向量

(2)將生成的句向量與模型模型已經(jīng)處理過的分類匹配,計算兩者余弦相似度,獲得相似度分值;

(3)根據(jù)分值排序,選擇最佳相似問句,將對應answer返回。

當然,之前算法大大分享過:由于語料庫巨大,如果每一條語料都與query計算,匹配效率會賊低。所以可以用一個高效的搜索引擎做粗粒度的篩選,選出候選答案,再進行向量方式處理。

2. 生成式閑聊實現(xiàn)

生成式聊天機器人采用端到端的深度學習模型,如seq2seq,會從海量對話數(shù)據(jù)中學習到問題和回復,從而對每條query都自動生成回復。翻譯過來就是,回復內(nèi)容不必預設(shè),全部讓機器人自己來生成。

一般可以通過LSTM等模型將輸入的序列映射為固定長度的向量,然后使用深度LSTM從向量中解碼得到目標輸出序列。

業(yè)界的觀點中,目前seq2seq的生成模型往往會出現(xiàn)安全回答的問題、機器人個性不一致的問題和多輪對話中的對話連續(xù)性問題。我司算法大大跟我說過,這類情況也不是沒辦法解決,一般會在生成模型中加入外部知識(如小冰的話題模型以及情感分類模型)來讓回復更有意義。

當然,在小七的觀點中,生成模型不只是會出現(xiàn)這三個問題,我們剛才講到的吹水策略,才是閑聊機器人的重點價值體現(xiàn)。生成式雖然可以保證每條消息都能有所答復,但朋友間的閑聊,不在于有話必應,而在于用心溝通,用心交往。

當然,我也曾經(jīng)天真地設(shè)想過一個方案:利用檢索式滿足策略回復同時,對于大量長尾的query,可以用生成回復,并引用情感等模型來保證回復內(nèi)容更有意義,這個顧全大局但ROI賊低的方案活生生就被算法大大一句“天真”懟回來了,哈哈哈哈哈~

五、怎么知道吹得好不好

當我們將一個閑聊機器人構(gòu)建完成并且上線了,不代表產(chǎn)品經(jīng)理的工作就完成了。我們需要通過數(shù)據(jù),了解機器人吹水能力是不是OK的,是不是真的達到用戶預期。

平日里我們說一個人溝通能力強,能夠和任何人談笑風生,但并沒有一個標準,往往都是主觀判斷。而機器人是一個產(chǎn)品,產(chǎn)品經(jīng)理始終需要找到可以衡量價值的指標,才能證明這個閑聊機器人是否真的滿足用戶需求。

如上圖所示,從不同的目標來看,產(chǎn)品經(jīng)理需要關(guān)注不同的指標,比如我們設(shè)計了一款兒童陪伴硬件機器人,從上往下都有不同的指標。

對于企業(yè)來說,首先關(guān)注的就是好不好賣。產(chǎn)品經(jīng)理就需要根據(jù)銷售量情況,去設(shè)計場景和亮點,保證產(chǎn)品側(cè)對銷售量的提升。

從用戶角度來說,產(chǎn)品經(jīng)理就需要關(guān)注其使用情況,大部門閑聊場景都是To C,所以避免不了要關(guān)注留存、活躍,也只有這兩個指標上去了,才能體現(xiàn)機器人陪伴的意義。其次,我們也需要關(guān)注每次對話的輪次,來了解用戶是否愿意聊下去,也就是業(yè)界所說的CPS(單輪對話次數(shù))。

從功能來說,產(chǎn)品經(jīng)理需要考慮每個技能的使用情況,包括每個技能、場景的觸發(fā)率、完成率、留存率。這類指標可以說是對整體留存、活躍、CPS的深層次現(xiàn)象探究,比如哪些場景的觸發(fā)率高,從而提升了cps;哪些技能完成率低,導致整體活躍降低。

最后,機器人是一個智能化系統(tǒng),自身也應該有一些客觀標準來衡量其智能化程度。因為我們討論的主要是基于檢索式的閑聊系統(tǒng),其常用評判標準有召回率、精準率和F-測度。

 

本文由 @steseven 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!