日韩精品国产自在久久现线拍,亚洲最新无码aⅴ在线播放

搜索

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業(yè)技能直播

會員專屬社群

榮耀標識

發(fā)布

注冊 | 登錄

從開放域機器人構(gòu)建出發(fā)，聊聊如何與機器人吹水

steseven

2020-02-13

0 評論 4023 瀏覽 17 收藏

35 分鐘

作者從自己的實際工作出發(fā)，以兒童機器人場景為例，從多個角度對如何構(gòu)建閑聊機器人進行了闡述，并分享了與機器人“吹水的”價值、方式方法以及背后原理。

一、機器人概述

機器人按照對話方式，可以分為“問答機器人”、“任務對話機器人”、“開放閑聊機器人”。但機器人的落地使用過程中，往往需要不同作用的機器人進行結(jié)合。

拿電器類客服機器人舉例來說，會有如下對話：

用戶：“包安裝嗎”

機器人：”我們是包安裝的哦，親“

以上是我們最常見的問答場景，機器人通過檢索方式，找出query對應的answer返回給用不。

再比如：

用戶：“我要查物流”

機器人：“您要查詢的是哪個訂單”（提供訂單A&訂單B&訂單C）

用戶：選擇A

機器人：該貨品目前已經(jīng)由順豐發(fā)出。

在以上場景中，機器人需要通過多輪方式完成查物流的任務。

這就像咱人一樣，在工作中，不僅需要有決策和解決問題的能力，還需要有日常溝通能力，任何一項都是不可或缺的。

由于工作中接觸了各類機器人，對于開放域聊天內(nèi)容的感觸比較深的是，閑聊本身在機器人的場景中，作用會相對弱一些，但大部分時候，又屬于機器人的基本能力，屬于典型的“得不到的永遠在騷動，得到的有恃無恐”。

而目前市面上的機器人介紹文檔，一方面關(guān)于閑聊的內(nèi)容不多，絕大部分是任務型和檢索性的文章；另一方面，閑聊的介紹更偏向于技術(shù)實現(xiàn)方式。但小七我認為，想要做好開放域聊天，其實不能只考慮技術(shù)實現(xiàn)，而應該從產(chǎn)品本身出發(fā)。

所以今天，小七結(jié)合之前做開放域機器人的實操過程，主要以兒童機器人場景為例子，從不同角度來闡述如何構(gòu)建閑聊機器人，跟著我燥起來！

二、吹水的價值

閑聊，俗稱“吹水”。朋友間吹水，講究開心就好。所以，閑聊是一個雙方都帶有情感訴求的過程，可以是解悶逗樂，也可以是哭訴慰藉。

基于此，如果用戶與機器人進行閑聊互動，必定是希望機器人能引起其情感的共鳴和變化。如下對話是用戶跟“小愛同學”（小米音箱）的對話：

用戶：小愛同學，放個屁

robot：矮油，人家是女孩紙，怎么會做這么羞羞的事情。既然主人想要聽放屁，我就勉為其難放一個，放的不好可不許怪我哦。

噗~~

用戶在這次對話中，讓小愛同學放屁，純粹是逗樂找趣。同時，機器人的反應也是有一定套路，讓用戶感受到，這是一個可以給自己帶來樂趣的朋友。

當一個朋友情商特別高，能夠在自己傷心時給予安慰，無聊時帶來樂趣，開心時互相分享，任何一個人都會很感激有這樣的益友，讓人離不開。

比如用戶面前有一個娛樂機器人，前者習慣性會以人與人交流的形式來進行對話。這時候，機器人不能而不是“直男”，顧著解決問題，也應該是一個情商高的朋友，感知用戶的情感，并在回復時伴隨著相應的情感，讓用戶感受到樂趣和溫度。

只有這樣子，用戶才能與機器人做更多交互，提高用戶粘性，而不是“仰天嘲笑出門去，AI都是智障人”？

三、如何吹水

用戶如果有意和機器人扯犢子吹水，必然會有”像人“的期望值。這個標準說起來簡單，做起來相當?shù)秒y，畢竟nlp技術(shù)還真沒達到完全理解人類的水平。

如果我們換個角度，如《西部世界》中所講，機器人如果擁有了記憶，便開始進化成有意識的生物了。同樣的，對于【像人】（類似有意識）這個狀態(tài)，我們可以抽象出一些特質(zhì)，機器人如果擁有了這些特征后，能讓用戶覺得還不錯，愿意聊下去。

那以下是筆者從過往做閑聊機器人過程中所抽象出的特質(zhì)，下面會一一做介紹。

1. 人設(shè)一致性

（1）人設(shè)一致性的意義

每個社會人都有自己統(tǒng)一的人設(shè)，包括身份、性別、形象、性格、愛好等，人與人之間也是基于這個“本”在對話。即使是路上的陌生人問路，也會先根據(jù)對方的形象、性別稱呼，比如路上經(jīng)常有人找我問路，都會說：“你好，帥哥”。而這稱呼，本身就是一個人物設(shè)定的表現(xiàn)。如果一個人人設(shè)不一致，有時候東，有時候西，那要么是這個人太戲精，要么就是神經(jīng)錯亂，比如下面這個人：

A：你是誰

B：我是來自廣東的產(chǎn)品經(jīng)理

A：那你平時工作都在干嘛

B：我在畫建筑設(shè)計圖，敲代碼，修空調(diào)。

A：（這恐怕是個假的產(chǎn)品經(jīng)理吧）

機器人也一樣，需要立個人設(shè)在用戶前面，才能讓后者有真實感，安全感。如果機器人沒有人設(shè)，會讓聊天變得異常怪異。有時候回答不上來、有時候亂回答，有時候上句不接下句，用戶會認為亂七八糟，溝通不了。就如Cathy Pearl在《語言用戶界面設(shè)計》中所說：“人物模型的一致性，使人們能夠在與它們溝通時得以預測接下來會發(fā)生什么”。

（2）設(shè)計方式

那我們要如何設(shè)定機器人的人設(shè)呢？平時我們要了解一個人，一般會從其背景信息出發(fā)，如名字、家鄉(xiāng)、職業(yè)、愛好等；其次，通過其談吐舉止，也可以了解一個人的性格特征。

關(guān)于機器人的背景，我們需要給到它一個故事?！段鞑渴澜纭分?，每個機器人都有自己的身份和劇本。但用戶會問機器人的哪些背景信息呢？事實是，不大可能枚舉出一個人的所有背景信息，就連人都可能忘了自己很多以前的事兒。

這里我們可以從日常提問（高頻問題）入手。以兒童機器人為例，在我們之前做的項目中，從線上交互數(shù)據(jù)看出，咨詢機器人背景信息的query占了所有交互數(shù)據(jù)的10%以上。這類問題包括：

機器人的身份是什么？姓名、年齡、生日、星座、家鄉(xiāng)等
機器人的能力是什么？
機器人的愛好是什么？
機器人的家庭背景、社交背景是怎么樣的？

另一方面，我們需要設(shè)計機器人的性格特點，以此來體現(xiàn)其談吐。性格特點可以是風趣、自信、忠誠，亦或是調(diào)皮、溫暖、腹黑。

最終我們可以有這么一個故事：

我們要創(chuàng)造一個兒童機器人，叫小七，男生，獅子座，關(guān)鍵很帥，來自泰坦星永恒一組，由于星球瀕臨滅絕，爸爸媽媽送他到了地球，所以他留在地球和人類愉快地生活。小七性格幽默，樂于助人，但有時候也有些腹黑，教育小朋友。

（3）產(chǎn)品舉例

筆者也找了市面上做botframework的平臺，這類產(chǎn)品的側(cè)重點主要在于技能定制及模型訓練，而對于人設(shè)很少涉及。后面發(fā)現(xiàn)以下兩個平臺有相關(guān)設(shè)定，其中：圖靈機器人涉及到的屬性有性別、年齡、星座、爸爸媽媽；海知涉及的屬性包括姓名、性別、生日、喜好和爸爸媽媽。人設(shè)內(nèi)容不多，但這類機器人基礎(chǔ)配置，還是必不可少的。

圖靈機器人人設(shè)頁面：

海知ruyi機器人人設(shè)頁面：

2. 語言風格設(shè)定

（1）意義與設(shè)計方式

語言風格首先要符合人設(shè)特點。幽默的性格，機器人的回復就需要搞笑輕松一些，若是嚴謹?shù)男愿瘢瑱C器人說話就需要嚴肅。想象一下，一個在法院的政務機器人，當你問它你會啥的時候，它說會泡妞撩妹，那場面真的會難以控制。

比如前面提到的小七喜歡掉書袋，那我們可以在小孩子玩游戲很久之后，提醒小朋友需要休息一下，然后看看書，或者引導其來學習古詩詞。

確定了語言風格之后，就需要將這種性格特點體現(xiàn)在機器人的對話中。我們可以從用戶所有query中，抽象高頻場景進行針對性設(shè)定，使得機器人人設(shè)和說話風格一致，更像一個人在聊天，這也是我們最終的預期效果。

而在這個過程中，為了讓機器人顯得更加擬人化，我們也嘗試加入了一些類似口頭禪的feature，比如有的人習慣以“呃”來開始，有的人喜歡說“然后”來銜接。

（2）產(chǎn)品舉例

在以往例子中，我們所發(fā)現(xiàn)的其中一個高頻場景是：用戶會重復問同一個問題（不知道是不是都是一些智能程度檢驗師在聊天，尷尬）。這種情況是極不建議機器人一直是單一回復，那就成了一個對話復讀機了。而微軟小冰對于用戶這種互動，結(jié)合了她自己的人設(shè)和語言風格來回應（比如：撒嬌、傲氣）。

我們可以探索下微軟小冰的策略：

小冰的策略是，針對同個問題，給出不同的回復。若用戶重復太多次，小冰會有情緒的變化，慢慢地顯得不耐煩，并且開始責怪用戶，到最后干脆不回答了，直到用戶說其他內(nèi)容，就回復“你終于不說重復的話啦~”。從中我們可以看出，小冰的語言是很活動調(diào)皮并且較為傲嬌的。

也只有這樣豐富的語言體現(xiàn)，用戶才更相信對面是個可以聊天的朋友，而不是一個無聊的智障機器人。

3. 個性化

（1）個性化意義

如同政治課本中的一句話：世界上不會有完全一樣的葉子。即使如雙胞胎，也會有各自的個性。我們過往發(fā)生的每件事情，讓我們形成了特有的世界觀，價值觀，人生觀。三觀決定了每個人的思想不同，而語言是思想的折射，從而讓每個人談吐都是與眾不同的。

相應的，機器人也應該有自己的過往記憶，從而形成自己與眾不同的三觀。這樣，每個機器人都是個性化的，就跟我們不同性格的朋友一樣。

（2）設(shè)計方式

當然，如果要記住所有的事情，對于機器人來說是困難的，也會顯得沒有意義，畢竟人也有記性差的時候。那機器人需要有什么記憶呢？除了剛才的背景信息，最重要的，是要記住它的主人，即用戶。

也就是說，機器人需要能記住自己主人相關(guān)的信息，包括姓名、性別、愛好等方面，甚至某些過往的交互行為。這樣，當某個用戶A擁有了一款能記住機子的機器人，即使市面上有其他機器人，對用戶來說，這個機器人小伙伴都是獨一無二的。

那要記住用戶，首先得有個收集用戶畫像的過程。這各場景就跟男生想要了解妹紙一樣，要么是自己主動了解（撩），要么是自己通過細心觀察（備胎式方案），被動了解。

1）主動了解型

如果機器人想主動去了解用戶，就需要找準時機，否則會顯得十分突兀，甚至讓用戶產(chǎn)生防備心理。

一般來說，最好的時機，應該是兩個朋友相互了解的時候。具體我們可以看以下例子：

用戶：你叫什么名字呀？

機器人：我叫小七。主人你呢？

用戶：我叫小八，你好呀。

機器人：你好，小八。我知道自己主人叫啥了，好開心！

用戶：你會做什么呢？

機器人：唱歌跳舞，啥都會呢。小八，你平時喜歡干什么呢？

用戶：我也喜歡唱歌呢。

機器人在這樣的互動中，能夠了解到用戶的興趣愛好，并記憶下來。而用戶也會覺得這個機器人真的像自己的玩伴，從而更愿意與其玩下去。

2）細心觀察型

當然，如果機器人能夠細心留意用戶以往說的話，也可以從中了解很多信息，從而做出很驚艷的交互表現(xiàn)。比如：

（早上）

用戶：早上好

機器人：早上好，小八。今天周末天氣很好，小八有打算去哪里玩嗎？

用戶：今天要跟爸爸媽媽去動物園。

機器人：聽起來很棒呀。要玩得開心哦

（晚上）

用戶：晚上好。

機器人：小八呀，今天去動物園玩了一天，能跟我講講都玩了什么了嗎

用戶：我今天看了斑馬、獅子、孔雀。。。。

機器人：好像很好玩呀。下次小八帶著小七一起去，好不好

機器人不僅能記憶，而且記性也好，讓小朋友感覺真的有在關(guān)注自己，也讓家長相信機器人確實是一個好陪伴，讓孩子不會孤單。

通過這樣的記憶，讓每個機器人都成為特有的存在。每個小朋友都有陪伴自己成長的專屬的玩伴。

P.S.當家里有兩個小朋友的時候，如果希望機器人能夠記住用戶是誰，我們也可以通過聲紋識別方式記住不同用戶的名稱。

4. 主動引導

（1）意義

一個相對智能的吹水機器人算是擺在這里了。但事實告訴我們，如果只是這樣，用戶不會一直和他聊下去。市面上很多機器人會宣稱自己有很多能力，可以陪伴小孩子，還可以教小朋友數(shù)學、英語等等。咱先不說這些能力有沒有用，好不好玩，到底能不能被用戶觸發(fā)，才是首要考慮的問題。

想象一下，兩個人在聊天，永遠是其中一方在找話題，另一方只是在附和，就算話癆也不可能永遠有話題。而且，用戶往往不知道要和機器人聊啥，尷尬的氣氛會讓前者失去聊下去的興趣。所以，通過機器人主動引導來找話題，從而讓用戶不斷來聊天，便顯得尤為重要。

（2）設(shè)計方式

設(shè)計主動引導的時候，產(chǎn)品經(jīng)理需要講究策略，主要解決三個關(guān)鍵點：內(nèi)容、時機、話術(shù)。

1）引導內(nèi)容

選擇引導什么內(nèi)容，這個取決于機器人的能力和定位，比如一個寓教于樂的機器人，應該多讓小朋友做數(shù)字游戲、詩詞游戲等互動。同時，機器人如果學習（上線）了一些新的能力，也需要及時引導用戶來體驗，保證用戶的活躍度。

2）引導時機

對于時間點的問題，我們可以選擇在開頭、過程中以及結(jié)尾三個timing去觸發(fā)。

比較常見會在用戶喚醒機器人時候去引導其體驗能力，如下case便是小度音箱在過年期間的能力引導，會在用戶開始閑聊之后，直接推薦響應技能。

user：小度小度，晚上好

小度：晚上好呀。先來看看明天的天氣吧，稍后還有精彩節(jié)目等著你哦~

小度：明天天氣xxxxx

小度：我為您整理了一些收聽率很高的節(jié)目，聽聽看吧，覺得不喜歡可以跟我說“換個臺”

但如果每次都在喚醒時引導就會顯得特別生硬。我們想象一下，兩個朋友在扯皮吹水，一般是從一個話題突然想到其他話題就開聊了。同理，用戶跟機器人聊天，也應該允許雙方聊著聊著就扯到其他話題的。

我們也不必在所有聊天內(nèi)容中去想辦法做話題引導。首先，應該找出用戶的高頻聊天場景中，比如小朋友會經(jīng)常讓機器人講笑話，講完后就可以引導做其他寓教于樂的游戲。當然，實際情況不可能如此簡單暴力，觸發(fā)條件需要做權(quán)重計算，包括用戶各類技能的觸發(fā)次數(shù)、其他引導場景的觸發(fā)頻率、歷史引導的用戶反饋（如用戶說：我不喜歡）等。

最后就是在結(jié)尾的timing做引導，也就是當雙方都陷入沉默的尷尬氣氛的時候。拿小米音箱舉例，由于是全雙工喚醒，當用戶每隔15s沒有說話，則會主動引導一次，連續(xù)三次引導無果才會退出喚醒狀態(tài)。比如：“主人你去哪兒了？告訴你哦，我最近新學了一項技能，要不要跟我一起玩呢”。這樣可以引起用戶聊下去的興趣，開始新的話題，保證cps的數(shù)據(jù)上漲。

3）引導話術(shù)

至于最后的引導話術(shù)，因為不同場景的話術(shù)是不一樣的，所以要保證與我們先前講的語言風格一致，至少不能讓一個很嚴肅的學霸型機器人突然撒嬌說：“跟人家聊點別的東東嘛~”

5. 趣味性

所謂好看的皮囊千篇一律，有趣的靈魂萬里挑一。說到底，一個chatbot如果不好玩，再怎么折騰也沒用。另一方面，聊天機器人始終是一個To C的產(chǎn)品，通過運營好玩的內(nèi)容，保證活躍和留存是相當重要的。這往往能給到用戶意想不到的驚喜，從而產(chǎn)生持續(xù)對話的興趣。

如何讓閑聊變得好玩，就不得不提小冰的套路了。一方面，小冰日常會更新技能，不斷刺激用戶去體驗；另一方面，也會在各種聊天中皮一皮，讓用戶相信這是個有趣的“朋友”，比如上文提到的對于用戶故意使壞，一直重復單句的場景。

再比如，小冰曾經(jīng)更新一個“讀心術(shù)”的技能，也就是在15個問題之內(nèi)猜出用戶心里想的人物是誰。利用ID3決策樹等算法先將人物及特征作為訓練樣本，再讓小冰反問用戶，為每個特征分類，最后選中用戶的“心上人”。

通過這一個個的小游戲，可以讓用戶不斷產(chǎn)生愉悅感及下次的期待感，朋友之間也是這樣，總有一些共同話題和興趣活動，才能讓雙方成為知己。

之前設(shè)計閑聊機器人時，小七也設(shè)定了某些套路策略。比如情人節(jié)前后的土味情話，每天用戶開始進行互動的時候，以主動消息的方式來發(fā)土味情話。當時每天的土味情話在情人節(jié)期間還是帶來了不少的留存和活躍的。在實現(xiàn)方式上也比較簡單，直接利用規(guī)則設(shè)定即可，ROI還是挺高的。

user：打開聊天女仆

bot：主人你好呀。啊，你有沒有聞到什么味道？

user：沒有啊/什么味/…

bot：怎么你一出來空氣就甜炸了啊

同樣的，兒童機器人更需要這樣的趣味性和新鮮感，畢竟兒童天性就是“喜新厭舊”。如果小玩伴每天都是玩同樣的游戲，說同樣的話，到最后一定“沒朋友”。所以可以加入寓教于樂的兒童游戲，日常更新的兒童笑話，兒童故事，來吸引小朋友的注意，讓孩子喜歡上這個玩伴。

6. 情感

根據(jù)馬斯洛的需求層次理論，情感和歸屬（love and belonging）的需要是極為強烈的，缺乏該需求的人，往往會因為沒有感受到身邊人的關(guān)懷，而認為沒有價值活在這世界上。而對于開放域聊天機器人，市場往往會將其定位為陪伴，以提供一定程度的情感需求。因此，如何讓機器人感知用戶的喜怒哀樂并做情感陪伴，就有很大的必要性了。

這里分為兩塊，其一是如何識別用戶情緒；其二是機器人如何做情感反饋。

（1）情緒識別

我們暫不討論情感識別的技術(shù)識別，而是從產(chǎn)品側(cè)分析機器人要識別哪些情緒，從數(shù)據(jù)角度，就是劃分哪些數(shù)據(jù)作為情感分類。

情感有很多種，態(tài)度上有喜歡和討厭，心情上有悲傷和快樂，人際上有疏遠和冷漠，等等。選擇哪些情感場景做反饋，主要取決于兩點：

機器人定位：比如兒童陪伴場景，機器人對用戶的大部分情緒都應該有敏感的識別，才能讓兒童感受到陪伴的意義；而法律機器人的閑聊場景，很多情感問題可以不用太注重，機器人選擇統(tǒng)一回復即可。
機器人回復內(nèi)容的顆粒度：比如在兒童場景中，小朋友罵了臟話，其實不需要了解具體罵的啥內(nèi)容，都應該先引導小朋友文明用詞，所以臟話內(nèi)容的分類不需要太細，只要是臟話就做統(tǒng)一回復即可。

（2）情感反饋策略

當知道了用戶開心、失望還是憤怒的情緒之后，身為“朋友”的機器人就需要有所回應。針對不同的情緒分類，機器人可以有不同的策略。這里我們可以列一下兒童場景中集中回復策略：

用戶生氣（說臟話）：小朋友不可以說臟話哦，這樣我就不想跟你玩了，我只想跟文明的小孩做朋友呢～（教育策略）

用戶生氣（無臟話）：怎么了？有人惹你不開心了嗎？沒事，有小七陪著你舒緩心情呢～不如跟我一起聽首好聽的兒歌放松放松吧（引導兒童場景）

用戶失落：主人，成長路上有不開心的事情，也會有開心的事情呢~至少小七一直陪著主人。對咯，我剛聽了一個笑話，可笑死我了，我也讓主人開心一下吧～（引導笑話場景）

用戶害怕：主人你抱著我，就沒啥好怕的了，我們一起變勇敢！

用戶開心：主人開心，小七就更開心啦。但是，但是，你要陪小七讀詩詞的呢，不要忘了哦～（引導詩詞場景）

總而言之，機器人的情感陪伴的最終效果，應該是真正做到：不許騙我、罵我，要關(guān)心我；別人欺負我時，你要在第一時間出來幫我；我開心時，你要陪我開心；我不開心時，你要哄我開心。嗯，最佳損友！

7. 特別說明：敏感詞處理

根據(jù)2017年國家頒布的《網(wǎng)絡(luò)安全法》第47條和68條的規(guī)定，企業(yè)要保證自己的網(wǎng)絡(luò)運營平臺內(nèi)容安全，若出現(xiàn)敏感詞等違規(guī)行為將會收到行政處罰，甚至被勒令停業(yè)整改。而作為聊天機器人的產(chǎn)品設(shè)計者，需要保證機器人不亂說話，否則牽連成本巨大。

所以一般我們會設(shè)計一個敏感詞庫，并且做日常維護更新。有了敏感詞庫之后，我們來看機器人的回復語料來源，主要由三種渠道：（1）人工添加；（2）網(wǎng)上爬??；(3）自動生成。對于（1）（2），我們會考慮在錄入回復的地方做敏感詞過濾；而對于自動生成的回復，一般會在生成回復的時候，過濾掉敏感詞。

嗯，做個聰明的機器人，知道什么該說，什么不該說。

四、吹水是怎么練成的

這一章主要聊的是機器人的實現(xiàn)方式，除非是算法類的產(chǎn)品經(jīng)理，其他AI產(chǎn)品經(jīng)理的重點還在于用戶場景，所以這塊我們簡單聊一下即可（畢竟說了好多了，在這段感情中累了）。

1. 檢索式閑聊實現(xiàn)

基于對話式檢索的閑聊主要使用匹配句子相似度的方式，比如先將用戶消息及對話庫的分類轉(zhuǎn)換為句向量，再計算兩者之間的余弦距離以得到語義相似度，最終將相似度最高的分類對應回復話術(shù)返回給用戶。

想要轉(zhuǎn)換為句向量，由詞向量通過監(jiān)督方法或者無監(jiān)督方法獲得?，F(xiàn)在主流的詞向量模型有Word2Vec、BERT等。當獲得了詞向量之后，可以通過各類模型獲得，如CNN、跳躍思維向量、快速思維向量。

整體流程可以概括為：

（1）將query做分詞等預處理，再通過Word2Vec、BERT等模型將分詞結(jié)果轉(zhuǎn)化為詞向量，再利用快速思維向量、跳躍思維向量等方式獲取句向量

（2）將生成的句向量與模型模型已經(jīng)處理過的分類匹配，計算兩者余弦相似度，獲得相似度分值；

（3）根據(jù)分值排序，選擇最佳相似問句，將對應answer返回。

當然，之前算法大大分享過：由于語料庫巨大，如果每一條語料都與query計算，匹配效率會賊低。所以可以用一個高效的搜索引擎做粗粒度的篩選，選出候選答案，再進行向量方式處理。

2. 生成式閑聊實現(xiàn)

生成式聊天機器人采用端到端的深度學習模型，如seq2seq，會從海量對話數(shù)據(jù)中學習到問題和回復，從而對每條query都自動生成回復。翻譯過來就是，回復內(nèi)容不必預設(shè)，全部讓機器人自己來生成。

一般可以通過LSTM等模型將輸入的序列映射為固定長度的向量，然后使用深度LSTM從向量中解碼得到目標輸出序列。

業(yè)界的觀點中，目前seq2seq的生成模型往往會出現(xiàn)安全回答的問題、機器人個性不一致的問題和多輪對話中的對話連續(xù)性問題。我司算法大大跟我說過，這類情況也不是沒辦法解決，一般會在生成模型中加入外部知識（如小冰的話題模型以及情感分類模型）來讓回復更有意義。

當然，在小七的觀點中，生成模型不只是會出現(xiàn)這三個問題，我們剛才講到的吹水策略，才是閑聊機器人的重點價值體現(xiàn)。生成式雖然可以保證每條消息都能有所答復，但朋友間的閑聊，不在于有話必應，而在于用心溝通，用心交往。

當然，我也曾經(jīng)天真地設(shè)想過一個方案：利用檢索式滿足策略回復同時，對于大量長尾的query，可以用生成回復，并引用情感等模型來保證回復內(nèi)容更有意義，這個顧全大局但ROI賊低的方案活生生就被算法大大一句“天真”懟回來了，哈哈哈哈哈~

五、怎么知道吹得好不好

當我們將一個閑聊機器人構(gòu)建完成并且上線了，不代表產(chǎn)品經(jīng)理的工作就完成了。我們需要通過數(shù)據(jù)，了解機器人吹水能力是不是OK的，是不是真的達到用戶預期。

平日里我們說一個人溝通能力強，能夠和任何人談笑風生，但并沒有一個標準，往往都是主觀判斷。而機器人是一個產(chǎn)品，產(chǎn)品經(jīng)理始終需要找到可以衡量價值的指標，才能證明這個閑聊機器人是否真的滿足用戶需求。

如上圖所示，從不同的目標來看，產(chǎn)品經(jīng)理需要關(guān)注不同的指標，比如我們設(shè)計了一款兒童陪伴硬件機器人，從上往下都有不同的指標。

對于企業(yè)來說，首先關(guān)注的就是好不好賣。產(chǎn)品經(jīng)理就需要根據(jù)銷售量情況，去設(shè)計場景和亮點，保證產(chǎn)品側(cè)對銷售量的提升。

從用戶角度來說，產(chǎn)品經(jīng)理就需要關(guān)注其使用情況，大部門閑聊場景都是To C，所以避免不了要關(guān)注留存、活躍，也只有這兩個指標上去了，才能體現(xiàn)機器人陪伴的意義。其次，我們也需要關(guān)注每次對話的輪次，來了解用戶是否愿意聊下去，也就是業(yè)界所說的CPS（單輪對話次數(shù)）。

從功能來說，產(chǎn)品經(jīng)理需要考慮每個技能的使用情況，包括每個技能、場景的觸發(fā)率、完成率、留存率。這類指標可以說是對整體留存、活躍、CPS的深層次現(xiàn)象探究，比如哪些場景的觸發(fā)率高，從而提升了cps；哪些技能完成率低，導致整體活躍降低。

最后，機器人是一個智能化系統(tǒng)，自身也應該有一些客觀標準來衡量其智能化程度。因為我們討論的主要是基于檢索式的閑聊系統(tǒng)，其常用評判標準有召回率、精準率和F-測度。

本文由 @steseven 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)作者許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于CC0協(xié)議。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App