“閑聊”的當(dāng)前現(xiàn)狀及未來展望
“閑聊”短時(shí)間內(nèi)還是需要產(chǎn)品驅(qū)動(dòng),而長時(shí)間則可能是依賴技術(shù)驅(qū)動(dòng)。
現(xiàn)狀梳理
人機(jī)對話的發(fā)展還處在起步階段,音箱之間的大戰(zhàn)就是一個(gè)很好的開始,未來會(huì)有更多的設(shè)備被賦予對話的能力。
目前整個(gè)過程最大的問題在于自然語言處理(即NLP),在這個(gè)NLP中最不好處理的就是開放域的閑聊了,這也是無論那個(gè)公司的”對話系統(tǒng)(廣義上的語音交互設(shè)備所搭載的系統(tǒng))“,都會(huì)出現(xiàn)答非所問的情況。
用戶體驗(yàn)角度
1. 了解競品(這里指狹義上的競品)
目前知名度最高的閑聊機(jī)器人就是小冰,小冰也是業(yè)內(nèi)首個(gè)提出用“交互次數(shù)(即CPS)”來作為衡量閑聊質(zhì)量的方式,而其他公司大多都還在用“單輪準(zhǔn)確率”來衡量聊天的好壞,這里最大的問題是評判標(biāo)準(zhǔn)過于主觀。當(dāng)然也有公司以其他相關(guān)轉(zhuǎn)化率為目標(biāo),不在分析范圍內(nèi)。
所以這里主要分為:以提升CPS為目標(biāo)的小冰和以提升單輪準(zhǔn)確率為目標(biāo)的其他公司。
2. 競品優(yōu)劣
前面已經(jīng)分析過了,各個(gè)公司的優(yōu)化目標(biāo)不同,所以他們出現(xiàn)的問題也會(huì)有所差異。
小冰:由于小冰以CPS為目標(biāo),所以導(dǎo)致小冰非常善于引導(dǎo)對話,也就是說小冰的主動(dòng)性太強(qiáng)了,就像你有一個(gè)非常愛嘮嗑的朋友,時(shí)不時(shí)還帶著你一起跑題。帶來的問題就是小冰常常會(huì)回復(fù)的答非所問,讓人感覺不知所云。
還有小冰為了實(shí)現(xiàn)上下文的關(guān)聯(lián)性,他們聊天庫的語料是進(jìn)行分類的,也就是當(dāng)你談到某個(gè)話題時(shí),他會(huì)在當(dāng)前的聊天中,固定出現(xiàn)該話題的語料,使用戶感覺到一直再聊一個(gè)事情。帶來的問題就是和小冰閑聊很難跳出該話題,不能夠更靈活的應(yīng)對用戶的反饋。
其他公司:那些重視單輪準(zhǔn)確率的閑聊,單獨(dú)拿出來每句話看,給人的感覺是很難區(qū)分這是人還是機(jī)器人。但是整體一起看,很容易就能看出來,其中前后矛盾,指代不明的現(xiàn)象頻繁出現(xiàn),很難堅(jiān)持聊下去。
由于為了提高單輪準(zhǔn)確率,最簡單的方式補(bǔ)充聊天庫,即Q-A語料。這時(shí)候的閑聊機(jī)器人是被動(dòng)的,也就是你問他,他才會(huì)回復(fù),當(dāng)你不知道該說什么的時(shí)候,對話就結(jié)束了。
綜合考慮,就用戶體驗(yàn)的角度來講,CPS為目標(biāo)更加客觀,更能滿足用戶的需求。
3. 潛在價(jià)值
閑聊無用論現(xiàn)在是大家的共識,這也是除小冰外,很少見大公司把這個(gè)當(dāng)作核心來做。其實(shí)這主要因?yàn)闆]有明確的商業(yè)模式,而且技術(shù)瓶頸明顯,但是市場規(guī)模還是很大的。因?yàn)榱奶鞂υ捠侨祟惖奶煨?,每個(gè)人都需要一個(gè)可以說心里話的人,目前技術(shù)是主要瓶頸,無法支撐開放域的自由對話,讓人感覺沒有人會(huì)和機(jī)器人聊天。
想要從閑聊的角度抓住用戶,那一定是要滿足情感的需求。
技術(shù)解決角度
面對開放域閑聊各種各樣的問題,也有各種各樣的解決方法,我按照自己的理解,大致分為三種方式算法、正則、兜底。
1. 算法
隨著深度學(xué)習(xí)的發(fā)展,算法這個(gè)詞逐漸進(jìn)入人們眼中,給人一種高深莫測的感覺,但是在自然語言處理中,所能起到的作用還是很有限的。按照回復(fù)方式,現(xiàn)在算法主要分為:匹配算法(計(jì)算兩個(gè)句子的是否匹配)、解析算法(先給輸入進(jìn)行分類,再按照預(yù)設(shè)類別回復(fù))和生成算法(直接生成回復(fù))
匹配算法:這應(yīng)該是閑聊最重要的算法了,主要是從海量聊天庫中找到相似的句子,和搜索用到的算法較一致。
解析算法:目前很多公司都用到了,主要就是通過模型對輸入進(jìn)行分類,也是目前算法的主流用法。
生成算法:很少有公司用這類算法,主要還是回復(fù)結(jié)果并不可控,據(jù)說中文版的小冰有10%的回復(fù)使用該算法。
2. 正則
正則指得就是正則表達(dá)式,這是比較傳統(tǒng)的方式,雖然簡單,但是效果立竿見影。這種方式在技能上比較常見,我覺得正則即可以準(zhǔn)確到完全匹配,也可以泛化到關(guān)鍵詞回復(fù)。
3. 隨機(jī)
所謂隨機(jī)就是不做任何解析,隨機(jī)回復(fù)我們預(yù)設(shè)好的回復(fù)。這往往用來解決超過機(jī)器人能力范圍時(shí),給用戶的一個(gè)反饋。在明知無法滿足用戶需求的情況下,回復(fù)的話術(shù)就會(huì)很重要,不同產(chǎn)品需要不同的設(shè)計(jì)思路。
語言的本質(zhì)
之前在一篇文章當(dāng)中看到一個(gè)對語言本質(zhì)的理解,說“語言時(shí)思維的映射”。也就是說如果你不會(huì)思考,那么你的語言終究是假的,是存在于表面的。而現(xiàn)在的深度學(xué)習(xí),也只是在利用大量的數(shù)據(jù)進(jìn)行特征提取,并沒有因果關(guān)系的推理,所以當(dāng)前的深度學(xué)習(xí)在NLP領(lǐng)域,能力有限。而想要實(shí)現(xiàn)真正像人一樣的閑聊,還是需要一定的時(shí)間,短時(shí)間內(nèi)無法速成。
未來展望
理解了閑聊的現(xiàn)狀,想象一下閑聊的未來,目前閑聊在對話系統(tǒng)中的位置可能如下:
1. 隨著人機(jī)對話的普及,會(huì)有越來越多的產(chǎn)品搭載對話系統(tǒng),閑聊將長時(shí)間會(huì)作為一個(gè)”兜底“的存在,用來解決技能以外的輸入。當(dāng)技能識別率和技能資源趨于一致的情況下,對話系統(tǒng)中的閑聊將會(huì)成為一個(gè)加分項(xiàng)的。
2. 閑聊如果可以收集到用戶畫像,那么基于閑聊的推薦系統(tǒng)將會(huì)發(fā)揮很大的作用,這個(gè)需要根據(jù)不同的產(chǎn)品進(jìn)行設(shè)計(jì)。如果做推薦,想到最好的入手點(diǎn)還是前面說到的情感,情感一方面可以造成用戶粘性,另一方面可以獲得用戶的信任。
我按照對語言本質(zhì)的猜測,將閑聊未來的發(fā)展分成兩部分,分割線就是技術(shù)是否可以讓技術(shù)實(shí)現(xiàn)思考:
1. 閑聊短時(shí)間內(nèi)還是需要產(chǎn)品驅(qū)動(dòng),而產(chǎn)品即需要了解當(dāng)前技術(shù)瓶頸,也需要了解用戶需求,甚至需求背后的人性,還有閑聊在整個(gè)產(chǎn)品中的定位,才有機(jī)會(huì)提升閑聊的用戶體驗(yàn)。
2. 閑聊長時(shí)間的未來可能是技術(shù)驅(qū)動(dòng),而產(chǎn)品只是一個(gè)輔助的角色。先進(jìn)的技術(shù)可以讓機(jī)器人思考,調(diào)整相關(guān)的參數(shù),就可以改變機(jī)器思考的方式,這個(gè)時(shí)候產(chǎn)品的作用就不再那么重要。
本文由 @我叫人人 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
不錯(cuò)