心理學(xué)角度思考:兒童語音機器人VUI設(shè)計(早教篇)
我曾給我外甥和外甥女買過語音機器人-撲閃著兩只萌萌大眼,配上胖墩墩的mini人物外形,本來以為會深受兩個小不點的喜好,誰知兩小不點在夜里被機器人嚇得之后都不敢靠近。正如Meadows曾提出“恐怖谷理論”:與人類極其相近但不完全相同的事物容易引起人的恐慌,也因這件事引發(fā)了我對兒童語音產(chǎn)品的探究。
如下圖:
恐怖谷理論
行業(yè)產(chǎn)品研究
簡單總結(jié)業(yè)內(nèi)兒童語音機器人做的比較出色的其中三家(并未窮盡,聊表敬意):科大訊飛的阿爾法蛋、狗尾草的公子小白、ROOBO的布丁豆豆。總結(jié)有誤之處還請指正。
(1)水平對比分析:下圖部分展示三家公司產(chǎn)品中其中三款產(chǎn)品的定位和交互、展示方式,且得到小結(jié)論:
- 主要面向0-16歲人群群體;
- 產(chǎn)品定位主要涉及兒童呵護、兒童教育(早教、學(xué)習(xí)指導(dǎo))、生活助理;
- 教學(xué)內(nèi)容基本為早教至初三前教學(xué)資源,少量涉及高中教學(xué)知識;
- 交互形式主要包括VUI(語音用戶界面)、GUI(圖形用戶界面);
- AI技術(shù)包括聲紋識別、ASR(語音轉(zhuǎn)文字識別)、自然語言處理和對話管理、語音合成、計算機視覺OCR(文字識別)、TTS(文字轉(zhuǎn)語音識別)、知識圖譜。
(2)垂直對比分析:將同家公司旗下的不同版本的語音機器人產(chǎn)品進行功能對比。
科大訊飛旗下有大蛋、小蛋、超能蛋、金龜子等,四款產(chǎn)品明顯區(qū)別:
- 大蛋有屏幕和攝像頭,可以滿足比如視頻通話、安全監(jiān)控、聲控拍照等關(guān)于視頻方面的操作需求,其它三款沒有。
- 大蛋和超能蛋是語音喚醒,小蛋和金龜子蛋是按鍵喚醒。
狗尾草旗下有公子小白成長版I、公子小白成長版II、公子小白青春版、公子小白Pro等,旗下產(chǎn)品比較清晰地劃分目標(biāo)群體用戶,成長版II主要針對嬰幼兒,成長版I主要針對學(xué)齡前至少年期,青春版主要針對青年期,Pro版主要針對成年期。
成長版和成長版II的明顯區(qū)別:
- I版有記憶調(diào)教,II版沒有,考慮學(xué)齡前至少年期兒童群體心智已較成熟且口頭表達能力較流暢;
- I版為語音喚醒,II版為按鍵喚醒,考慮鍛煉兒童動手能力和降低嬰幼兒因口齒不清喚醒機器人的難度。
ROOBO旗下有布丁機器人1S、布丁綠豆、布丁迷你豆、布丁豆豆慧讀版等,區(qū)別在于:
- 布丁綠豆是1S的版本升級,增加了觸摸操控+屏幕表情,雙插電充電+升級電池、記憶功能、學(xué)習(xí)報告、視頻功能、豐富了教學(xué)資源;
- 布丁豆豆慧讀比綠豆增加了繪本讀書器功能;
- 迷你豆比綠豆減少屏幕,增加微聊和胎教教學(xué)內(nèi)容。
小結(jié)思考:“是否需要為兒童提供屏幕動態(tài)視頻展示功能”、“是否需要針對不同年齡段兒童制作不同功能版本的機器人”是我在了解行業(yè)產(chǎn)品后發(fā)現(xiàn)的有趣探討點,在接下來“心理學(xué)角度思考:兒童語音機器人VUI設(shè)計”系列會進一步涉及個人觀點。
心理學(xué)角度思考:兒童語音機器人VUI設(shè)計(早教篇)
第一步:確定目標(biāo)用戶群體
意大利著名的“蒙特梭利教育理念”提到:寶寶在6歲前不同階段對語言、動作、細節(jié)、程序、書寫、閱讀等特別敏感,該段時期稱為“敏感期”,抓住該段時期讓孩子從無意識狀態(tài)過渡到有意識狀態(tài),并建立起寶寶所特有的心理結(jié)構(gòu)和語言表達機制。
0-6歲孩子八大敏感期如下:
本篇主要研討早教語音機器人VUI設(shè)計,目標(biāo)用戶群體為0-6歲嬰幼兒群體。
第二步:樹立VUI人格特質(zhì),選取符合產(chǎn)品形象的音色
Cathy Pearl在《語音用戶界面設(shè)計》一書中曾提到:
“用戶會將你的VUI人格化,無論你是否有意讓用戶這樣做,他們都會認為VUI具有某種人格特質(zhì),最好做法是你自己在設(shè)計時就確定好VUI人格?!?/p>
Siri的高冷女性形象、微軟小冰的賣萌逗趣小可愛、小愛同學(xué)的青春二次元美少女便是主動打造VUI虛擬角色、樹立不同人格特質(zhì)的做法。
而0-6歲嬰幼兒最需要家人陪伴,因此機器人形象樹立為年輕溫和的寶爸或?qū)殝?,由于不同家庭寶爸寶媽陪伴孩子的時間各異,可構(gòu)建兩種形象版本讓用戶切換選擇,比如:某戶家庭中陪伴孩子時間比較少的是爸爸,用戶可以選擇“寶爸”版本,讓語音產(chǎn)品填補寶寶缺乏的來自父母某方的陪伴。
而機器人語音音色的選擇需要和產(chǎn)品形象保持一致,需要溫和不嚴厲的年輕音色。目前科大訊飛已經(jīng)推出聲音復(fù)刻技術(shù)在小范圍群體使用,往后若聲音復(fù)刻技術(shù)達到推廣應(yīng)用水平,或許可讓用戶通過復(fù)刻自身聲音來自主定義機器人語音音色,使得寶寶更真切感受到家人的陪伴。
第三步:明確產(chǎn)品定位,構(gòu)思功能,繪制VUI流程圖
流程圖在IVR(互動式語音問答)設(shè)計中用于展示VUI系統(tǒng)所有可能發(fā)生路徑的圖示,在繪制流程圖前要先根據(jù)產(chǎn)品的定位和目標(biāo)確定產(chǎn)品功能。
- 產(chǎn)品定位為:早教+陪護。
- 產(chǎn)品目標(biāo)包括三項:開發(fā)智力、關(guān)注心理健康、保障安全。
Part 1 : 產(chǎn)品功能考慮細節(jié)
屏幕視頻功能考慮:
針對早教是否需搭配動態(tài)視頻展示這個問題,有的機器人產(chǎn)品考慮保護孩童視力不建議增加動態(tài)視頻功能。
個人觀點是:根據(jù)“蒙特梭利教育理念”提到的0-6歲寶寶的“感官敏感期”,4個月左右時,寶寶大腦中負責(zé)聽覺、語言、嗅覺的顳葉和枕葉會變得更加活躍,色彩鮮艷、情節(jié)簡單的擬人卡通視頻會對他們更有吸引力,且在有助在其不識字狀態(tài)幫助理解學(xué)習(xí)。感官的全面調(diào)動也有助于開發(fā)寶寶智力。
互動游戲功能考慮:
同時,“蒙特梭利教育理念”提到:孩童6個月后會進入咿呀學(xué)語模仿階段,9個月左右進入語言理解階段,13個月左右可進入以詞帶句教育階段,下圖舉例了3-6歲孩童的語言能力發(fā)展目標(biāo)。
此階段要讓孩童多與環(huán)境中對應(yīng)的事物互動并鼓勵說出來、培養(yǎng)孩童的專注力和聽力等,這種情況下趣味性的互動游戲便不可或缺。
引用《蒙特梭利:兒童語言能力訓(xùn)練》
虛擬表情動態(tài)功能考慮:
美國著名的心理學(xué)家丹尼爾.西格爾在《全腦教養(yǎng)法》中提過“印證式傾聽”,而印證式傾聽的前提是讓對方感受到自己是在用心了解其觀點。孩童渴望得到關(guān)注和聆聽,因此當(dāng)機器人跟寶寶在溝通對話時,搭配上虛擬表情狀態(tài),表達對溝通者的關(guān)注和喜怒哀樂情緒的共情。
狀態(tài)追蹤監(jiān)護功能考慮:
如果要打造寶寶狀態(tài)追蹤監(jiān)護功能,機器人硬件最好設(shè)計為可移動+室內(nèi)空間定位,搭配計算機視覺技術(shù)。家長可在離家時開啟寶寶追蹤監(jiān)控,通過人物識別確定追蹤對象身份而追隨其活動,重點識別是否進入危險區(qū)域和人體姿態(tài)識別其是否出現(xiàn)摔倒等狀況。打造該功能時產(chǎn)品方需要承擔(dān)責(zé)任風(fēng)險和考慮孩童抵觸心理,以及遇到像掃地機器人無法抵達家里某些空間的問題。
磨牙功能考慮:
寶寶6歲后進入探索事物的萌芽期,把抓到的東西放入嘴里啃咬是他們探索世界、尋求安全感的一種方式,且長牙階段的難受使得寶寶更頻繁咬東西。弗洛伊德的兒童心理學(xué)理論將該階段稱為口唇期,阻止孩童啃咬東西容易導(dǎo)致孩童長大后缺乏安全感和咬手指等壞習(xí)慣,因此要主動給寶寶提供安全衛(wèi)生耐啃咬的產(chǎn)品。
Part 2 : 確定總產(chǎn)品功能(以下功能只是部分舉例)
【早教功能】
- 英語動畫視頻教學(xué)+中英互譯;
- 故事詩歌等中文視頻教學(xué);
- 雙語語言游戲;
- 知識百科(兒童百科知識+育兒知識)。
【陪護功能】
- 關(guān)注心理健康的AI對話+虛擬表情動態(tài);
- 兒童歌曲;
- 微聊+雙視頻通話+狀態(tài)追蹤監(jiān)護;
- 童鎖+防近視屏幕;
- 定時提醒;
- 家居設(shè)備中控;
- 防摔耐磨+安全磨牙材質(zhì)。
Part 3 : 繪制VUI流程圖
VUI流程圖設(shè)計關(guān)注點如下:
- 設(shè)計的可發(fā)現(xiàn)性:讓用戶知道IVR系統(tǒng)都能為其做什么;
- 設(shè)計的完整性和可退出性:確保每個狀態(tài)豆包含一組通用組件,如:主菜單、幫助、操作、重復(fù)、退出;
- 根據(jù)用戶使用時間間隔,區(qū)分新用戶和老用戶的提示設(shè)置;
- 針對異常情況的應(yīng)答處理;
- 每個狀態(tài)的記憶選項不超過7個,當(dāng)記憶選項過多時采取GUI+VUI結(jié)合的交互方式。
【第一種VUI流程圖】
- 優(yōu)勢:每個分支用戶記憶選項比較少;
- 劣勢:用戶交互步驟較為繁瑣。
【第二種VUI流程圖】
- 優(yōu)勢:用戶交互步驟比較簡潔;
- 劣勢:每個分支用戶記憶選項比較多,需要搭配GUI進行交互。
第四步:兒童對話場景設(shè)計思考
Part 1 : 語音對話技術(shù)實現(xiàn)原理
(該圖出處不明確,知道原作者請告知,我加以注明)
以一張圖講述語音交互系統(tǒng)實現(xiàn)原理,幫助對語音交互理解,在語音對話技術(shù)實現(xiàn)過程中的需要注意的事項:
- 實現(xiàn)多輪對話和長依賴關(guān)系,解決對話問題;
- 處理一詞多義,語言消歧、否定詞問題;
- 對用戶情感理解解析,對不同狀態(tài)下語氣詞表示含義的識別和反饋;
- 良好的端點檢測功能引擎,如何更好實現(xiàn)語音降噪;
- 如何保障用戶數(shù)據(jù)隱私和數(shù)據(jù)安全不泄漏。
Part 2 : 調(diào)研常見情景,構(gòu)建對話邏輯,設(shè)計用戶指令集
面對紛繁復(fù)雜的用戶使用情景,可以區(qū)分使用人群,了解不同人群常見使用情景而重點梳理構(gòu)建對話邏輯,在此要考慮到的是:兒童早教機器人的用戶群體不僅有孩童,還有孩童的家人等成人群體。
本次選取用戶使用中文早教功能來構(gòu)建對話邏輯:
針對中文早教的用戶使用場景,<course>、<grade>、<type>是設(shè)計用戶指令集時設(shè)置的槽位(slot),下圖列舉部分用戶指令:
Part 3 : 通用的語音對話設(shè)計注意事項
根據(jù)Cathy Pearl在《語音用戶界面設(shè)計》的理論,匯總語音對話設(shè)計通用注意事項:
- 對話的親切自然、簡短突出要點,加入基本對話禮儀,不要責(zé)怪用戶,語速適中;
- 設(shè)置自然的啟動和結(jié)束對話模式,利用啟動效應(yīng)讓用戶知道提問進度;
- 針對復(fù)雜問題,給出答案格式實例;設(shè)置更好的問題結(jié)構(gòu),避免問到一半,用戶已搶先回答出不規(guī)范的答復(fù);
- 構(gòu)建N-Best列表,根據(jù)可能性和置信度排序問題答案,解決部分語音識別錯誤問題,兼容用戶更多不同形式的回復(fù);
- 適當(dāng)?shù)亟o用戶反饋,包括給用戶確認、系統(tǒng)出現(xiàn)等待時間時候等的反饋;
- 區(qū)分無語音超時(NSP)和語音終止超時來設(shè)置語音超時時間,如確定用戶說完喚醒詞后無語音超時時間,一般建議為10s;
- 允許用戶打斷語音,可用“魔法詞”作為打斷語音的暗號;
- 增強錯誤提示,進階錯誤行為提醒;
- 根據(jù)不同置信度采用語言或非語言的確認方案;
- 處理微妙的話輪轉(zhuǎn)換形式,比如:“嗯嗯”;
- 增加聲紋識別,讓IVR系統(tǒng)認主。
而面對兒童群體,還需要注意兒童群體存在發(fā)音口齒不清和吞音、尾音過短等問題,特別是有的孩童在3-6歲期間會出現(xiàn)短暫的口吃、失語癥問題,要如何設(shè)計N-Best列表?
Part 4 : 在通用設(shè)計原則基礎(chǔ)上,結(jié)合兒童心理學(xué),設(shè)計對話應(yīng)答腳本
個體心理學(xué)派的創(chuàng)始人阿爾弗雷德.阿德勒在《兒童人格教育》一書中曾提到:兒童心理問題包括自卑、因心理補償而出現(xiàn)的膨脹野心、缺乏安全感、懶惰、焦慮、孤僻、依賴等。
此部分思考針對孩童陪護功能,針對孩童缺乏安全感的心理問題,結(jié)合丹尼爾.西格爾的全腦教養(yǎng)法理論來設(shè)計對話應(yīng)答腳本。
而丹尼爾.西格爾在《全腦教養(yǎng)法》提出:左腦是邏輯、語言的、求實的,而右腦是情感、非語言、經(jīng)驗化的。單獨依賴右腦會引起感情泛濫、依賴左腦會引起情感荒蕪。當(dāng)孩童遇到不好經(jīng)歷而拒絕表明傷痛,這樣的情感處理方式是退回左腦處于情感荒蕪狀態(tài),如果不正確梳理容易造成孩童長大后缺乏安全感和對對應(yīng)事物產(chǎn)生恐懼心理。
很多人會采用避開談?wù)摵⒆釉庥龅膫?,而正確的做法是引導(dǎo)孩子復(fù)述故事,幫助孩子整合左右腦,通過調(diào)用右腦理順細節(jié),然后引入右腦重訪情緒,讓孩子正面其內(nèi)心的擔(dān)心、害怕,隨之讓孩子意識到其在整個過程并非孤立無援,意識到問題已經(jīng)解決過去。或者通過分享經(jīng)歷故事安撫情緒。
? ?錯誤做法
?正確做法
以下舉例針對兒童遭遇不好情景或缺乏安全感時的對話腳本(script):
門外漢的膚淺觀點暫告一段落~
Thanks!
本文由 @唐吖年 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自網(wǎng)站
大腦左右半球可以分開執(zhí)行高級心理機能是錯誤的觀點。腦在執(zhí)行一個任務(wù)時激活的腦區(qū)非常廣泛,fMRI分析中會發(fā)現(xiàn)個別腦區(qū)為單側(cè)激活,多數(shù)腦區(qū)仍是雙側(cè)激活,且單側(cè)激活的腦區(qū)中左側(cè)和右側(cè)激活的腦區(qū)往往都是有的。
引用心理的文獻請不要使用大眾讀物,謝謝!
(*^_^*)謝謝大神指導(dǎo),文章中該點言論來自于美國心理學(xué)家丹尼爾的《全腦教養(yǎng)法》,每位大牛級人物術(shù)業(yè)有專攻,不確定是否左右腦功能這點神經(jīng)學(xué)知識丹尼爾大神是否有講錯,大神能否附上fmri的學(xué)校資料查看渠道,我進一步學(xué)習(xí)了解。我只大概知道:功能性核磁共振成像技術(shù)可以顯示大腦各個區(qū)域內(nèi)靜脈毛細血管中血液氧合狀態(tài)所起的磁共振信號的微小變化,而實驗得到的結(jié)果很感興趣想進一步了解~