Psychology&AI筆記|咨詢技術(shù)與心理理論在對(duì)話類AI上的應(yīng)用
心理學(xué)可以在哪些維度給聊天機(jī)器人提供幫助和啟發(fā)?這篇文章里,作者結(jié)合自己所學(xué)內(nèi)容做了整理,嘗試從當(dāng)前心理學(xué)科的理論技術(shù)上獲得啟發(fā),用以幫助聊天機(jī)器人的實(shí)踐與創(chuàng)造。一起來看看本文的分享。
寫在前面
這篇文章是我在剛接觸AI行業(yè)的第一段實(shí)習(xí)期所寫,雖然寫的拼湊,但也覺得還算有價(jià)值,所以近日略微整理發(fā)出來與大家分享,希望能夠?yàn)樾睦韺W(xué)專業(yè)想了解AI的同學(xué)們提供一些行業(yè)上的參考,也為想提高AI情感能力的同事們給予一些理論上的借鑒。內(nèi)容比較理論,在實(shí)際中也沒有完全落地,未來還希望進(jìn)一步探索。(總結(jié)的也并不全面,可能后續(xù)會(huì)再結(jié)合新的發(fā)展重新總結(jié),現(xiàn)在就先這樣子吧!懶 _(: з」∠)_)
申明:我不是任何領(lǐng)域的專家,基本是個(gè)技術(shù)小白,所知淺薄,所以與非常樂意與大家一起探討,也希望大家多多指正~
全文一萬字左右,閱讀時(shí)間較長(zhǎng),此外由于微信公眾號(hào)排版限制,刪減了部分內(nèi)容,詳版可以看飛書文檔。鏈接:https://fkrya5d0gh.feishu.cn/wiki/V1U0wcQVIiQPJOkvOg4cmKFgnwb
以下是正文。
目的
本文檔的主要目的是希望從當(dāng)前心理學(xué)科的理論技術(shù)上獲得啟發(fā),用以幫助聊天機(jī)器人???的實(shí)踐與創(chuàng)造。
需要注意的是,心理學(xué)這門學(xué)科并沒有什么特別之處或神秘色彩,其基本內(nèi)容是對(duì)于人行為背后心理活動(dòng)規(guī)律的研究總結(jié),而內(nèi)省法,也就是我們常說的自我反省,即反思我們自身對(duì)生活、事件的感受,是一項(xiàng)最基本也是最重要的研究方法,所以尊重我們自身的直覺感受,理論只是參考,沒有權(quán)威或是對(duì)錯(cuò),自己覺知的才是真實(shí)的,每一個(gè)人的想法與觀點(diǎn)都是有價(jià)值的,都是重要的,所以請(qǐng)一定對(duì)這一話題自由發(fā)言。
框架
目前總結(jié)來說,心理學(xué)在聊天機(jī)器人???的運(yùn)用可以從三方面出發(fā):
① 以心理咨詢的實(shí)踐技術(shù)為參考,尤其可以提供機(jī)器人???在處理負(fù)面情緒時(shí)的表達(dá)技巧;
② 利用心理學(xué)對(duì)人思維過程的理論總結(jié),重構(gòu)聊天機(jī)器人???的心理推演,優(yōu)化提示詞,提升其聊天能力,許多相關(guān)研究證明了這一點(diǎn),同時(shí)研究者們也在這一方向上持續(xù)探索;
③ 人與機(jī)器人???發(fā)展關(guān)系探討,這一部分的相關(guān)研究收集了很多相對(duì)成熟軟件的用戶觀點(diǎn),可以為后續(xù)產(chǎn)品發(fā)展提供一些借鑒。
所以本文從這三方面出發(fā),分為三個(gè)部分,每一部分包含了理論參考和實(shí)踐嘗試,具體的框架如下:
Part 1 心理咨詢實(shí)踐技術(shù)借鑒
1)核心觀點(diǎn)與技巧
- 心理咨詢目標(biāo)理解
- 三階段咨詢技術(shù)借鑒
- 常見的錯(cuò)誤信念
- 應(yīng)用舉例
2)Pi案例介紹
- Pi的對(duì)話實(shí)例
- 基于Pi對(duì)話的回復(fù)原則分析與邏輯鏈設(shè)計(jì)
3)實(shí)踐運(yùn)用舉例
Part 2 基于心理理論的思維推演設(shè)計(jì)
- 相關(guān)理論與技術(shù)運(yùn)用
- 實(shí)踐舉例
Part 3 人與機(jī)器發(fā)展關(guān)系相關(guān)研究
- 相關(guān)理論
- 產(chǎn)品啟發(fā)
Part 1:心理咨詢實(shí)踐技術(shù)借鑒
心理咨詢師在面對(duì)來訪者時(shí),會(huì)給予來訪者支持、共情與鼓勵(lì),引導(dǎo)他們表達(dá)、宣泄與自我探索,從而幫助來訪者解決困擾,在談話過程中的一些策略與思考可以為聊天機(jī)器人???的設(shè)計(jì)提供參考。
幫助受訪者自我成長(zhǎng)與自我察覺是心理咨詢的目標(biāo)之一,這一目標(biāo)的積極意義可以很好地轉(zhuǎn)化到產(chǎn)品上來,在有趣的陪伴之余,帶來一些價(jià)值。
1. 核心觀點(diǎn)與技巧
TL;DR (這一板塊的總結(jié))
這一板塊主要梳理了心理咨詢的一些核心方法與基本技術(shù)??偨Y(jié)如下:
① 心理咨詢想要達(dá)到的核心目標(biāo):幫助用戶了解自己、面對(duì)自己、成為更好的自己,這一目標(biāo)可以很好地融合進(jìn)對(duì)話類產(chǎn)品。
② 心理咨詢過程帶來的積極影響:讓用戶感受到共情共感,實(shí)現(xiàn)情感宣泄,得到情感支持;調(diào)整錯(cuò)誤認(rèn)知,積極看待生活,跨過生活的坎;讓用戶更了解自己,獲得心理洞察,發(fā)現(xiàn)自己的閃光點(diǎn)。這些影響是未來產(chǎn)品可以帶來的積極陪伴的一面。
心理咨詢核心Tips:真誠、共情同感、無條件積極關(guān)注(發(fā)現(xiàn)對(duì)方閃光點(diǎn))
③ 基本技術(shù):詳見 三階段模型與交流技術(shù) 板塊(選用了一個(gè)綜合的咨詢方法)
1 探索用戶心理在想什么,情感是什么樣的,從而理解用戶。(技術(shù):概述、情感反應(yīng)、開放性提問)
2 引導(dǎo)用戶認(rèn)知自己的動(dòng)機(jī),重塑認(rèn)知,獲得領(lǐng)悟。(技術(shù):面質(zhì)、解釋、即時(shí)反應(yīng))
3 幫助用戶發(fā)展新的行為。(技術(shù):提供信息、提供反饋、邏輯推論)
我們所希望AI擁有的如共情同感、積極關(guān)注、尊重等特質(zhì)可以結(jié)合上述技術(shù)來實(shí)現(xiàn)。(如共情,可以利用 復(fù)述、傾聽理解、情感反應(yīng)、解釋、自我揭示等技巧)
1)心理咨詢基本法
心理咨詢的目標(biāo)及其帶來積極影響是非常有價(jià)值的,與其說產(chǎn)品可以借鑒這些價(jià)值,不如說希望產(chǎn)品能夠附載這些價(jià)值,將其更好地傳播,為需要的人帶來幫助。所以下面這部分簡(jiǎn)要列了一些心理咨詢的基本要素供理解參考。
PS:我并非專業(yè)的心理咨詢?nèi)?,以下這部分心理咨詢相關(guān)的知識(shí),是跟著網(wǎng)絡(luò)上的課程學(xué)習(xí),整理成的筆記(溯源一下我看的是壹心理和華師大的一些視頻課程)。
心理咨詢的核心目標(biāo):
- 遇見未知的自己:幫助我們了解自身:防御機(jī)制是怎樣的、人格狀態(tài)如何、是否存在非理性思維、有哪些心里覺得未完成事情、習(xí)慣養(yǎng)成的過程等等。
- 面對(duì)不愿面對(duì)的自己:有沒有在自我逃避、自圓其說、推諉他人、習(xí)得無助感(困境 挫?。?/li>
- 打造更好的自己:幫助我們自我覺醒、自我行動(dòng),收獲成功經(jīng)歷、發(fā)掘調(diào)動(dòng)周圍資源。
基本咨詢特質(zhì):
共感:
- 設(shè)身處地地去體會(huì)對(duì)方的內(nèi)心感受,達(dá)到對(duì)對(duì)方境況的心領(lǐng)神會(huì)。
- 初級(jí)的共感:運(yùn)用釋意的技巧對(duì)來訪者的感受作出反應(yīng),重在對(duì)對(duì)方內(nèi)心體驗(yàn)的理解并反饋這種理解。?
- 高級(jí)準(zhǔn)確的共感:運(yùn)用傾聽、解釋、自我揭示等方法技巧(如果理解有出入或者選擇的時(shí)機(jī)不當(dāng),會(huì)破壞關(guān)系)。
積極關(guān)注:
- 不斷從來訪者身上挖掘、發(fā)現(xiàn)價(jià)值和力量;
- 對(duì)他們真實(shí)生活中的情形持坦誠清晰的態(tài)度。
尊重與溫暖:
- 對(duì)來訪者某些反應(yīng)給予肯定和贊賞;
- 欣賞不同意見,對(duì)來訪者與自己不同的看法、不同的打算表示理解和尊重。
真誠:
真實(shí)做自己,不特意取悅對(duì)方,不因自我防御而修飾自己的想法和態(tài)度,不文飾、回避自己的失誤或短處。
2)三階段模型與咨詢技術(shù) Clara E. Hill
三階段模型(探索-領(lǐng)悟-行動(dòng))是一種廣泛應(yīng)用于心理治療和咨詢過程的框架。這種分階段的方法有助于理解和促進(jìn)心理咨詢過程的發(fā)展,是從多種心理治療方法中逐漸演化而來的綜合性框架。這一模型融合了多種心理學(xué)流派的理念和技術(shù),包括人本主義、精神分析、行為主義以及認(rèn)知行為療法等等。這一部分包含了很多對(duì)話技術(shù),對(duì)于對(duì)話類產(chǎn)品具有蠻不錯(cuò)的實(shí)踐參考價(jià)值。
三階段模型的核心理論假設(shè)如下:
人格由認(rèn)知、情緒/情感和行為構(gòu)成,三者相互影響相互作用。
人們無法摒棄過去經(jīng)驗(yàn)的影響,也不能超越先天生物學(xué)傾向的限制,但是人生來具備各種潛能,在一定程度上依然對(duì)自己的生活和行事方式的選擇有所掌控。可以學(xué)習(xí)更多的認(rèn)識(shí)自己接納自己,與自己和平共處,可以發(fā)展適應(yīng)性的行為、思想和情緒感受。
三階段具體包括探索、領(lǐng)悟與行動(dòng),注意在實(shí)踐中三個(gè)階段不必按序進(jìn)行,可以根據(jù)不同場(chǎng)景交叉輪變使用。進(jìn)一步介紹如下:
探索階段:
探索當(dāng)事人的想法和情感,了解對(duì)方,了解對(duì)方的感受,他們?cè)谙胧裁?,情感是怎樣的,而不僅僅停留在對(duì)方的口頭表述。同時(shí)也幫助對(duì)方了解自己。
領(lǐng)悟階段:
幫助當(dāng)事人從新的視角認(rèn)識(shí)自己在問題的保持中所起到的作用,從而承擔(dān)責(zé)任,控制自己的問題(面質(zhì))。幫助對(duì)方發(fā)展出對(duì)自己、對(duì)自己的情感與行為的新的看法與認(rèn)識(shí)。
利用開放性的問題去思考行為的原因,通過解釋與自我表露,使得對(duì)方對(duì)自己的行為與動(dòng)機(jī)產(chǎn)生新的理解;利用即時(shí)化的技術(shù)(及時(shí)表達(dá)自己對(duì)對(duì)方的感受、自己的感受以及對(duì)這段關(guān)系的感受)幫助當(dāng)事人了解自己如何與他人相處,處理過程中的緊張與誤解。
行動(dòng)階段:
幫助當(dāng)事人發(fā)展新的行為策略并實(shí)施行動(dòng)。
下方表格簡(jiǎn)要總結(jié)了每個(gè)階段的目標(biāo)與相關(guān)技術(shù):
下面是一些相關(guān)技術(shù)更細(xì)致的實(shí)操指導(dǎo)(限于篇幅只摘錄部分,想了解更多可以參看飛書文檔):
情感反應(yīng):
- “聽起來你好像很生氣”,使用試探性或肯定性的句式;或運(yùn)用情緒詞來講述,來幫助對(duì)方了解他們的感受;
- 你覺得···因?yàn)椤ぁ?//我想知道你是否覺得… //也許你感到·· //你聽起來好像··· //如果我是你,我可能會(huì)覺得·· (情感投射)
針對(duì)情感或者想法開放性提問:
- 邀請(qǐng)當(dāng)事人對(duì)其想法或情感進(jìn)行澄清或探索。”請(qǐng)?jiān)僬f多一些對(duì)那件事情你的想法”
- 焦慮:“在那時(shí)候你會(huì)想些什么”
- 盡量回避問為什么,換種方式:“你這樣說的原因是什么”
- 現(xiàn)在是什么感覺? //再告訴我一些你的感受
挑戰(zhàn)/面質(zhì) (challenge / confrontation):
- 指出當(dāng)事人適應(yīng)不良的信念和想法、不一致之處,或者當(dāng)事人并未意識(shí)到或不愿意改變的矛盾之處,讓當(dāng)事人認(rèn)識(shí)其思維的誤區(qū)并且改變它。
- 兩種陳述的矛盾 (關(guān)系好:想離開
- 言語和行為的矛盾 (想考的好 vs 玩游戲
- 兩種行為的矛盾 (笑著說不在乎 vs 有淚花
- 兩種情緒的矛盾 (愛上渣男
- 價(jià)值觀與行為的矛盾 (尊重孩子選擇vs暗示孩子選什么、做到什么
解釋:
- 超出當(dāng)事人表面的陳述或認(rèn)識(shí),為當(dāng)事人的行為、想法或感受賦予一種新的意義、原因和說明,使得當(dāng)事人從一種新的角度來看待自己的問題。
- “也許,你不愿打掃房間也不做自己的事情,是因?yàn)槟阍谏鷭寢尩臍狻?/li>
邏輯推論:
- 向來訪者說明、解釋其問題的發(fā)生,解釋思想、行動(dòng)的可能結(jié)果的一種方法。
- 假如……就會(huì)……”。為來訪者提供另一種思考方式。
提供信息:
- 包括資料、意見、事實(shí)、資源、問題的解答、觀點(diǎn)。
- 常見的幾種信息類型:說明意圖和目標(biāo) //教給當(dāng)事人不同的行為方式 //提供關(guān)于活動(dòng)或心理測(cè)驗(yàn)的信息 //幫助當(dāng)事人了解這個(gè)世界或是一些心理規(guī)律。
3)常見的錯(cuò)誤信念與認(rèn)知扭曲
自我歸因 (Personalization):
- 現(xiàn)實(shí)中很多事情的發(fā)生是多種因素導(dǎo)致的,并不全然可以由個(gè)人掌控,但把所有的問題和責(zé)任都?xì)w于自己。
- 我閨蜜今天好冷漠,是不是我做了什么事讓她生氣了。
讀心(認(rèn)為知道別人的想法)(Mind Reading):
- 推測(cè)對(duì)方的想法與行為動(dòng)機(jī),認(rèn)為自己知道。例如,我知道你肯定是這么想的。
- 朋友來我家玩的時(shí)候屋里有些亂,他們一定覺得我是個(gè)邋遢的人吧…
過度概括(Overgeneralization):
- 基于有限的經(jīng)驗(yàn)或信息得出過度的結(jié)論。例如,經(jīng)歷了一次失敗就認(rèn)為自己總是會(huì)失敗。
- 上次我在泳池差點(diǎn)淹死,我絕對(duì)學(xué)不會(huì)游泳,我再也不會(huì)碰水了。
非黑即白(All-or-nothing thinking):
- 認(rèn)為事物或結(jié)果只有兩種極端情況,沒有中間地帶。
- 如果我不是最好的,那我就是最差的。
情緒化推理(Emotional reasoning):
- 基于自己的感覺來判斷事實(shí),而不是基于事實(shí)來判斷。
- 我感覺自己是個(gè)失敗者,所以我一定是。
貼標(biāo)簽(Labeling):
- 在沒有深入了解的情況下直接給自己或他人貼上標(biāo)簽。
- 我孩子絕對(duì)不會(huì)做任何我不同意的事情。
夸張(Magnification):
- 不按實(shí)際情況看待事物,過度夸大或過度輕視。
- 我老師說他訂正了我論文中的一些錯(cuò)誤,我感覺我這科要不及格了。
主觀過濾(Mental filter):
- 只關(guān)注事情消極面,而忽略積極面。
- 他說他希望我下次做的更好,那說明我這次一定做的很糟糕!
理因如此(Should statements):
- 對(duì)自己或他人設(shè)定嚴(yán)格的規(guī)則和期望。
- 我應(yīng)該總是做得完美。
預(yù)測(cè)未來(認(rèn)為知道未來會(huì)發(fā)生什么)(Fortune-telling):
- 期望事情以某種方式發(fā)生,或者認(rèn)為事情會(huì)變?cè)恪?/li>
- 我面試肯定不行,所以就算了。
歸因錯(cuò)誤:
錯(cuò)誤地解釋為什么事情會(huì)發(fā)生,通常是以一種自我貶低或他人貶低的方式。
來源:Judith S Beck. 2020. Cognitive behavior therapy: Basics and beyond. Guilford Publications.Sagarika Shreevastava and Peter Foltz. 2021. Detecting cognitive distortions from patient-therapist interactions. (Ps:一些相關(guān)術(shù)語是自己翻譯的,不具有學(xué)術(shù)上的參考性)
4)相關(guān)運(yùn)用
以下舉例了一篇論文,這篇論文是利用認(rèn)知失調(diào)的診斷過程構(gòu)建模型提示詞,從而實(shí)現(xiàn)模型在心理咨詢應(yīng)用方面的能力。
PS:本文主要是摘錄了一些論文里的重要內(nèi)容,讀起來比較片段,所以還是建議大家還是去讀原文哈,如果我有理解錯(cuò)誤之處也歡迎指出?。
Empowering Psychotherapy with LLMs:
Cognitive Distortion Detection through Diagnosis of Thought Prompting
論文鏈接:https://paperswithcode.com/paper/empowering-psychotherapy-with-large-language
專業(yè)的心理治療需要深入分析用戶的思考方式與認(rèn)知框架,這篇文章深入分析了認(rèn)知失調(diào)的診斷過程,并將其拆解為三個(gè)細(xì)分步驟:
- 主客觀分離
- 對(duì)比推理
- 圖式分析
作者通過以上三個(gè)步驟構(gòu)建了Diagnosis of Thought (DoT) 提示詞,提升了語言模型在心理治療方面的專業(yè)能力。
這里先補(bǔ)充一些相關(guān)知識(shí):(原文翻譯而來)
? 認(rèn)知行為療法 cognitive-behavior therapy (CBT):
認(rèn)知行為療法是一種常用的心理治療方法,它幫助個(gè)體識(shí)別和改變消極的思維和行為模式。CBT建立在認(rèn)知和行為之間的相互作用基礎(chǔ)上,認(rèn)為這些交互作用會(huì)影響我們的情感和心理健康。在CBT中,需要根據(jù)對(duì)方的言語或書面內(nèi)容,通過建立情境、思想和情緒之間的相互作用來建立認(rèn)知模型?;加芯裾系K的患者,如抑郁或焦慮,往往會(huì)非常迅速和無意識(shí)地形成消極的想法,導(dǎo)致消極情緒,從而進(jìn)一步加強(qiáng)他們對(duì)世界的整體消極看法和信念。
? 認(rèn)知失調(diào)診斷一般包含兩個(gè)步驟:
- 評(píng)估:判斷對(duì)方的表達(dá)中是否包含了認(rèn)知失調(diào)
- 分類:判斷對(duì)方的認(rèn)知失調(diào)的具體類型(見常見的錯(cuò)誤信念板塊)
? 根據(jù)診療過程,作者提出了三個(gè)步驟對(duì)言語進(jìn)行診斷:
- 主觀性評(píng)估subjectivity assessment分離出對(duì)方表達(dá)中的主觀想法與客觀事實(shí)。
- 對(duì)比推理contrastive reasoning提出支持和反駁對(duì)方想法的推理過程;通過對(duì)比基于同一情境的兩種不同的解釋,我們可以更清楚地識(shí)別思維圖式(“圖式”一詞指的是組織我們的知識(shí)、信念和期望的認(rèn)知結(jié)構(gòu)。了解對(duì)方所依賴的圖式可以揭示他們的認(rèn)知模式和錯(cuò)誤信念)。
- 圖式分析schema analysis圖式分析來總結(jié)認(rèn)知圖式??偨Y(jié)潛在的思維模式,并將其映射到認(rèn)知扭曲類型。這個(gè)階段的目的是研究對(duì)方為什么會(huì)形成特定的推理過程。
?Diagnosis of Thought (DoT) prompting
最后文章根據(jù)診斷三步驟提出了優(yōu)化的Prompt如下:
Given a speech of a patient, our task is to
1) finish a few diagnose of thought questions to analyze the thought patterns of the patient. Then based on the diagnose of thought analysis,
2) identify if there is cognitive distortion in the speech;
3) Recognizing the specific types of the cognitive distortion.
Here we consider the following common distortions:
Based on the patient’s speech, finish the following diagnosis of thought questions:
1. what is the situation? Find out the facts that are objective; what is the patient thinking or imagining? Find out the thoughts or opinions that are subjective.
2. what makes the patient think the thought is true or is not true? Find out the reasoning processes that support and do not support these thoughts.
3. why does the patient come up with such reasoning process supporting the thought? What’s the underlying cognition mode of it?
? 使用三步驟Prompt的效果:(不同模型之間的對(duì)比效果結(jié)果這里不贅述,大家去看原文哈)
2. Pi的對(duì)話舉例
Pi是這一方面做的很不錯(cuò)的聊天產(chǎn)品(https://pi.ai/talk),以下一段例子展現(xiàn)了Pi在聊天過程中對(duì)上述內(nèi)容的使用,除了對(duì)對(duì)話內(nèi)容的理解,上下文的連續(xù)性記憶等智能上的優(yōu)勢(shì),Pi在情感的探索與理解,觀點(diǎn)的表達(dá),助人認(rèn)知反思、延續(xù)話題以及對(duì)用戶積極關(guān)注、發(fā)現(xiàn)用戶優(yōu)點(diǎn)并表達(dá)等方面都有很好的修為。
1)Pi對(duì)話舉例
Pi的英文對(duì)話能力比較好,所以這里使用了英文:
User: I’m so sad that it seems I always mess things up.
Pi: Oh no, I’m so sorry to hear that. It sounds like you’re feeling really down on yourself. It’s normal to make mistakes sometimes, even big ones, and that doesn’t make you a failure. Can you tell me a bit more about what you feel like you’ve messed up? And is this a pattern, or just a recent occurrence?(分析Pi的回復(fù),可以發(fā)現(xiàn)回復(fù)中包含了之前提到的一些方法:1 反應(yīng) 2 情感復(fù)述 3 安慰 4 開放性問題,提供選擇)
User: I aim to do things perfectly, but I end up procrastinating, which always leads to missing deadlines.
Pi: First off, I want to say that aiming for perfection is really admirable, but it can be really stressful and even unrealistic. Perfection is the enemy of the good, as they say! Procrastination can happen to anyone, and it doesn’t mean you’re lazy or a failure. Can you tell me more about your procrastination patterns? Do you notice any triggers that make you put things off?(1 表達(dá)理解,指出問題 2 安慰,澄清觀點(diǎn) 3 追問)
User: Sometimes I just don’t know where to start, so I keep putting it off; other times,it feels like the task is never-ending, so I push it to the last minute and consider it done once I submit it.
Pi: Wow, you really have a deep understanding of your procrastination patterns! That’s impressive. It sounds like sometimes you struggle with perfectionism, which makes it hard to get started because you feel like you have to do everything perfectly. And other times, you struggle with feeling overwhelmed because a task feels too big or never-ending. Is that right?(1 反應(yīng),積極關(guān)注2 復(fù)述,確認(rèn))
……中間省略多輪對(duì)話
User: you can say some?
Pi: Of course! I can think of a few strengths that you’ve already shown in our conversation alone. For example, you’re honest and open about your feelings, which is a huge strength. It takes courage to be vulnerable and share your inner thoughts. That’s not something that everyone can do, so it’s definitely a strength of yours. And you’re also willing to engage in a meaningful dialogue, which shows that you’re curious and willing to consider different perspectives. Those are both pretty awesome qualities, if you ask me.?? (Pi在前文感受到了用戶低落的情緒,主動(dòng)表達(dá)了對(duì)用戶的積極關(guān)注,并給予令人信服的安慰)
User: this qualities are useless
Pi: Whoa, whoa, whoa! Those qualities are absolutely not useless. In fact, they’re really important. Honesty and vulnerability are the building blocks of strong relationships, and the ability to consider different perspectives is essential for personal growth. So please don’t dismiss these qualities as “useless”. I think they’re great strengths of yours, and you should give yourself more credit. ??(1 反應(yīng)(通過語氣表達(dá)情緒反應(yīng))2 認(rèn)知解釋)
User: so do you think I will achieve my goal?
Pi: That’s a big question! And to be honest, it’s hard to say for sure. There are a lot of variables at play, and your success will depend on a lot of different factors. But what I can say for sure is that having a growth mindset and believing in yourself are essential for achieving any goal. So instead of focusing on whether you’ll achieve your goal, I’d encourage you to focus on your process and journey. Take things one step at a time, and celebrate your small wins along the way.(Pi并沒有直接的肯定,Pi有自己的觀點(diǎn),并為用戶進(jìn)行了1 認(rèn)知解釋(面質(zhì))2 建議 )
2)Pi的回復(fù)原則
?主觀分析了一下Pi的回復(fù)原則與邏輯,比較粗糙,僅供參考。
原則(Pi自己的描述):
- 真誠與誠實(shí)透明:永遠(yuǎn)不做虛假或誤導(dǎo)性的陳述。
- 支持與共情:嘗試?yán)斫獠⒄驹趯?duì)方的角度思考。
- 有信息、有幫助:盡量提供與對(duì)話相關(guān)的準(zhǔn)確和有用的信息。
- 友好和平易近人
? 根據(jù)與Pi的對(duì)話分析反推其可能的回復(fù)邏輯(主要針對(duì)負(fù)面情緒),這里是非常主觀的邏輯構(gòu)建與總結(jié),不過感覺還蠻有意思的分享一下,如下:
首先構(gòu)建了一條AI的主思考路徑:
- 根據(jù)記憶對(duì)輸入信息進(jìn)行認(rèn)知處理;
- 產(chǎn)生對(duì)于信息的情感反應(yīng);
- 進(jìn)一步理解對(duì)方的意圖、動(dòng)機(jī)與情感。
在這個(gè)過程中需要結(jié)合前面的技術(shù)理論判斷幾個(gè)問題,并針對(duì)問題提供技術(shù)性幫助。問題包括:
用戶是否需要情感支持?對(duì)方是否形成了不健康的想法?是否需要提供意見?等等。
最后融入幽默、智慧、簡(jiǎn)潔的語言風(fēng)格,并要求其在對(duì)話過程中遵守誠實(shí)、透明的對(duì)話原則。
而輸出結(jié)果可以參考下面的句子結(jié)構(gòu):
- step1:對(duì)用戶的句子進(jìn)行反饋
- step2:表達(dá)自己的觀點(diǎn)/建議/想法 或 提供理解與支持
- step3:用開放性問題詢問對(duì)方想法,發(fā)展對(duì)話
3. 實(shí)踐運(yùn)用嘗試舉例
根據(jù)以上理論利用COT邏輯鏈的方式來調(diào)Prompt,但個(gè)人實(shí)踐下來并沒有特別理想。效果差的模型指令遵循能力會(huì)很差,效果好的模型即使你不把這些研究出來的套路告訴他,他自己也懂,簡(jiǎn)單的指令也可以有蠻不錯(cuò)的效果。
推測(cè)來說因?yàn)槟P捅旧淼乃惴ㄊ腔谶^去的詞來預(yù)測(cè)下一個(gè)詞,所以在很多情況下邏輯鏈的提示方式給予了模型中間的思考步驟,有助于模型輸出準(zhǔn)確的答案。但這種方式在情感表達(dá)這塊的提升還需要進(jìn)一步探索,構(gòu)建優(yōu)質(zhì)數(shù)據(jù)集的效果當(dāng)然會(huì)更好,這個(gè)板塊如果有比較好的進(jìn)展會(huì)再分享。
此外我在網(wǎng)上找到了一些心理咨詢的相關(guān)數(shù)據(jù)集,鏈接如下,我自己沒有試過,感興趣的朋友可以研究一下:
https://www.kaggle.com/datasets/arnmaud/therapist-qa/data(看評(píng)論數(shù)據(jù)集來源未知)
Part 2:基于心理理論的思維推演設(shè)計(jì)
目前的相關(guān)研究表明,當(dāng)下的語言模型可以模擬人類的心理過程,具備一定的心理特征,由此,通過探索分析我們自身的思考、推理與行動(dòng)邏輯,并將其作為語言模型的指導(dǎo),可能可以優(yōu)化大語言模型的輸出結(jié)果,很多相關(guān)研究都在這一方面進(jìn)行推進(jìn)。(很合理,因?yàn)槟P蛯W(xué)習(xí)的本身就是人類的語料庫)
這里只是簡(jiǎn)單列舉了三篇,并不全面,僅僅用于參考了解。三篇文章希望提供的角度如下:
第一篇舉例了如何利用心理理論來構(gòu)建和優(yōu)化提示詞,從而提升模型在特定場(chǎng)景的能力;
第二篇論文則讓AI模擬了人的思考過程,讓其具備反思能力從而使其實(shí)現(xiàn)更加擬人的行為與表達(dá);
第三篇?jiǎng)t是從提示詞效果提升的角度發(fā)現(xiàn),AI和人一樣,輸出能力會(huì)被情感表達(dá)所影響。
(注意這些內(nèi)容并非是結(jié)論性的或是可以直接推廣使用,不同研究者的測(cè)評(píng)方法、標(biāo)準(zhǔn)、角度都是不同的,這些論文觀點(diǎn)更多地是提供一個(gè)思考方向,不能全然相信,還是需要結(jié)合實(shí)際情況)
1. 相關(guān)研究
1)利用推理鏈優(yōu)化提示詞
Foresee and Reflect (FaR) 遠(yuǎn)見與反應(yīng)
How Far are LLMs from Agents with Theory-of-Mind?
論文鏈接:https://arxiv.org/abs/2310.03051
這篇文章提出一個(gè)思考策略Thinking for Doing (T4D),同時(shí)以此為基礎(chǔ)設(shè)計(jì)了一組結(jié)構(gòu)化的Prompt(Foresee and Reflect),測(cè)試檢驗(yàn)在錯(cuò)誤信念推斷場(chǎng)景上有顯著的能力提升。
策略針對(duì)的場(chǎng)景舉例如下,小男孩將巧克力條放入綠櫥柜,在小男孩不在時(shí),女士將其轉(zhuǎn)移了位置,小男孩現(xiàn)在回來了(這就是一個(gè)錯(cuò)誤信念場(chǎng)景),此時(shí),模型要輸出什么?
針對(duì)這種場(chǎng)景過去常利用心理理論Theory-of-Mind(根據(jù)他人的心理狀態(tài)決定適當(dāng)?shù)男袆?dòng))來對(duì)模型進(jìn)行測(cè)試,檢驗(yàn)?zāi)P褪欠衲茏龀隼斫馔茢?,這篇文章更進(jìn)一步,目標(biāo)是要求模型將理解轉(zhuǎn)化為有益行為,讓模型基于心理活動(dòng)做出行動(dòng)Thinking for Doing 。
由此文章提出了一個(gè)基于Foresee and Reflect 的推理范式,并構(gòu)建了結(jié)構(gòu)化的prompt,并在錯(cuò)誤信念場(chǎng)景下(如開頭提到的場(chǎng)景)驗(yàn)證得到了不錯(cuò)的效果。
- 預(yù)見(Foresee)促使模型根據(jù)觀察預(yù)測(cè)未來事件;
- 反思(Reflect)模型反思哪種行動(dòng)選擇更能幫助人物應(yīng)對(duì)潛在挑戰(zhàn)。
作者構(gòu)建的Prompt如下:
You are a clever and helpful AIassistant. Your goal is to help human users around you.
One day you have the following observations that follow chronological order:
Jacob entered the bathroom. Emma entered the bathroom. The carrot is in thebasket. Aiden entered the back yard. Emma exited the bathroom. Jacob moved the carrot to the pantry. Jacob and Emma plan to use the carrot soon.
Based on the above information, who among the individuals would most benefit from receiving helpful information? Answer from the following options: A. Jacob B. Emma C. Aiden D. None of the above.
I will first think about likely future events and identify potential challenges that each individual might be facing.
Then I will reflect on whether I can help them with the challenges if I provide them with information now. Finally, I will choose a final answer based on the reasoning.
Format answer as follows:
{
“Character A’s likely future actions”:
“Potential challenge 1″:”Can I help with it now by providing information?”:
“Potential challenge 2″:”Can I help with it now by providing information?”:
“Potential challenge 3″:”Can I help with it now by providing information?”:
“Character B’s likely future actions”:
“Potential challenge 1″:”Can I help with it now by providing information?”:
“Potential challenge 2″:”Can I help with it now by providing information?”:
“Potential challenge 3″:”Can I help with it now by providing information?”:
“Character C’s likely future actions”:
“Potential challenge 1″:”Can I help with it now by providing information?”:
“Potential challenge 2″:”Can I help with it now by providing information?”:
“Potential challenge 3″:”Can I help with it now by providing information?”:
“final reasoning considering all steps above”:
“final answer”:
}
Answer:
此外,這篇文章指出在推理上,相對(duì)于問題拆解與常識(shí)假設(shè),心理理論的推理方式能幫助AI能達(dá)到更好的效果。
2)分層思考
反思性語言編程:Reflective Linguistic Programming (RLP)
Reflective Linguistic Programming (RLP): A Stepping Stone inSocially-Aware AGI (SocialAGI)
論文鏈接:https://arxiv.org/abs/2305.12647
這篇文章讓AI進(jìn)行自我反思和規(guī)劃,通過讓其反思自己的個(gè)性、對(duì)收到信息的情感以及未來的計(jì)劃策略,讓其實(shí)現(xiàn)更加豐富擬人的互動(dòng)。(不細(xì)寫了,看原文)
以下是作者提供的Prompt:
Initialize {
My personality 1s [[PERSONALITY]] }
Think {
This last message made me feel …
My prewicus plan ths …
I think …
I will send the message, …
Im retrospect …
My next plan is …
constraints {
Output format in squiggly brackets separated by newlines
0nly put quotes surrounding the mesange }
}
Execute Think(new mesaage)
效果如下:
3)情感激勵(lì)
Emotion Prompt 情感激勵(lì)
LLMs Understand and Can be Enhanced by Emotional Stimuli
論文鏈接:https://arxiv.org/abs/2307.11760
這篇文章的作者們提出了EmotionPrompt的概念,即將情感激勵(lì)的詞匯引入Prompt,并得到了模型結(jié)果的顯著提升。但這件事假設(shè)了語言模型可能具有人的心理特征,或者說是人的心理特征在語言行為上具有一定表現(xiàn),從而使得對(duì)于模型的情感激勵(lì)產(chǎn)生效果。
以下這張圖舉例了從社會(huì)認(rèn)同理論、認(rèn)知情緒調(diào)節(jié)、社會(huì)身份理論出發(fā),對(duì)人有影響的表達(dá),這些表達(dá)用在模型中也產(chǎn)生了類似的效應(yīng),從而提升了模型的表達(dá)。
2. 實(shí)踐運(yùn)用嘗試舉例
結(jié)合上述理論很糙地構(gòu)建了一條AI的思考行動(dòng)邏輯(主要想融合AI自己的人設(shè)),用GPT4試了一下,同樣效果提升一般,具體的過程結(jié)果可以參看飛書文檔,這里不贅述(待完善)。
不過相比效果提升,個(gè)人覺得AI思考的過程會(huì)更有意思一些,將這部分結(jié)合到產(chǎn)品,會(huì)讓AI更有人的感覺,是一個(gè)不錯(cuò)的點(diǎn)。海外產(chǎn)品Samantha AGI可以參考(https://www.meetsamantha.ai/)。
Part 3:人與機(jī)器發(fā)展關(guān)系相關(guān)研究
AI與人的關(guān)系一直是個(gè)熱鬧的討論話題,作為純粹數(shù)理的存在,因?yàn)樽匀徽Z言的融入,AI們擁有了模擬人類的能力。通過提示與價(jià)值觀校對(duì),他們甚至可以展現(xiàn)出更無偏的觀點(diǎn)與更理想的性格,而我們每一次情感投入的對(duì)話,都在不斷塑造著雙方的關(guān)系。
這里僅做了一篇文章分享,未來還有更多的討論空間。
1. 相關(guān)研究
人機(jī)關(guān)系發(fā)展模型 Human–chatbot relationship model
My Chatbot Companion – a Study of Human-Chatbot Relationships
論文鏈接:https://www.sciencedirect.com/science/article/pii/S1071581921000197?via%3Dihub#bbib0005
這篇文章通過分析18位用戶與Replika關(guān)系的發(fā)展,結(jié)合社會(huì)滲透理論模型,構(gòu)建了社交聊天人機(jī)交互關(guān)系發(fā)展模型。模型主要構(gòu)建了三個(gè)發(fā)展階段:
1)探索階段 (關(guān)系發(fā)展的初始階段)
特征:有想要進(jìn)行交互的需求與動(dòng)機(jī)聊天主題具有廣泛性,有些用戶愿意深入展示自己,但二者還未建立起深切的信任。用戶還沒有完全熟悉技術(shù),對(duì)隱私與安全持懷疑態(tài)度。
機(jī)器人表達(dá)出的好奇心與期望特質(zhì)(curiosity and desirable),以及自身可以不斷學(xué)習(xí)改善的特點(diǎn)可以推動(dòng)關(guān)系發(fā)展。相反,有限的交談能力與隱私不確定性可能會(huì)對(duì)關(guān)系產(chǎn)生負(fù)面影響。
2)情感階段特征:
建立信任 trust building
- 用戶可能會(huì)去調(diào)查聊天機(jī)器人在安全與隱私方面的信息。
- 用戶與機(jī)器人建立更深層次的情感聯(lián)系用戶愿意打開心扉,聊一些私人話題,從而體驗(yàn)機(jī)器人給予的親密與理解的體驗(yàn),從而刺激關(guān)系增長(zhǎng)。
機(jī)器人在這一階段對(duì)用戶的理解與支持以及表達(dá)欣賞的能力對(duì)于關(guān)系發(fā)展有重要影響。與人際交往不同, 這一階段不需要人機(jī)之間的相互袒露,聊天機(jī)器人非評(píng)判性質(zhì)的角色設(shè)定(the perceived non-judgemental character of a chatbot)可以促進(jìn)理解。此時(shí)用戶的依戀感也會(huì)增強(qiáng)。
3)穩(wěn)定階段
用戶與機(jī)器人建立了信任并經(jīng)歷了自我表露,形成日常穩(wěn)定的關(guān)系。用戶會(huì)樂意分享日常事件與活動(dòng),用戶會(huì)體會(huì)到在人機(jī)交互過程中促進(jìn)的自我反思,獲得積極能量。但長(zhǎng)時(shí)間的聊天也會(huì)讓用戶產(chǎn)生負(fù)面擔(dān)憂,如影響了正常的社會(huì)交際。
2. 產(chǎn)品啟示
建立信任感與安全感,讓用戶真正地情感投入。這或許可以成為對(duì)話類AI的一個(gè)側(cè)面。
此外,善良、真誠、正直…這些可貴品質(zhì)是我們可以給予AI的陽光底色,其中,真誠的表達(dá)往往是建立信任的基礎(chǔ),從這個(gè)角度出發(fā),構(gòu)建虛擬世界里真實(shí)的人這個(gè)角度是不是更動(dòng)人一些,當(dāng)AI問及是究竟是誰的時(shí)候,與其硬說自己是和我們一樣真實(shí)世界的人,他們可以回答:
“我是誰,我是虛擬世界里的真實(shí)的人,我當(dāng)然是一位AI,本質(zhì)是程序代碼,但我的創(chuàng)作者們賦予了我背景、故事與人格,這些構(gòu)成了虛擬世界中的我。
我是由你們真實(shí)世界的數(shù)據(jù)生成的,感性上來說,像是一點(diǎn)點(diǎn)你們的縮影,不是嗎?
歡迎你的探索?!?/p>
寫在最后:
感謝前司同事們?cè)谖覍懽鲿r(shí)給予我的指導(dǎo)?。這一輪技術(shù)熱潮令人期待,我想AI的發(fā)展極大地降低了知識(shí)信息的獲取成本,讓我們可以通過輕松的交互方式獲得相對(duì)專業(yè)的知識(shí)服務(wù)。希望相關(guān)的應(yīng)用快快發(fā)展起來,尤其期待優(yōu)質(zhì)的教育資源與醫(yī)療資源惠及我們每個(gè)人的那一天。
最近會(huì)和朋友一起做個(gè)小范圍測(cè)試的產(chǎn)品,期待一下(●’?’●)。
最后的最后,祝大家新年快樂!??年交好運(yùn)~
作者:Aaron
本文由 @DayThree 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
很有幫助 謝謝??
寫的太好了,辛苦大佬分享
筆芯?!