沒有功德圓滿,沒有一步登天,一些提示詞撰寫的個人體會

Mrs.Data
0 評論 1018 瀏覽 2 收藏 11 分鐘
🔗 产品经理的核心价值是能够准确发现和满足用户需求,把用户需求转化为产品功能,并协调资源推动落地,创造商业价值

在大語言模型(LLM)的應(yīng)用中,提示詞的撰寫是實現(xiàn)高效人機(jī)交互的關(guān)鍵環(huán)節(jié)。本文作者通過豐富的實踐經(jīng)驗和案例分享了關(guān)于提示詞撰寫的深刻體會,強(qiáng)調(diào)提示詞并非萬能,其效果受限于模型能力和業(yè)務(wù)需求的匹配度。

最近很多項目中都需要用到提示詞工程,經(jīng)過一段時間的實踐和驗證,總結(jié)了一些個人體會比較深刻的感悟。

一、提示詞不是萬能的,大模型不是萬能的

自從deepseek火出圈后,各行各業(yè),不論大公司、小公司似乎都加快了大模型在企業(yè)內(nèi)部的應(yīng)用。

但是大多數(shù)公司由于缺乏專業(yè)的數(shù)據(jù)、算法團(tuán)隊,缺乏前期的技術(shù)積累和數(shù)據(jù)積累,能快速入手滿足嘗鮮需求的,就只有提示詞+通用大模型。

但是不是所有場景都能只通過提示詞來實現(xiàn)。面對業(yè)務(wù)部門提出的需求時,最好仔細(xì)判斷和驗證。

用提示詞是事半功倍,還是事倍功半。如果要說服業(yè)務(wù)不要通過大模型來實現(xiàn)他們的需求,也最好能通俗易懂的告訴他們?yōu)槭裁础?/p>

如何通俗易懂的告訴業(yè)務(wù),他們的需求模型和提示詞不能做,或者僅靠模型和提示詞不能做?

可以嘗試簡單回答下面的這幾個問題,基本上能讓業(yè)務(wù)對自己的需求能不能做、以及做出來的最終效果有一些預(yù)期。

  • 上下文限制:為什么不能上傳多個文件,為什么不能上傳超過一定字?jǐn)?shù)的文件
  • 生成速度:為什么回答速度這么慢
  • 模型幻覺:為什么生成的內(nèi)容和事實不符?能不能保證百分百的精確和準(zhǔn)確?
  • 文件解析:為什么不支持pdf\ppt\png\jpg格式的文件識別
  • 多模態(tài):為什么不能處理視頻、音頻

二、提示詞需要不斷迭代

提示詞的撰寫沒有功德圓滿,沒有一步登天。

需要不斷的迭代和修改,無限接近,但可能永遠(yuǎn)無法達(dá)到最完美的境地,當(dāng)然也不需要完美,只需要最適合當(dāng)前的情景。

在個人的實際應(yīng)用中,發(fā)現(xiàn)提示詞的迭代往往遵循這樣的規(guī)律:

  • 第一版提示詞通常是基于對需求的初步理解,能解決80%的簡單場景;
  • 第二版提示詞會針對測試中發(fā)現(xiàn)的問題進(jìn)行修正,覆蓋到90%的場景;
  • 第三版及以后的迭代則是在邊緣案例和特殊情況上不斷打磨,期望能盡可能多的覆蓋更多場景。

有時候,一個看似微小的詞語調(diào)整,就能讓模型的輸出從混亂變得井然有序,當(dāng)然也有可能導(dǎo)致模型輸出效果變得更差。

這種迭代不是無休止的,而是要找到一個平衡點——當(dāng)提示詞能夠滿足業(yè)務(wù)核心需求,且邊際收益開始遞減時,就可以暫時告一段落。

記得隨時記錄每次迭代的變化和效果,這些積累下來的經(jīng)驗,會成為提示詞工程能力提升的寶貴資源。

三、提示詞撰寫是一項科學(xué)工程

有效的提示工程需要將其視為科學(xué)過程,這需要嚴(yán)格記錄實驗(提示、設(shè)置、結(jié)果),以便進(jìn)行學(xué)習(xí)、比較和復(fù)現(xiàn) ,從而幫助我們更加系統(tǒng)、理性地應(yīng)對復(fù)雜的業(yè)務(wù)需求,提高撰寫成功率和效率。

提示詞撰寫雖然看起來只是寫幾行文字,但實際上它涉及到需求分析、方案設(shè)計、實現(xiàn)、測試和優(yōu)化的完整流程,就像軟件開發(fā)一樣需要遵循工程化的方法。

首先,需求分析階段要明確業(yè)務(wù)目標(biāo)和約束條件。這包括理解用戶真正需要解決的問題,以及可能面臨的各種邊界情況。一個好的提示詞工程師會問”為什么需要這個功能”而不僅僅是”需要什么功能”。

其次,方案設(shè)計階段需要考慮提示詞的整體結(jié)構(gòu)。這包括角色設(shè)定、任務(wù)描述、約束條件、輸出格式等要素的組織方式。好的提示詞結(jié)構(gòu)應(yīng)該清晰、模塊化,便于后續(xù)維護(hù)和調(diào)整。

實現(xiàn)階段則是根據(jù)設(shè)計編寫具體的提示詞內(nèi)容。需要對自然語言有敏銳的感覺,知道哪些表達(dá)方式更容易被模型準(zhǔn)確理解,哪些可能導(dǎo)致歧義。(這是我個人比較擅長的領(lǐng)域)

測試階段尤為重要,需要設(shè)計各種測試用例,覆蓋正常場景和邊緣場景。通過系統(tǒng)性測試,發(fā)現(xiàn)提示詞的弱點和盲區(qū)。

最后是優(yōu)化階段,根據(jù)測試結(jié)果有針對性地調(diào)整提示詞。這是一個反復(fù)試錯的過程,需要耐心和細(xì)心。

四、提示詞撰寫門檻低,上限高

門檻低

任何一個普通員工,即使沒有技術(shù)背景,也可以通過一些簡單的培訓(xùn),快速學(xué)會提示詞的撰寫。

如果能夠再投入一定的精力,學(xué)會top-k\ top-p等參數(shù)的應(yīng)用、了解COT\TOT\少樣本學(xué)習(xí)等撰寫技巧后,就能針對許多業(yè)務(wù)場景進(jìn)行探索和實驗。

上限高

合適的場景+合適的提示詞,能夠?qū)崿F(xiàn)令人眼前一亮的效果,精心設(shè)計的提示詞可以讓模型的輸出質(zhì)量接近專業(yè)人士的水平。

提示詞的上限取決于對業(yè)務(wù)領(lǐng)域的理解深度、對模型特性的把握程度以及提示詞設(shè)計的巧妙程度,當(dāng)然也受限于當(dāng)前所使用模型能力的上限。當(dāng)這些因素結(jié)合得當(dāng)時,即使是通用模型也能表現(xiàn)出接近專家的能力。

正是這種”門檻低、上限高”的特性,使得提示詞工程成為當(dāng)前AI應(yīng)用落地最具性價比的方式之一。

五、簡潔、簡潔還是簡潔

提示詞的撰寫要珍惜寶貴的上下文額度。在一些復(fù)雜的業(yè)務(wù)需求中,需要說明的任務(wù)較多時,必須在能簡潔的地方用最簡潔的文字描述,這樣才能為核心的說明留下更充足的字?jǐn)?shù)。

當(dāng)你想要給當(dāng)前的提示詞增加一些內(nèi)容時,最好同時看看哪里能刪減一些內(nèi)容, 且不影響最終效果。

簡潔并不意味著模糊或不完整,而是要用最精準(zhǔn)的語言表達(dá)最核心的意圖。這需要不斷練習(xí)和打磨,找到每個詞存在的價值。

在實踐中,我發(fā)現(xiàn)一個有效的方法是先寫出完整的提示詞,然后進(jìn)行”減法”——刪除那些不直接影響輸出質(zhì)量的描述性文字,合并表達(dá)相似意思的句子,用更簡潔的表達(dá)替換冗長的說明。

模型理解能力很強(qiáng),不需要像對人類那樣反復(fù)強(qiáng)調(diào)或解釋。直接、明確、簡潔的指令通常比長篇大論更有效。

六、模型能力很重要,提示詞能力也有限;但如果選擇不多,就需要最大化利用自己手頭上已有的。

模型能力的高低,會直接表現(xiàn)在對提示詞的回應(yīng)上。同樣的提示詞,一個更先進(jìn)的模型,就是能更好的發(fā)揮作用。

如果現(xiàn)在你感覺提示詞的效果并不好,可以等一段時間,更強(qiáng)大的模型推出后再試試,許多問題會迎刃而解。

當(dāng)然,并不是所有公司都有資源支持先進(jìn)模型的落地,雖然前面說了很多提示詞應(yīng)用的局限。

但是當(dāng)你所在的公司處于硬件設(shè)備、數(shù)據(jù)、技術(shù)、模型、團(tuán)隊資源有限的情況下,提示詞確實是最快捷、最低成本落地AI的途徑。有時候,限制反而能激發(fā)創(chuàng)造力。

在資源有限的情況下,可以采取一些策略來最大化現(xiàn)有模型的效果。例如,將復(fù)雜任務(wù)拆分成多個簡單任務(wù),讓模型逐步完成;利用少樣本學(xué)習(xí),提供幾個高質(zhì)量的示例來引導(dǎo)模型;或者設(shè)計巧妙的提示詞結(jié)構(gòu),讓模型按照特定的思考路徑來解決問題,或者開發(fā)一些工具,供模型使用,再下一步就是開發(fā)agent應(yīng)用。

七、總結(jié)一下

總的來說,提示詞工程是一門融合了語言藝術(shù)與科學(xué)的實踐,它既需要對語言的敏銳感知,也需要系統(tǒng)化的工程思維。在企業(yè)應(yīng)用中,應(yīng)當(dāng)既看到它的潛力,也需要認(rèn)清它的局限。不斷通過實踐積累經(jīng)驗,在迭代中尋找最佳平衡點。

提示詞工程不是終點,而是通向AI應(yīng)用落地的一條重要路徑。隨著技術(shù)的發(fā)展,我們的工具會更強(qiáng)大,但提示詞背后的思考方式和方法論,將繼續(xù)指引我們更好地駕馭AI的力量,為業(yè)務(wù)創(chuàng)造真正的價值。

本文由 @Mrs.Data 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
17435人已学习18篇文章
本专题的文章分享了车载HMI设计指南,包括HMI的交互、设计、功能等方面的知识分享。
专题
20417人已学习19篇文章
好的权限系统可以明确公司内不同人员、不同部门的分工,便于管理等优势。本专题的文章提供了后台权限管理设计指南。
专题
13083人已学习12篇文章
OTA,在线旅游(Online Travel Agency)指“旅游消费者通过网络向旅游服务提供商预定旅游产品或服务,并通过网上支付或者线下付费。
专题
13012人已学习19篇文章
如今随着互联网的发展,数字化给我们带来了更多的机会,在大数据时代,数据规模也在不断的膨胀,所以各种企业需要大数据治理。本专题的文章分享了数据治理相关的知识。
专题
12556人已学习11篇文章
怎么做投放是很多运营人和品牌方的一大难题,做好投放不可缺少以下几大步骤。本专题的文章以小红书投放为例,分享了一些策略,一起来看下吧。
专题
14060人已学习12篇文章
本专题的文章分享了供应链系统设计指南。