從底層原理讓你的AI更好用!

古木杉
0 評(píng)論 744 瀏覽 0 收藏 7 分鐘
🔗 B端产品需要更多地依赖销售团队和渠道合作来推广产品,而C端产品需要更多地利用网络营销和口碑传播来推广产品..

在使用AI工具時(shí),你是否遇到過(guò)答非所問(wèn)、數(shù)理計(jì)算不準(zhǔn)確或編造事實(shí)等問(wèn)題?這些問(wèn)題可能源于提示詞的不當(dāng)設(shè)計(jì)或模型本身的局限性。本文將從大模型的底層原理出發(fā),深入探討如何通過(guò)提示詞調(diào)優(yōu)、外部資源調(diào)用和模型微調(diào)等方法提升AI的使用效果。

在用AI落地你的想法時(shí),是否有遇到以下問(wèn)題:

  • 答非所問(wèn)
  • 數(shù)理計(jì)算不準(zhǔn)確
  • 編造事實(shí)

大家遇到這些問(wèn)題時(shí)可能會(huì)疑惑:到底是提示詞寫的不好?還是模型本身的能力不足?

面對(duì)問(wèn)題卻只能“拔劍四顧心茫然”,不知道該用什么方式解決問(wèn)題

本文的目的便是幫大家理解大模型,后續(xù)使用AI遇到問(wèn)題時(shí),能夠快速找到合適的解決方案

(為幫助不同背景的同學(xué)理解,本文的舉例、概念有一定的簡(jiǎn)化)

一、大模型不會(huì)思考

從deepseek、豆包等大模型的使用體驗(yàn)而言,我們能感受到大模型有所謂“思考”的過(guò)程,但其實(shí)這只是為了用戶體驗(yàn)所包裝出來(lái)的假象:

大模型其實(shí)不會(huì)思考,但他擅長(zhǎng)“推理計(jì)算”,本質(zhì)是一個(gè)概率函數(shù),根據(jù)上文計(jì)算出接下來(lái)概率最大的文本是什么。

以一個(gè)小學(xué)生的完形填空題目為例:

既然大模型不會(huì)思考,為什么改提示詞能夠讓它更聽話?甚至能影響模型輸出的“思考過(guò)程”?

二、讓大模型更聽話的三種方式

大模型不聽話可能有幾種原因:

  • 無(wú)法回答或編造事實(shí),可能為大模型本身缺少相關(guān)知識(shí)
  • 回答過(guò)于發(fā)散,可能為大模型訓(xùn)練時(shí)很少接觸過(guò)此類問(wèn)題,對(duì)應(yīng)的語(yǔ)言/推理模式較弱
  • 指令丟失,可能提示詞/上下文過(guò)長(zhǎng),超出了模型可處理的長(zhǎng)度

從提示詞工程、外部知識(shí)與工具、模型微調(diào)三種方式可針對(duì)性地解決問(wèn)題

2.1 提示詞調(diào)優(yōu)

如前文表述,提示詞是最直接影響大模型輸出結(jié)果的因素,

在模型本身能力范圍內(nèi),提示詞是提升準(zhǔn)確性最具性價(jià)比的方式

像deepseek-R1這種推理模型是否不再需要復(fù)雜的提示詞?

——看情況,若希望有效果更穩(wěn)定的回答,提示詞技巧仍然適用,對(duì)于一些通識(shí)性問(wèn)題,推理模型自帶的推理模式可以很好地解決問(wèn)題,不需要過(guò)多的人為引導(dǎo)

列舉部分提示詞優(yōu)化技巧,列舉主要是為了幫助大家理解其原理,實(shí)操上可以將提示詞扔給大模型幫忙優(yōu)化

更多技巧可參考:

? 結(jié)構(gòu)化提示詞

若嘗試了多種提示詞技巧后,發(fā)現(xiàn)結(jié)果仍然不符合預(yù)期,可能觸及了當(dāng)前大模型的能力邊界,可參考2.2~2.3方法進(jìn)階調(diào)優(yōu)

2.2 外部資源調(diào)用

當(dāng)前大模型長(zhǎng)文本閱讀、數(shù)理計(jì)算、知識(shí)時(shí)效性方面仍然有局限性

為了補(bǔ)足這些短板,大模型也發(fā)展出了調(diào)用外部資源的能力

在具體落地上,可以使用Coze、Dify等AI應(yīng)用搭建平臺(tái),均有提供相關(guān)功能

雖然外部資源調(diào)用能一定程度擴(kuò)大大模型的能力邊界,但現(xiàn)在也仍有高延遲、實(shí)時(shí)性、安全風(fēng)險(xiǎn)等問(wèn)題

在落地時(shí)為了更好的效果,需要在工程側(cè)做一定優(yōu)化

2.3 模型微調(diào)

示例參考:模型微調(diào) – SiliconFlow

模型微調(diào)的本質(zhì)是調(diào)整大模型的參數(shù),需要引入“模型訓(xùn)練”的環(huán)節(jié)

在微調(diào)后,模型對(duì)特定領(lǐng)域場(chǎng)景的能力將會(huì)得到提升,但訓(xùn)練過(guò)程的門檻和成本都比較高

效果示例如下:

三、選擇合適你的調(diào)優(yōu)方式

一般來(lái)說(shuō),提示詞調(diào)優(yōu)>外部知識(shí)&工具>模型微調(diào)

  • 當(dāng)提示詞觸及模型能力邊界的問(wèn)題,再考慮另外兩種方式
  • 當(dāng)準(zhǔn)確度、時(shí)效要求較高時(shí),考慮微調(diào)

作者:古木杉 公眾號(hào):Jor的思考日記

本文由 @古木杉 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!
专题
15756人已学习15篇文章
汽车座舱的智能化,本质上是通过硬件+软件的手段,让汽车座舱具备人类“智能”的能力,使人与车直接协作更加安全高效。本专题的文章分享了智能座舱的产品模块解读。
专题
14488人已学习10篇文章
聚合支付作为对银行和第三方支付平台服务的拓展,能够提供多渠道支付方式,简化商家的支付对接。本专题的文章分享了聚合支付的设计思路。
专题
16282人已学习11篇文章
本专题分享了算法相关的知识,汇总了算法的基础知识和进阶知识。
专题
14723人已学习12篇文章
数据库对于产品经理来说是一个既熟悉又陌生的概念,虽然产品设计中的数据基本都要与数据库交互,但平时的工作中也很少接触到数据库的具体操作和细节。本专题的文章分享了数据库的基础知识。
专题
33921人已学习17篇文章
作为产品经理,你真的懂什么是敏捷开发吗?
专题
13406人已学习12篇文章
随着互联网的不断发展,如今获客渠道及方式也有很多。本专题的文章分享了获客渠道及方法。