企業(yè)要接入 DeepSeek 等大模型,應(yīng)當(dāng)注意哪些風(fēng)控問(wèn)題?

亨亨
0 評(píng)論 2804 瀏覽 7 收藏 15 分鐘
🔗 产品经理的核心价值是能够准确发现和满足用户需求,把用户需求转化为产品功能,并协调资源推动落地,创造商业价值

隨著AI大模型如DeepSeek的興起,越來(lái)越多的企業(yè)希望接入這些技術(shù)以提升效率和產(chǎn)品體驗(yàn)。然而,企業(yè)使用大模型并非簡(jiǎn)單的技術(shù)接入,還涉及諸多風(fēng)險(xiǎn)控制問(wèn)題。本文從經(jīng)營(yíng)和業(yè)務(wù)視角出發(fā),詳細(xì)梳理了企業(yè)在接入大模型時(shí)可能面臨的風(fēng)控挑戰(zhàn),并提出了針對(duì)性的解決方案,供大家參考。

DeepSeek 的熱潮,從春節(jié)一直持續(xù)到現(xiàn)在,一浪接一浪。最開(kāi)始是科技媒體和自媒體,對(duì)于 DeepSeek 展開(kāi)討論,而現(xiàn)在湊風(fēng)口的,則是眾多企業(yè),紛紛宣布接入了 DeepSeek,就連國(guó)民級(jí)應(yīng)用微信,以及競(jìng)爭(zhēng)對(duì)手文心一言和騰訊元寶,也紛紛宣布在自家大模型的軟件里,接入了 DeepSeek 。

AI 的發(fā)展勢(shì)不可擋,AI 革命正在如火如荼,很多企業(yè)都有接入大模型產(chǎn)品,提升內(nèi)部效率或者產(chǎn)品體驗(yàn)的意愿和需求。但是,企業(yè)使用大模型不同于個(gè)人,要考慮商業(yè)機(jī)密、業(yè)務(wù)安全等等諸多問(wèn)題。

本文,我們就徹底厘清楚,企業(yè)要接入大模型,應(yīng)當(dāng)注意哪些風(fēng)控問(wèn)題。這不是一篇技術(shù)文章,而是更多的從經(jīng)營(yíng)和業(yè)務(wù)視角,用相對(duì)通俗的語(yǔ)言,識(shí)別出企業(yè)在實(shí)際落地 AI 過(guò)程中,不可忽視的 AI 風(fēng)險(xiǎn)。

01 接入大模型,會(huì)面臨哪些潛在風(fēng)險(xiǎn)

在研究大模型的風(fēng)控問(wèn)題前,我們首先要明確,企業(yè)接入大模型,都有哪幾種方式。

我在《業(yè)務(wù)中“接入大模型”,到底有哪幾種接入方法?》一文中專門(mén)寫(xiě)過(guò),不論是 DeepSeek,還是其他大模型,企業(yè)能夠接入的方式,一般就是以下 5 種,這張表格總結(jié)了各種方式的優(yōu)劣勢(shì)。

在不同的接入方式里,由于部署方法和使用方式的不同,所包含的風(fēng)控點(diǎn)也不同。

個(gè)人直接使用平臺(tái)功能,和通過(guò)智能體平臺(tái)搭建 Agent,這兩種方式,由于是公用平臺(tái),因此數(shù)據(jù)保密等級(jí)最低,作為個(gè)人工作的 Copilot(副駕駛、助理),沒(méi)太多問(wèn)題,但如果要把企業(yè)的機(jī)密信息傳入,就容易產(chǎn)生信息泄漏。

API 調(diào)用、私有化本地部署、通過(guò)云服務(wù)商間接部署,這三種方式,一方面涉及到對(duì)大模型的調(diào)整和訓(xùn)練,另一方面也涉及到模型輸出內(nèi)容會(huì)公開(kāi),所以涉及到比較多的風(fēng)險(xiǎn),比如訓(xùn)練數(shù)據(jù)合規(guī)、權(quán)限控制、輸出內(nèi)容審查等。

具體的風(fēng)險(xiǎn)類型和處理方法,我們?cè)谙挛脑敿?xì)展開(kāi)。

02 如何進(jìn)行 AI 大模型的企業(yè)風(fēng)控

根據(jù) AI 的使用者與 AI 大模型產(chǎn)生交互的時(shí)機(jī),我們把企業(yè)接入大模型的風(fēng)險(xiǎn),分成三個(gè)階段:傳入模型時(shí)風(fēng)控、模型處理中風(fēng)控、模型輸出時(shí)風(fēng)控。

傳入模型時(shí)風(fēng)控

這一階段,是信息進(jìn)入大模型的入口階段,日常的 AI 問(wèn)答不會(huì)有問(wèn)題,最大的風(fēng)險(xiǎn),就是業(yè)務(wù)敏感信息泄漏和數(shù)據(jù)合規(guī)。

風(fēng)險(xiǎn)點(diǎn)一:數(shù)據(jù)安全風(fēng)險(xiǎn)(保密數(shù)據(jù)、隱私數(shù)據(jù))。

在實(shí)際工作中,會(huì)因?yàn)闃I(yè)務(wù)需要,把實(shí)際業(yè)務(wù)的真實(shí)數(shù)據(jù)、或者重要的商業(yè)機(jī)密發(fā)送給 AI,在這個(gè)過(guò)程中,很容易將公司的核心機(jī)密流傳出去。

例如 AI 能力的提供方(不一定是大模型的研發(fā)公司,也有可能是提供 AI 服務(wù)的第三方等)可以查看到用戶與 AI 對(duì)話的內(nèi)容;或者 AI 在接收到信息后,內(nèi)化于自己的數(shù)據(jù)庫(kù),在與另外的用戶對(duì)話時(shí),將信息泄漏;又或者“偽本地化”部署方案中,若接口加密不完善,攻擊者可通過(guò)逆向工程竊取傳輸中的業(yè)務(wù)數(shù)據(jù)。

解決方法就在于對(duì)于數(shù)據(jù)安全的重視,主要是 2 個(gè):

1. 針對(duì)保密數(shù)據(jù)和隱私數(shù)據(jù),在底層的表結(jié)構(gòu)上,就做好權(quán)限控制?;驹瓌t是「最小權(quán)限原則」,即限制數(shù)據(jù)可訪問(wèn)的范圍和保密等級(jí),例如一些敏感數(shù)據(jù),只有達(dá)到一定權(quán)限的人才能增刪查改,其他人不能訪問(wèn),從數(shù)據(jù)獲取的源頭上,就做好把關(guān)。

2. 加強(qiáng)公司成員保密意識(shí),在使用 AI 時(shí),對(duì)敏感數(shù)據(jù)進(jìn)行脫敏處理。AI 的運(yùn)行過(guò)程中,如果必須使用某些數(shù)據(jù),那么就應(yīng)當(dāng)對(duì)數(shù)據(jù)進(jìn)行脫敏,比如 AI 大模型在調(diào)用用戶數(shù)據(jù)表時(shí),提前將用戶的身份證號(hào)和手機(jī)號(hào),進(jìn)行模糊化處理。

風(fēng)險(xiǎn)點(diǎn)二:訓(xùn)練數(shù)據(jù)合規(guī)風(fēng)險(xiǎn)

除了數(shù)據(jù)保密的風(fēng)險(xiǎn),企業(yè)還得多關(guān)注訓(xùn)練數(shù)據(jù)的合規(guī)性。什么意思呢?就是拿來(lái)訓(xùn)練大模型的數(shù)據(jù),必須得合法合規(guī),不能踩法律的紅線。尤其是隱私保護(hù)和知識(shí)產(chǎn)權(quán),稍微不注意,就可能讓公司在法律框架內(nèi)觸及紅線。如果某些數(shù)據(jù)只是拿來(lái)訓(xùn)練,不會(huì)對(duì)外提供服務(wù),那么訓(xùn)練過(guò)程中,要做好數(shù)據(jù)生命周期的管理工作,及時(shí)銷(xiāo)毀使用完的數(shù)據(jù)。

同時(shí),數(shù)據(jù)的質(zhì)量把控也得過(guò)硬,這是為了大模型的品質(zhì)考慮,這很好理解,如果數(shù)據(jù)質(zhì)量過(guò)差,大模型的水平自然也不會(huì)好。

模型處理中風(fēng)控

模型處理中的風(fēng)控問(wèn)題較多,某種程度上,也不僅僅是技術(shù)上的風(fēng)控問(wèn)題,也是企業(yè)內(nèi)控的一些要求。在這個(gè)階段,需要關(guān)注的風(fēng)控問(wèn)題主要有 5 個(gè)。

風(fēng)險(xiǎn)點(diǎn)一:模型倫理風(fēng)控

因?yàn)?AI 訓(xùn)練的過(guò)程,大多是黑盒,很多時(shí)候,我們并不知道 AI 在處理信息時(shí),究竟是怎么一個(gè)“腦回路”,所以大模型往往會(huì)搞出一些科技倫理問(wèn)題。模型倫理這塊兒,主要是別讓 AI“學(xué)壞了”。

比如招聘場(chǎng)景下,AI 可能因?yàn)闅v史數(shù)據(jù)男性偏多,因此在進(jìn)行處理時(shí),形成對(duì)女性的偏見(jiàn);或者由于網(wǎng)絡(luò)上對(duì)于某個(gè)人群的過(guò)度歧視,導(dǎo)致 AI 進(jìn)一步加強(qiáng)這種歧視。

所以在模型訓(xùn)練中,企業(yè)必須得用多樣化的數(shù)據(jù),把偏見(jiàn)扳回來(lái),還需要在產(chǎn)品研發(fā)流程上,增加一些倫理審核流程,別讓模型做出違背道德倫理和科技倫理的行為。畢竟,誰(shuí)也不想自家 AI 變成“道德滑坡”的典型吧……

風(fēng)險(xiǎn)點(diǎn)二:模型可解釋性

模型可解釋性,通俗點(diǎn)講,就是得搞清楚模型為什么這么決定。

大模型的訓(xùn)練與使用過(guò)程,我們已經(jīng)非常熟悉:將問(wèn)題和需求告知 AI,AI 自行處理后返回結(jié)果,這個(gè)結(jié)果可能是符合常理的,也有可能是完全意想不到的。這種不可控性,對(duì)于大多數(shù)場(chǎng)景而言,都是無(wú)害的,甚至能通過(guò)天馬行空的想象,挖掘出不一樣的靈感。

但是,有一些場(chǎng)景,AI 的不可控性,反而會(huì)成為掣肘,如果讓模型黑盒跑,誰(shuí)也不知道它怎么想的,那出了錯(cuò),都沒(méi)法向用戶解釋,嚴(yán)重一點(diǎn),監(jiān)管也會(huì)找上門(mén)。

而且,光和 AI 聊天,還只是算是初步應(yīng)用,要想讓 AI 能夠大規(guī)模釋放生產(chǎn)力,還是得讓 AI 進(jìn)入到工作流程中。比如金融方案、醫(yī)療推薦,AI 產(chǎn)生一個(gè)答案,那產(chǎn)出的過(guò)程中,因?yàn)槭裁??參考了什么?邏輯是什么?理由是什么?怎么推理出這個(gè)答案?這些問(wèn)題,都需要能夠有理有據(jù)的擇出來(lái),也就是大模型的推理結(jié)果,要有「可解釋性」。

可解釋性的保障,不僅僅要在模型嚴(yán)謹(jǐn)程度的參數(shù)上做調(diào)整,也要在產(chǎn)品流程上進(jìn)行介入。例如在產(chǎn)品流程上,強(qiáng)制性讓 AI 處理過(guò)程分為幾個(gè)步驟,并每個(gè)步驟強(qiáng)制性索引所有引用到的材料,或者在每個(gè)步驟,都設(shè)置監(jiān)控工具,確保出了問(wèn)題,能查到根源。

風(fēng)險(xiǎn)點(diǎn)三:行業(yè)合規(guī)要求

主要是特定行業(yè)和特定區(qū)域的合規(guī)要求,比如醫(yī)療行業(yè)的臨床要求、歐盟國(guó)家的 GDPR(歐盟跨境數(shù)據(jù)法規(guī))等。

風(fēng)險(xiǎn)點(diǎn)四:算力、成本、運(yùn)維的內(nèi)控問(wèn)題

尤其是私有部署的方案中,企業(yè)內(nèi)部能夠形成“成本陷阱”的地方特別多,因此,企業(yè)在內(nèi)部制度上,要做好企業(yè)內(nèi)控和技術(shù)方案的選擇。

大模型的訓(xùn)練,所需要的算力,是非常大的成本,即使是采用公有云的部署方案,花費(fèi)也不低。因此,選擇怎樣的技術(shù)實(shí)現(xiàn)方案,性價(jià)比更高?哪個(gè)云服務(wù)的配套,更有優(yōu)勢(shì)?算力是否有閑置,算力采購(gòu)過(guò)程中是否有舞弊?這些都能看作是大模型部署的內(nèi)控關(guān)注點(diǎn),不要稀里糊涂的把錢(qián)燒出去。

風(fēng)險(xiǎn)點(diǎn)五:模型失效與性能退化

是的,模型也是會(huì)退化的。

大模型部署完成后,并非一勞永逸,即使不考慮新模型對(duì)舊模型的超越,單就同一個(gè)模型來(lái)看,也存在性能退化的問(wèn)題,時(shí)間長(zhǎng)了可能就“老化”了。

這種老化,一般是由于數(shù)據(jù)分布漂移、數(shù)據(jù)循環(huán)污染等原因造成。數(shù)據(jù)分布漂移就是,現(xiàn)實(shí)世界的情況會(huì)隨著時(shí)間變化,但模型中的數(shù)據(jù)不會(huì),就會(huì)產(chǎn)生偏差(比如 20 世紀(jì)的某些政策并不能套用到 21 世紀(jì))。數(shù)據(jù)循環(huán)污染是大模型與大量用戶對(duì)話后,被拉低了數(shù)據(jù)質(zhì)量,導(dǎo)致模型的繭房加劇,偏差加大。

所以在應(yīng)對(duì)模型失效與退化上,監(jiān)控和預(yù)警機(jī)制、數(shù)據(jù)更新和再訓(xùn)練的策略、數(shù)據(jù)容災(zāi)與回滾機(jī)制等措施,都很重要。同時(shí),在組織與流程上的保障也是要考慮的,比如專門(mén)的團(tuán)隊(duì)和 SOP,來(lái)對(duì)模型的實(shí)際表現(xiàn),進(jìn)行定量和定性的監(jiān)控。

模型輸出時(shí)風(fēng)控

這個(gè)過(guò)程比較容易理解,就是對(duì)于模型輸出的內(nèi)容,本身也需要進(jìn)行一定的篩選和過(guò)濾,以便符合內(nèi)容合規(guī)的要求。這部分的內(nèi)容風(fēng)控,本質(zhì)上與社交媒體發(fā)布信息時(shí)間的風(fēng)控,是類似的。

輸出階段,傳統(tǒng)的信息合規(guī)要注意:

  1. 政策層面的內(nèi)容合規(guī),要符合監(jiān)管的要求。
  2. 社區(qū)氛圍的良性導(dǎo)向,如謾罵、隱私等。
  3. 社區(qū)用戶安全的保證。

這部分現(xiàn)有的解法都非常成熟,機(jī)器學(xué)習(xí)+人工審核的配套方案,基本上不會(huì)出現(xiàn)問(wèn)題。

AI 場(chǎng)景中,還需要額外注意一個(gè)“AI 幻覺(jué)”的問(wèn)題。目前的大模型,或多或少都有這個(gè)毛病,愛(ài)“胡說(shuō)八道”,比如編個(gè)不存在的事實(shí),或者胡扯一個(gè)數(shù)據(jù)來(lái)源。所以在某些嚴(yán)肅場(chǎng)景下的業(yè)務(wù),企業(yè)要在輸出檢查上,多做幾道驗(yàn)證。

03 風(fēng)控是為了更好的創(chuàng)新

接入大模型,能給企業(yè)帶來(lái)效率和創(chuàng)新,但風(fēng)險(xiǎn)也不少。從傳入模型時(shí)的數(shù)據(jù)保密和合規(guī),到處理中的可解釋性、倫理、行業(yè)標(biāo)準(zhǔn)、成本控制和性能維護(hù),再到輸出時(shí)的內(nèi)容審查和減少幻覺(jué),企業(yè)得全盤(pán)考慮,步步為營(yíng)。

怎么管好這些風(fēng)險(xiǎn)?需要有一個(gè)完整的 AI 治理框架,數(shù)據(jù)得管?chē)?yán)、合規(guī)得做足、模型得選對(duì)、部署得合理,并且隨時(shí)優(yōu)化。只要把這些風(fēng)控點(diǎn)掐住了,企業(yè)才能放心用 AI,既安全又高效。

作者:亨哼;公眾號(hào):產(chǎn)品變量(ID:hengpaper)

本文由 @亨哼 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖由作者提供

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!
专题
14554人已学习13篇文章
在产品的运营过程中,无论是产品、运营还是市场团队,都希望能清晰地了解用户的行为路径,通过用户行为分析,优化用户体验,实现更精准的运营和营销。
专题
85589人已学习22篇文章
不能用C端产品思维套在B端产品上哦。
专题
17295人已学习14篇文章
本专题的文章分享了如何设计B端SaaS产品及B端SaaS产品方法论。
专题
52334人已学习14篇文章
现在业内很多人都强调产品思维,但它到底是什么?又有何用武之地呢?
专题
14024人已学习13篇文章
本专题的文章分享了WMS系统设计指南。
专题
17986人已学习15篇文章
本专题的文章分享了Android和iOS在产品、设计、交互等方面的差异。