【入門科普】關(guān)于Deepseek你肯定會關(guān)心的3個(gè)基本問題

0 評論 2402 瀏覽 1 收藏 14 分鐘
🔗 产品经理的不可取代的价值是能够准确发现和满足用户需求,把需求转化为产品,并协调资源推动产品落地,创造商业价值。

是什么,超越ChatGPT登頂蘋果App Store排行榜?

是什么,讓英偉達(dá)股價(jià)暴跌近20%?

是什么,讓OpenAI一邊忍不住夸贊一邊又無中生有地污蔑其盜竊?

是什么,讓中國人春節(jié)前后歡騰不已而美國人叫苦不迭?

答案是——Deepseek的橫空出世。

相信春節(jié)前后有在關(guān)注科技圈的朋友們,都會被關(guān)于Deepseek的報(bào)道、體驗(yàn)、分析等內(nèi)容一遍遍地刷屏。這些內(nèi)容,有從個(gè)人體驗(yàn)切入感嘆Deepseek的強(qiáng)大,有從技術(shù)層面入手詳細(xì)拆解背后的突破,也有從政治、經(jīng)濟(jì)、國際關(guān)系等層面剖析中美兩國關(guān)系的變化。但我在春節(jié)期間回家與親朋戚友交流發(fā)現(xiàn),他們其實(shí)也有刷到相關(guān)的內(nèi)容,但大多表示看不懂,或者不太清楚這款產(chǎn)品對于他們的日常使用有什么影響?基于此,結(jié)合本人這些天來的信息搜集和個(gè)人體驗(yàn),我打算撰寫這篇科普文章,希望從普通人的視角來切入,回答普通人對于Deepseek需要知道的內(nèi)容。

01 Deepseek是什么

簡單來說,Deepseek是由杭州深度求索公司所自研的一款通用生成式AI產(chǎn)品。深度求索公司在2023年7月17日正式成立,在短時(shí)間內(nèi),Deepseek發(fā)布了多個(gè)重要模型,比如Deepseek Coder、Deepseek LLM、Deepseek-V2、Deepseek-V3。2025年1月15日,搭載Deepseek-V3模型的APP上架,快速登頂蘋果App Store排行榜。2025年1月20日,引起關(guān)注的Deepseek-R1模型發(fā)布并同步開源。

看到這里,也許你會發(fā)出疑問:在此之前,國內(nèi)已經(jīng)有多款A(yù)I產(chǎn)品先后發(fā)布,也號稱取得良好的效果。那為什么這次Deepseek的發(fā)布,如此大的關(guān)注呢?來,我們接著往下。

02 為什么Deepseek的發(fā)布,會引起如此大的關(guān)注

Deepseek近期引發(fā)全球關(guān)注的原因,總結(jié)起來有以下4點(diǎn):

1)模型的表現(xiàn)卓越:根據(jù)Deepseek官方和其他行業(yè)人士測試的結(jié)果,Deepseek-R1模型在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩 OpenAI o1 正式版,部分測試甚至超越了OpenAI的模型。而且,Deepseek針對中文語境和特定行業(yè)需求進(jìn)行了精心優(yōu)化,“更適合中國寶寶體質(zhì)”。

2)模型的訓(xùn)練方式足夠創(chuàng)新突破:Deepseek-R1 通過獨(dú)立自研的方式,在對模型訓(xùn)練方式、架構(gòu)等進(jìn)行了多項(xiàng)優(yōu)化改進(jìn),從而大幅提升了訓(xùn)練效率。而且,Deepseek團(tuán)隊(duì)將他們的探索過程一一記錄在論文當(dāng)中,幫助業(yè)界指明方向。

3)模型的全面開源:Deepseek-R1模型完全開源,在遵循MIT License的規(guī)則下,為全球開發(fā)者敞開了自由使用、修改和進(jìn)一步開發(fā)的大門。這種開放性極大地促進(jìn)了AI領(lǐng)域的技術(shù)交流與創(chuàng)新,為整個(gè)行業(yè)的發(fā)展提供了強(qiáng)大助力。而這樣的開源精神,曾經(jīng)是OpenAI所倡導(dǎo)的(OpenAI的Open正是此意)。

4)模型的使用成本低:如果不想部署開源模型,Deepseek也提供了價(jià)格很低的API。這意味著普通開發(fā)者和企業(yè)可以在不承擔(dān)過高費(fèi)用的前提下,輕松地將Deepseek的強(qiáng)大功能集成到自己的應(yīng)用程序或業(yè)務(wù)流程中。相信隨著越來越多的落地場景探索,AI技術(shù)在應(yīng)用層面會取得更大的突破。

綜上所述,從國際關(guān)系視角來看,Deepseek是我國打破美國算力芯片封鎖的有力動(dòng)作,某種層面也給了其他行業(yè)極大的信心(任何年代,信心都是比黃金還要珍貴的事物);從技術(shù)視角來看,Deepseek使用了很低的算力成本,就達(dá)到了OpenAI-O1模型的水平,為后續(xù)的技術(shù)迭代指明了方向,而且它還對外開源了;從應(yīng)用視角來看,Deepseek相當(dāng)于讓每一位使用者都可以使用到第一梯隊(duì)的AI產(chǎn)品,實(shí)現(xiàn)“技術(shù)平權(quán)”。

或許,你不負(fù)責(zé)技術(shù)實(shí)現(xiàn),也不關(guān)心國家大事,但Deepseek的問世,也意味著我們使用AI的方式也有了變化,這就跟我們密切相關(guān)了。接下來,我們來看看,對于普通人而言,Deepseek發(fā)布后,使用AI的方式有哪些改變。

03 Deepseek發(fā)布后,我們使用AI的方式有哪些變化

我們先來看看,在Deepseek發(fā)布之前(或者說是OpenAI-o1發(fā)布之前),在普羅大眾層面?zhèn)鞑サ腁I使用方式是怎樣的。以下是我在微信搜索“提示詞”的一些典型文章截圖。

這些提示詞教學(xué),無一不是在強(qiáng)調(diào)提示詞的框架性。但從Deepseek-R1發(fā)布的那一刻起,這些文章的內(nèi)容就已經(jīng)不再適用了。關(guān)于這一點(diǎn)的原因,我在我自己的AI課程里也有介紹,倒不是說這些內(nèi)容是錯(cuò)誤的,而是它們其實(shí)是屬于提示詞工程(Prompt Engineering)范疇的內(nèi)容。各類專業(yè)框架,實(shí)質(zhì)上是給AI生成過程提供嚴(yán)謹(jǐn)、完整的參考信息和思考鏈路,從而追求極致的生成質(zhì)量。但是,Deepseek-R1以及之前的OpenAI-O1,都是推理型模型,自帶思維鏈的能力。對于沒有經(jīng)過深度鉆研提示詞工程的普羅大眾而言,盲目套用這些框架,只會干擾AI的思考結(jié)果,得不償失。就好比手動(dòng)檔的汽車,需要駕駛員自己判斷何時(shí)切換檔位,為此也有各路老司機(jī)總結(jié)的一些判斷準(zhǔn)則。但是,盲目將這些判斷套用到自動(dòng)檔上,顯然是適得其反。

所謂思維鏈(CoT,Chain-of-Thought),就是讓模型在給出答案前進(jìn)行逐步的思考與推理,并將這一過程顯式呈現(xiàn),仿佛是人類將復(fù)雜的思考路徑拆解展示。例如在解決多步數(shù)學(xué)問題或復(fù)雜邏輯推理時(shí),模型按照邏輯順序逐步分析,先理解問題,再尋找關(guān)鍵條件,逐步推導(dǎo)直至得出結(jié)論。這種方式不僅增強(qiáng)了模型的可解釋性,使人們能夠清晰了解答案的由來,同時(shí)也提升了解決復(fù)雜問題的能力。

那么,在自帶思維鏈的Deepseek面前,我們使用AI方式,應(yīng)該如何改變?比之“改變”,我認(rèn)為準(zhǔn)確的說法是“回歸”,也就是回歸到平常的自然語言上。用大白話解答就是三個(gè)字——

說——人——話——

展開來講就是,忘掉以往學(xué)習(xí)軟件那一套“指令式交互”,而是回歸到完成任務(wù)本身。也就是我們把AI看成是一名“無所不知、非常聰明、聽懂人話、剛進(jìn)公司”的實(shí)習(xí)生,然后想想,如果你跟這樣一名實(shí)習(xí)生交代任務(wù),你會怎么交代?是不是要把任務(wù)講清楚,然后要提供足夠的參考信息,盡可能明確各類要求,必要的時(shí)候還可以提供一些參考例子?

是的,跟AI下達(dá)指令時(shí),不要再去糾結(jié)這樣說“正不正確”,而是關(guān)注這樣說“齊不齊全”。只要信息給得足夠齊全,Deepseek會自己拆解問題逐步思考給出回答。

至于具體的使用Prompt的技巧,這足夠單獨(dú)成文了。限于篇幅,我們在這里就不展開,如果大家比較感興趣,可以給在下多多點(diǎn)贊,我在后續(xù)安排上。這里,我就給大家展示一個(gè)我自己使用Deepseek的例子,就是讓AI依據(jù)詞牌寫詞(補(bǔ)充一下,我很喜歡用給AI出寫古代詩詞,基本上能很好地看出是套了ChatGPT還是自己訓(xùn)練,前者對中文的理解沒有這么透徹)。

我的Prompt如下:

你要參考水調(diào)歌頭的詞牌,以當(dāng)前人工智能的發(fā)展為主題,寫一首歌,我希望你告訴我你主要參考了哪些作者的作品,參考了哪些內(nèi)容。

是不是感覺這段Prompt平平無奇,甚至有些簡陋。是的,我是故意為之,當(dāng)時(shí)也是想看看Deepseek的思維鏈表現(xiàn)。來,我們再來看看Deepseek的思考過程(內(nèi)容較多,我就直接截圖)。

看完后我直呼好家伙,Deepseek展示了它的完整思考過程。首先挑選它認(rèn)為合適的參考作品,然后確定主題內(nèi)容,押韻韻腳和用詞的選擇,最后還會檢查是否符合格律要求。這簡直就跟人類在思考創(chuàng)作一闕詞作的過程一模一樣。

不過,我還有后招,按我以前的經(jīng)驗(yàn),AI大概率是處理不好中文的押韻問題的(我曾經(jīng)為此跟ChatGPT及多款A(yù)I來回拉扯了幾輪都沒有達(dá)成)。大家注意看下,“秋”和“浮”是不押韻的,當(dāng)時(shí)我心里想,“哈哈,還不讓我抓住你的小瓣子”。于是,我就在對話里指出,“上面的作品,秋和浮,不押韻”。

然而,結(jié)果證明是我膚淺了。來,我們來看下Deepseek對此的回應(yīng)。

原來是我低估了,Deepseek指出,它參考了《詞林正韻》,“流”和“浮”這兩個(gè)字在古代的讀音是押韻的,“浮”字的宋代實(shí)際讀音近「f?u」(這點(diǎn)我作為一名廣東人還是能理解的,實(shí)際上這兩個(gè)字在粵語里的確還是押韻的)。而且,它還補(bǔ)充說,“蘇軾原詞「天」「年」「寒」「間」同樣存在古今音變問題”,這多少是有點(diǎn)傲嬌了哈哈。不過,它最后還是按照要求進(jìn)行了調(diào)整。

之后,我在多輪對話中,陸續(xù)還提了“我希望就以現(xiàn)代普通話為標(biāo)準(zhǔn)就行”、“最后兩句的結(jié)尾都是同一個(gè)字“舟”,可否避免?”等要求。這是我和Deepseek的最后一輪對話。

我雖已練就與AI對話的能力,但在與Deepseek對話的過程中,我依然有一種“驚喜感”,一種“你太會了”的感受??梢哉f,Deepseek代表著人類在AI領(lǐng)域的探索又前進(jìn)了一步。我之前曾有總結(jié)“AI生成結(jié)果再豐富再優(yōu)質(zhì),最終的判斷與選擇權(quán)在使用者。只有使用者的認(rèn)知水平足夠高,才能辨別AI結(jié)果的優(yōu)與劣?!边@既是對AI沒有判斷立場的補(bǔ)充,又仿佛是人類的挽尊。

最后總結(jié)一下,我們在面對類似Deepseek這樣自帶思維鏈的推理型AI模型,在實(shí)際對話的過程中,不必關(guān)注Prompt的框架性,而是要“說人話”,也就是使用自然語言來表達(dá)清楚我們的任務(wù)。重點(diǎn)關(guān)注提供的信息,對于完成任務(wù)而言是否有幫助,是否足夠齊全。至于過程中的問題拆解,就盡管交給AI即可。

作者:產(chǎn)品經(jīng)理崇生,公眾號:崇生的黑板報(bào)

本文由 @產(chǎn)品經(jīng)理崇生 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自 unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
12430人已学习13篇文章
Sora产品的爆火,给了我们不少的震撼,感叹AI在内容创作领域的进步实在是太快了。本专题的文章分享了对于Sora的解读和思考。
专题
15079人已学习12篇文章
用户体验五要素包括战略层、范围层、框架层、结构层、表现层五个方面,本专题的文章分享了用户体验五要素的看法。
专题
12645人已学习14篇文章
对电商行业的从业者们而言,GMV这个概念估计都不陌生,不少人也开始拿GMV作为评判各家电商平台市占率的指标之一。本专题的文章分享了GMV破亿的经验总结。
专题
60417人已学习20篇文章
想转行做产品经理,这个专题值得一看,看看前人是怎么做到的。
专题
12566人已学习12篇文章
运营分很多类,流量运营、用户运营、内容运营…每一个环节都有特别关注的数据和指标。本专题的文章分享了互联网运营,应该分析哪些数据和指标。