你是上AI大模型的船,還是讀蘇東坡的詩(shī)?
AI領(lǐng)域的從業(yè)者在接觸大模型時(shí),應(yīng)該學(xué)習(xí)哪些技術(shù)?想打造AI產(chǎn)品的同學(xué)或者想做大模型相關(guān)應(yīng)用的同學(xué),又該如何學(xué)習(xí)相關(guān)技術(shù)?這篇文章里,作者做了梳理和總結(jié),一起來(lái)看一下。
不少歷經(jīng)移動(dòng)互聯(lián)網(wǎng)創(chuàng)業(yè)者都有過(guò)輝煌的融資歷史,但他們現(xiàn)在的生活呢?我聽(tīng)了幾個(gè)故事版本,那共同的特性是,他們白天是焦慮不安甚至恐懼的,夜深時(shí)他們才稍微安穩(wěn)下來(lái),因?yàn)榫凭驮?shī)意,仿佛還能沉醉在曾經(jīng)大廠(chǎng)、名校、下樓喝杯咖啡就融到資的幻覺(jué)里。對(duì)于人生巔峰時(shí)期腳本、高速生長(zhǎng)互聯(lián)網(wǎng)的留戀,多一秒鐘都是浪費(fèi),蘇東坡是一次不得志,后面次次不得志。時(shí)光有限,抓住機(jī)會(huì)趕緊上。
這次AIGC大模型技術(shù)和產(chǎn)品轉(zhuǎn)的快因?yàn)橛腥缦翧I-Infrustructure基礎(chǔ)。工程師已經(jīng)如火如荼的趕在AIGC大模型的道上了,產(chǎn)品經(jīng)理也得加油。
主動(dòng)改變是紅利,被動(dòng)改變是后退!
沒(méi)有基礎(chǔ)的同學(xué)抓緊看,AI-Infrastructure很重要.
本文主要講解AI領(lǐng)域從業(yè)者,在接觸AIGC大模型的時(shí)候,應(yīng)該學(xué)習(xí)哪些大模型有關(guān)的技術(shù),做大模型相關(guān)的應(yīng)用應(yīng)該學(xué)哪些技術(shù),如何學(xué)懂這些技術(shù),會(huì)遇到哪些問(wèn)題,如何解決問(wèn)題?
一、客戶(hù)需要AI大模型博得未來(lái)
我們一個(gè)連續(xù)創(chuàng)業(yè)者客戶(hù)是這樣回應(yīng)一個(gè)時(shí)代結(jié)束了:
“拿不到AI大模型的票,接下來(lái)的人生只能讀蘇東坡的詩(shī)”!
客戶(hù)說(shuō):”要開(kāi)發(fā)得先咨詢(xún)和學(xué)習(xí)下面這么多AIGC大模型技術(shù),先請(qǐng)你們來(lái)企業(yè)實(shí)戰(zhàn)咨詢(xún)也一并給你們來(lái)開(kāi)發(fā)吧,我們邊學(xué)邊問(wèn)。”,那么客戶(hù)究竟學(xué)了哪些AIGC大模型技術(shù)呢?下面一一道來(lái)。
二、AIGC和大模型擁有廣闊的應(yīng)用場(chǎng)景
人工智能生成內(nèi)容技術(shù)(AIGC)大模型有不同應(yīng)用場(chǎng)景。可以看到以下應(yīng)用:
1)山姆奧特曼封神OpenAI Dev Day演講后開(kāi)啟Iphone時(shí)刻的GPTs
https://www.gptshunter.com/
2)新聞和文章:AIGC可以用于生成新聞文章、評(píng)論文章、博客文章等
www.cnbluesource.com
3)廣告和營(yíng)銷(xiāo):AIGC可以用于生成廣告文案、營(yíng)銷(xiāo)創(chuàng)意、社交媒體帖子等
www.chinaciaf.org
4)娛樂(lè)和游戲:AIGC可以用于生成電影、電視劇、動(dòng)畫(huà)、游戲等
m.tech.china.com
5)教育和培訓(xùn):AIGC可以用于生成課件、練習(xí)題、模擬測(cè)試等
www.chinaedu.net
6)科學(xué)和研究:AIGC可以用于生成實(shí)驗(yàn)報(bào)告、論文、數(shù)據(jù)分析等
6352484650069.huodongxing.com
7)個(gè)人和商業(yè)使用:AIGC可以用于生成個(gè)人作品、商業(yè)文檔等
https://item.m.jd.com/product/10067217658262.html?gx=RnAoFNnisLpgEx-KdwPoEfgeSQ&gxd=RnAokWcKbGeIyZFG_oN0WuHzhV8fcEw&ad_od=share&utm_source=androidapp&utm_medium=appshare&utm_campaign=t_335139774&utm_term=CopyURL
AIGC大模型技術(shù)具有廣闊的應(yīng)用前景,可以為我們的生活和工作帶來(lái)許多便利。
三、做AIGC大模型產(chǎn)品需要懂哪些技術(shù)?
1. PC互聯(lián)網(wǎng)主要是懂PC基礎(chǔ)技術(shù)架構(gòu)
如圖所示:PC互聯(lián)網(wǎng)的基礎(chǔ)技術(shù)架構(gòu)可以總結(jié)為以下幾點(diǎn):
1)客戶(hù)端技術(shù)
包括瀏覽器、搜索引擎等前端技術(shù),以及操作系統(tǒng)、硬件等用戶(hù)設(shè)備方面技術(shù)。主要技術(shù)有HTML/CSS/JavaScript、瀏覽器內(nèi)核、搜索算法等。
2)服務(wù)器端技術(shù)
包括web服務(wù)器、應(yīng)用服務(wù)器、數(shù)據(jù)庫(kù)等后臺(tái)技術(shù)。主要技術(shù)有Linux、Apache、Nginx、Tomcat、MySQL、Java等服務(wù)端編程語(yǔ)言和框架。
3)網(wǎng)絡(luò)技術(shù)
包括網(wǎng)絡(luò)協(xié)議、網(wǎng)絡(luò)設(shè)備等互聯(lián)網(wǎng)基礎(chǔ)設(shè)施方面技術(shù)。主要技術(shù)有TCP/IP、DNS、CDN、骨干網(wǎng)等。
4)數(shù)據(jù)技術(shù)
包括數(shù)據(jù)采集、處理、分析、挖掘、可視化等方面技術(shù)。主要技術(shù)有大數(shù)據(jù)處理框架、數(shù)據(jù)倉(cāng)庫(kù)、機(jī)器學(xué)習(xí)算法等。
5)語(yǔ)音和圖像技術(shù)
支持語(yǔ)音交互、圖像處理等多媒體應(yīng)用的技術(shù)。主要技術(shù)有語(yǔ)音識(shí)別、自然語(yǔ)言處理、圖形圖像算法等。
6)安全技術(shù)
包括網(wǎng)絡(luò)安全、數(shù)據(jù)安全方面的技術(shù)。主要技術(shù)有加密算法、身份認(rèn)證、安全審計(jì)等。
以上構(gòu)成了PC互聯(lián)網(wǎng)的核心基礎(chǔ)技術(shù)架構(gòu)。
2. 移動(dòng)互聯(lián)網(wǎng)主要是懂Mobile基礎(chǔ)技術(shù)架構(gòu)
如上圖所示:移動(dòng)互聯(lián)網(wǎng)的基礎(chǔ)技術(shù)架構(gòu)可以概括為以下幾點(diǎn):
1)移動(dòng)設(shè)備硬件
包括智能手機(jī)、平板等移動(dòng)智能硬件的處理器、存儲(chǔ)、傳感器、無(wú)線(xiàn)模塊等核心部件技術(shù)。
2)移動(dòng)操作系統(tǒng)
智能手機(jī)和平板上的操作系統(tǒng),如Android和iOS。包含針對(duì)移動(dòng)設(shè)備優(yōu)化的內(nèi)核、驅(qū)動(dòng)、框架和應(yīng)用層。
3)移動(dòng)應(yīng)用開(kāi)發(fā)
基于移動(dòng)操作系統(tǒng)的應(yīng)用開(kāi)發(fā)技術(shù),如Android應(yīng)用開(kāi)發(fā)、iOS應(yīng)用開(kāi)發(fā)等。主要使用Java、Swift、React Native等語(yǔ)言和框架。
4)移動(dòng)網(wǎng)絡(luò)技術(shù)
包括移動(dòng)通信網(wǎng)絡(luò)技術(shù),如蜂窩移動(dòng)通信的演進(jìn)(2G/3G/4G/5G)等。充分利用無(wú)線(xiàn)網(wǎng)絡(luò)優(yōu)勢(shì)實(shí)現(xiàn)”任何時(shí)間任何地點(diǎn)”連接。
5)移動(dòng)數(shù)據(jù)技術(shù)
移動(dòng)大數(shù)據(jù)分析、機(jī)器學(xué)習(xí)在移動(dòng)場(chǎng)景的應(yīng)用技術(shù)??梢詫?shí)現(xiàn)個(gè)性化推薦、智能助手等。
6)移動(dòng)支付
移動(dòng)支付技術(shù),如NFC技術(shù),可以使智能設(shè)備快速安全地進(jìn)行支付。
7)移動(dòng)安全
針對(duì)移動(dòng)場(chǎng)景的安全技術(shù),如移動(dòng)設(shè)備加密、安全數(shù)據(jù)存儲(chǔ)、網(wǎng)絡(luò)安全、應(yīng)用安全機(jī)制等。
總體來(lái)說(shuō),移動(dòng)互聯(lián)網(wǎng)集成了包括無(wú)線(xiàn)通信、移動(dòng)硬件、操作系統(tǒng)、開(kāi)發(fā)框架、數(shù)據(jù)技術(shù)和安全技術(shù)等全套移動(dòng)化的技術(shù)體系。
3. 而AIGC大模型需要懂的是AIGC大模型基礎(chǔ)技術(shù)架構(gòu)
技術(shù)架構(gòu):從右到左,右側(cè)是大語(yǔ)言模型(開(kāi)源、閉源),中間層是早期系列應(yīng)用,包含研究用、包含編程用等;最左側(cè)是具體產(chǎn)品應(yīng)用
4. AIGC大模型技術(shù)架構(gòu)與對(duì)應(yīng)產(chǎn)品架構(gòu)(AI財(cái)稅為例)
UI 層:用戶(hù)界面層,提供給用戶(hù)與語(yǔ)言模型交互的界面,可以是網(wǎng)頁(yè)、移動(dòng)應(yīng)用、命令行界面等。
會(huì)話(huà)處理層:處理用戶(hù)與語(yǔ)言模型之間的交互會(huì)話(huà),包括對(duì)用戶(hù)輸入的解析、對(duì)話(huà)管理、上下文維護(hù)等功能。
數(shù)據(jù)審計(jì)層:負(fù)責(zé)對(duì)用戶(hù)數(shù)據(jù)進(jìn)行審計(jì)和保護(hù),防止數(shù)據(jù)泄露、濫用或被攻擊。這個(gè)層次也可以包括對(duì)模型的安全性和可信度進(jìn)行評(píng)估。
操作編排層:這個(gè)層級(jí)可以管理和協(xié)調(diào)多個(gè)語(yǔ)言模型、工具、智能體的運(yùn)行,比如多個(gè)模型之間的調(diào)用、結(jié)果的融合等。它可以作為一個(gè)簡(jiǎn)單的流程引擎,將多個(gè)模型組合成復(fù)雜的工作流程。
LLM 增強(qiáng)層:這個(gè)層級(jí)可以對(duì)語(yǔ)言模型進(jìn)行額外的優(yōu)化和增強(qiáng),比如加速推理速度、提供相關(guān)上下文、提高模型的準(zhǔn)確性、支持特定的任務(wù)等。這個(gè)層級(jí)也可以包括對(duì)模型解釋性和可解釋性的增強(qiáng)。
LLM 層:最底層是語(yǔ)言模型本身,它是整個(gè)架構(gòu)的核心。它可以是一個(gè)基于深度學(xué)習(xí)的模型,比如 LSTM、Transformer 等,也可以是一個(gè)基于傳統(tǒng) NLP 技術(shù)的模型。在這個(gè)層級(jí),模型會(huì)接收輸入并輸出相應(yīng)的文本結(jié)果。
大型語(yǔ)言模型(Large Language Model)的技術(shù)架構(gòu)通常是由多個(gè)組件組成的復(fù)雜系統(tǒng),用于訓(xùn)練和部署這些模型。以下是大型語(yǔ)言模型(例如GPT-3或GPT-4)的基礎(chǔ)技術(shù)架構(gòu)的一般概述:
模型架構(gòu):大型語(yǔ)言模型的核心是其模型架構(gòu),通常采用深度神經(jīng)網(wǎng)絡(luò),如變換器(Transformer)架構(gòu)。這個(gè)架構(gòu)包括多個(gè)層和注意力機(jī)制,用于處理自然語(yǔ)言文本。
數(shù)據(jù)集:模型的訓(xùn)練依賴(lài)于大規(guī)模的文本數(shù)據(jù)集,這些數(shù)據(jù)集用于學(xué)習(xí)語(yǔ)言的模式和結(jié)構(gòu)。數(shù)據(jù)集通常包括互聯(lián)網(wǎng)上的文本、書(shū)籍、文章等多種來(lái)源。
計(jì)算資源:大型語(yǔ)言模型的訓(xùn)練需要大量的計(jì)算資源,通常使用圖形處理單元(GPU)或更強(qiáng)大的張量處理單元(TPU)。這些資源用于執(zhí)行模型的前向和反向傳播過(guò)程。
分布式訓(xùn)練:由于大型語(yǔ)言模型的參數(shù)數(shù)量巨大,通常會(huì)使用分布式訓(xùn)練技術(shù),將訓(xùn)練過(guò)程分布到多個(gè)計(jì)算節(jié)點(diǎn)上,以加速訓(xùn)練。
模型優(yōu)化:在訓(xùn)練后,模型需要進(jìn)行優(yōu)化,以提高推理性能和減小模型的尺寸。這可能涉及到剪枝、蒸餾等技術(shù)。
部署:訓(xùn)練完成后,大型語(yǔ)言模型可以部署到云端服務(wù)器或邊緣設(shè)備上,以供用戶(hù)進(jìn)行自然語(yǔ)言處理任務(wù)的推理。
API和接口:通常,大型語(yǔ)言模型會(huì)提供API和接口,使開(kāi)發(fā)人員能夠與模型進(jìn)行交互,輸入文本并獲取生成的文本結(jié)果。
數(shù)據(jù)隱私和安全:數(shù)據(jù)隱私和模型安全是部署大型語(yǔ)言模型時(shí)的重要考慮因素,需要采取相應(yīng)的措施來(lái)確保用戶(hù)數(shù)據(jù)的保護(hù)和模型的安全性。
模型評(píng)估和監(jiān)控:部署后,需要對(duì)模型進(jìn)行評(píng)估和監(jiān)控,以確保其性能和輸出的質(zhì)量。
請(qǐng)注意,具體的大型語(yǔ)言模型技術(shù)架構(gòu)可能因模型類(lèi)型、用途和部署環(huán)境而有所不同。例如,GPT-3和GPT-4等不同的模型可能有不同的技術(shù)細(xì)節(jié)和架構(gòu)。
四、如何學(xué)習(xí)這些技術(shù)?
學(xué)習(xí)LLM(大語(yǔ)言模型)的訓(xùn)練和應(yīng)用技術(shù)以及AI基礎(chǔ)設(shè)施技術(shù)對(duì)于從事AI領(lǐng)域的從業(yè)者非常重要。以下是一些建議,幫助你學(xué)習(xí)這些技術(shù):
1. 學(xué)習(xí)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)基礎(chǔ)知識(shí)
開(kāi)始之前,確保你已經(jīng)建立了扎實(shí)的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)基礎(chǔ)。這包括對(duì)神經(jīng)網(wǎng)絡(luò)、損失函數(shù)、優(yōu)化算法、反向傳播等概念的理解。
2. 學(xué)習(xí)自然語(yǔ)言處理(NLP)基礎(chǔ)知識(shí)
了解自然語(yǔ)言處理的基本概念,例如分詞、詞嵌入、文本分類(lèi)、文本生成等。這些知識(shí)對(duì)于LLM模型的訓(xùn)練和應(yīng)用至關(guān)重要。
1)學(xué)習(xí)大規(guī)模模型的訓(xùn)練
了解大規(guī)模模型(如GPT、BERT等)的訓(xùn)練流程,包括數(shù)據(jù)準(zhǔn)備、模型架構(gòu)、超參數(shù)調(diào)整和訓(xùn)練策略。可以通過(guò)官方文檔、教程和研究論文來(lái)深入了解。
2)掌握深度學(xué)習(xí)框架
學(xué)習(xí)使用流行的深度學(xué)習(xí)框架如PyTorch、TensorFlow等,這將幫助你實(shí)際操作大型模型的訓(xùn)練和應(yīng)用。
3)學(xué)習(xí)AI基礎(chǔ)設(shè)施技術(shù)
了解云計(jì)算平臺(tái),如AWS、Azure、Google Cloud等,以及它們?cè)贏I領(lǐng)域的服務(wù)。掌握虛擬機(jī)、容器、Kubernetes等技術(shù),以支持模型的部署和擴(kuò)展。
4)學(xué)習(xí)數(shù)據(jù)處理和管理
數(shù)據(jù)是AI的基礎(chǔ),學(xué)習(xí)數(shù)據(jù)收集、清洗、存儲(chǔ)和管理技術(shù)非常重要。了解數(shù)據(jù)庫(kù)、數(shù)據(jù)湖和數(shù)據(jù)倉(cāng)庫(kù)等概念。
5)學(xué)習(xí)模型部署和監(jiān)控
了解模型的部署技術(shù),包括將模型部署到云端或邊緣設(shè)備。學(xué)習(xí)如何監(jiān)控模型性能,診斷問(wèn)題并進(jìn)行模型更新。
6)參加在線(xiàn)課程和培訓(xùn)
參加在線(xiàn)課程、培訓(xùn)班或找領(lǐng)路人等,以獲取系統(tǒng)化的知識(shí)。
7)閱讀相關(guān)書(shū)籍和文檔
閱讀與大模型訓(xùn)練和AI基礎(chǔ)設(shè)施技術(shù)相關(guān)的書(shū)籍、教材和官方文檔,以深入了解細(xì)節(jié)。
8)實(shí)踐項(xiàng)目
最重要的是實(shí)際動(dòng)手。通過(guò)自己的項(xiàng)目來(lái)應(yīng)用所學(xué)知識(shí),這將幫助你更深入地理解和掌握這些技術(shù)。
9)參與社區(qū)和網(wǎng)絡(luò)
參與AI社區(qū),參與討論、問(wèn)答和開(kāi)源項(xiàng)目。這將幫助你與其他從業(yè)者互動(dòng),并獲取有用的建議和見(jiàn)解。
10)持續(xù)學(xué)習(xí)
AI領(lǐng)域不斷發(fā)展,因此要不斷學(xué)習(xí)和跟進(jìn)最新的研究和技術(shù)進(jìn)展。
五、學(xué)習(xí)這些技術(shù)可能遇到的難題是?
以下是一些可能的難題以及應(yīng)對(duì)建議:
- 數(shù)學(xué)和統(tǒng)計(jì)知識(shí):深度學(xué)習(xí)和大規(guī)模模型訓(xùn)練涉及復(fù)雜的數(shù)學(xué)和統(tǒng)計(jì)概念,如線(xiàn)性代數(shù)、微積分、概率論等。如果你之前沒(méi)有相關(guān)背景,建議先學(xué)習(xí)基礎(chǔ)數(shù)學(xué)和統(tǒng)計(jì)知識(shí),然后深入學(xué)習(xí)與深度學(xué)習(xí)相關(guān)的數(shù)學(xué)概念。
- 編程技能:深度學(xué)習(xí)和AI基礎(chǔ)設(shè)施技術(shù)通常需要編程技能,尤其是Python。如果你不熟悉編程,建議先學(xué)習(xí)Python編程語(yǔ)言,然后深入學(xué)習(xí)深度學(xué)習(xí)框架的使用。
- 復(fù)雜的模型架構(gòu)和算法:理解大型語(yǔ)言模型的架構(gòu)和訓(xùn)練算法可能需要時(shí)間和精力。建議從簡(jiǎn)單的模型和算法開(kāi)始,逐漸深入研究更復(fù)雜的內(nèi)容。閱讀研究論文和教程可以幫助你理解這些概念。
- 數(shù)據(jù)處理和清洗:數(shù)據(jù)質(zhì)量對(duì)于訓(xùn)練和應(yīng)用模型至關(guān)重要。學(xué)習(xí)如何準(zhǔn)備和清洗數(shù)據(jù)以滿(mǎn)足模型的需求是一個(gè)挑戰(zhàn),但它是必要的。學(xué)習(xí)數(shù)據(jù)工程技術(shù)和數(shù)據(jù)處理工具可以幫助你解決這個(gè)問(wèn)題。
- 云計(jì)算和基礎(chǔ)設(shè)施:學(xué)習(xí)云計(jì)算和AI基礎(chǔ)設(shè)施技術(shù)可能會(huì)涉及到復(fù)雜的概念和工具,如容器編排、自動(dòng)化部署、網(wǎng)絡(luò)配置等。建議逐步學(xué)習(xí),可以先從基本的云計(jì)算概念開(kāi)始,然后逐漸深入研究高級(jí)主題。
- 持續(xù)學(xué)習(xí)和實(shí)踐:學(xué)習(xí)這些技術(shù)需要時(shí)間和不斷的實(shí)踐。持續(xù)學(xué)習(xí)和解決問(wèn)題是非常重要的,因?yàn)锳I領(lǐng)域不斷發(fā)展,技術(shù)不斷演進(jìn)。
六、如何克服困難學(xué)習(xí)提升?
尋求幫助和資源:不要害怕尋求幫助。參加在線(xiàn)課程、參與社區(qū)、參考教程和文檔,與其他從業(yè)者互動(dòng),都是獲取幫助和資源的途徑。
最重要的是,要有耐心和堅(jiān)持不懈的決心。學(xué)習(xí)這些技術(shù)需要時(shí)間和努力,但它們?yōu)槟阍贏I領(lǐng)域取得成功提供了重要的技能和機(jī)會(huì)。逐步學(xué)習(xí),一步一步地深入研究,你會(huì)逐漸克服這些難題。
專(zhuān)欄作家
LineLian連詩(shī),公眾號(hào):LineLian。人人都是產(chǎn)品經(jīng)理專(zhuān)欄作家,《產(chǎn)品進(jìn)化論:AI+時(shí)代產(chǎn)品經(jīng)理的思維方法》一書(shū)作者,前阿里產(chǎn)品專(zhuān)家,希望與創(chuàng)業(yè)者多多交流。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!