AI的小城故事:在小城市做AI,究竟是一種什么體驗
一提起做AI,大多數(shù)人都會想到實(shí)在北上廣深這種一線城市;其實(shí)小城市也可以做。比如文章中的案例,在昆明做AI,都會遇到那些問題和困難,希望這些案例,能給大家?guī)硪恍﹩l(fā)。
“您認(rèn)為AI公司在昆明,跟北上廣相比有什么優(yōu)勢?”
“我覺得昆明就是中國的硅谷,氣候特別好。”
這段對話,是在一次人工智能主題座談會上真實(shí)發(fā)生的。
經(jīng)常參加這類交流活動的朋友可能會懂,這類問題一般在“遞話”,給受訪人一個“安利”自家的產(chǎn)品、技術(shù)、差異化價值的由頭。所以當(dāng)現(xiàn)場有人拋出這個問題時,我也做好了聽到一堆PR公關(guān)辭令的準(zhǔn)備。
沒想到,這位昆明某AI服務(wù)商、數(shù)據(jù)科技公司的技術(shù)負(fù)責(zé)人,給出的答案是大家都沒有設(shè)想過的。但這種“意料之外”,展現(xiàn)出在“北上廣”這類大城市少見到的“地氣”。
活動結(jié)束后,我和這位技術(shù)負(fù)責(zé)人單獨(dú)聊了聊,又發(fā)現(xiàn)了一種“意料之外”。
他們公司也在做大模型,用的是開源Llama架構(gòu)+國產(chǎn)算力,經(jīng)由私有數(shù)據(jù)微調(diào),為云南游客提供線上問答服務(wù)。
你可能會問,AI模型都不是自己從底層代碼寫上來的,有什么差異化競爭力?實(shí)際上并不是大家想的那么簡單,只要調(diào)用API再用數(shù)據(jù)跑一遍就行了,他們在模型之外做的工作非常多且扎實(shí)。
比如,他們服務(wù)的一些云南本地企業(yè),可能連數(shù)據(jù)標(biāo)注、數(shù)據(jù)治理、數(shù)據(jù)工具鏈等基礎(chǔ)概念都不知道,高質(zhì)量數(shù)據(jù)集、文檔也沒有,想要訓(xùn)練專有AI模型,就得從自己組建“標(biāo)注組”開始。因為客戶都很在意數(shù)據(jù)隱私,所以一個組的項目做完就要解散,標(biāo)注人才就流失了,下次再重新建組。今天的AI落地,依然高度依賴“有多少人工就有多少智能”。
當(dāng)我們走到三、四線城市,發(fā)現(xiàn)這里的AI公司和開發(fā)者,對AI的認(rèn)知和做法,都有很大的不同。
用這些“意料之外”,我們可以大概拼出一張拼圖,上面寫著:在小城市做AI,究竟是一種什么體驗。
一、小城做AI,如同養(yǎng)“中華田園貓”
雄踞全球科技資本和人才的硅谷,是OpenAI、DeepMind等頂級AI機(jī)構(gòu)生長的土壤。那么,中國三、四線小城市的一方水土,會孕育出怎樣的AI呢?
在云南,我見到了兩個AI服務(wù)商,以及不少開發(fā)了行業(yè)AI應(yīng)用的實(shí)體企業(yè),他們的AI模型有一個共同點(diǎn):都使用通用大模型作為基座。比如基于開源Llama 2架構(gòu),加上自有數(shù)據(jù)、客戶數(shù)據(jù)進(jìn)行精調(diào),底層代碼都不是自己從頭寫上來的。
站在巨人的肩膀上,是目前在小城市做AI的最優(yōu)解。
當(dāng)?shù)氐腁I開發(fā)者告訴我,首先,他們測試了市面上主流的開源大模型和閉源大模型,最終選擇了Llama,原因是模型在業(yè)務(wù)場景下的表現(xiàn)好,而且生態(tài)夠豐富,社區(qū)資源多,配套工具成熟,這給他們的后續(xù)訓(xùn)練和開發(fā)減少了很多難度。
此外,身在三、四線城市的AI公司,往往并沒有足夠的預(yù)算、算力、工程人才去從頭訓(xùn)練一個新的大模型,加入開源社區(qū)或閉源生態(tài)是最現(xiàn)實(shí)的選擇。一位技術(shù)負(fù)責(zé)人說,他們沒法像大廠那樣囤上幾千幾萬張英偉達(dá)算力卡,加上N卡價格瘋漲,所以用的是國產(chǎn)算力,雖然需要解決跟CUDA的兼容性問題,但能滿足他們的需求,是目前比較有性價比的選擇。
另外,他們在本地垂類賽道,數(shù)據(jù)和工程是核心競爭力。這些三、四線城市的AI公司,沒有股價壓力,也不需要給投資人PR,專注于某一個非常小的垂類場景,一般也是大廠看不上、不會去碰的小市場,依靠私有數(shù)據(jù)積累和工程化交付的能力,就能建立起商業(yè)模式。
因為很多落地場景,只有在當(dāng)?shù)厣钊肓私庑袠I(yè)才能發(fā)現(xiàn)。
比如一個AI公司,基于開源大模型+自有旅游數(shù)據(jù)開發(fā)的民宿大模型,已經(jīng)在云南大理的民宿落地了。而將大模型的對話能力,打造成“24小時AI管家”,這個靈感來自民宿會遇到社恐的游客,或者不希望暴露隱私,不想因為WiFi密碼等小事麻煩服務(wù)人員,管家的介入很難做到恰到好處,讓游客住的不夠舒適自在。而大模型出來之后,就在旅客和管家之間,多了一個AI交互的緩沖地帶,一些小問題通過AI管家就能解決,需要人工服務(wù)時隨叫隨到,這樣就很好地解決了旅客的顧慮。
目前,該公司的AI大模型服務(wù),主打的就是可落地、支持私有化,目前覆蓋了文旅、工業(yè)、政務(wù)等場景,業(yè)務(wù)營收有70%以上來自大型企業(yè)的數(shù)智化。
實(shí)話說,很多一線城市的AI創(chuàng)業(yè)公司、高??蒲性核蛟斓拇竽P停嘉幢啬墚a(chǎn)生這樣的落地能力和經(jīng)濟(jì)價值。
總的來說,我的感受是,三、四線城市的技術(shù)從業(yè)者,上來就是從場景里找機(jī)會,找跟AI的結(jié)合點(diǎn),反而更容易出效果。
一位開發(fā)者朋友是這樣說的,“搞AI就像養(yǎng)貓,科學(xué)家們和企業(yè)會養(yǎng)聰明的品種貓,這跟我沒什么關(guān)系,我喜歡養(yǎng)小貓串串,把AI領(lǐng)域跟人文藝術(shù)領(lǐng)域結(jié)合起來,這個品種你沒見過吧”。
將通用大模型的“品種貓”跟本地場景、本土需求相結(jié)合,進(jìn)行“雜交”,養(yǎng)出一只只“混血小貓”,這些垂類AI應(yīng)用,就像中華田園貓,可能是大廠和科技媒體人不太關(guān)注的,卻沐浴著云南得天獨(dú)厚的陽光,真實(shí)而有生命力地成長著。
二、在小城市做AI的可能性
在交流活動中,有好幾個媒體人都詢問,在云南做AI有哪些阻礙和挑戰(zhàn)。真正的問題,似乎在意料之外,又在情理之中。
所謂意料之外,是很多問題已經(jīng)在被積極解決了。
比如基礎(chǔ)設(shè)施,在大家的印象中,三、四線城市的數(shù)字基礎(chǔ)設(shè)施發(fā)展比較晚,發(fā)展AI的資源稟賦比較薄弱。實(shí)際上,基礎(chǔ)設(shè)施在當(dāng)?shù)卦絹碓讲怀蔀閱栴}。
拿算力來說,云南的算力資源已經(jīng)可以滿足當(dāng)?shù)谹I的開發(fā)需求。當(dāng)?shù)毓ぷ魅藛T告訴我們,由于電價便宜,氣候條件好,所以云南很適合發(fā)展AI人工智能數(shù)據(jù)中心,前文提到的民宿大模型,就是在昆明人工智能計算中心上進(jìn)行訓(xùn)練的,采用的國產(chǎn)算力。當(dāng)?shù)亟煌I(lǐng)域的數(shù)據(jù)中心工作人員也提到,該行業(yè)數(shù)據(jù)中心已經(jīng)完成了60%的國產(chǎn)替代率。
至于數(shù)據(jù),參加交流活動的兩家AI服務(wù)商,此前都是數(shù)據(jù)服務(wù)提供商。其中一個成立于2018年,在2020年的時候就形成了第一版數(shù)據(jù)解決方案,和一、二線的大廠簽訂了合作關(guān)系,積累了大量的數(shù)據(jù)資源和工程經(jīng)驗。而算法,如前所說,依托全球領(lǐng)先的開源模型和社區(qū),當(dāng)?shù)谹I公司也可以快速上手開發(fā)。
那么,當(dāng)?shù)谹I發(fā)展的真正約束條件是什么呢?
一是遠(yuǎn)離產(chǎn)業(yè)帶。行業(yè)AI解決方案包含了多個環(huán)節(jié)和生產(chǎn)鏈條,很多小城市還沒有建立起產(chǎn)業(yè)集聚優(yōu)勢,導(dǎo)致生產(chǎn)環(huán)節(jié)中存在斷點(diǎn)。一位昆明當(dāng)?shù)氐腁I服務(wù)商提到,客戶的私有化部署,往往需要單獨(dú)成立標(biāo)注組,項目完成就解散了,人才就要流失。而他們跟省外的標(biāo)注公司合作,有的要收取加盟費(fèi),有的對團(tuán)隊規(guī)模有要求,必須達(dá)到100人以上,這就給他們的項目增加了不少成本。
二是缺人。既然到外省找人很麻煩,那么找本地人才呢?答案就是當(dāng)?shù)貨]有那么多AI人才。那一場交流活動中,也有云南當(dāng)?shù)氐腁I產(chǎn)業(yè)學(xué)院老師參加,對方提到,該學(xué)院今年招收了200名人工智能專業(yè)的本科生?,F(xiàn)場一家AI公司表示:“200個?根本不夠用啊?!?/p>
除了人數(shù)少,由于人工智能是一個新興專業(yè),當(dāng)?shù)匾策€在探索培養(yǎng)方案,有老師提到,目前AI教學(xué)還存在跟應(yīng)用領(lǐng)域不夠貼近的問題,企業(yè)提供的AI實(shí)訓(xùn)平臺不符合教學(xué)、科研的需求,學(xué)校只能自己開發(fā)。
如何解決上述困境?我也在當(dāng)?shù)乜吹搅艘环N跟開源文化有點(diǎn)類似的產(chǎn)業(yè)集群創(chuàng)新模式,那就是“抱團(tuán)取暖”。
一家本地的數(shù)據(jù)服務(wù)公司,將自己打造的數(shù)據(jù)標(biāo)注、數(shù)據(jù)治理、數(shù)據(jù)探源等工具鏈,開源出來,豐富區(qū)域內(nèi)的數(shù)據(jù)資源。此外,依托昆明人工智能計算中心,當(dāng)?shù)匾苍陉懤m(xù)開展師資培訓(xùn)、工程師培訓(xùn)等人才培養(yǎng)項目,打通“學(xué)練訓(xùn)賽業(yè)”,推動產(chǎn)學(xué)研用的融合。
遠(yuǎn)離了“北上廣”和“龍頭企業(yè)”的三、四線城市,由于AI產(chǎn)業(yè)鏈的零星聚集,反而跟彼此產(chǎn)生了格外強(qiáng)的引力,特別積極地希望貢獻(xiàn)出自己的一份力量。
三、產(chǎn)業(yè)AI的“面子”和“里子”
說到這里,你可能會問,那三、四線城市的AI落地情況究竟怎么樣?跟當(dāng)?shù)禺a(chǎn)業(yè)相結(jié)合的廣度和深度如何呢?
我可以分享兩個真實(shí)的見聞故事:
一個是“面子”。在中國-老撾的邊境城市,當(dāng)?shù)毓ぷ魅藛T帶我們參觀了位于火車站附近的“智慧展示中心”。我們發(fā)現(xiàn),這個展示中心的作用,確實(shí)是“展示”,我們到大屏幕前觀看完兩部宣傳片,就沒能再深入了。
另一個是“里子”。當(dāng)我們走到日常運(yùn)行的貨車檢查站,一個工作人員對著鏡頭侃侃而談,告訴我們5G+AI的應(yīng)用如何落地,讓貨車一站式通關(guān),避免了層層卡驗,將每輛車的平均通關(guān)時間從8分鐘縮短到4分鐘。從技術(shù)規(guī)劃到落地效果,講的非常清晰,帶著一種很了解一線實(shí)際情況才有的揮灑自如。
對此,不同的人可能會有不同的解讀角度。
AI應(yīng)該樂觀嗎?好像是的,它已經(jīng)抵達(dá)了最遙遠(yuǎn)的邊境線,在n線城市落地。AI應(yīng)該悲觀嗎?也有點(diǎn)道理,有效的AI應(yīng)用似乎就那么多,作為“典型案例”存在,而如果沒有AI場景的遍地開花,那么建好的AI基礎(chǔ)設(shè)施發(fā)揮的作用,確實(shí)就是擺在那里,作為“展示”。
今天,三、四線城市的AI探索,處于一個智能化需求特別多、特別分散的階段,只能一個場景一個場景地滲透。而這也是本地AI企業(yè)和開發(fā)者的機(jī)會,也有越來越多的人看到了這些地方存在的無數(shù)個被AI改變的可能性。
在當(dāng)?shù)刈咴L時,本地AI企業(yè)提到一句話:通過一個場景,探索出一些模式,應(yīng)用到整個行業(yè),一個個場景的智能化,拼起來就是整個行業(yè)的智能化。
他們確實(shí)也是這樣做的。
這些微小而分散的需求,是AI大廠和巨頭不愿意觸碰,做了也投入回報比很低的場景,被當(dāng)?shù)仄髽I(yè)一個接一個地解決著。
比如云南開發(fā)出的越南語、老撾語、緬甸語、柬埔寨語、泰語等南亞東南亞語言的掃描筆、AI翻譯機(jī);幫助企業(yè)無需寫字段調(diào)用API,就能根據(jù)不同的使用場景,比如經(jīng)營分析會、領(lǐng)導(dǎo)參觀匯報、財務(wù)數(shù)據(jù)上報等,實(shí)時生成任意需求BI的垂類大模型;為麻醉科提供高效智能排班服務(wù)的大模型等。
大模型狂奔這一年,已經(jīng)從價值炒作階段進(jìn)入到價值沉淀階段,有大模型廠商提出了“不作詩、只做事”的理念。那么,誰來做事呢?
這些在小城市做AI的人,用一個個場景的拼圖,拼出了大模型“有用”的答案。而AI的小城故事,還會在這片土地一直講下去。
作者:風(fēng)辭遠(yuǎn)
來源公眾號:腦極體(ID:unity007),從技術(shù)協(xié)同到產(chǎn)業(yè)革命,從智能密鑰到已知盡頭。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @腦極體 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
有些偏小一點(diǎn)的地方,還沒發(fā)展起來的時候,往往也是一種機(jī)會