AI產(chǎn)品經(jīng)理B端產(chǎn)品典型案例——從0到1構(gòu)建機(jī)器學(xué)習(xí)平臺(tái)

0 評(píng)論 6309 瀏覽 49 收藏 14 分鐘

編輯導(dǎo)讀:現(xiàn)在,越來越多的重復(fù)繁瑣的工作正在由機(jī)器人代勞,而隨著人工智能的發(fā)展,機(jī)器學(xué)習(xí)平臺(tái)未來能幫助人類解決更多復(fù)雜的事情。本文作者分析如何從0到1構(gòu)建機(jī)器學(xué)習(xí)平臺(tái),希望對(duì)你有幫助。

一、需求分析

1. what

首先解答一個(gè)問題,什么是機(jī)器學(xué)習(xí)平臺(tái)。第一步就是要了解什么是機(jī)器學(xué)習(xí),主要指的是現(xiàn)如今大火的人工智能的實(shí)現(xiàn)方法(比如利用決策樹、聚類、貝葉斯分類、SVM、adaboost等等,當(dāng)然也有當(dāng)前主流各種深度神經(jīng)網(wǎng)絡(luò)模型Alexnet、resnet等等),跟人工智能、深度學(xué)習(xí)的關(guān)系可以參考我的另一篇文章《AI產(chǎn)品經(jīng)理的7堂必修課:必備的AI基礎(chǔ)知識(shí)》此處不做贅述,當(dāng)然這些知識(shí)也應(yīng)該是一個(gè)AI產(chǎn)品經(jīng)理應(yīng)知應(yīng)會(huì)的。

什么是一個(gè)機(jī)器學(xué)習(xí)的平臺(tái)呢?因?yàn)榍懊嫣峁C(jī)器學(xué)習(xí)是人工智能的實(shí)現(xiàn)方法,那么這個(gè)平臺(tái)就是AI算法工程師實(shí)現(xiàn)人工智能算法所需要的工具集,為什么是工具集而不是工具;因?yàn)槠脚_(tái)的定義絕不僅僅是單一功能的,而是涵蓋了從0到1如何實(shí)現(xiàn)一個(gè)算法模型的數(shù)據(jù)準(zhǔn)備、算法模型選擇、驗(yàn)證、測(cè)試與優(yōu)化、量化與部署,即從無到最終實(shí)現(xiàn)。因?yàn)檫@是一個(gè)相對(duì)復(fù)雜的系統(tǒng)工程,每一個(gè)步驟或者是每一個(gè)不同類型的任務(wù)需要的工具就會(huì)有差別,因此我們需要一個(gè)平臺(tái)提供端到端閉環(huán)的完整服務(wù)。

最終實(shí)現(xiàn)的事情可以這樣理解,我們輸入是一些我們?cè)谌粘I钪邢胍狝I計(jì)算機(jī)解決的問題(比如如何快速識(shí)別人臉、如何在手機(jī)上分類圖片),輸出就是一個(gè)完成的AI服務(wù)(無論是在線的網(wǎng)頁訪問還是離線的手機(jī)上調(diào)用)

2. who

我們的用戶是誰?

首先上文提到了AI算法工程師,因此是一個(gè)個(gè)有特定職業(yè)技能的個(gè)體,因此我們定義成是一個(gè)to C的產(chǎn)品么?不要忘記知名產(chǎn)品經(jīng)理俞軍老師說過:“用戶不是人,而是需求的集合?!?/p>

我們所看到的AI算法工程師(學(xué)生),他們都是被一個(gè)個(gè)組織所雇傭,最終是為了解決一個(gè)個(gè)企業(yè)/組織面臨的有待用AI方法解決的問題。但是如果沒有平臺(tái),其實(shí)這些事情也可以做,只不過相對(duì)效率就低了很多。因此我們的平臺(tái)定位就是:高效高質(zhì)量的解決組織面臨的需要AI算法模型解決的問題。

因?yàn)樯虡I(yè)的本質(zhì)是追逐利益最大化的,如何提升AI算法模型從無到有的每一環(huán)節(jié)的效率且并最終可以做到邊際成本為零(批量的復(fù)制生產(chǎn)AI模型且不會(huì)出錯(cuò),或者版本一致性較差等問題),甚至可以做到替代部分人甚至替代全部的人,這個(gè)應(yīng)該是機(jī)器學(xué)習(xí)平臺(tái)追求可以不斷優(yōu)化迭代的方向,也是企業(yè)組織會(huì)為你的產(chǎn)品買單的原因,因此這個(gè)平臺(tái)定位是一個(gè)to B的產(chǎn)品。

3. when & where

解決了上一個(gè)問題,這個(gè)問題就十分好回答了。

既然我們的用戶是利用AI解決實(shí)際生產(chǎn)經(jīng)營(yíng)問題或者提供AI服務(wù)的組織,那么他們使用的場(chǎng)景應(yīng)該就是典型的workplace,當(dāng)然包含可遠(yuǎn)程辦公接入的場(chǎng)景,接入的設(shè)備默認(rèn)就是相對(duì)專業(yè)的電腦而不是各種移動(dòng)端設(shè)備。且由于我們是to B類的產(chǎn)品。且一般ai算法模型的訓(xùn)練迭代可能是7*24的,因此對(duì)于平臺(tái)的穩(wěn)定性、安全性、容災(zāi)性要求更高。

但是對(duì)于剛開始僅對(duì)內(nèi)部服務(wù)的平臺(tái)除外,這類平臺(tái)初期,可以多邀請(qǐng)?jiān)缙趦?nèi)部的算法同事優(yōu)先使用,在早期發(fā)現(xiàn)各種問題,并進(jìn)行敏捷迭代,穩(wěn)定后再逐步推廣到范圍更大的組織使用。其實(shí)很多to B的產(chǎn)品應(yīng)該都是這樣的路線,比如釘釘、飛書,其實(shí)都是從內(nèi)部需求中不斷打磨最終才拓展到外部,面向更大的市場(chǎng),做商業(yè)上的變現(xiàn)。

二、競(jìng)品分析

其實(shí)機(jī)器學(xué)習(xí)平臺(tái)并不是一個(gè)很創(chuàng)新的產(chǎn)品,其實(shí)早期做云平臺(tái)的公司,都從PaaS逐步向上做SaaS做更增值的部分,那么機(jī)器學(xué)習(xí)應(yīng)用就是一個(gè)很典型的場(chǎng)景。

根據(jù)IDC發(fā)布的報(bào)告,可以看到機(jī)器學(xué)習(xí)平臺(tái)賽道已經(jīng)聚集了三支實(shí)力軍團(tuán):以BAT、AWS和微軟為代表的云服務(wù)商;以第四范式為代表的AI平臺(tái)公司;以新華三為代表的大數(shù)據(jù)公司。從2021年上半年的中國(guó)AI云的市場(chǎng)占有份額TOP我們重點(diǎn)分析下百度、阿里、華為、騰訊以及海外代表亞馬遜;

圖1、IDC發(fā)布的2021上半年中國(guó)AI云服務(wù)市場(chǎng)份額占比BAT占據(jù)前4名中的三席

接下來對(duì)這五家進(jìn)行一個(gè)橫向的對(duì)比分析:

表1、主流AI學(xué)習(xí)平臺(tái)對(duì)比分析

通過表格分析可知,如今主流平臺(tái)的核心優(yōu)化點(diǎn)都在于提升的效率,無論是一站式服務(wù)、節(jié)約成本、零門檻上手、快速訓(xùn)練/部署等等,此外平臺(tái)預(yù)置預(yù)訓(xùn)練大模型也將是未來機(jī)器學(xué)習(xí)平臺(tái)的一個(gè)突出趨勢(shì)。

三、如何實(shí)現(xiàn)how

通過分析國(guó)內(nèi)外主流機(jī)器學(xué)習(xí)平臺(tái),我們得出機(jī)器學(xué)習(xí)平臺(tái)的全流程,具體流程梳理如下思維導(dǎo)圖:

圖2、機(jī)器學(xué)習(xí)平臺(tái)全流程拆解

如果想要進(jìn)一步了解每每一個(gè)機(jī)器學(xué)習(xí)平臺(tái)產(chǎn)品的功能模塊細(xì)節(jié),建議大家可以去各家官網(wǎng)上查閱產(chǎn)品文檔,相信我,認(rèn)真讀懂整個(gè)產(chǎn)品文檔,你應(yīng)該可以構(gòu)建一個(gè)60分的機(jī)器學(xué)習(xí)平臺(tái)了。個(gè)人比較推薦華為modelarts和百度的EasyDL,兩家的文檔結(jié)構(gòu)清晰、內(nèi)容翔實(shí)。

但是由于這幾家的平臺(tái)產(chǎn)品都是面向全行業(yè)的用戶,比如百度EasyDL支持圖像、文本、語音、OCR、視頻、結(jié)構(gòu)化數(shù)據(jù)(數(shù)據(jù)智能),但是我們一般自己構(gòu)建的平臺(tái)更多的是針對(duì)自己組織所遇到的問題,因此一上來并不需要特別全面,而是針對(duì)某一個(gè)任務(wù)完成端到端流程的打通,后續(xù)再橫向拓展兼容其他類型的任務(wù)。

再比如,我現(xiàn)在遇到的問題就是計(jì)算機(jī)視覺CV領(lǐng)域的非常常見問題圖片多標(biāo)簽,這是一個(gè)分類問題,谷歌的imagenet整個(gè)數(shù)據(jù)集包含21841類,1400萬張圖片,其中常用的子集包含1000類,120萬張圖片,為什么我們還在做類似的問題,就是因?yàn)榇蠖囟ň蜁?huì)在某個(gè)具體領(lǐng)域具體產(chǎn)品場(chǎng)景上表現(xiàn)夠好,比如我們的手機(jī)相冊(cè),隨著隱私保護(hù)逐步引起大家重視,不太可能要求用戶把數(shù)據(jù)全部同步到云端。

如何通過機(jī)器學(xué)習(xí)平臺(tái)自動(dòng)化的提升端側(cè)提升用戶端側(cè)相冊(cè)照片的多標(biāo)簽表現(xiàn)力,需要從數(shù)據(jù)整理、模型訓(xùn)練(增量學(xué)習(xí)、大模型蒸餾小模型)、測(cè)試和調(diào)優(yōu)(在滿足用戶使用場(chǎng)景的測(cè)試集上進(jìn)行驗(yàn)證,看迭代的模型是否較上一版本有顯著提升,同時(shí)需要考慮端側(cè)的算力與功耗的平衡)。

雖然商業(yè)化的機(jī)器學(xué)習(xí)平臺(tái)有其優(yōu)勢(shì),比如更穩(wěn)定、功能更全面、更自動(dòng)化,但是針對(duì)自有問題場(chǎng)景深度定制的平臺(tái)可以更精準(zhǔn)的定位痛點(diǎn)、解決本質(zhì)問題。自有平臺(tái)與商業(yè)平臺(tái)可以進(jìn)行優(yōu)勢(shì)組合,自有平臺(tái)做商業(yè)平臺(tái)無法解決的,商業(yè)平臺(tái)完成已經(jīng)非常成熟的、經(jīng)過大規(guī)模商業(yè)論證的部分。最終讓機(jī)器學(xué)習(xí)平臺(tái)價(jià)值最大化。

圖3、相冊(cè)某任務(wù)的用戶行為分析,用來反推機(jī)器學(xué)習(xí)平臺(tái)需要重點(diǎn)優(yōu)化的功能

前期構(gòu)建過程中,可以多與具體負(fù)責(zé)該功能的ai算法工程師進(jìn)行訪談,了解其當(dāng)前工作中的主要困難、比如一些商業(yè)化的平臺(tái)無法解決的但是高頻遇到的,主要影響其效率的;并結(jié)合最終應(yīng)用場(chǎng)景的用戶埋點(diǎn)數(shù)據(jù)進(jìn)行分析,包括一些NPS數(shù)據(jù),用戶當(dāng)前對(duì)于哪些場(chǎng)景滿意度較差、哪些環(huán)節(jié)影響了使用體驗(yàn)、打斷了用戶的使用節(jié)奏,那么這些就是我們需要總結(jié)歸納,通過平臺(tái)來解決的問題。

當(dāng)然做前期的產(chǎn)品調(diào)研也要考慮到未來平臺(tái)產(chǎn)品的可擴(kuò)展性,下一步計(jì)劃解決什么樣的任務(wù),與平臺(tái)技術(shù)專家多溝通,深入了解用什么樣的架構(gòu)/設(shè)計(jì)可以兼容未來的潛在需求,聊聊平臺(tái)產(chǎn)品成功時(shí)候的樣子。

四、如何在早期提升用戶的活躍度,實(shí)現(xiàn)從0到1 的用戶增長(zhǎng)

因?yàn)閺?到1的時(shí)候還不涉及商業(yè)化變現(xiàn),但是其實(shí)一個(gè)平臺(tái)本身可以通過一些自身的論證數(shù)據(jù)來體現(xiàn)其價(jià)值。比如,數(shù)據(jù)準(zhǔn)備效率從100人天縮短至10人天,訓(xùn)練耗時(shí)從1天變成0.5天等等。平臺(tái)本身的用戶活躍度和使用時(shí)長(zhǎng)也可以很好的說明一些問題。

同時(shí)早起可以營(yíng)造一個(gè)內(nèi)部開放共享的生態(tài)環(huán)境,比如類似華為和百度的AI市場(chǎng),鼓勵(lì)大家內(nèi)部開源模型、數(shù)據(jù)等等,同時(shí)對(duì)于積極開源的用戶可以按照貢獻(xiàn)值提供平臺(tái)特殊的福利,不一定是以金錢來衡量,但是卻是算法工程師很剛需只有你可以提供的。

比如說,貢獻(xiàn)值高的用戶有排隊(duì)訓(xùn)模型的VIP通道,模型可以加速訓(xùn)練,可以優(yōu)先體驗(yàn)一些平臺(tái)的新功能(一鍵式部署/自動(dòng)采集標(biāo)注數(shù)據(jù)等等);這些對(duì)于組織內(nèi)部有限的資源,且工程師每天可能會(huì)花很多時(shí)間來等待資源訓(xùn)練的話,貢獻(xiàn)度高的用戶在你這個(gè)平臺(tái)上就可以體驗(yàn)到“爽”的體驗(yàn)。其實(shí)這背后的道理跟做其他產(chǎn)品是一樣的,別讓用戶“等”、別讓用戶“想”、別讓用戶“煩”,要讓用戶有參與感!

隨著平臺(tái)逐步壯大后,從1到N的商業(yè)模式其實(shí)上面推薦的商業(yè)化平臺(tái)都有很好的示范,比如拿百度的EasyDL距離,圖像在訓(xùn)練模型階段不收取任何費(fèi)用,僅在模型部署應(yīng)用階段計(jì)費(fèi),分為:公有云API計(jì)費(fèi)(按QPS計(jì)算)、私有服務(wù)器部署計(jì)費(fèi)、設(shè)備端離線SDK計(jì)算(按裝機(jī)數(shù)量計(jì)算)、軟硬一體方案計(jì)費(fèi)(整機(jī)+算法服務(wù)的一整套解決方案,直接賣設(shè)備)。大家可以直接參考。

最后,希望看完這篇文章的你對(duì)于如何構(gòu)架一個(gè)機(jī)器學(xué)習(xí)平臺(tái)或者是打造一個(gè)B端的產(chǎn)品能有一些啟發(fā)。

 

作者:大仙河,7年AI產(chǎn)品相關(guān)經(jīng)驗(yàn);微信號(hào) :大仙河知識(shí)學(xué)堂

本文由 @大仙河? 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Pexels,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!