案例解析:AI產(chǎn)品設(shè)計(jì),怎么在不同情況下做出判斷?
獨(dú)立思考,實(shí)事求是,鍥而不舍,以勤補(bǔ)拙。
——一顆西藍(lán)花
一、從AI技術(shù)說(shuō)起
什么是機(jī)器學(xué)習(xí)?
Tom Michell 給出定義:對(duì)于某類任務(wù)T和性能度量P,如果一個(gè)計(jì)算機(jī)程序在T上以P衡量的性能隨著經(jīng)驗(yàn)E而自我完善,那么我們稱這個(gè)計(jì)算機(jī)程序從經(jīng)驗(yàn)E學(xué)習(xí)。
通常,為了很好地定義一個(gè)學(xué)習(xí)問(wèn)題,我們必須明確這樣三個(gè)特征:任務(wù)的種類,衡量任務(wù)提高的標(biāo)準(zhǔn),經(jīng)驗(yàn)的來(lái)源。
舉一個(gè)手寫(xiě)識(shí)別學(xué)習(xí)問(wèn)題:
- 任務(wù)T:識(shí)別和分類圖像中的手寫(xiě)文字
- 性能標(biāo)準(zhǔn)P:分類的正確率
- 訓(xùn)練經(jīng)驗(yàn)E:已知分類的手寫(xiě)文字?jǐn)?shù)據(jù)庫(kù)
機(jī)器學(xué)習(xí)與深度學(xué)習(xí)
深度學(xué)習(xí)是一種特定類型的機(jī)器學(xué)習(xí),具有強(qiáng)大的能力和靈活性,它將大千世界表示為嵌套的層次概念體系。
深度學(xué)習(xí)是受人工神經(jīng)網(wǎng)絡(luò)的大腦結(jié)構(gòu)和功能啟發(fā)而創(chuàng)造的算法,由于它的興起,推動(dòng)了人工智能行業(yè)技術(shù)的落地應(yīng)用,如人臉識(shí)別。
二、從技術(shù)到用戶體驗(yàn)
伴隨著技術(shù)的發(fā)展,市面上創(chuàng)造出來(lái)了大量的基于AI技術(shù)的產(chǎn)品。
產(chǎn)品設(shè)計(jì),本身是一件非常難的事。
而AI產(chǎn)品,因其應(yīng)用場(chǎng)景的復(fù)雜性,讓產(chǎn)品設(shè)計(jì)這件事變得更加困難。對(duì)產(chǎn)品經(jīng)理而言,需要其在設(shè)計(jì)產(chǎn)品時(shí)候,對(duì)實(shí)際應(yīng)用場(chǎng)景的思考,更加地透徹。
《用戶體驗(yàn)要素》的文章開(kāi)篇,有如下一段話:
在產(chǎn)品設(shè)計(jì)時(shí)候,我們對(duì)用戶體驗(yàn)的關(guān)注實(shí)在是太少:我們所生產(chǎn)的產(chǎn)品是供人們?cè)诂F(xiàn)實(shí)世界中使用的。在產(chǎn)品開(kāi)發(fā)過(guò)程中,人們更多地關(guān)注產(chǎn)品將用來(lái)做什么。用戶體驗(yàn)是經(jīng)常被忽略的另一個(gè)因素——即產(chǎn)品如何工作——而這一因素恰恰是決定產(chǎn)品成敗的關(guān)鍵因素。
用戶體驗(yàn)并不是指一件產(chǎn)品本身是如何工作的,用戶體驗(yàn)是指“產(chǎn)品如何與外界發(fā)生聯(lián)系并發(fā)揮作用”,也就是人們?nèi)绾巍敖佑|”和“使用”它。當(dāng)人們?cè)儐?wèn)你某個(gè)產(chǎn)品或服務(wù)時(shí)候,他們問(wèn)的是使用的體驗(yàn)。用起來(lái)難不難?是不是很容易學(xué)會(huì)?使用起來(lái)感覺(jué)如何?
上述摘錄中,有一段話,很有意思,單獨(dú)拿出來(lái):
在產(chǎn)品開(kāi)發(fā)過(guò)程中,人們更多地關(guān)注產(chǎn)品將用來(lái)做什么。用戶體驗(yàn)是經(jīng)常被忽略的另一個(gè)因素——即產(chǎn)品如何工作——而這一因素恰恰是決定產(chǎn)品成敗的關(guān)鍵因素。
我解釋一下,上面這句話的意思。一共有兩層理解:
- 第一層,在產(chǎn)品開(kāi)發(fā)的過(guò)程中,產(chǎn)品經(jīng)理更多關(guān)注這個(gè)產(chǎn)品將來(lái)做什么。即理想情況下,該產(chǎn)品將來(lái)的功能。
- 第二層,指出產(chǎn)品經(jīng)理忽略的一個(gè)點(diǎn),當(dāng)產(chǎn)品被應(yīng)用到實(shí)際場(chǎng)景中的時(shí)候,這款產(chǎn)品與真實(shí)的場(chǎng)景交互,在這樣的一些場(chǎng)景中,產(chǎn)品又將如何工作。
在產(chǎn)品開(kāi)發(fā)中,產(chǎn)品經(jīng)理容易忽略產(chǎn)品與真實(shí)場(chǎng)景的交互。AI產(chǎn)品的設(shè)計(jì)更是如此,AI產(chǎn)品的使用場(chǎng)景復(fù)雜,很多時(shí)候需要產(chǎn)品在不同情況下做出判斷。如果產(chǎn)品經(jīng)理沒(méi)有提前將所有可能出現(xiàn)的場(chǎng)景思考明白且提前做出設(shè)計(jì)方案,那么該AI產(chǎn)品造成的用戶體驗(yàn)可能會(huì)非常糟糕。
用一個(gè)AI產(chǎn)品的例子來(lái)說(shuō)明。
二、AI場(chǎng)景,行人闖紅燈抓拍
還原「行人闖紅燈抓拍」的真實(shí)業(yè)務(wù)場(chǎng)景:
十字路口,為了更好規(guī)范行人與車(chē)輛,因此有了紅綠燈。當(dāng)紅燈亮起時(shí),行人也好,車(chē)輛也好,都不能通過(guò)或行駛。當(dāng)綠燈亮起的時(shí)候,行人和車(chē)輛均可通行。
但總會(huì)有人,不遵守交通規(guī)則,闖紅燈。因此,在這種場(chǎng)景下,我們可以借助AI來(lái)幫助我們更好地監(jiān)控行人闖紅燈的行為。我們希望,如果有行人A闖了紅燈,那我們的設(shè)備可以將此人記錄下來(lái),并向后端監(jiān)控設(shè)備上傳該用戶闖紅燈的事件信息,包括時(shí)間、地點(diǎn)、行人的臉。
上面的需求描述,比較寬泛,讓我們思考如何將該需求,拆解成算法(AI)+硬件可實(shí)現(xiàn)。
- 紅燈期間,集成了算法工業(yè)相機(jī)檢測(cè)并抓拍到紅燈期間出現(xiàn)在斑馬線上的人;
- 將該事件相關(guān)信息,包括時(shí)間、地點(diǎn)、行人的臉一共上傳到后端監(jiān)控設(shè)備。
三、從需求文檔到實(shí)際業(yè)務(wù)場(chǎng)景
需求文檔輸出后,我們這款產(chǎn)品似乎馬上就要成功了。但是,我們來(lái)看一個(gè)圖:
(1)上面這個(gè)圖是什么
作為宣傳廣告,印刷在公交車(chē)身的董明珠女士,被抓拍到闖紅燈。并且,登上了當(dāng)?shù)氐男腥岁J紅燈曝光臺(tái)。
(2)為什么會(huì)出現(xiàn)上述情況
產(chǎn)品經(jīng)理在輸出需求文檔時(shí)候,只描述了需求是檢測(cè)行人闖紅燈。沒(méi)有考慮車(chē)身廣告這種情況,因此沒(méi)有事先思考解決方案,故而出現(xiàn)了上圖的情況。
俞軍老師在他的新書(shū)《俞軍產(chǎn)品方法論》中,講到:
技術(shù)本身并不創(chuàng)造價(jià)值,技術(shù)必須被應(yīng)用于產(chǎn)品。
無(wú)論是多么高端的技術(shù),脫離了產(chǎn)品,都
四、怎么做得更好?
4.1 還原真實(shí)場(chǎng)景
讓我們來(lái)思考一下真實(shí)的業(yè)務(wù)場(chǎng)景,紅綠燈是在十字路口,用來(lái)維持交通秩序的。
當(dāng)A通道的紅燈亮起時(shí)候,A通道的行人以及電動(dòng)車(chē)、自行車(chē)都都不得通行。此時(shí)B通道的車(chē)輛是可以通行的。如果說(shuō),B通道的車(chē)輛車(chē)身印刷有人像,那么會(huì)出現(xiàn)什么情況呢?
或許在一開(kāi)始設(shè)計(jì)產(chǎn)品的思路,沒(méi)有想得足夠深入,忽略了這種場(chǎng)景,從而導(dǎo)致了上圖印刷在車(chē)身的董明珠被識(shí)別為闖紅燈的行人。
4.1 怎么做得更好
我們了解了真實(shí)場(chǎng)景,基于對(duì)真實(shí)場(chǎng)景的理解,如果重來(lái)一次,我們?nèi)绾巫龅酶媚兀?/p>
- 活體檢測(cè):場(chǎng)景需求是對(duì)“行人在斑馬線闖紅燈”的抓拍,因此算法需要檢測(cè)的區(qū)域是“斑馬線”區(qū)域。需要檢測(cè)的目標(biāo)是“行人”,時(shí)間段是在紅燈時(shí)間段。檢測(cè)區(qū)域是“斑馬線”,檢測(cè)目標(biāo)是“闖紅燈行人”。在這個(gè)區(qū)域,在紅燈時(shí)間段,出現(xiàn)車(chē)身人臉,因此被系統(tǒng)檢測(cè)為了闖紅燈。針對(duì)這種場(chǎng)景,我們可以提前想到“活體檢測(cè)”的解決方案。
- 邊界分析:我們需要將檢測(cè)邊界按照時(shí)間、地點(diǎn)、人物三要素進(jìn)行設(shè)定,對(duì)應(yīng)到本場(chǎng)景中,即:紅燈時(shí)間段、斑馬線區(qū)域、人臉+活體。
- 技術(shù)方案:在這種場(chǎng)景下,如何做活體檢測(cè)呢?由于場(chǎng)景的開(kāi)放性,不能像在線支付那樣,我們可以要求用戶左看看,右看看。那我們可以加一個(gè)目標(biāo)檢測(cè),如果檢測(cè)到人臉、且檢測(cè)到汽車(chē),則我們可以排除。同時(shí),行人闖紅燈過(guò)馬路,是一個(gè)連續(xù)的動(dòng)作,這個(gè)過(guò)程會(huì)持續(xù)一段時(shí)間,我們可以將這個(gè)作為切入點(diǎn)。一是可以考慮增加“姿態(tài)估計(jì)”,二是考慮“軌跡”檢測(cè)到第一張臉后不做推送,而是繼續(xù)檢測(cè),同時(shí)考慮公交車(chē)的移動(dòng)方向與斑馬線行人的移動(dòng)方向是垂直方向。
總結(jié)
- 從算法模型到部署到真實(shí)業(yè)務(wù)場(chǎng)景中,AI產(chǎn)品經(jīng)理/項(xiàng)目經(jīng)理需要思考很多很多。
- 很多時(shí)候,需要思考產(chǎn)品如何與真實(shí)業(yè)務(wù)場(chǎng)景產(chǎn)生交互,這非常重要,而不單單只思考我們期望中的算法該如何運(yùn)作。
- 產(chǎn)品如何與世界交互,這非常重要。
參考:
本文由 @一顆西蘭花 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議
雖然是很久之前的文章了,還是要給你評(píng)論下,董明珠那段幽默又引人發(fā)醒,太搞笑了,2023年AIGC大火了,不知道前輩做的如何了,想從普通產(chǎn)品經(jīng)理轉(zhuǎn)AI產(chǎn)品經(jīng)理,有機(jī)會(huì)嗎?