你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆其他產(chǎn)品?

1 評(píng)論 5920 瀏覽 21 收藏 29 分鐘

在工作中,不少職場(chǎng)人都需要借助一定的軟件來(lái)提高工作效率,比如結(jié)合通義聽(tīng)悟或飛書(shū)妙記的語(yǔ)音轉(zhuǎn)文字功能,來(lái)輔助業(yè)務(wù)的進(jìn)行。這篇文章里,作者就對(duì)通義聽(tīng)悟這款產(chǎn)品進(jìn)行了拆解分析,不妨來(lái)看一下。

過(guò)去我是飛書(shū)妙記的重度用戶,現(xiàn)在我?guī)缀跬耆艞壦?/p>

只是因?yàn)樾庐a(chǎn)品的出現(xiàn):通義聽(tīng)悟!

它將語(yǔ)音轉(zhuǎn)文字的操作一鍵完成,轉(zhuǎn)換準(zhǔn)確率大幅提升,支持多種導(dǎo)出格式,更重要的是還具備強(qiáng)大的AI分析能力,實(shí)現(xiàn)智能提煉、總結(jié)等功能。

想象一下,復(fù)雜的工作可以被簡(jiǎn)化,重復(fù)的勞動(dòng)可以被自動(dòng)化,難以獲取的價(jià)值可以被發(fā)掘。

下面讓我?guī)阋黄穑匦赂惺蹵I的力量 : )

Take Away:

  • 通義聽(tīng)悟如何利用AI能力,改善語(yǔ)音轉(zhuǎn)文字的使用體驗(yàn)?
  • 通義聽(tīng)悟相較其他產(chǎn)品的獨(dú)特優(yōu)勢(shì)在哪里?
  • 它的產(chǎn)品演化路徑是怎樣的?
  • 它的產(chǎn)品主體框架是什么?
  • 通義聽(tīng)悟可能的商業(yè)模式和發(fā)展前景?
  • 通義聽(tīng)悟產(chǎn)品迭代的幾點(diǎn)建議

一、通義聽(tīng)悟Super已經(jīng)重度使用了!

給大家看我的界面:

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

很多音頻文件我都是用通義聽(tīng)悟來(lái)處理,有哪些場(chǎng)景會(huì)用到呢?給大家說(shuō)說(shuō)幾個(gè)典型的例子?。?/p>

1. 聽(tīng)播客

我們現(xiàn)在時(shí)間有限,很多優(yōu)秀的播客內(nèi)容又想聽(tīng),那怎么辦呢?可以使用下面的方法來(lái)把音頻文件導(dǎo)出來(lái),丟給通義聽(tīng)悟,轉(zhuǎn)成文字版本,還帶有總結(jié)呢,方便多了:

將小宇宙的單集節(jié)目分享到微信里;

再用電腦瀏覽器打開(kāi)單集節(jié)目的鏈接;

在播放按鈕上右鍵,選擇檢查;

在右側(cè)的源代碼界面,找到Audio Src=“xxx”;

雙擊復(fù)制,打開(kāi)一個(gè)新窗口,粘貼后打開(kāi)該鏈接;

在播放器下面的三個(gè)小點(diǎn)按鈕那點(diǎn)擊一下,選擇下載;

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

把這個(gè)mp3丟給通義聽(tīng)悟,幾分鐘,就可以開(kāi)始看文字了。

2. 前采總結(jié)

我做訪談節(jié)目,有些會(huì)有個(gè)前采環(huán)節(jié),相當(dāng)于預(yù)先的采訪,這里會(huì)產(chǎn)生2-3小時(shí)的對(duì)話內(nèi)容,我習(xí)慣說(shuō)把過(guò)程錄音下來(lái),然后回來(lái)丟給通義聽(tīng)悟,基于轉(zhuǎn)文字之后,來(lái)做提煉總結(jié)。

甚至更進(jìn)一步,我會(huì)把訪談內(nèi)容導(dǎo)出成word,丟給Claude,請(qǐng)它來(lái)總結(jié)嘉賓的成長(zhǎng)經(jīng)歷:

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

以及給出對(duì)應(yīng)的訪談提綱:

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

這樣能非??焖俚貛椭覀兲釤拑?nèi)容,并且我們可以根據(jù)最后的內(nèi)容做調(diào)整和修改。

有關(guān)我是如何用Claude來(lái)提高效率的,大家可以等我下一篇文章。

3. 視頻&播客剪輯配合

因?yàn)槊恳黄诓タ鸵纛l的時(shí)長(zhǎng)會(huì)在2個(gè)小時(shí)以上,需要剪輯成40-50分鐘的內(nèi)容,就需要對(duì)著文字來(lái)做刪減,我會(huì)先把視頻里面的音頻提取出來(lái),丟給通義聽(tīng)悟,然后對(duì)著里面的文字做標(biāo)注,方便回頭用Audition來(lái)做刪減:

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

文字上標(biāo)注藍(lán)色的,是我會(huì)保留的內(nèi)容,其他的會(huì)刪掉。

這樣在Audition操作的時(shí)候,就可以對(duì)照著看,快速的找到時(shí)間點(diǎn)做處理了。

4. 播客高亮和Shownotes提取

我做播客,習(xí)慣把一些精彩的對(duì)話片段放在音頻一開(kāi)頭,吸引到聽(tīng)眾。

怎么做呢?

通義聽(tīng)悟有一個(gè)功能叫實(shí)驗(yàn)室,里面會(huì)提取出一些值得關(guān)注的內(nèi)容,根據(jù)我的幾次測(cè)試,里面推薦的文字,不少確實(shí)是整段對(duì)話中的精彩片段!這就很省事了!

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

除此之外呢,通義聽(tīng)悟還有章節(jié)速覽的功能,對(duì)于輔助我做好Shownotes頗有幫助,可以借助來(lái)快速找到對(duì)應(yīng)的內(nèi)容段落:

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

二、為什么通義聽(tīng)悟可以取代飛書(shū)妙記

在是用通義聽(tīng)悟之前,我一直在用飛書(shū)妙記,飛書(shū)妙記的核心功能,也是視頻/語(yǔ)音轉(zhuǎn)文字,但我現(xiàn)在只會(huì)在需要分享給嘉賓的時(shí)候,才會(huì)回到飛書(shū)妙記上,因?yàn)槟壳巴x聽(tīng)悟還不大能分享。

那在哪些點(diǎn)上,通義聽(tīng)悟做的比飛書(shū)妙記要好呢?

主要有三層:

  1. AI總結(jié)能力
  2. 用戶體驗(yàn)層面
  3. 產(chǎn)品顆粒度

我們分別來(lái)講講。

1. AI總結(jié)能力

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

飛書(shū)妙記主體還是以語(yǔ)音轉(zhuǎn)錄為主,然后我們看右上方也提煉了一些關(guān)鍵詞,點(diǎn)擊之后相當(dāng)于搜索關(guān)鍵詞。

除此之外,幾乎就沒(méi)有了AI總結(jié)的能力。

那我們反過(guò)來(lái)看通義聽(tīng)悟,至少有這么幾個(gè)AI能力:

1)關(guān)鍵詞、全文摘要、章節(jié)速覽、發(fā)言總結(jié)

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

分別從不同維度使用AI做了內(nèi)容摘要。

2)問(wèn)題回顧

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

打開(kāi)后,它會(huì)對(duì)原文內(nèi)容中的問(wèn)題,做高亮顯示。

我看了下,基本覆蓋得很全面。

3)值得關(guān)注

提取了算法覺(jué)得一些重點(diǎn)的內(nèi)容片段,鼠標(biāo)移上去會(huì)出現(xiàn)浮窗,可以點(diǎn)回顧,正文會(huì)跳轉(zhuǎn)到內(nèi)容所在的位置,可以點(diǎn)摘取,會(huì)把語(yǔ)句復(fù)制到右側(cè)的編輯區(qū)。

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

4)待辦事項(xiàng)

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

會(huì)自動(dòng)的提取出正文內(nèi)容里可能需要代辦的事項(xiàng)。

值得關(guān)注、待辦事項(xiàng)兩個(gè)區(qū)域,都可以自己手動(dòng)新增記錄。

5)翻譯能力
你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

6)自定義專屬詞匯

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

如果希望有很多專有詞匯,希望語(yǔ)音轉(zhuǎn)的比較準(zhǔn)確,可以自己增加。這個(gè)我倒是沒(méi)用過(guò),普通的轉(zhuǎn)譯已經(jīng)挺準(zhǔn)的了。

2. 用戶體驗(yàn)層面

1)易用性角度

通義聽(tīng)悟支持微信小程序,并且可以從微信里直接讀取文件。

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

而飛書(shū)妙記必須使用PC網(wǎng)頁(yè)端才能上傳文件,使得你的文件必須要首先同步到電腦上,就很麻煩了。

2)為了工作學(xué)習(xí)打造

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

因此右側(cè)給了一半的編輯區(qū)域,可以把正文部分的內(nèi)容一鍵摘取過(guò)來(lái),也可以把標(biāo)記的內(nèi)容一鍵摘取。

編輯器也做的挺豐富的,基本的功能也都支持。

3)標(biāo)注的部分會(huì)在時(shí)間軸上顯示,方便用戶查找

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

4)時(shí)間軸會(huì)顯示所處的段落

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

5)導(dǎo)出格式友好

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

飛書(shū)妙記只支持飛書(shū)文檔、TXT之類的,麻煩得很。通義聽(tīng)悟則直接支持主流的PDF、Word。

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

其他的還有不少細(xì)節(jié),大家可以自己去挖掘一下。

3. 產(chǎn)品顆粒度

飛書(shū)妙記,如果你想使用,得注冊(cè)飛書(shū)賬號(hào),并且必須是企業(yè)賬號(hào),這帶來(lái)了使用門(mén)檻。

同時(shí),飛書(shū)妙記是飛書(shū)All in One工具體系的其中一個(gè)模塊,也讓它的易用性收到了飛書(shū)整體系統(tǒng)的復(fù)雜度。

整體容量在免費(fèi)版本里面,上限就是10個(gè)G:

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

之前我使用,都經(jīng)常需要?jiǎng)h除內(nèi)容來(lái)保留空間。

那通義聽(tīng)悟,則更加小巧靈活。因?yàn)樗褪且粋€(gè)獨(dú)立的產(chǎn)品,可以更加專注的做用戶場(chǎng)景的優(yōu)化。

之前是網(wǎng)頁(yè)版,現(xiàn)在針對(duì)微信增加了小程序版,體驗(yàn)更加絲滑了。小程序使用微信手機(jī)接口授權(quán)就可以登錄,使用門(mén)檻大幅降低。

容量空間只有2個(gè)G,但是呢,它打通了阿里云盤(pán),在上傳音視頻界面里,可以選擇直接從阿里云盤(pán)里面導(dǎo)入,這個(gè)時(shí)候是不占用空間的。

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

因?yàn)镾uper使用阿里云盤(pán)比較早,我的阿里云盤(pán)空間是1.79TB,足夠足夠了。

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

對(duì)我來(lái)講,通義聽(tīng)悟+阿里云盤(pán)=免費(fèi)的無(wú)限空間。

小結(jié)來(lái)看,飛書(shū)妙記只是針對(duì)飛書(shū)本身的應(yīng)用場(chǎng)景,比如使用飛書(shū)在線會(huì)議時(shí),可以一鍵轉(zhuǎn)錄成飛書(shū)妙記,并自動(dòng)轉(zhuǎn)寫(xiě)成文字,這是非常方便的。

但也恰巧是All in One限制了它,它并不是作為一個(gè)獨(dú)立產(chǎn)品快速迭代更新的。使用飛書(shū)妙記有一兩年的時(shí)間了吧,我?guī)缀鯖](méi)有看到過(guò)它在什么地方有過(guò)更新。。。

但通義聽(tīng)悟有后發(fā)優(yōu)勢(shì),獨(dú)立團(tuán)隊(duì)開(kāi)發(fā),也瞄準(zhǔn)了更加廣闊的工作學(xué)習(xí)AI助手的場(chǎng)景,快速迭代,推出的功能也非常符合用戶需求,加上AI的賦能,很快就有了不少黑科技的突破。

就我自己來(lái)講,已經(jīng)推薦了身邊很多朋友使用:

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

三、通義聽(tīng)悟產(chǎn)品演化

根據(jù)【三五環(huán)】《No.121 對(duì)談志杰:從通義聽(tīng)悟看,當(dāng) AI 不再是工具,而是個(gè)人助手》;

志杰是阿里云通義聽(tīng)悟產(chǎn)品&研發(fā)負(fù)責(zé)人,根據(jù)播客內(nèi)的交流,我們可以得知,通義聽(tīng)悟的誕生至少有這么幾個(gè)大階段:

  1. 構(gòu)建技術(shù)底盤(pán):招AI人才,做算法的研究等等,是一個(gè)純技術(shù)打造的環(huán)節(jié);
  2. 技術(shù)服務(wù)內(nèi)部:阿里內(nèi)部的呼叫中心會(huì)產(chǎn)生大量數(shù)據(jù),如何用算法提供產(chǎn)品服務(wù)于場(chǎng)景的課題就產(chǎn)生了;
  3. 云端產(chǎn)品演化:基于阿里云,使用API輸出技術(shù),其他的B端企業(yè)就可以使用這一服務(wù),別客戶集成使用;
  4. 服務(wù)內(nèi)部同事:公司同事出現(xiàn)例會(huì),戰(zhàn)略會(huì),有音頻整理的需求,就做了個(gè)網(wǎng)站,接著發(fā)現(xiàn)投資部門(mén)做背景調(diào)查也會(huì)用到,發(fā)布會(huì)會(huì)用到,年會(huì)的外籍員工比較多,也有“同聲傳譯”的需求出現(xiàn),加上大模型的出現(xiàn),就開(kāi)始變成產(chǎn)品化正式立項(xiàng)了。
  5. 免費(fèi)產(chǎn)品公測(cè):做一款ToC產(chǎn)品,搜集用戶反饋,探索用戶真正的需求。

我們看到這種演化過(guò)程,它就會(huì)更加像是,先有技術(shù)積累,逐步服務(wù)更多用戶之后,進(jìn)一步的擴(kuò)展成C端產(chǎn)品,去搜集用戶反饋,反過(guò)來(lái)看在具體的場(chǎng)景里要去突破什么技術(shù)要點(diǎn):

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

從目前可見(jiàn)的產(chǎn)品迭代來(lái)說(shuō),確實(shí)是如此,比如下面提到的PPT提取就很典型。

當(dāng)然,我覺(jué)得這一章節(jié)里面,通義聽(tīng)悟的訴求絕不僅僅是持續(xù)的做好技術(shù)和產(chǎn)品的相互促進(jìn),其實(shí)他們的產(chǎn)品定位也非常的清晰“你的工作學(xué)習(xí)AI助手”,對(duì)于這個(gè)市場(chǎng)的渴望絕對(duì)是很強(qiáng)的。

當(dāng)前能找到新市場(chǎng)增量的產(chǎn)品不多,有潛在的機(jī)會(huì),放過(guò)太可惜了,所以我們也看到通義聽(tīng)悟在快速迭代,包括多個(gè)渠道的產(chǎn)品覆蓋等等。從動(dòng)作回推,市場(chǎng)化的欲望騙不了人。

另一方面,我們看完通義聽(tīng)悟的誕生和演化過(guò)程,也能理解,在戰(zhàn)略上的思考,也直接決定了產(chǎn)品的大小:

飛書(shū)妙記是為了飛書(shū)服務(wù)的,通義聽(tīng)悟是從為客戶服務(wù),到為用戶服務(wù)的獨(dú)立產(chǎn)品,背靠阿里云、釘釘資源。結(jié)果似乎必然。

四、通義聽(tīng)悟產(chǎn)品設(shè)計(jì)

Super理解,通義聽(tīng)悟的技術(shù)層面,由下面的架構(gòu)構(gòu)成:

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

技術(shù)層面不多說(shuō),我們來(lái)看看toC側(cè),它的整體產(chǎn)品框架設(shè)計(jì):

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

它的產(chǎn)品構(gòu)成是:

  • 語(yǔ)音轉(zhuǎn)寫(xiě)是地基
  • AI分析是高樓

怎么理解呢?

我們看到通義聽(tīng)悟,名稱里的聽(tīng)悟,就是聽(tīng)了悟了,是先聽(tīng)再悟!

把聽(tīng)到的語(yǔ)音,轉(zhuǎn)化成文字,然后就可以使用AI的能力對(duì)文字進(jìn)行語(yǔ)義理解,再做各種黑科技操作。

因?yàn)槿粘9ぷ骱蜕钪校祟惤邮苄畔⒌姆绞?,除了看就是?tīng):

根據(jù)美國(guó)哈佛商學(xué)院有關(guān)研究人員的分析資料表明,人的大腦每天通過(guò)五種感官接受外部信息的比例分別為:視覺(jué)83%,聽(tīng)覺(jué)11%,嗅覺(jué)3.5%,觸覺(jué)1.5%,味覺(jué)1%.

視覺(jué)信息包含大量細(xì)節(jié),存儲(chǔ)和處理成本很大。聲音信息特別是人類的對(duì)話信息,則信息量小很多,AI好做處理,把聲音信息處理好,能夠解決大量的工作生活學(xué)習(xí)的場(chǎng)景,比如聽(tīng)課、聽(tīng)播客、對(duì)話等等。

所以在處理信息時(shí),優(yōu)先選擇容易做的聲音信息,是很正確的邏輯。

我們可以看到,通義聽(tīng)悟也可以處理視頻,不過(guò)更多的是基于視頻里的音頻轉(zhuǎn)錄成文字后,基于時(shí)間點(diǎn)對(duì)視頻上的進(jìn)度做對(duì)應(yīng)關(guān)聯(lián)。

這是通義聽(tīng)悟的基本盤(pán)。也就是語(yǔ)音轉(zhuǎn)寫(xiě)是地基的含義。

這個(gè)也是飛書(shū)妙記的基本盤(pán),甚至說(shuō)飛書(shū)妙記的絕大部分功能都體現(xiàn)在語(yǔ)音轉(zhuǎn)寫(xiě)上面。

超越飛書(shū)妙記的通義聽(tīng)悟,發(fā)力就發(fā)力在了AI分析上。

我們前面提到的通義聽(tīng)悟之所以能夠取代飛書(shū)妙記,就是在AI總結(jié)部分有很多發(fā)力。

AI分析是高樓。這座高樓使得通義聽(tīng)悟在使用體驗(yàn)上,遠(yuǎn)超飛書(shū)妙記。

除了上面說(shuō)的這兩點(diǎn),通義聽(tīng)悟還有一個(gè)功能最近更新的很有意思:

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

上傳視頻文件后,通義聽(tīng)悟?qū)⒆詣?dòng)識(shí)別和總結(jié)視頻中的PPT,你可以在視頻下方閱讀圖文總結(jié),點(diǎn)擊圖片全屏查看,還支持導(dǎo)出PPT文件哦!

我自己倒是用不上,但是看這個(gè)功能,對(duì)于上網(wǎng)課,學(xué)視頻課程的,還是很有意義的。結(jié)合了視頻中的圖片識(shí)別、提取、關(guān)聯(lián)、摘要總結(jié)、分段等。

也是徹底貫徹了通義聽(tīng)悟的slogan“你的工作學(xué)習(xí)AI助手

五、通義聽(tīng)悟的商業(yè)前景

我們首先要了解,通義聽(tīng)悟背靠阿里云,意味著有強(qiáng)大的AI技術(shù)積累和算力支持!這是其商業(yè)化的重要支撐!

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

2022年,阿里云在中國(guó)云市場(chǎng)占有率為36%,為市場(chǎng)最大者。

基于按使用量付費(fèi)的模式,結(jié)合阿里云市場(chǎng),可以快速打入到大客戶。

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

另外,阿里的云釘一體,通義聽(tīng)悟可以與釘釘深度打通,成為協(xié)同辦公場(chǎng)景下的智能產(chǎn)品,提高產(chǎn)品的附加值。

截至2022年9月30日,釘釘用戶數(shù)破6億人,企業(yè)組織數(shù)超過(guò)2300萬(wàn)家,付費(fèi)DAU(日活用戶數(shù))突破1500萬(wàn)人。

嵌入到釘釘?shù)臅?huì)議里面還是有比較大的價(jià)值的,就看是用什么方式嵌入,以及企業(yè)的需求量多大了。

我自己是比較樂(lè)觀的,特別是如果能夠和云存儲(chǔ)捆綁的話,就比較有增值服務(wù)的意義。

我們看騰訊會(huì)議就有類似的服務(wù),按月收25元,包含了會(huì)議語(yǔ)音轉(zhuǎn)文字等功能:

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

以上是B端的市場(chǎng)前景。

在C端,通義聽(tīng)悟也非常有機(jī)會(huì),目前是免費(fèi)內(nèi)測(cè)階段,從公司重要Ai產(chǎn)品階段出發(fā),通義聽(tīng)悟完全可以繼續(xù)用免費(fèi)的C端邏輯,來(lái)繼續(xù)快速打開(kāi)市場(chǎng),并且獲得用戶反饋,這樣可以快速迭代產(chǎn)品,不斷地占有更大的市場(chǎng)。

免費(fèi)的邏輯,可以這么設(shè)計(jì):

1)免費(fèi)使用,但需要和現(xiàn)在一樣積累轉(zhuǎn)寫(xiě)時(shí)長(zhǎng)。

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

2)轉(zhuǎn)寫(xiě)時(shí)長(zhǎng)可以增加獲得難度,比如每天登錄只能獲得1小時(shí)轉(zhuǎn)寫(xiě)時(shí)長(zhǎng),重度使用用戶可以通過(guò)邀請(qǐng)好友獲得轉(zhuǎn)寫(xiě)時(shí)長(zhǎng),或者是付費(fèi)進(jìn)行購(gòu)買(mǎi)轉(zhuǎn)寫(xiě)時(shí)長(zhǎng)。

利用稀缺資源卡脖子,關(guān)注用戶的動(dòng)作行為來(lái)評(píng)估產(chǎn)品對(duì)用戶的重要程度,再持續(xù)的調(diào)整商業(yè)邏輯。

同時(shí),從功能層面來(lái)說(shuō),目前在產(chǎn)品體驗(yàn)上是遠(yuǎn)超飛書(shū),但是功能體驗(yàn)層面,或許不構(gòu)成護(hù)城河,核心還是單純的產(chǎn)品是否能夠很強(qiáng)的解決用戶的剛需,按照當(dāng)前的情況,競(jìng)品包括飛書(shū)和騰訊會(huì)議,其轉(zhuǎn)寫(xiě)功能是附著在主體(飛書(shū)、騰訊會(huì)議)本身的,脫離了主體,目前只剩下通義聽(tīng)悟可以單獨(dú)去解決用戶需求。

還是有比較大的先發(fā)市場(chǎng)機(jī)會(huì)的。

六、產(chǎn)品迭代方向

通義聽(tīng)悟目前在產(chǎn)品設(shè)計(jì)層面,主體框架已經(jīng)比較穩(wěn)定了,底層的大模型技術(shù)迭代,我們就不說(shuō)了,下面從幾個(gè)方面簡(jiǎn)單講講后續(xù)可以做的方向:

1)覆蓋更多渠道:除了瀏覽器插件,增加iOS、安卓App覆蓋,使得用戶在應(yīng)用商店搜索時(shí),可以找到應(yīng)用下載。

2)支持更多音頻輸入來(lái)源:目前僅限于本地上傳音頻文件,如果可以直接解析網(wǎng)頁(yè)里的音頻鏈接,會(huì)更加方便,比如BiBiGPT可以丟鏈接直接獲得總結(jié)的結(jié)果:

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

我們看播客、視頻場(chǎng)景,是需要在通義聽(tīng)悟里面上傳文件的,如果可以自動(dòng)解析鏈接里的音視頻內(nèi)容,就有大幅簡(jiǎn)化了用戶的操作流程。

3)打通云存儲(chǔ)服務(wù):除了阿里云盤(pán),也可以增加更多云盤(pán)的支持,比如夸克網(wǎng)盤(pán)等常用的云盤(pán),擴(kuò)展用戶場(chǎng)景,夸克也同樣是阿里系產(chǎn)品。

、

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

4)用戶體系打通:現(xiàn)在通義聽(tīng)悟是一個(gè)獨(dú)立產(chǎn)品,也是個(gè)比較輕量化的產(chǎn)品,可以考慮和flomo一樣,像水那樣融入到其他產(chǎn)品里面。除了釘釘,也可以考慮找到有類似場(chǎng)景的產(chǎn)品融合。

5)提供個(gè)性化定制功能:當(dāng)前支持用戶自定義專有詞匯,后面可以考慮增加不同的模型,比如美劇字幕模型、專業(yè)英語(yǔ)考試模型等等。

6)增加快捷鍵:可以增加一些快捷鍵,提高操作效率。

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

比如選擇文案后彈出的窗口,我還需要移動(dòng)鼠標(biāo)去選擇功能操作,這里可以增加一個(gè)快捷鍵,免去了移動(dòng)鼠標(biāo)的動(dòng)作。

7)輸出格式多樣化:目前的輸出還是以文字為主,可以考慮增加思維導(dǎo)圖的模式,對(duì)于用戶理解全文結(jié)構(gòu)會(huì)更加清晰直觀。

8)開(kāi)放API接口:現(xiàn)在需要進(jìn)入到幫助頁(yè)面才能找到,可以在官網(wǎng)首頁(yè)更加直觀的展示入口,鼓勵(lì)開(kāi)發(fā)者調(diào)用。

9)探索新商業(yè)模式:除了常規(guī)的接口調(diào)用后付費(fèi)模式、可能的付費(fèi)購(gòu)買(mǎi)轉(zhuǎn)寫(xiě)時(shí)長(zhǎng)模式,還可以增加比如企業(yè)的語(yǔ)音監(jiān)測(cè)等模式。

10)國(guó)際化:面向東南亞、歐美、非洲市場(chǎng),開(kāi)拓海外。

七、總結(jié)

今天在即刻上看到呂立青放出來(lái)的騰訊會(huì)議截圖,在會(huì)議摘要上已經(jīng)做到不輸通義聽(tīng)悟的程度了。技術(shù)上,不覺(jué)得通義聽(tīng)悟有很強(qiáng)的護(hù)城河:

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

Super個(gè)人認(rèn)為通義聽(tīng)悟比起飛書(shū)妙記、騰訊會(huì)議更厲害的一點(diǎn),反而它是獨(dú)立產(chǎn)品:

它是API,它是網(wǎng)頁(yè),它是小程序,它是App,它是水,可以流動(dòng)在一切需要它的地方。也正是如此,它的技術(shù)架構(gòu)反而能夠無(wú)限聚焦在工作學(xué)習(xí)領(lǐng)域擴(kuò)展:

你的工作學(xué)習(xí)AI助手:通義聽(tīng)悟,如何通過(guò)AI能力顛覆飛書(shū)妙記?(6000字)

不斷在用戶最有需求的地方延展自己的能力。

今天我們文章就在這里正式進(jìn)入了尾聲,來(lái)一段正式的總結(jié)吧:

數(shù)字化時(shí)代,語(yǔ)音轉(zhuǎn)文字成為提高工作效率的利器。通義聽(tīng)悟作為新晉玩家,憑借獨(dú)立產(chǎn)品的靈活迭代優(yōu)勢(shì),在AI能力上不斷突破,領(lǐng)先于同類產(chǎn)品。

然而技術(shù)迭代速度無(wú)止境,用戶體驗(yàn)至上。通義聽(tīng)悟仍需在易用性、商業(yè)模式等方面不斷優(yōu)化,與用戶場(chǎng)景和需求零距離貼合,才能在激烈競(jìng)爭(zhēng)中脫穎而出。

期待通義聽(tīng)悟能繼續(xù)發(fā)力AI,以“你的工作學(xué)習(xí)AI助手”為使命,助力用戶提升工作學(xué)習(xí)效率,創(chuàng)造更大價(jià)值。也歡迎更多優(yōu)秀產(chǎn)品加入這場(chǎng)讓人類生活變得更美好的競(jìng)賽。

AI改變世界!

參考:【三五環(huán)】《No.121 對(duì)談志杰:從通義聽(tīng)悟看,當(dāng) AI 不再是工具,而是個(gè)人助手》 包括產(chǎn)品演化,產(chǎn)品架構(gòu)部分

專欄作家

Super黃,微信公眾號(hào):Super黃的念想,人人都是產(chǎn)品經(jīng)理專欄作家。專注于深度產(chǎn)品拆解+商業(yè)分析。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 寫(xiě)的好,感謝分享。

    來(lái)自江西 回復(fù)