AI瀏覽器插件,到底誰才是打工人的新質(zhì)生產(chǎn)力(Kimi與豆包完整版體驗(yàn)報(bào)告)
近日,月之暗面官宣上線Kimi瀏覽器插件,官方介紹稱,該插件支持輕量搜索功能,適用于瀏覽網(wǎng)頁術(shù)語查詢、報(bào)道文章摘要總結(jié)、寫作靈感提供、文檔數(shù)據(jù)查詢等應(yīng)用場景。插件目前功能較少,但都為大模型常用場景,包括“點(diǎn)文筆”和“總結(jié)器”兩項(xiàng)功能。那么kimi與豆包的瀏覽器插件功能上線后到底誰更勝一籌,通過這篇文章作者帶大家一探究竟。
一、插件是什么?
相較于傳統(tǒng)的應(yīng)用開發(fā)流程,插件無需開發(fā)一整套完整系統(tǒng),通過接口就能提供服務(wù),且易于修改和更新。在某種意義上,插件是AI應(yīng)用創(chuàng)新的最佳載體。
kimi瀏覽器插件的下載地址:https://kimi.moonshot.cn/extension/download
豆包瀏覽器插件的下載地址:https://www.doubao.com/browser-extension/landing?utm_source=web_signed
二、豆包與Kimi的特點(diǎn)與差異化
通過安裝教程知道豆包與Kimi的瀏覽器插件都是crx文件直接拖動至chrom即可安裝成功。
豆包與Kimi自己回答本身的插件功能如下
1. 豆包
- 逐行翻譯:直接在原文旁查看翻譯,能夠清晰對比。
- 快速摘要和亮點(diǎn)生成:可以一鍵從網(wǎng)頁、PDF 和圖片中總結(jié)并生成亮點(diǎn)。
- AI 輔助搜索結(jié)果:使用豆包進(jìn)行搜索,并利用偏好的搜索引擎生成搜索摘要。
- 創(chuàng)意寫作助手:直接撰寫周報(bào)日報(bào)、朋友圈、小紅書、微博等內(nèi)容。
- 側(cè)邊欄面板:點(diǎn)擊豆包的浮窗菜單按鈕可打開側(cè)邊欄面板,自動根據(jù)當(dāng)前頁面進(jìn)行對話。
- 頭像浮窗菜單按鈕:提供常用功能,如翻譯此網(wǎng)頁,可沉浸式翻譯當(dāng)前網(wǎng)頁內(nèi)容;總結(jié)此網(wǎng)頁,可在側(cè)邊欄總結(jié)當(dāng)前網(wǎng)頁內(nèi)容。
- AI 劃詞工具欄:不僅集成了 AI 搜索、解釋、翻譯和復(fù)制等實(shí)用快捷工具,還允許用戶對劃詞工具欄的外觀進(jìn)行個(gè)性化定制,甚至能自定義工具欄技能。用戶可進(jìn)入設(shè)置頁面調(diào)整外觀樣式,也可添加新技能,每個(gè)技能本質(zhì)上是一個(gè)小 Bot,在提示詞內(nèi)容中支持變量 selection 表示當(dāng)前劃詞的文字內(nèi)容,以便更靈活地定制技能。
- 豆包搜索摘要卡:在搜索頁面中展示搜索摘要卡,不僅能快速搜索總結(jié),還可向豆包繼續(xù)提問,并在聊天中繼續(xù)對話,改變以往的搜索體驗(yàn)。點(diǎn)擊“在聊天中繼續(xù)”按鈕后,會直接進(jìn)入側(cè)邊欄面板繼續(xù)對話。
- 智能語法檢查:當(dāng)在網(wǎng)頁輸入文本出現(xiàn)語法錯(cuò)誤時(shí),及時(shí)提醒并提供修改建議。
- 語音朗讀:劃詞工具欄的“翻譯”和“總結(jié)”功能支持語音朗讀。
- 在線視頻總結(jié)和對話:支持對在線視頻進(jìn)行總結(jié)和對話,例如 B 站的視頻右邊會顯示“總結(jié)視頻”的入口,總結(jié)完成后可在右側(cè)展示“總結(jié)內(nèi)容”和“視頻亮點(diǎn)”,點(diǎn)擊每個(gè)亮點(diǎn)內(nèi)容可自動定位到視頻具體位置,也可點(diǎn)擊總結(jié)內(nèi)容底部的“在聊天中繼續(xù)”與視頻進(jìn)行對話。
2. Kimi
- 多語言對話能力:能夠流暢地進(jìn)行中文和英文對話。
- 長文本處理:支持最多20萬字的輸入和輸出,可以處理長文本寫作、翻譯、代碼編寫等任務(wù)。
- 文件閱讀和解析:能夠閱讀和解析TXT、PDF、Word文檔、PPT幻燈片、Excel電子表格等格式的文件。
- 網(wǎng)頁內(nèi)容解析:當(dāng)用戶發(fā)送網(wǎng)頁鏈接時(shí),我會先解析網(wǎng)頁內(nèi)容,然后結(jié)合解析內(nèi)容回答用戶問題。
- 搜索能力:結(jié)合搜索結(jié)果為用戶提供更全面的回答。
- 角色扮演:根據(jù)用戶要求,可以進(jìn)行角色扮演對話。
- 代碼輸出:對于代碼相關(guān)問題,我會提供完整的可執(zhí)行代碼。
- 文檔和文件生成:雖然不能直接創(chuàng)建文件,但可以提供文字回復(fù)幫助用戶解決問題。
- 付費(fèi)打賞支持:用戶可以通過網(wǎng)頁端付費(fèi)打賞支持Kimi。
- Kimi+功能:允許用戶根據(jù)特定需求自定義Kimi模型。
- 網(wǎng)頁和App使用引導(dǎo):提供Kimi智能助手的網(wǎng)頁和App下載鏈接。
- 語音輸入輸出支持:最新版Kimi智能助手App支持語音輸入和輸出。
從豆包和kimi的大模型插件回答中,可以看出豆包回答的實(shí)際功能還是比較準(zhǔn)確的,kimi回答的12個(gè)功能中,其中有5條是不符合瀏覽器插件功能的只有通過訪問官網(wǎng)才會有,從語意理解上豆包的回答會更準(zhǔn)確一些。
基于插件功能的基礎(chǔ)上我們接下來進(jìn)行幾個(gè)維度的體驗(yàn)分析
3、基礎(chǔ)功能拆解
對豆包與kimi的瀏覽器插件基礎(chǔ)功能進(jìn)行拆解
經(jīng)過基礎(chǔ)的功能拆解后通過對比,豆包的基礎(chǔ)能力要比kimi豐富很多,在插件的展示邏輯上豆包只能通過側(cè)邊欄進(jìn)行輔助工作,kimi可以通過快捷鍵進(jìn)行全局懸浮,從交互體驗(yàn)上kimi在處理基礎(chǔ)文本工作上體驗(yàn)會更友好一些。
豆包大模型瀏覽器插件如下圖,基礎(chǔ)功能上支持圖像生成;AI搜索;翻譯等,這一點(diǎn)要遠(yuǎn)比kimi支持的業(yè)務(wù)場景更多元,在交互體驗(yàn)與更多功能中,豆包支持劃詞工具欄簡化與技能庫,這是Kimi不具備的,技能庫這一功能可以重點(diǎn)展開講一下,對于小紅書創(chuàng)作的博主與代碼極客來說實(shí)在是太爽了,可以無縫銜接通過懸浮窗進(jìn)行文案修改與代碼糾錯(cuò),這兩點(diǎn)在后續(xù)的業(yè)務(wù)場景中會詳細(xì)展開來說。
三、適用的業(yè)務(wù)場景
結(jié)合白領(lǐng)工作模擬3類業(yè)務(wù)大模型推理場景,分析豆包與kimi的推理能力
1. 競品分析
TOB產(chǎn)品經(jīng)理在日常工作中需要經(jīng)常對于競品網(wǎng)站的業(yè)務(wù)邏輯與覆蓋板塊進(jìn)行邏輯梳理與分析,下面以用友、泛微、攜程商旅三個(gè)TOB網(wǎng)站為測試樣本測試Kimi與豆包大模型插件的邏輯推理能力。
kimi與豆包表現(xiàn):
觀點(diǎn)1:通過3個(gè)TOB的高級網(wǎng)站業(yè)務(wù)框架分析kimi與豆包的推理能力,從token的推理數(shù)量與網(wǎng)站邏輯分析上來看kimi 與豆包打平,但是kimi可以用【回車】按鈕直接進(jìn)行全文總結(jié)推理,交互上kimi更勝一籌。
2. 簡歷分析
在文件處理工作中LLM模型應(yīng)用最為廣泛以簡歷附件處理為背景測試kimi與豆包的大模型插件在瀏覽器中的實(shí)用性,當(dāng)在chrom瀏覽器中打開一份簡歷附件時(shí),kimi與豆包的插件懸浮按鈕是不支持彈出的,需要手動打開插件側(cè)邊欄進(jìn)行輔助工作,但這一功能只有豆包有效,Kimi是無效的。
在瀏覽器側(cè)邊欄跟豆包進(jìn)行交互時(shí),邏輯卻不是耦合的在pdf文件上進(jìn)行劃詞時(shí),無法激活豆包的劃詞技能庫,只有在側(cè)邊欄單獨(dú)進(jìn)行附件傳輸與問答時(shí)才有作用。
觀點(diǎn)2:在關(guān)聯(lián)固定瀏覽器打開的pdf文件時(shí),Kimi還需進(jìn)行適配激活優(yōu)化,豆包需要進(jìn)行耦合邏輯與激活劃詞技能庫優(yōu)化
3. 文案創(chuàng)作與文章閱讀
當(dāng)日常我們在閱讀公眾號文章或小紅書博主在進(jìn)行文案腳本創(chuàng)作時(shí),kimi與豆包的大模型插件可以在瀏覽器中幫助進(jìn)行大幅提效;
當(dāng)選取的文字沒有上下文做支撐時(shí),Kimi 需要在文本框輸入文字搜索;而豆包得益于更好的 UI 界面,直接點(diǎn)擊搜索便在側(cè)邊欄得到詳盡答案。
當(dāng)有足夠的上下文支撐時(shí),Kimi 表現(xiàn)亮眼,不僅能給出細(xì)致解釋,也能結(jié)合上下文進(jìn)一步幫助用戶理解詞匯和文章。
對于一篇題為“股權(quán)融資活動與歐洲價(jià)值增長回報(bào)”的英文文章,豆包能夠正確總結(jié)網(wǎng)站并給予 6 個(gè)點(diǎn)的亮點(diǎn)提煉;Kimi 插件也能準(zhǔn)確總結(jié)文章,并對關(guān)鍵段落進(jìn)行總結(jié)提煉亮點(diǎn),且能夠?qū)?shù)據(jù)、重要定義以及關(guān)鍵行為進(jìn)行解釋,其總結(jié)更加全面并且深入。
豆包得益于更好的 UI 界面與劃詞技能庫,這一點(diǎn)對于新媒體作者的靈感非常有幫助,以小紅書腳本為例豆包插件可以直接通過劃詞技能庫直接生成小紅書文案。
觀點(diǎn)3:在輔助閱讀時(shí),Kimi插件不僅總結(jié)內(nèi)容,還能對數(shù)據(jù)、重要定義以及關(guān)鍵行為進(jìn)行解釋,增加總結(jié)的深度且全局懸浮的交互效果好大幅提高文章閱讀效率;豆包的UI界面和劃詞技能庫設(shè)計(jì)對新媒體作者特別有用,內(nèi)容創(chuàng)作方面的實(shí)用性上更勝一籌。
四、當(dāng)下與未來的生態(tài)擴(kuò)展思考
1. 當(dāng)下問題優(yōu)化
1)提升交互體驗(yàn)
- 即時(shí)反饋:進(jìn)一步優(yōu)化Kimi的即時(shí)反饋機(jī)制,如通過語音或更直觀的界面提示,增強(qiáng)用戶的交互體驗(yàn)
- 多模態(tài)交互:探索將視覺、觸覺等多模態(tài)交互方式融入插件,提升用戶體驗(yàn)。
2)增強(qiáng)文件處理能力
- 跨平臺適配:加強(qiáng)Kimi和豆包在不同操作系統(tǒng)和瀏覽器中的文件處理能力,確保其在各種環(huán)境下的穩(wěn)定性和兼容性。
- 智能預(yù)處理:開發(fā)智能預(yù)處理功能,自動調(diào)整文件格式和內(nèi)容,以適應(yīng)不同的閱讀和分析需求。
3)深化內(nèi)容理解與創(chuàng)作輔助
- 深度學(xué)習(xí)與自然語言處理:利用深度學(xué)習(xí)技術(shù)提升對數(shù)據(jù)、定義和行為的理解和解釋能力,使總結(jié)更加精準(zhǔn)和深入。
- 創(chuàng)意生成工具:為豆包開發(fā)更高級的創(chuàng)意生成工具,幫助新媒體作者在內(nèi)容創(chuàng)作中實(shí)現(xiàn)更多創(chuàng)新和個(gè)性化表達(dá)。
2. 未來生態(tài)擴(kuò)展
當(dāng)前豆包與kimi只是開發(fā)了適配于瀏覽器的插件進(jìn)行工作提效,想要獲得的更大的市場份額和利益生態(tài)擴(kuò)展是必然;
但是在當(dāng)前大模型市場與互聯(lián)網(wǎng)行業(yè)的軟件生態(tài)的存量市場競爭中,市場份額很高的現(xiàn)象級軟件,不論是TOB/TOC領(lǐng)域都已巨頭林立;
豆包背靠母公司字節(jié)在抖音,西瓜視頻,今日頭條,激萌等一眾APP產(chǎn)品線的扶持下市場份額不必有太多擔(dān)心,在APP工廠下自然會有C端來不斷的補(bǔ)齊研發(fā)成本,拉高ROI;
但是對于kimi這種創(chuàng)業(yè)團(tuán)隊(duì)來說想要與巨頭已經(jīng)完成閉環(huán)的生態(tài)中競爭,進(jìn)行產(chǎn)業(yè)融合的落地是唯一的不二選擇
例如:
- 教育與研究場景:將大模型插件應(yīng)用于教育和研究領(lǐng)域,輔助學(xué)術(shù)研究和知識傳播。
- 企業(yè)解決方案場景:開發(fā)面向企業(yè)的定制化解決方案,幫助企業(yè)在數(shù)據(jù)分析、市場研究等方面提升效率。
- 數(shù)據(jù)安全:加強(qiáng)數(shù)據(jù)加密和隱私保護(hù)措施,確保用戶在使用插件時(shí)的數(shù)據(jù)安全。
- 合規(guī)性:確保插件符合各國的數(shù)據(jù)保護(hù)法規(guī),增強(qiáng)用戶對產(chǎn)品的信任。
但是只卷TOB/TOG領(lǐng)域?qū)τ诳萍籍a(chǎn)業(yè)資本來講市場還是小的,而且抗周期與抗風(fēng)險(xiǎn)性較差,還需要與數(shù)10億的C端消費(fèi)者共享企業(yè)利潤才可以達(dá)成完美的閉環(huán);
例如最近爆火的蘿卜快跑,科技是服務(wù)于人民的;人工智能更多的應(yīng)用場景值得科技資本進(jìn)一步的探索。
專欄作家
小于愛學(xué)習(xí),公眾號:產(chǎn)品技術(shù)加油站,人人都是產(chǎn)品經(jīng)理專欄作家。左手科技互聯(lián)網(wǎng)&右手產(chǎn)業(yè)與經(jīng)濟(jì),長期關(guān)注硬科技和產(chǎn)業(yè)經(jīng)濟(jì)學(xué)。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!