開年搶跑AI賽道,Sora“截胡”字節(jié)
最近,OpenAI的Sora模型在互聯(lián)網(wǎng)圈、科技圈掀起熱議,而國內(nèi)選手在大模型領域其實也有了新動作,比如字節(jié)就上線了“Coze扣子”AI Bot開發(fā)平臺。AI賽道上的競逐,看樣子還遠未結(jié)束。
最近,國內(nèi)的大公司在AI賽道上被Sora搶占了風頭。
在2024年2月初,此前在大模型領域保持低調(diào)的字節(jié)跳動終于有了新動作,上線了“Coze扣子”AI Bot開發(fā)平臺,據(jù)Coze官方介紹,Coze可以讓用戶快速創(chuàng)建各種由AI提供支持的問答B(yǎng)ot,且可以將Bot發(fā)布到各種應用程序,從而促進與這些應用程序上的用戶的動態(tài)交互。
簡單來說,Coze的特點是,可以讓用戶創(chuàng)建個人定制版Bot,實現(xiàn)“0代碼”開發(fā)。
這倒也并非創(chuàng)新之舉。早在2023年末,OpenAI發(fā)布的GPTs也是旨在“每個人都可以定制自己的ChatGPT,從而讓GPT成為一個家族?!钡珜τ谧止?jié)跳動而言,這多少算個大動作,畢竟此前它在大模型領域沉寂已久。
不過,還未等Coze掀起太大的水花,OpenAI發(fā)布的Sora直接“王炸”,搶走風頭,引發(fā)熱議。
一、定制Chatbot,從求職到小紅書文案
“Coze是一個一站式AI機器人開發(fā)平臺。”
據(jù)Coze官網(wǎng),為了促進和簡化AI機器人的開發(fā)過程,Coze目前集成了60多個插件,增強了Bot在信息檢索、旅行協(xié)助、生產(chǎn)力、圖像理解等領域的功能,“你可以直接將這些插件添加到Bot中,豐富Bot能力。例如使用新聞插件,打造一個可以播報最新時事新聞的AI新聞播音員?!庇脩粢部梢酝ㄟ^指定現(xiàn)有API的輸入和輸出來快速創(chuàng)建自定義插件。
此外,Coze支持為Bot創(chuàng)建定時任務。Coze官網(wǎng)介紹稱,用戶無需編寫任何復雜的代碼,只需一個簡單的描述,Bot就可以按需完成工作。例如,可以配置為:每天早上 9:00 向您發(fā)送個性化新聞。提醒您每天早上7:00查看今天的天氣預報和日程。
鋅刻度體驗Coze時發(fā)現(xiàn),目前Coze的Bot商店內(nèi)已有各種場景的預置Bot,其中包括女生頭像生成器、小紅書文案輸出大師、求職助手等,而根據(jù)官網(wǎng)介紹,選擇預生成Bot后,用戶會被引導到該Bot的配置頁面。在這里,你可以查看這個Bot的配置信息,與這個Bot進行交互,體驗它提供的能力。
經(jīng)體驗,鋅刻度留意到,目前的預置Bot多搭載云雀大模型。其中,“求職助手”可以提供求職建議、推薦工作機會。
Coze Bot商店內(nèi)的“求職助手”界面
而部分Bot或許還有一定完善和提升空間。比如,在體驗“小紅書文案輸出大師”時,鋅刻度分別提出“幫我列出送媽媽的禮物清單”和“幫我列出送奶奶的禮物清單”的需求,但得到的回答基本相同。這一問題在“春聯(lián)大王”這一Bot也出現(xiàn),據(jù)鈦媒體,要求bot幫助寫一個關于雪的春聯(lián),經(jīng)過兩次追加不一樣的提示詞(Prompt),最后生成的兩副春聯(lián)竟是一模一樣的,并未如預期出現(xiàn)不同的回答。
值得一提的是,除了可以體驗這些預置Bot,用戶也可復制一個預置的Bot,并根據(jù)你的具體需求對其進行修改。
至于Coze背后的開發(fā)團隊,據(jù)界面新聞報道,Coze由2023年11月字節(jié)跳動成立的AI創(chuàng)新業(yè)務部門Flow研發(fā)而成的,該部門業(yè)務主要聚焦于AI應用層,由字節(jié)跳動技術副總裁洪定坤擔任技術負責人,原今日頭條CEO朱文佳擔任字節(jié)大模型團隊業(yè)務負責人。
不過,Coze官網(wǎng)鏈接的企業(yè)為“北京春田知韻科技有限公司”,天眼查顯示,該公司成立于2023年7月,由北京抖音信息服務有限公司100%持股。
二、字節(jié)猛追進度
在發(fā)布Coze之前,字節(jié)跳動在AI賽道上一度“掉隊”。
在字節(jié)跳動2024年全員會上,字節(jié)跳動CEO梁汝波表示,字節(jié)跳動存在低效和遲鈍現(xiàn)象,并直言,“字節(jié)對于大模型領域的反應過于遲鈍,直到2023年中才出現(xiàn)跟GPT相關的討論,而GPT-1在2018年就發(fā)布了,且業(yè)內(nèi)做得比較好的大模型創(chuàng)業(yè)公司也基本在2018-2021年間創(chuàng)立?!?/p>
回顧此前,直到去年8月,字節(jié)跳動基于云雀大模型開發(fā)的AI聊天機器人“豆包”才開始公測,面向C端市場發(fā)力AI應用。與此同時,還在國外發(fā)布了基于CPT模型訓練的Cici,后者目前已經(jīng)在超過30個國家和地區(qū)上線。
字節(jié)跳動“豆包”
與此同時,國內(nèi)大公司紛紛在這個賽道發(fā)力:從2023年的3月到9月,從百度的大語言模型“文心一言”、360的智腦大模型,到阿里巴巴的“通義千問”大模型、科大訊飛的星火大模型,再到騰訊的混元大模型,國內(nèi)傳統(tǒng)的三大互聯(lián)網(wǎng)巨頭“BAT”悉數(shù)下場。
手機廠商也未缺席,華為、小米、OPPO、vivo、榮耀都先后在賽道亮相;五科研院所和初創(chuàng)企業(yè)不甘示弱,北京智源人工智能研究院發(fā)布了“悟道”大模型,上海人工智能實驗室推出了“書生”大模型,鵬城實驗室研發(fā)了“鵬城·腦?!贝竽P?;京東、攜程、好未來等也相繼召開發(fā)布會;甚至連移動、聯(lián)通、電信三大運營商,長虹等家電生產(chǎn)企業(yè)也欲分一杯羹……
更不用提諸多風云人物對此的討論不斷。其中,據(jù)財經(jīng)網(wǎng),華為創(chuàng)始人任正非3月中旬參加華為 “難題揭榜火花獎” 頒獎座談會時稱,華為會做底層算力平臺:“未來AI大模型會風起云涌,不只微軟一家。ChatGPT把計算、管道流量撐大,華為的產(chǎn)品就有了機會?!蓖略碌?,騰訊總裁劉熾平在財報電話會上說,生成式人工智能可成為騰訊已有業(yè)務,如社交、游戲的“倍增器”,也可幫助開拓數(shù)字助手、搜索等新增長線。此外,《張朝陽的物理課》直播結(jié)束后會自動生成字幕:“‘社交互動’‘算法推薦以及AIGC’‘自媒體’,是這些年來互聯(lián)網(wǎng)的三個線索。”
數(shù)據(jù)則更為直觀,據(jù)“趣解商業(yè)”,2023年5月的中關村論壇上,專家口中中國“10億級參數(shù)規(guī)模以上”大模型的發(fā)布數(shù)量尚為79個;而《2023中國新一代人工智能科技產(chǎn)業(yè)發(fā)展報告》顯示,截至2023年10月,我國擁有10億參數(shù)規(guī)模以上大模型的廠商及高校院所共計254家,分布于20多個省市/地區(qū),國內(nèi)大模型總數(shù)達238個;而據(jù)GitHub的統(tǒng)計數(shù)據(jù),到2023年底國內(nèi)已經(jīng)發(fā)布的大語言模型接近300個。
所以,當“百模大戰(zhàn)”如火如荼時,在2024年初發(fā)布Coze的字節(jié)跳動,與其說是搶跑,可能更精確的說法是“奮起直追”。
三、OpenAI搶占風頭,字節(jié)又該如何應對?
字節(jié)跳動或許本想著在2024年初搶先嶄露頭角,卻不料OpenAI再放“狠招”,直接“王炸”,搶占了風頭。就在Coze上線后不久,Sora橫空出世。
2月16日,OpenAI推出了一款能根據(jù)文字指令即時生成短視頻的模型,命名為Sora。據(jù)介紹,Sora能夠從文本說明中生成長達60秒的視頻,并能夠提供具有多個角色,特定類型的動作和詳細的背景細節(jié)的場景。Sora還能在一個生成的視頻中創(chuàng)建多個鏡頭,體現(xiàn)人物和視覺風格。此外,Sora可以一次性生成整個視頻,也可以擴展生成的視頻。
Sora技術報告
這意味著,OpenAI已然在人工智能賽道上邁入下半場,國內(nèi)外大模型的差距更明顯了。當OpenAI官方公布長達60秒未經(jīng)修改的AI視頻,國內(nèi)也有AI團隊緊急上線相關“文字生成視頻”大模型,但與國外主流AI視頻模型能力相仿,均暫時無法超越Sora的水平。
不過,當OpenAI已經(jīng)開始深耕文生視頻的大模型,字節(jié)跳動卻似乎如夢初醒,剛剛開始追趕對話問答大模型的進度。
日前雖有消息稱,在Sora引爆文生視頻賽道之前,國內(nèi)的字節(jié)跳動也推出了一款顛覆性視頻模型——Boximator。與Gen-2、Pink1.0等模型不同的是,Boximator可以通過文本精準控制生成視頻中人物或物體的動作。但對此,字節(jié)跳動相關人士回應新浪科技稱,Boximator是視頻生成領域控制對象運動的技術方法研究項目,目前還無法作為完善的產(chǎn)品落地,距離國外領先的視頻生成模型在畫面質(zhì)量、保真率、視頻時長等方面還有很大差距。
事實上,字節(jié)跳動的Coze也多少有些亦步亦趨,早在Coze發(fā)布之前,其實在2023年11月的OpenAI首屆開發(fā)者大會上,GPTs就已經(jīng)發(fā)布,而根據(jù)當時的介紹,GPTs無需編程技巧,可以讓用戶用自己的自然語言來創(chuàng)建“個人版ChatGPT”,實現(xiàn)全程“0代碼”開發(fā)。
用OpenAI CEO奧爾特曼的話說,每個人都可以定制自己的ChatGPT,從而讓GPT成為一個家族。那時候,外界討論,GPTs搭配GPT Store,很可能會在AI應用生態(tài)中誕生下一個蘋果。
彼時,華西證券研報曾評價,類比App Store,GPT Store將成為OpenAI生態(tài)重要一環(huán)。
按照研報的說法,對初創(chuàng)公司來說,GPTs本身就是一個值得挖掘的AI應用項目;而對于現(xiàn)有的互聯(lián)網(wǎng)應用來說,GPT Store是一個優(yōu)質(zhì)的流量入口,GPTs要實現(xiàn)復雜功能普遍需調(diào)用外部API,若現(xiàn)有App能充分利用GPTs的高智能、高靈活性,并與自身應用進行結(jié)合,有望為現(xiàn)有互聯(lián)網(wǎng)生態(tài)注入新鮮血液,“AI+一切”已近在咫尺。
顯然,Coze的設定與此相同。
只不過,當字節(jié)跳動這次試圖緊跟OpenAI腳步時,還是稍有差距??梢灶A想的是,國內(nèi)或許很快也將掀起文生視頻大模型的新浪潮,而字節(jié)跳動又該如何應對呢?
作者:黎炫岐,編輯:黎文婕
來源公眾號:鋅刻度(ID:znkedu),專注科技、互聯(lián)網(wǎng)新經(jīng)濟原創(chuàng)深度報道。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @鋅刻度 授權發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!