國(guó)產(chǎn)AI再創(chuàng)新,這次是真的很接地氣
最近在網(wǎng)絡(luò)平臺(tái)上,各路名人突然一夜之間變成了“語(yǔ)言大師”,而在這些AI配音視頻背后,其實(shí)是HeyGen這款產(chǎn)品在“炫技”,用戶只需簡(jiǎn)單的操作,即可生成短視頻。這樣看來(lái),AI似乎離普通人的生活越來(lái)越近了。
郭德綱在麻省理工講起了英語(yǔ)相聲?
是的,你沒(méi)看錯(cuò),郭老師甚至可以用他的京腔英語(yǔ)直接對(duì)話趙本山的東北英語(yǔ)。更有大量德云英語(yǔ)聽力試題不斷沖擊著好學(xué)的網(wǎng)友。
除了英語(yǔ),一眾外國(guó)明星也紛紛操起一口流利的中文,連諧音梗大師完顏慧德的普通話都標(biāo)準(zhǔn)了起來(lái),八國(guó)語(yǔ)言隨意切換,只需動(dòng)動(dòng)手指就能把自己笑擁。
各路名人為何一夜之間變成了語(yǔ)言大師?原來(lái),這都是AI配音搞的鬼。
01
AI越來(lái)越會(huì)炫技了。
這款“爆火”的AI視頻翻譯工具叫HeyGen,只需要上傳一張人物照片,什么都不用做,啪的一下,一個(gè)短視頻就生成了。除了上百款數(shù)字人素材和模板,官方還提供包括中文在內(nèi)的50多種語(yǔ)言和300多種不同的音色供用戶選擇。
HeyGen背后的公司名叫詩(shī)云科技,成立于 2020 年。他們最初致力于做 AI 數(shù)字人生成,目前其客戶包括英偉達(dá)、亞馬遜、volvo等。
不少網(wǎng)友感嘆,“這翻譯沒(méi)有譯制片腔調(diào)。”“嘴型、手勢(shì)都對(duì)得上,太自然了,差點(diǎn)兒以為是真的?!薄安恢棺煨危€有身體動(dòng)作和語(yǔ)速的配合?!?/p>
不得不說(shuō),在翻譯配音上,AI的表現(xiàn)非常出色,HeyGen的火爆程度也完全不輸去年面世的AI繪畫工具M(jìn)idjourney。同樣只需幾秒鐘,被稱為史上最強(qiáng)作圖神器的Midjourney就能調(diào)配出各種風(fēng)格的圖像,同類型軟件還可以讓生成的圖片直接動(dòng)起來(lái)。
自去年11月ChatGPT橫空出世,大眾一次次被AI的創(chuàng)新所驚艷。從GPT4到Midjourney,再到HeyGen,文字、圖片到視頻,AI不斷刺激著人類的感官,一次次刷新著人類的認(rèn)知。更讓人期待的是,AI還有無(wú)限的潛能可被發(fā)掘,創(chuàng)新之路還遠(yuǎn)遠(yuǎn)看不到盡頭。
02
那么,人人追捧的AI,究竟離我們普通人的生活還有多遠(yuǎn)?
雖然2023年以來(lái)國(guó)內(nèi)很多公司都發(fā)布了自己的通用大模型,但很多還停留在“開放閑聊”階段,這種泛娛樂(lè)的方式并不能帶來(lái)實(shí)際生產(chǎn)力。所以,以“開放閑聊”為產(chǎn)品形態(tài)的ChatGPT,“嘗鮮“的流量在6月達(dá)到巔峰之后,就開始出現(xiàn)下滑。
與通用大模型不同,垂直大模型可以深入到不同行業(yè),更容易落地到具體的場(chǎng)景,如金融、教育、醫(yī)療和零售等。目前已經(jīng)積累了數(shù)百萬(wàn)個(gè)視頻數(shù)據(jù)的HeyGen,之后也會(huì)考慮做視頻垂直領(lǐng)域的大模型。
有趣好玩,還能極大提升效率,是AI帶給大眾最直接的好處。AI配音既能打破語(yǔ)言隔閡,還能取代一部分配音和字幕組的工作。
此前,生成式AI的幾次創(chuàng)新也都伴隨著對(duì)重復(fù)人工的解放。Midjourney的出現(xiàn),為影視工作者提供了更高效的工作方式,國(guó)內(nèi)網(wǎng)友熟知的妙鴨視頻,最早也是誕生于劇組的選角場(chǎng)景,用AI圖像生成的方式不僅提高效率還大大節(jié)約了成本。AI生成內(nèi)容的浪潮已經(jīng)從追風(fēng)開始走向務(wù)實(shí)。
縱觀全行業(yè),今年以來(lái)的“百模大戰(zhàn)”背后,垂直領(lǐng)域的大模型開始成為新一輪布局的重點(diǎn)。
03
說(shuō)到底,無(wú)論是通用還是垂直大模型,其核心點(diǎn)還是落地場(chǎng)景和商業(yè)化。讓普通人都能用起來(lái),是大模型最重要的后半步。
如今,AI正廣泛運(yùn)用于繪圖、配音、劇本寫作等方面,科技公司們也在多模態(tài)上不斷訓(xùn)練自家AI,試圖讓其產(chǎn)出更接近真人的創(chuàng)作。圖片生成上,阿里大文娛推出的妙鴨相機(jī),逼真的換裝功能對(duì)用戶開放后,也曾走紅網(wǎng)絡(luò)。在配音上,AI燕姿、AI杰倫就曾憑借獨(dú)特的音色與唱腔,搭配與歌手本人風(fēng)格或相似或迥異的歌曲,吸引了不少關(guān)注。
但隨之而來(lái)的,是廣泛運(yùn)用后產(chǎn)生的爭(zhēng)議。AI換臉和AI配音都會(huì)構(gòu)成侵權(quán),甚至?xí)灰恍┎环ǚ肿佑糜谠p騙,如果AI技術(shù)被濫用,后果是無(wú)法想象的。技術(shù)的普及也讓這些隱患風(fēng)險(xiǎn)一一暴露,除了監(jiān)管部門,研發(fā)公司也應(yīng)該從源頭杜絕「技術(shù)濫用」的發(fā)生。
行業(yè)巨頭們都非常重視這一威脅。OpenAI CEO Sam Altman一直擔(dān)憂AI有一天會(huì)向人類扔核彈。他們最近組建了一支全新的團(tuán)隊(duì),旨在對(duì)抗“人工智能的災(zāi)難性風(fēng)險(xiǎn)”。
但任何技術(shù)的革新都無(wú)法擺脫風(fēng)險(xiǎn)和挑戰(zhàn),只要對(duì)人類有益,這項(xiàng)技術(shù)就值得推進(jìn)。在具體的應(yīng)用場(chǎng)景中不斷成長(zhǎng),不斷滿足用戶反饋的需求,或許是大模型最快也是最理想的落地方式。
作者:Lime
來(lái)源公眾號(hào):明晰野望(ID:MXYW-1688),銳眼看財(cái)經(jīng)野望大市場(chǎng)
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @明晰野望 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!