欧美一区二区三区激情视频,国产精品视频每日更新

<noframes id="vwygd"></noframes>

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

開通會(huì)員

發(fā)布

注冊(cè) | 登錄

有視覺記憶的Agent、大變身的搜索、更強(qiáng)的AI全家桶和大一統(tǒng)的Gemini｜現(xiàn)場(chǎng)圍觀Google I/O的絕地反擊

硅星人

2024-05-15

0 評(píng)論 404 瀏覽 0 收藏

如果說前一天OpenAI用GPT-4o和全新的ChatGPT實(shí)現(xiàn)了炸場(chǎng)，那么隨之而來(lái)的Google I/O大會(huì)上的發(fā)布，則可以看作為一場(chǎng)反向狙擊。

今年的Google Shoreline圓形劇場(chǎng) ，彌漫著一種前所未有的角斗場(chǎng)般的氣息。

前一天OpenAI用GPT-4o和全新的ChatGPT把全世界掀翻，而Google要在今年甚至最近幾年最重要的一場(chǎng)Google I/O上做何應(yīng)對(duì)，似乎成了唯一的主題。

事實(shí)上，據(jù)OpenAI的人士透露，GPT-4o是一個(gè)至少兩年前就已經(jīng)開始開發(fā)的模型，而硅谷AI圈子之小，互通有無(wú)之頻繁，其實(shí)不僅OpenAI有機(jī)會(huì)故意選在Google的大會(huì)前狙擊Google，后者同樣也會(huì)對(duì)此有所預(yù)期。

所以，當(dāng)Pichai走上舞臺(tái)中央時(shí)，一場(chǎng)反狙擊開始了。

在這場(chǎng)持續(xù)兩小時(shí)的發(fā)布中，Google有攻有守。

它對(duì)自己的看家業(yè)務(wù)搜索做了最徹底的一次AI化改造，還再次全面更新了Gemini模型家族。

守住OpenAI們猛攻的方向，同時(shí)發(fā)起進(jìn)攻。

一方面很有火藥味的發(fā)布了效果超過Sora的模型Veo，并且是可以立刻申請(qǐng)?bào)w驗(yàn)的產(chǎn)品；另外還展示了與GPT-4o 相似的語(yǔ)音視覺交互功能Gemini Live，同時(shí)，還更進(jìn)一步推出了比OpenAI等對(duì)手更激進(jìn)的AI智能體Project Astra。

以下為現(xiàn)場(chǎng)實(shí)錄。

一、Gemini，Gemini，還是Gemini

當(dāng)Google CEO Sundar Pichai走上臺(tái)，在他的前幾分鐘講話里，Gemini的頻率甚至超過了Google這個(gè)詞。

Gemini是去年Google I/O上正式推出的最核心的模型，而一年以后，Google已經(jīng)用它完成了對(duì)自己內(nèi)部的“大一統(tǒng)”。模型是Gemini，智能助手是Gemini，Android的核心是Gemini。甚至，Pichai都不叫自己Googler了，他們叫：

Geminier。

而當(dāng)天大會(huì)上Gemini模型首先進(jìn)行了更新。此前幾個(gè)月，Gemini 1.5的長(zhǎng)文本版本以預(yù)覽版本推出，今天它正式對(duì)所有人發(fā)布。此前的Gemini 1.5版本上下文長(zhǎng)度為100萬(wàn)token。而Pichai似乎輕描淡寫的公布：

新版本長(zhǎng)度再次刷新，達(dá)到200萬(wàn)token。

現(xiàn)場(chǎng)的開發(fā)者爆發(fā)出當(dāng)天的第一陣歡呼。

“我們正式進(jìn)入了Gemini時(shí)代?！盤ichai直入主題說。目前有超過1500萬(wàn)開發(fā)者在使用Gemini做開發(fā)。而Gemini最近三個(gè)月時(shí)間達(dá)到了100萬(wàn)訂閱用戶。

關(guān)于Gemini的具體信息，自然是由Deepmind的CEO Demis Hassabis來(lái)講。這也是這位傳奇人物第一次Google I/O演講。

在他的演講中，第一個(gè)發(fā)布是Gemini 1.5 flash。這是一個(gè)針對(duì)端側(cè)的模型，同樣有100萬(wàn)和200萬(wàn)token的版本。這似乎指向了Google接下來(lái)對(duì)端側(cè)的野心。

排排隊(duì)

“我們總有很多模型同時(shí)在訓(xùn)練，我們會(huì)用我們最強(qiáng)的模型來(lái)幫助小模型?！?/p>

而對(duì)于此前推出的單獨(dú)版本的Gemini App，Google也做了更新，推出了更高級(jí)別的訂閱服務(wù)Gemini Advanced。也就是對(duì)標(biāo)ChatGPT Plus的最高級(jí)別服務(wù)。

在這個(gè)服務(wù)里，一個(gè)新的功能看起來(lái)正是對(duì)昨天ChatGPT的更新的回應(yīng)——Gemini Live。你可以在Gemini里實(shí)時(shí)無(wú)延遲地打電話來(lái)與AI互動(dòng)，也就是GPT-4o昨天做的事情。遺憾的是這部分只是一帶而過，看起來(lái)Google更多是想說，哪怕晚一天，也要告訴世界，不是只有你能做。

不過現(xiàn)場(chǎng)似乎對(duì)此略顯失望，人們顯然希望看到更多針尖對(duì)麥芒的發(fā)布。

二、有視覺記憶的AI Agent

于是，大的來(lái)了。

一個(gè)充滿野心的AI Agent。

面對(duì)OpenAI的進(jìn)攻，不能只是防守。Google也需要一些更加激進(jìn)的東西來(lái)反擊。這個(gè)東西就是Project Astra。這是一個(gè)還在研發(fā)中的AI Agent，而Pichai形容Google的夢(mèng)想一直就是做出一個(gè)強(qiáng)大的AI Agent。

Google Deepmind CEO Hassabis親自上臺(tái)，講解和展示了Astra的一個(gè)原型的運(yùn)作視頻。

是的，一個(gè)意味深長(zhǎng)的交接

在展示中，一開始一切都和我們見過的AI Agent差不多，可以通過用戶打開的攝像頭識(shí)別物體，與用戶實(shí)時(shí)語(yǔ)音交互。而驚人的一刻在最后到來(lái)，當(dāng)用戶帶著Astra走了一大圈后，突然提出一個(gè)此前沒有涉及到的問題：

“你記得我把眼鏡放哪了么？”

這是此前沒有詢問的問題，但攝像頭掃過的時(shí)候Astra曾“看”到過他的眼鏡，而AI Agent居然以視覺的形式記錄了下來(lái)。

“你的眼鏡在桌上蘋果旁邊?！盇stra回答道。

這讓現(xiàn)場(chǎng)一陣驚呼，也是此次發(fā)布會(huì)上最長(zhǎng)的一次掌聲。

此外，Google還明顯針對(duì)Sora做了一次進(jìn)攻。發(fā)布了一款全新的視覺模型，Voe。這是Google過往許多視覺模型的集大成者，也可以看作Sora逼迫下的一次內(nèi)部資源整合。

在Voe的展示中，用戶可以通過點(diǎn)擊擴(kuò)展，而繼續(xù)增加視頻生成的時(shí)長(zhǎng)，這讓它可以超過了Sora一開始的1分鐘，并且可以保持一致性。

Google還著重展示了他們開發(fā)這些產(chǎn)品過程里與藝術(shù)家的合作。似乎也在隔空喊話那些對(duì)Sora不滿的藝術(shù)家，來(lái)這里來(lái)這里，我更好。

三、終于對(duì)搜索下手：Google搜索最大的一次改造

除了對(duì)OpenAI的進(jìn)攻的反應(yīng)，人們也關(guān)心一件事：Google的搜索改造得怎么樣了。

Google什么時(shí)候?qū)λ阉飨率?，是所有人期待的那個(gè)重要時(shí)刻。OpenAI此前的煙霧彈，Perplexity不停地碰瓷，都讓Google一直顯得太過安靜。而這一次終于有了最大的一次更新和變化。

當(dāng)數(shù)億美國(guó)用戶今天打開Google時(shí)，他們將看到近幾年最大變化的Google。

AI overview，也就是AI生成的搜索答案總結(jié)，會(huì)出現(xiàn)在所有人的搜索框下。

而且，這個(gè)總結(jié)并不是一個(gè)固定的模版，而是根據(jù)你的問題進(jìn)行調(diào)整。

比如，Google可以根據(jù)你的問題幫你做規(guī)劃。這時(shí)候在搜索框下，會(huì)顯示正在進(jìn)行的步驟，然后在Overview里展示給你不同卡片，把需要的信息整理出來(lái)提供給你。

Google表示這是必須有強(qiáng)大的實(shí)時(shí)搜索才能做的，言外之意，那些沒有搜索能力基礎(chǔ)的公司，就別來(lái)碰瓷了。

而搜索的改造也只是個(gè)開始，它看起來(lái)很像是要變成Google激發(fā)用戶AI需求的一個(gè)超級(jí)入口。

比如Google展示了一個(gè)場(chǎng)景，當(dāng)用戶哪怕不知道自己該具體問什么的時(shí)候，Google也可以給你推薦，與你做頭腦風(fēng)暴。而此時(shí)這個(gè)搜索的界面也進(jìn)一步完全變成了另一個(gè)樣子。像是不同卡片的信息流，每一個(gè)都可以進(jìn)一步操作。

“Google會(huì)替你Google?！边@是Pichai對(duì)此的定義。

更進(jìn)一步，Google還展示了一個(gè)用實(shí)時(shí)視頻對(duì)話來(lái)搜索的功能。而這也是全場(chǎng)進(jìn)行了半小時(shí)后的第一次Live demo的環(huán)節(jié)。

現(xiàn)場(chǎng)一度過于安靜，人們等待Live demo，這個(gè)小車帶著一臺(tái)電腦被推上來(lái)時(shí)，大家騷動(dòng)了一下

當(dāng)你買了一臺(tái)唱片播放器，但你對(duì)此毫無(wú)了解，它出了播放問題，但你不知道問題到底在哪里的時(shí)候，你可以直接打開攝像頭拍攝并詢問。

而Google直接給出了AI整理的答案和解決建議。

“這就是Gemeni時(shí)代的搜索?！盤ichai說。現(xiàn)場(chǎng)掌聲再次響起。

四、對(duì)全家桶的AI能力進(jìn)一步改造升級(jí)

Google I/O上的保留節(jié)目是對(duì)全家桶的新功能展示。而Gemini時(shí)代來(lái)了，這些全家桶也自然要更新。

Pichai在當(dāng)天展示的第一個(gè)應(yīng)用案例，是“Ask Photo”。9年前，Google Photo發(fā)布。每天有60億的照片視頻上傳。Gemini讓AI編輯更簡(jiǎn)單。

你現(xiàn)在可以ask photo，與照片進(jìn)行對(duì)話。比如，你可以問Photo app，“我的汽車牌照是多少”。然后Gemini就在照片里尋找出來(lái)你的車告訴你答案。

或者你可以詢問Photo，“我女兒是什么時(shí)候?qū)W會(huì)游泳的”，然后還可以進(jìn)一步詢問，“她的進(jìn)步是怎樣的”。Photo都可以把對(duì)應(yīng)的照片和視頻給你展示出來(lái)。這對(duì)于每天都抱著手機(jī)看自己寶貝孩子成長(zhǎng)歷程的人們來(lái)說，實(shí)在是太有用了。

這個(gè)功能的展示也讓全場(chǎng)一陣歡呼。

此外Workspace也有了很多新功能，Google還展示了一個(gè)基于多模態(tài)能力的教學(xué)工具，你可以用語(yǔ)音提出教學(xué)要求，比如“給我一個(gè)用籃球解釋力學(xué)原理的案例”，Motion就會(huì)自動(dòng)用很自然的語(yǔ)音講出來(lái)。

另一個(gè)讓現(xiàn)場(chǎng)觀眾眼前一亮的功能，是Android對(duì)Gemnini的使用?，F(xiàn)場(chǎng)展示的一個(gè)live demo中，一個(gè)詐騙電話打來(lái)，像我們經(jīng)常遇到的電話那樣，在一通義正嚴(yán)辭的提醒后，對(duì)方要求你把錢轉(zhuǎn)到一個(gè)安全的賬戶。

而就在這句話說出來(lái)時(shí)，Gemini被激發(fā)了，直接彈出一個(gè)警告框，阻止了電話的繼續(xù)進(jìn)行。

全場(chǎng)響起可能是當(dāng)天第二長(zhǎng)的一次歡呼。

在發(fā)布會(huì)的最后，Pichai做最后總結(jié)時(shí)開玩笑說，肯定有人在數(shù)，我今天說了多少次AI。

“不用數(shù)了，Gemini數(shù)完了?！?/p>

然后大屏幕顯示120。

“我說了這么多次AI?！?/p>

然后Gemini又加了1，變成了121。

現(xiàn)場(chǎng)都笑了。

很明顯，Google依然正在一個(gè)整合資源的過程里。無(wú)論是對(duì)全家桶的能力提升，還是對(duì)搜索的改造，背后都是一個(gè)邏輯，要把Google這么多年積累下來(lái)的能力和資源用起來(lái)，由Gemini來(lái)做唯一的大腦，改造一切，守住并繼續(xù)搶奪新的用戶。

Google不會(huì)輕易下牌桌，AI大戰(zhàn)會(huì)繼續(xù)進(jìn)行下去。

以下為當(dāng)天Google I/O上各種發(fā)布的更多信息：

（1）Gemini 1.5 Flash ：更快、更經(jīng)濟(jì)的輕量化推理模型

為了滿足用戶對(duì)低延遲和低成本的需求，谷歌首先帶來(lái)輕量化模型Gemini 1.5 Flash。它專為大規(guī)模服務(wù)設(shè)計(jì)，速度更快、成本低至0.35美元每百萬(wàn)tokens。

盡管1.5 Flash體積小巧，仍實(shí)現(xiàn)了100萬(wàn)個(gè)標(biāo)記的長(zhǎng)上下文窗口，開發(fā)人員還能注冊(cè)嘗試200萬(wàn)個(gè)標(biāo)記。此外，它在跨大量信息的多模態(tài)推理方面表現(xiàn)出色，適用于摘要、聊天應(yīng)用、圖像和視頻字幕、長(zhǎng)文檔和表格的數(shù)據(jù)提取等多種任務(wù)。

這種強(qiáng)大性能來(lái)源于“蒸餾”技術(shù)，該技術(shù)將1.5 Pro中最重要的知識(shí)和技能轉(zhuǎn)移到更小、更高效的模型中。從今天起，超過200個(gè)國(guó)家的用戶都可以在Google AI Studio和Vertex AI中使用Gemini 1.5 Flash。

（2） Gemini 1.5 Pro 迎來(lái)重大升級(jí)：200萬(wàn)上下文、更強(qiáng)大的推理和理解能力

今天起，Google最先進(jìn)的多模態(tài)大模型Gemini 1.5 Pro 將在 Gemini Advanced 中直接供消費(fèi)者使用100萬(wàn)標(biāo)記上下文窗口，并在私人預(yù)覽中擴(kuò)展到 200 萬(wàn)標(biāo)記。這使得Gemini 1.5 Pro能處理更更大量的復(fù)雜信息，生成更準(zhǔn)確、更細(xì)致的輸出。

同時(shí)，通過數(shù)據(jù)和算法改進(jìn)，增強(qiáng)了模型的代碼生成、邏輯推理和規(guī)劃、多輪對(duì)話以及音頻和圖像理解能力。升級(jí)后的Gemini 1.5 Pro在MMMU、AI2D、MathVista、ChartQA、DocVQA、InfographicVQA和EgoSchema等多項(xiàng)公共基準(zhǔn)測(cè)試中取得了顯著改進(jìn)，在多項(xiàng)圖像和視頻理解基準(zhǔn)測(cè)試中也實(shí)現(xiàn)了最先進(jìn)性能。

此外Gemini 1.5 Pro還能夠遵循越來(lái)越復(fù)雜和細(xì)微的指示，包括指定產(chǎn)品級(jí)行為的指示，如角色、格式和風(fēng)格等。谷歌也在 Gemini API 和 Google AI Studio 中增加了音頻理解，支持跨圖像和音頻進(jìn)行推理。

用戶可以通過 Gemini Advanced 訂閱服務(wù)體驗(yàn)最新的Gemini 1.5 Pro，支持超過150個(gè)國(guó)家的35種語(yǔ)言。

(3) 首個(gè)AI Agent產(chǎn)品Project Astra

Hassabis表示，Project Astra旨在像人類一樣理解和響應(yīng)復(fù)雜的動(dòng)態(tài)世界，記住所見所聞以理解上下文并采取行動(dòng)。同時(shí)，它需要主動(dòng)、可教和個(gè)性化，使用戶能夠自然地與之交流，無(wú)延遲。

其挑戰(zhàn)之一是將響應(yīng)時(shí)間縮短到對(duì)話級(jí)別，這是一個(gè)困難的工程難題。Astra基于Gemini和其他特定任務(wù)模型，通過持續(xù)編碼視頻幀、將視頻和語(yǔ)音輸入結(jié)合到事件時(shí)間線上，并緩存信息以便高效回憶，從而更快地處理信息。

“基于 Gemini 模型，我們開發(fā)了能夠高效調(diào)用視頻幀和語(yǔ)音輸入的代理，并增強(qiáng)了其語(yǔ)調(diào)范圍，使其更好地理解上下文并快速響應(yīng)?！?Hassabis補(bǔ)充道。

未來(lái)，用戶就可以通過手機(jī)或眼鏡擁有一個(gè)專家級(jí)別助手。今年晚些時(shí)候，這些功能將出現(xiàn)在Gemini應(yīng)用程序等Google產(chǎn)品中，如Gemini應(yīng)用程序。

媒體生成工具

（4）Veo：比Sora更強(qiáng)的視覺模型

Veo能夠生成超過一分鐘的高質(zhì)量1080p視頻，涵蓋多種電影和視覺風(fēng)格。據(jù)介紹，Veo具備高級(jí)的自然語(yǔ)言和視覺語(yǔ)義理解能力，能準(zhǔn)確呈現(xiàn)細(xì)節(jié)并捕捉情感基調(diào)。它理解“延時(shí)攝影”等電影術(shù)語(yǔ)，提供高度創(chuàng)作控制，生成的鏡頭中人、動(dòng)物和物體的運(yùn)動(dòng)非常真實(shí)。

Google已邀請(qǐng)電影制片人和創(chuàng)作者試用Veo，并根據(jù)他們的反饋改進(jìn)技術(shù)。Veo基于Google多年生成視頻模型的工作，如GQN、DVD-GAN、Imagen-Video等，結(jié)合新技術(shù)提高質(zhì)量和分辨率。Veo將作為VideoFX的私人預(yù)覽提供給特定創(chuàng)作者，所有人可申請(qǐng)注冊(cè)候補(bǔ)名單，未來(lái)可能直接引入YouTube Shorts。

（5）Imagen 3發(fā)布，文生圖模型升級(jí)

Imagen 3是Google最高質(zhì)量的文本到圖像生成模型。它能生成細(xì)節(jié)豐富、栩栩如生的圖像，視覺干擾明顯少于之前的模型。并且能更好地理解自然語(yǔ)言和提示背后的意圖，結(jié)合長(zhǎng)提示中的細(xì)微細(xì)節(jié)，掌握多種風(fēng)格。它還是迄今為止Google最好的文字渲染模型，使生成個(gè)性化生日祝福和演示文稿標(biāo)題頁(yè)成為可能。

從今天起，Imagen 3將作為ImageFX中的私人預(yù)覽提供給特定創(chuàng)作者，用戶可以注冊(cè)加入候補(bǔ)名單。很快，Imagen 3也將在Vertex AI上提供。

此外，Google還設(shè)計(jì)并構(gòu)建了音樂AI工具M(jìn)usic AI Sandbox，旨在為創(chuàng)意打開新的天地，讓人們從零開始創(chuàng)作新的器樂部分并以新的方式轉(zhuǎn)換聲音。

（6）AI搜索

Gemini時(shí)代的搜索正在全面改變搜索的呈現(xiàn)方式、服務(wù)體驗(yàn)和廣告方式。首先，美國(guó)用戶將體驗(yàn)到近年來(lái)最大的交互界面變動(dòng)。搜索框下方的信息會(huì)先呈現(xiàn)一個(gè)AI生成的概覽，據(jù)Google透露，用戶已通過搜索實(shí)驗(yàn)室數(shù)十億次使用AI概覽。這一功能增加了搜索頻率，并提高了用戶對(duì)搜索結(jié)果的滿意度。本周，數(shù)億用戶將可使用AI概覽，預(yù)計(jì)到年底覆蓋超過十億人。

搜索也不再是“一次性”的服務(wù)，而是一個(gè)AI智能體的入口。用戶提出復(fù)雜問題后，AI會(huì)將其分解為小模塊，提供準(zhǔn)確的答案和建議，還可以根據(jù)問題和搜索結(jié)果為你擬定計(jì)劃。例如，用戶可以搜索“創(chuàng)建一個(gè)易于準(zhǔn)備的3天餐計(jì)劃”，獲得來(lái)自網(wǎng)絡(luò)的各種食譜，并能提出進(jìn)一步需求和修改建議使答案更個(gè)性化，再快速將餐點(diǎn)計(jì)劃導(dǎo)出到Docs或Gmail，“一條龍”式服務(wù)極大提升了搜索的實(shí)用性和便捷性。

此外，AI不僅提供答案，還能主動(dòng)幫助用戶尋找靈感并進(jìn)行頭腦風(fēng)暴，創(chuàng)建AI組織的結(jié)果頁(yè)面。未來(lái)，Google還會(huì)推出視頻AI搜索功能。

這種改動(dòng)也對(duì)廣告產(chǎn)生了影響。Google表示，通過AI概覽，用戶會(huì)訪問更多樣化的網(wǎng)站，以解決更復(fù)雜的問題。AI概覽中包含的鏈接獲得的點(diǎn)擊次數(shù)比傳統(tǒng)網(wǎng)頁(yè)列表更多。隨著這一體驗(yàn)的擴(kuò)展，Google將繼續(xù)專注于為出版商和創(chuàng)作者帶來(lái)有價(jià)值的流量，廣告仍會(huì)出現(xiàn)在專用位置，并清晰標(biāo)注以區(qū)分有機(jī)和贊助結(jié)果。

——從回答、計(jì)劃、需求定制到組織和視頻搜索，Google都會(huì)替你完成，而你需要做的只有提問。

（7）TPU

十多年來(lái)，Google一直在開發(fā)專用的AI硬件——Tensor Processing Units（TPU）。今天大會(huì)上展示的Gemini 1.5 Flash、Imagen 3和Gemma 2.0這些創(chuàng)新模型都是在TPU上訓(xùn)練和部署的。今天，谷歌也推出自己迄今為止性能最高、能效最優(yōu)的第六代TPU——Trillium。

Trillium TPUs提供比TPU v5e高4.7倍的峰值計(jì)算性能，同時(shí)將高帶寬內(nèi)存（HBM）和芯片間互連（ICI）帶寬翻倍。配備第三代SparseCore加速器，能更快地訓(xùn)練基礎(chǔ)模型并降低延遲和成本。其能效比TPU v5e提高67%以上，是最可持續(xù)的TPU。它也可以在單個(gè)集群中擴(kuò)展到256個(gè)TPU，并通過多切片技術(shù)和Titanium IPU擴(kuò)展到數(shù)百個(gè)集群，構(gòu)建大規(guī)模的超級(jí)計(jì)算機(jī)。

多項(xiàng)技術(shù)突破使得Trillium TPUs能夠大幅提升AI工作負(fù)載訓(xùn)練和服務(wù)性能，處理更大模型，提升計(jì)算能力，改進(jìn)大模型訓(xùn)練和服務(wù)性能。

（8）Gemini on Android

Google此次也在安卓平臺(tái)上推出一系列全新AI功能，將搜索和智能服務(wù)提升到一個(gè)新的水平。此前，”Circle to Search”允許用戶無(wú)需切換應(yīng)用即可搜索，現(xiàn)在起它還可以作為學(xué)習(xí)伴侶，解答數(shù)學(xué)題、圖表等復(fù)雜問題。目前這一功能已在超過1億臺(tái)安卓設(shè)備上提供，預(yù)計(jì)到年底這一數(shù)字將翻倍。

在與朋友的信息對(duì)話中，用戶可以隨時(shí)召喚Gemini生成圖片，針對(duì)YouTube教程視頻或較長(zhǎng)的PDF文檔提出特定問題，Gemini會(huì)在幾秒鐘內(nèi)提供解答，就像把數(shù)據(jù)中心裝進(jìn)了口袋。

端側(cè)模型上，接入具備多模態(tài)能力的Gemini Nano。用戶可以詢問照片信息或獲取關(guān)于服裝搭配的意見。Gemini Nano還將集成到Android Studio中，為開發(fā)者提供助力。此外，當(dāng)收到不明詐騙電話時(shí)，AI系統(tǒng)還會(huì)自動(dòng)發(fā)出警報(bào)，提示用戶可能存在詐騙風(fēng)險(xiǎn)。

總之，Gemini正在將AI融入所有安卓平臺(tái)的服務(wù)和應(yīng)用中，為用戶帶來(lái)更加智能和便捷的使用體驗(yàn)。

本文由人人都是產(chǎn)品經(jīng)理作者【硅星人】，微信公眾號(hào)：【硅星人Pro】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App