2024谷歌I/O开发者大会,生成式AI被推上顶峰,大模型安卓15确定要上!

 人參與 | 時(shí)間:2025-08-02 14:10:31

挺過(guò)最困的12點(diǎn),在大家可能已經(jīng)邁入睡眠的時(shí)候,在凌晨1點(diǎn)時(shí)刻,我們迎來(lái)了期待許久的2024谷歌I/O開(kāi)發(fā)者大會(huì)!

本次開(kāi)發(fā)者大會(huì),谷歌核心的重點(diǎn)就放在時(shí)下非常火熱的生成式AI功能上,其中多次談及再度升級(jí)的Gemini1.5 Pro大模型,并且還發(fā)布了谷歌視頻生成模型Veo。

bandicam 2024-05-15 01-11-49-351.jpg

另外谷歌搜索也進(jìn)行升級(jí),同時(shí)也宣布Gemini模型將會(huì)用于在Android 15之上,并展示了一系列即將上線的生成式AI功能。

發(fā)布會(huì)開(kāi)始,谷歌正式推出了“AI Overviews”搜索功能,不過(guò)本周會(huì)在美國(guó)率先開(kāi)放,后續(xù)會(huì)陸續(xù)在其它國(guó)家和地區(qū)上線。

bandicam 2024-05-15 01-05-56-892.jpg

谷歌搜索融入Gemini大模型,搜索可以AI生成摘要,并且可以輸入一段精確的文字,然后根據(jù)文字內(nèi)容以及場(chǎng)景,去匹配搜索的內(nèi)容,在做旅游規(guī)劃時(shí)也會(huì)創(chuàng)建更合理的清單,甚至?xí)鶕?jù)天氣去做推薦。同時(shí)還將上線視頻搜索功能,可以拍攝一段視頻來(lái)搜索想要查找的內(nèi)容。

bandicam 2024-05-15 01-44-47-330.jpg

bandicam 2024-05-15 01-46-08-251.jpg

隨后帶來(lái)了一個(gè)“Ask Photos”功能,該功能的主要亮點(diǎn)就是,在Gemini大模型之下,通過(guò)聊天的方式去搜索照片或者視頻,比如詢問(wèn)我的車牌是多少,通過(guò)檢索+辨別的方式,搜索出你的車牌號(hào)。另外詢問(wèn)孩子的游泳狀況,會(huì)搜集到孩子過(guò)往的游泳照片,該功能將會(huì)在夏天正式推出。

006Fd7o3ly1hppjk5ggxbj31hc0u0jtd.jpg

另外谷歌還發(fā)布了一個(gè)Gemini 1.5 Flash模型,相比Gemini1.5 Pro成本更低,并且針對(duì)延遲做了優(yōu)化,宣稱可以一次性分析1500頁(yè)文檔或超過(guò)30000行的代碼庫(kù),為開(kāi)發(fā)人員提供了一個(gè)低成本的選擇。

bandicam 2024-05-15 01-24-02-813.jpg

緊接而來(lái)的是一個(gè)重磅Project Astra項(xiàng)目,面向未來(lái)的生成式AI交互體驗(yàn)!

bandicam 2024-05-15 01-25-10-247.jpg

演示的視頻,顯示的是手機(jī)通過(guò)攝像頭對(duì)于周圍空間環(huán)境的理解,并且能夠?qū)崟r(shí)的進(jìn)行語(yǔ)音交互。打開(kāi)手機(jī)攝像頭,詢問(wèn)拍到的物體,可以準(zhǔn)確識(shí)別并給出語(yǔ)音回答,甚至還能記起拍攝過(guò)程某個(gè)物體的位置,而這種功能可以從手機(jī)流轉(zhuǎn)到眼鏡上繼續(xù)使用。

bandicam 2024-05-15 01-26-45-282.jpg

bandicam 2024-05-15 01-27-10-169.jpg

在文生圖功能上推出了 Imagen 3,相比上代可以更加準(zhǔn)確的識(shí)別文字信息,創(chuàng)作的圖片也會(huì)更符合文本描述。

bandicam 2024-05-15 01-30-26-799.jpg

除了圖片、文本生成式創(chuàng)作以外,谷歌發(fā)布了視頻生成模型Veo,對(duì)標(biāo)OpenAI的Sora,可以通過(guò)文本、圖像來(lái)生成視頻,生成的視頻分辨率可以達(dá)到1080P,并且視頻時(shí)長(zhǎng)可以超過(guò)1分鐘。

bandicam 2024-05-15 01-34-23-772.jpg

在辦公場(chǎng)景中,谷歌 Gmail也會(huì)加入Gemini的大模型能力,不僅可以去總結(jié)郵件的內(nèi)容,甚至可以根據(jù)需求去比較郵件內(nèi)容(比如同樣裝修報(bào)價(jià)郵件,可以自動(dòng)比價(jià)),并且根據(jù)上下文語(yǔ)境智能提供回復(fù)內(nèi)容。

bandicam 2024-05-15 01-57-53-684.jpg

bandicam 2024-05-15 01-59-34-840.jpg

在開(kāi)發(fā)者大會(huì)上,谷歌也是明確安卓15將會(huì)加入谷歌Gemini大模型,提供更多的AI功能,比如已經(jīng)在三星AI手機(jī)上采用的即圈即搜功能,除了可以搜索物體以外,還加入了截圖功能,圈選題目給出解題思路和答案,幫助學(xué)生解題。

bandicam 2024-05-15 01-42-34-688.jpg

另外在查看PDF等文件時(shí),可以總結(jié)PDF的文件內(nèi)容,并且以詢問(wèn)的方式獲得PDF里面你想要了解的內(nèi)容。如果識(shí)別的頁(yè)面是視頻,也可以對(duì)視頻的內(nèi)容、字幕進(jìn)行分析,更快速獲得視頻里面的內(nèi)容。

bandicam 2024-05-15 02-25-31-906.jpg

bandicam 2024-05-15 02-26-10-620.jpg

而且谷歌還為手機(jī)加入了AI詐騙電話檢測(cè)功能,如果在通話過(guò)程中識(shí)別到疑似詐騙的行為,就會(huì)彈出提示窗來(lái)警告用戶。

bandicam 2024-05-15 02-29-42-173.jpg

相比目前國(guó)內(nèi)手機(jī)的生成式AI功能,谷歌所帶來(lái)的即圈即搜的解題、視頻的內(nèi)容AI分析、AI詐騙電話檢測(cè)等功能,進(jìn)一步豐富了手機(jī)AI功能體驗(yàn),大會(huì)上谷歌也宣布明天會(huì)上線Android 15 Beta 2,期待Android 15正式版上線時(shí)所帶來(lái)的更多AI驚喜。

頂: 9778踩: 81777