當(dāng)前位置：當(dāng)前位置：首頁(yè) > 熱點(diǎn) > 谷歌DeepMind推出4K视频模型，正面迎击Sora正文

谷歌DeepMind推出4K视频模型，正面迎击Sora

作者:焦點(diǎn)　來(lái)源:時(shí)尚　瀏覽:　【大 中 小】　發(fā)布時(shí)間:2025-08-02 14:34:58 評(píng)論數(shù):

近日，谷歌Alphabet部門(mén)Google DeepMind突然公布Veo 2視頻模型，距離Veo一代發(fā)布僅七個(gè)月后，現(xiàn)版本已經(jīng)可以生成最高4K分辨率，長(zhǎng)達(dá)兩分鐘以上的視頻。

要知道，OpenAI在一周前剛剛正式推出了Sora視頻模型，同樣經(jīng)過(guò)近一年的打磨，Sora卻依舊受限于1080p的最大分辨率。

圖片15.jpg

谷歌在關(guān)于Veo 2的介紹中提到：“低分辨率視頻非常適合移動(dòng)設(shè)備，但創(chuàng)作者希望看到他們的作品在大屏幕上大放異彩。”顯然，這段發(fā)言直指Sora。

谷歌發(fā)言人表示，Veo 2 的4K剪輯默認(rèn)限制為8秒，但可以延長(zhǎng)至2分鐘或更長(zhǎng)時(shí)間。與之相比，Sora的1080p視頻上限僅為20秒。

圖片16.jpg

拋開(kāi)以上這些參數(shù)，AI視頻模型有個(gè)問(wèn)題繞不過(guò)，就是那些“低級(jí)”BUG。Sora一經(jīng)推出，很多自媒體都做了測(cè)試，壞消息是，各種奇怪的物理和人體表現(xiàn)依舊存在。比如，生成人物可能有許多條腿，或遇到稍微復(fù)雜的運(yùn)動(dòng)時(shí)，扭曲的身體讓人看得背后發(fā)毛，似乎這是AI現(xiàn)階段難以逾越的大山。

但谷歌部門(mén)聲稱(chēng)，在糾正“幻覺(jué)”細(xì)節(jié)（如額外的手指）和展示“現(xiàn)實(shí)世界的物理學(xué)以及人類(lèi)運(yùn)動(dòng)和表情”方面取得了重大進(jìn)展。

圖片17.jpg

一些具備相關(guān)學(xué)術(shù)背景的專(zhuān)業(yè)人士對(duì)AI所犯的物理錯(cuò)誤發(fā)表了看法，他們認(rèn)為，只能通過(guò)所謂的世界模型來(lái)解決，這些模型具有理解和生成3D環(huán)境的“空間智能”。湊巧的是，谷歌本月早些時(shí)候推出了自己的Genie 2世界模型，難道這就是《黑客帝國(guó)》的訓(xùn)練場(chǎng)？

同時(shí)，Veo 2也能更好理解“電影語(yǔ)言”，比如“18mm鏡頭”、“淺景深”等專(zhuān)業(yè)用語(yǔ)。但是，也有很多人對(duì)日趨“合理”的視頻模型產(chǎn)生擔(dān)憂(yōu)，圖像和視頻生成器的輸出越合理，它們被用于邪惡目的的風(fēng)險(xiǎn)就越大，防偽技術(shù)的迭代勢(shì)在必行。

圖片18.jpg

對(duì)于Veo 2來(lái)說(shuō)，DeepMind將不可見(jiàn)的SynthID水印置于Veo 2生成的視頻中。這種“水印”的優(yōu)點(diǎn)是，隱匿的SynthID可能會(huì)讓視頻傳播者大意，技術(shù)人員更容易發(fā)現(xiàn)造假視頻的證據(jù)。缺點(diǎn)也很明顯，普通人很難區(qū)分一段視頻是否由AI生成。

相比之下，OpenAI的Sora會(huì)在其生成視頻的右下角嵌入一個(gè)可見(jiàn)的水印動(dòng)畫(huà)，對(duì)于普通人更容易分辨。

圖片19.jpg

不過(guò)大家對(duì)于AI視頻模型的擔(dān)憂(yōu)一定不會(huì)停止，現(xiàn)階段，各家視頻大模型還是以秒或分鐘來(lái)生成，而且相對(duì)比較容易分辨。但按照當(dāng)今的發(fā)展速度，未來(lái)AI生成的視頻一定會(huì)以假亂真，到時(shí)候我們將如何面對(duì)互聯(lián)網(wǎng)世界？你所喜愛(ài)的視頻博主，也許根本不存在。

歷史的回響｜信仰之光照未來(lái)
英國(guó)加強(qiáng)打擊人口走私團(tuán)伙多名嫌犯落網(wǎng)