來(lái)認(rèn)識(shí)一下 Sora — OpenAI 的新文本到視頻生成器。這家舊金山公司周四推出的該工具使用生成人工智能,根據(jù)書(shū)面命令立即創(chuàng)建短視頻。
Sora 并不是第一個(gè)展示這種技術(shù)的人。但行業(yè)分析師指出,該工具迄今為止展示的視頻質(zhì)量很高,并指出它的推出標(biāo)志著 OpenAI 和文本到視頻生成的未來(lái)的整體重大飛躍。
盡管如此,與當(dāng)今快速發(fā)展的人工智能領(lǐng)域的所有事物一樣,此類(lèi)技術(shù)也引發(fā)了人們對(duì)潛在道德和社會(huì)影響的擔(dān)憂(yōu)。這是您需要了解的內(nèi)容。
Sora 是一款文本到視頻生成器 - 使用生成式 AI 根據(jù)書(shū)面提示創(chuàng)建長(zhǎng)達(dá) 60 秒的視頻。該模型還可以從現(xiàn)有的靜態(tài)圖像生成視頻。
生成式人工智能是人工智能的一個(gè)分支,可以創(chuàng)造新的東西。示例包括聊天機(jī)器人(如 OpenAI 的 ChatGPT)以及圖像生成器(如 DALL-E 和 Midjourney)。讓人工智能系統(tǒng)生成視頻是更新的、更具挑戰(zhàn)性的,但依賴(lài)于一些相同的技術(shù)。
Sora 尚未可供公眾使用(OpenAI 表示,在正式發(fā)布該工具之前,它正在與政策制定者和藝術(shù)家進(jìn)行接觸),而且還有很多我們不知道的事情。但自周四宣布以來(lái),該公司已經(jīng)分享了一些 Sora 生成的視頻示例,以展示其功能。
OpenAI 首席執(zhí)行官 Sam Altman 還利用 X(以前稱(chēng)為Twitter 的平臺(tái))要求社交媒體用戶(hù)及時(shí)發(fā)送想法。后來(lái),他分享了逼真詳細(xì)的視頻,這些視頻響應(yīng)了“兩只金毛獵犬在山頂上播客”和“在海洋上與不同動(dòng)物進(jìn)行自行車(chē)比賽,運(yùn)動(dòng)員在無(wú)人機(jī)攝像機(jī)視圖下騎自行車(chē)”等提示。
雖然 Sora 生成的視頻可以描繪復(fù)雜、極其詳細(xì)的場(chǎng)景,但 OpenAI 指出仍然存在一些弱點(diǎn),包括一些空間和因果元素。例如,OpenAI 在其網(wǎng)站上補(bǔ)充道,“一個(gè)人可能會(huì)咬一口餅干,但之后,餅干可能沒(méi)有咬痕。”
OpenAI 的 Sora 并不是同類(lèi)產(chǎn)品中的第一個(gè)。谷歌、Meta 和初創(chuàng)公司 Runway ML 等公司都展示了類(lèi)似的技術(shù)。
盡管如此,行業(yè)分析師還是強(qiáng)調(diào)了迄今為止分享的 Sora 視頻的明顯質(zhì)量和令人印象深刻的長(zhǎng)度。麥格理美國(guó)人工智能和軟件研究主管 Fred Havemeyer 表示,Sora 的推出標(biāo)志著該行業(yè)向前邁出了一大步。
“你不僅可以制作更長(zhǎng)的視頻,據(jù)我所知最長(zhǎng)可達(dá) 60 秒,而且所創(chuàng)建的視頻看起來(lái)更正常,而且似乎實(shí)際上更尊重物理和現(xiàn)實(shí)世界,”哈夫梅爾說(shuō)。“你不會(huì)在視頻源上看到那么多看起來(lái)……不自然的‘恐怖谷’視頻或片段。”
盡管去年人工智能生成的視頻取得了“巨大進(jìn)步”(包括去年 11 月推出的穩(wěn)定視頻擴(kuò)散),但 Forrester 高級(jí)分析師 Rowan Curran 表示,此類(lèi)視頻需要更多的“拼接”以實(shí)現(xiàn)角色和場(chǎng)景的一致性。
然而,Sora 視頻的一致性和長(zhǎng)度代表著“創(chuàng)意人員有新的機(jī)會(huì)將人工智能生成的視頻元素融入到更傳統(tǒng)的內(nèi)容中,現(xiàn)在甚至可以根據(jù)一個(gè)或幾個(gè)提示生成完整的敘事視頻,”Curran 告訴《The》雜志。美聯(lián)社周五通過(guò)電子郵件。
盡管自周四發(fā)布以來(lái),Sora 的能力令觀察人士感到震驚,但對(duì)人工智能生成視頻使用的道德和社會(huì)影響的擔(dān)憂(yōu)仍然存在。
例如,哈夫梅爾指出了 2024 年可能充滿(mǎn)挑戰(zhàn)的選舉周期中存在的巨大風(fēng)險(xiǎn)。他補(bǔ)充說(shuō),通過(guò)一種“潛在神奇”的方式來(lái)生成看起來(lái)和聽(tīng)起來(lái)都逼真的視頻會(huì)帶來(lái)政治內(nèi)外的許多問(wèn)題,并指出欺詐、宣傳和錯(cuò)誤信息的擔(dān)憂(yōu)。
Havemeyer 表示:“生成式人工智能的負(fù)面外部性將成為 2024 年?duì)幷摰囊粋€(gè)關(guān)鍵話題。” “這是今年每個(gè)企業(yè)和每個(gè)人都需要面對(duì)的重大問(wèn)題。”
隨著世界各國(guó)政府努力迎頭趕上,科技公司仍在管理人工智能及其風(fēng)險(xiǎn)方面發(fā)號(hào)施令。去年12月,歐盟就世界上第一個(gè)全面的人工智能規(guī)則達(dá)成協(xié)議,但該法案要在最終批準(zhǔn)兩年后才會(huì)生效。
周四,OpenAI 表示,在廣泛使用 Sora 之前,它正在采取重要的安全措施。
該公司寫(xiě)道:“我們正在與紅隊(duì)成員合作,他們是錯(cuò)誤信息、仇恨內(nèi)容和偏見(jiàn)等領(lǐng)域的領(lǐng)域?qū)<?,他們將以?duì)抗性方式測(cè)試該模型。” “我們還在構(gòu)建工具來(lái)幫助檢測(cè)誤導(dǎo)性?xún)?nèi)容,例如檢測(cè)分類(lèi)器,可以判斷 Sora 何時(shí)生成視頻。”
OpenAI 全球事務(wù)副總裁 Anna Makanju 周五在慕尼黑安全會(huì)議上發(fā)表講話時(shí)重申了這一點(diǎn),OpenAI 和其他 19 家科技公司承諾自愿合作,打擊人工智能生成的選舉深度造假。她指出,公司“以相當(dāng)謹(jǐn)慎的方式”發(fā)布 Sora。
與此同時(shí),OpenAI 透露了有關(guān) Sora 如何構(gòu)建的有限信息。OpenAI 的技術(shù)報(bào)告沒(méi)有透露使用哪些圖像和視頻源來(lái)訓(xùn)練 Sora,該公司周五也沒(méi)有立即回應(yīng)進(jìn)一步置評(píng)的請(qǐng)求。
Sora 的發(fā)布也是在一些作者和《紐約時(shí)報(bào)》對(duì) OpenAI 及其商業(yè)合作伙伴微軟提起訴訟的背景下發(fā)布的,原因是 OpenAI 使用受版權(quán)保護(hù)的寫(xiě)作作品來(lái)訓(xùn)練 ChatGPT。OpenAI 向美聯(lián)社支付了一筆未公開(kāi)的費(fèi)用,以獲取其文本新聞檔案的許可。
原文鏈接;https://abcnews.go.com/US/wireStory/sora-chatgpt-maker-openais-new-text-video-generator-107300294

