粉嫩av在线观看|无码视频网站亚洲理论在线|Av在线中文亚洲|99这里都是精品|国产精品成人女人久久|欧美日韩高清免费播放一区二区三区|久久久久久桃九九九国产精品|成人一级黄片国外超级A片|欧美特级毛片国产精品H视频|看特黄A级片亚洲另类区

大數(shù)跨境

科幻電影照進(jìn)現(xiàn)實(shí), GPT-4o震撼發(fā)布

科幻電影照進(jìn)現(xiàn)實(shí), GPT-4o震撼發(fā)布 揚(yáng)帆出海
2024-05-14
418
導(dǎo)讀:對所有人免費(fèi)、更強(qiáng)大、更易用。

就在本周一,OpenAI公布了其最新的AI大語言模型,稱該模型將使 ChatGPT 更智能、更易用。
 新模型名為 GPT-4o,是GPT-4 模型的升級版。更重要的是,GPT-4o不僅可以免費(fèi)使用,能力更是橫跨聽、說、讀、寫,絲滑流暢毫無延遲,就像在打一個(gè)視頻電話。  

 OpenAI 首席技術(shù)官M(fèi)ira Murati在舞臺上直播演示了此次產(chǎn)品升級。來源:OpenAI。

超低延遲,多維處理

 根據(jù)演示,GPT-4o 將提供一個(gè)可以進(jìn)行實(shí)時(shí)口語對話的數(shù)字個(gè)人助理。它能使用文本和 “視覺”進(jìn)行交互,接受文本、音頻和圖像的任意組合作為輸入,并生成文本、音頻和圖像輸出。文本、表格的輸出能力依然十分驚人,而更新后最值得注意的是其對畫面的實(shí)時(shí)處理能力。例如,用戶輸入一段視頻,利用 GPT-4o進(jìn)行實(shí)時(shí)畫面解讀,其輸出速度之快讓人咋舌,且畫面描述十分準(zhǔn)確。
 

 

在OpenAI新發(fā)布的一段宣傳片中,一位有視力障礙的男士通過手持AI讓其扮演自己的“眼睛”,ChatGPT會對拍攝到的現(xiàn)實(shí)畫面進(jìn)行實(shí)時(shí)詳細(xì)解說,讓該男士可以通過畫面描述“看”到這個(gè)世界。  

 用戶可以用ChatGPT對準(zhǔn)身邊的物品要求其用指定語言翻譯,新模型也輕松搞定。

 也能夠根據(jù)圖像做出更深層次的判斷。例如,ChatGPT可以通過用戶的手勢判斷石頭剪刀布的輸贏。

超強(qiáng)語音,實(shí)時(shí)交互

 OpenAI 的高管還演示了 ChatGPT 的強(qiáng)大口語功能。例如,他展示了如何通過對話讓ChatGPT對數(shù)學(xué)問題進(jìn)行實(shí)時(shí)指導(dǎo)、講睡前故事和獲得編碼建議。  

 ChatGPT 既能用自然、人聲說話,也能用機(jī)器人的聲音說話,還能唱出部分回答。甚至能夠讓兩臺ChatGPT進(jìn)行對話,一方輸入為客服,一方為客戶,雙方有模有樣地進(jìn)行協(xié)商并最終解決問題。

 未來,GPT-4o的語音對話功能將不斷改進(jìn),變得更加自然、實(shí)時(shí),并有可能實(shí)現(xiàn)實(shí)時(shí)視頻功能。例如,用戶可以向 ChatGPT 展示一場實(shí)時(shí)體育比賽,讓其進(jìn)行實(shí)時(shí)講解。
 OpenAI計(jì)劃在未來幾周內(nèi)推出具有這些新語音模式 的alpha 版模型,Plus 用戶將享有提前訪問權(quán)限。

用戶點(diǎn)擊右下角的耳機(jī)圖標(biāo)即可開始語音對話
此外,ChatGPT還可以進(jìn)行同聲傳譯,其質(zhì)量和速度都不錯(cuò),各大翻譯直呼“直接失業(yè)”。  

 "這是我們第一次在易用性方面邁出一大步”, Murati 在進(jìn)行現(xiàn)場演示時(shí)說道,“這種交互變得更加自然,也更加容易。”  

 "新的語音(和視頻)模式是我用過的最好用的功能,"OpenAI 首席執(zhí)行官Sam Altman在發(fā)布后的一篇博文中寫道,"感覺就像電影里演的那樣,在現(xiàn)實(shí)里真實(shí)體驗(yàn)到還是讓我有點(diǎn)吃驚的。AI能夠與人類實(shí)現(xiàn)實(shí)時(shí)交互是一項(xiàng)難以達(dá)到的成就。"

AI也能通人性?

 在發(fā)布會上,OpenAI還展示了新模型檢測用戶情緒的功能。例如,在ChatGPT聆聽了一位高管的呼吸聲后,似乎察覺到了他的緊張情緒,鼓勵(lì)他冷靜下來。而在聽到員工夸張的呼吸聲后,ChatGPT甚至用女音損了他一句 “ 你又不是吸塵器! ”
 

 很明顯,新模型能聽出發(fā)言人呼吸聲的輕重,并且會富有情感的適時(shí)開玩笑。
 除了通過聲音識別情緒,新模型也能從用戶面部表情準(zhǔn)確識別其情緒。例如,有用戶輸入了幾張自己不同表情的照片,讓AI識別其情緒,而其輸出的描述幾乎完美。

 同時(shí),從上圖可以看到,ChatGPT在對第二張照片進(jìn)行描述時(shí)自動與第一張照片進(jìn)行了比較。這就是新模型具備的記憶功能,它將可以“記住”過去與用戶的對話并從中學(xué)習(xí),使得每段對話都不再是孤立的存在。

AI競賽日益激烈

 新版本發(fā)布之際,OpenAI 力求在日益激烈的AI競賽中保持領(lǐng)先地位。其主要競爭對手——包括谷歌和 Meta——正不斷更新大型語言模型,優(yōu)化Chatbot,并將AI技術(shù)應(yīng)用到其他各種產(chǎn)品中。
 就在OpenAI 發(fā)布會的第二天,谷歌的年度 I/O 開發(fā)者大會將在美國加州開幕。屆時(shí),谷歌將分享關(guān)于Android 15和AI的最新消息。預(yù)計(jì)谷歌將在會上宣布其 Gemini AI 模型的更新。與新的 GPT-4o 一樣,谷歌的 Gemini 也是多模態(tài)的,這意味著它可以解釋和生成文本、圖像和音頻。此外,下個(gè)月蘋果備受矚目的年全球開發(fā)者大會也接踵而至,屆時(shí)蘋果有望展示其最新的AI戰(zhàn)略,盡管具體內(nèi)容尚未對外公布。  
對微軟來說,GPT 新版本的發(fā)布無疑是個(gè)好消息,因?yàn)槲④浺呀?jīng)向 OpenAI 投資了數(shù)十億美元,將其AI技術(shù)嵌入到微軟自己旗下的產(chǎn)品中。
 針對所有用戶,OpenAI還推出了新的 MacOS 版 ChatGPT 桌面應(yīng)用程序,旨在使用戶操作更加方便快捷。只需一個(gè)簡單的鍵盤快捷鍵(Option + Space),用戶就可以立即向 ChatGPT 提問,也可以直接在應(yīng)用程序中截圖進(jìn)行對話。
 更新后的技術(shù)和功能將在未來幾個(gè)月內(nèi)推廣到 ChatGPT。目前來看,雖然打著“對所有用戶免費(fèi)”的旗號,免費(fèi)用戶所能使用的功能還是有限的,且在使用新模型達(dá)到一定次數(shù)后,ChatGPT將自動恢復(fù)到GPT-3.5 。而Plus 用戶的消息限制將是免費(fèi)用戶的 5 倍,團(tuán)隊(duì)和企業(yè)用戶的限制將更高。
 目前已有超過 1 億人在使用 ChatGPT,但OpenAI的目標(biāo)不止于此。此次更新大大優(yōu)化了ChatGPT的使用體驗(yàn),提升了交互能力,增強(qiáng)了語音對話功能,這將會為OpenAI吸引越來越多的用戶。
 最后,最近谷歌和 Meta 正將 AI 集成到更日常的消費(fèi)類產(chǎn)品中(例如 Instagram 和 Google Assistant),OpenAI又推出此款新模型,由此可見,這些大型科技公司的技術(shù)正在向更普及和更易用的方向發(fā)展。
【聲明】內(nèi)容源于網(wǎng)絡(luò)
揚(yáng)帆出海
互聯(lián)網(wǎng)出海服務(wù)平臺 幫助中國企業(yè)揚(yáng)帆出海
內(nèi)容 2004
粉絲 3
揚(yáng)帆出海 互聯(lián)網(wǎng)出海服務(wù)平臺 幫助中國企業(yè)揚(yáng)帆出海
總閱讀692.7k
粉絲3
內(nèi)容2.0k