粉嫩av在线观看|无码视频网站亚洲理论在线|Av在线中文亚洲|99这里都是精品|国产精品成人女人久久|欧美日韩高清免费播放一区二区三区|久久久久久桃九九九国产精品|成人一级黄片国外超级A片|欧美特级毛片国产精品H视频|看特黄A级片亚洲另类区

大數(shù)跨境
0
0

科幻電影照進現(xiàn)實, GPT-4o震撼發(fā)布

科幻電影照進現(xiàn)實, GPT-4o震撼發(fā)布 揚帆出海
2024-05-14
385
導讀:對所有人免費、更強大、更易用。

就在本周一,OpenAI公布了其最新的AI大語言模型,稱該模型將使 ChatGPT 更智能、更易用。
 新模型名為 GPT-4o,是GPT-4 模型的升級版。更重要的是,GPT-4o不僅可以免費使用,能力更是橫跨聽、說、讀、寫,絲滑流暢毫無延遲,就像在打一個視頻電話。  

 OpenAI 首席技術(shù)官Mira Murati在舞臺上直播演示了此次產(chǎn)品升級。來源:OpenAI。

超低延遲,多維處理

 根據(jù)演示,GPT-4o 將提供一個可以進行實時口語對話的數(shù)字個人助理。它能使用文本和 “視覺”進行交互,接受文本、音頻和圖像的任意組合作為輸入,并生成文本、音頻和圖像輸出。文本、表格的輸出能力依然十分驚人,而更新后最值得注意的是其對畫面的實時處理能力。例如,用戶輸入一段視頻,利用 GPT-4o進行實時畫面解讀,其輸出速度之快讓人咋舌,且畫面描述十分準確。
 

 

在OpenAI新發(fā)布的一段宣傳片中,一位有視力障礙的男士通過手持AI讓其扮演自己的“眼睛”,ChatGPT會對拍攝到的現(xiàn)實畫面進行實時詳細解說,讓該男士可以通過畫面描述“看”到這個世界。  

 用戶可以用ChatGPT對準身邊的物品要求其用指定語言翻譯,新模型也輕松搞定。

 也能夠根據(jù)圖像做出更深層次的判斷。例如,ChatGPT可以通過用戶的手勢判斷石頭剪刀布的輸贏。

超強語音,實時交互

 OpenAI 的高管還演示了 ChatGPT 的強大口語功能。例如,他展示了如何通過對話讓ChatGPT對數(shù)學問題進行實時指導、講睡前故事和獲得編碼建議。  

 ChatGPT 既能用自然、人聲說話,也能用機器人的聲音說話,還能唱出部分回答。甚至能夠讓兩臺ChatGPT進行對話,一方輸入為客服,一方為客戶,雙方有模有樣地進行協(xié)商并最終解決問題。

 未來,GPT-4o的語音對話功能將不斷改進,變得更加自然、實時,并有可能實現(xiàn)實時視頻功能。例如,用戶可以向 ChatGPT 展示一場實時體育比賽,讓其進行實時講解。
 OpenAI計劃在未來幾周內(nèi)推出具有這些新語音模式 的alpha 版模型,Plus 用戶將享有提前訪問權(quán)限。

用戶點擊右下角的耳機圖標即可開始語音對話
此外,ChatGPT還可以進行同聲傳譯,其質(zhì)量和速度都不錯,各大翻譯直呼“直接失業(yè)”。  

 "這是我們第一次在易用性方面邁出一大步”, Murati 在進行現(xiàn)場演示時說道,“這種交互變得更加自然,也更加容易。”  

 "新的語音(和視頻)模式是我用過的最好用的功能,"OpenAI 首席執(zhí)行官Sam Altman在發(fā)布后的一篇博文中寫道,"感覺就像電影里演的那樣,在現(xiàn)實里真實體驗到還是讓我有點吃驚的。AI能夠與人類實現(xiàn)實時交互是一項難以達到的成就。"

AI也能通人性?

 在發(fā)布會上,OpenAI還展示了新模型檢測用戶情緒的功能。例如,在ChatGPT聆聽了一位高管的呼吸聲后,似乎察覺到了他的緊張情緒,鼓勵他冷靜下來。而在聽到員工夸張的呼吸聲后,ChatGPT甚至用女音損了他一句 “ 你又不是吸塵器! ”
 

 很明顯,新模型能聽出發(fā)言人呼吸聲的輕重,并且會富有情感的適時開玩笑。
 除了通過聲音識別情緒,新模型也能從用戶面部表情準確識別其情緒。例如,有用戶輸入了幾張自己不同表情的照片,讓AI識別其情緒,而其輸出的描述幾乎完美。

 同時,從上圖可以看到,ChatGPT在對第二張照片進行描述時自動與第一張照片進行了比較。這就是新模型具備的記憶功能,它將可以“記住”過去與用戶的對話并從中學習,使得每段對話都不再是孤立的存在。

AI競賽日益激烈

 新版本發(fā)布之際,OpenAI 力求在日益激烈的AI競賽中保持領(lǐng)先地位。其主要競爭對手——包括谷歌和 Meta——正不斷更新大型語言模型,優(yōu)化Chatbot,并將AI技術(shù)應用到其他各種產(chǎn)品中。
 就在OpenAI 發(fā)布會的第二天,谷歌的年度 I/O 開發(fā)者大會將在美國加州開幕。屆時,谷歌將分享關(guān)于Android 15和AI的最新消息。預計谷歌將在會上宣布其 Gemini AI 模型的更新。與新的 GPT-4o 一樣,谷歌的 Gemini 也是多模態(tài)的,這意味著它可以解釋和生成文本、圖像和音頻。此外,下個月蘋果備受矚目的年全球開發(fā)者大會也接踵而至,屆時蘋果有望展示其最新的AI戰(zhàn)略,盡管具體內(nèi)容尚未對外公布。  
對微軟來說,GPT 新版本的發(fā)布無疑是個好消息,因為微軟已經(jīng)向 OpenAI 投資了數(shù)十億美元,將其AI技術(shù)嵌入到微軟自己旗下的產(chǎn)品中。
 針對所有用戶,OpenAI還推出了新的 MacOS 版 ChatGPT 桌面應用程序,旨在使用戶操作更加方便快捷。只需一個簡單的鍵盤快捷鍵(Option + Space),用戶就可以立即向 ChatGPT 提問,也可以直接在應用程序中截圖進行對話。
 更新后的技術(shù)和功能將在未來幾個月內(nèi)推廣到 ChatGPT。目前來看,雖然打著“對所有用戶免費”的旗號,免費用戶所能使用的功能還是有限的,且在使用新模型達到一定次數(shù)后,ChatGPT將自動恢復到GPT-3.5 。而Plus 用戶的消息限制將是免費用戶的 5 倍,團隊和企業(yè)用戶的限制將更高。
 目前已有超過 1 億人在使用 ChatGPT,但OpenAI的目標不止于此。此次更新大大優(yōu)化了ChatGPT的使用體驗,提升了交互能力,增強了語音對話功能,這將會為OpenAI吸引越來越多的用戶。
 最后,最近谷歌和 Meta 正將 AI 集成到更日常的消費類產(chǎn)品中(例如 Instagram 和 Google Assistant),OpenAI又推出此款新模型,由此可見,這些大型科技公司的技術(shù)正在向更普及和更易用的方向發(fā)展。
【聲明】內(nèi)容源于網(wǎng)絡
揚帆出海
互聯(lián)網(wǎng)出海服務平臺 幫助中國企業(yè)揚帆出海
內(nèi)容 2003
粉絲 3
揚帆出海 互聯(lián)網(wǎng)出海服務平臺 幫助中國企業(yè)揚帆出海
總閱讀672.1k
粉絲3
內(nèi)容2.0k