粉嫩av在线观看|无码视频网站亚洲理论在线|Av在线中文亚洲|99这里都是精品|国产精品成人女人久久|欧美日韩高清免费播放一区二区三区|久久久久久桃九九九国产精品|成人一级黄片国外超级A片|欧美特级毛片国产精品H视频|看特黄A级片亚洲另类区

<code id="w4k6e"></code>

<table id="e0wy6"></table>

<tfoot id="e0wy6"></tfoot>

>

科幻電影照進(jìn)現(xiàn)實(shí)， GPT-4o震撼發(fā)布

>

科幻電影照進(jìn)現(xiàn)實(shí)， GPT-4o震撼發(fā)布

科幻電影照進(jìn)現(xiàn)實(shí)， GPT-4o震撼發(fā)布

揚(yáng)帆出海

2024-05-14

418

導(dǎo)讀：對所有人免費(fèi)、更強(qiáng)大、更易用。

就在本周一，OpenAI公布了其最新的AI大語言模型，稱該模型將使 ChatGPT 更智能、更易用。

新模型名為 GPT-4o，是GPT-4 模型的升級版。更重要的是，GPT-4o不僅可以免費(fèi)使用，能力更是橫跨聽、說、讀、寫，絲滑流暢毫無延遲，就像在打一個(gè)視頻電話。

OpenAI 首席技術(shù)官M(fèi)ira Murati在舞臺上直播演示了此次產(chǎn)品升級。來源：OpenAI。

超低延遲，多維處理

根據(jù)演示，GPT-4o 將提供一個(gè)可以進(jìn)行實(shí)時(shí)口語對話的數(shù)字個(gè)人助理。它能使用文本和 “視覺”進(jìn)行交互，接受文本、音頻和圖像的任意組合作為輸入，并生成文本、音頻和圖像輸出。文本、表格的輸出能力依然十分驚人，而更新后最值得注意的是其對畫面的實(shí)時(shí)處理能力。例如，用戶輸入一段視頻，利用 GPT-4o進(jìn)行實(shí)時(shí)畫面解讀，其輸出速度之快讓人咋舌，且畫面描述十分準(zhǔn)確。

在OpenAI新發(fā)布的一段宣傳片中，一位有視力障礙的男士通過手持AI讓其扮演自己的“眼睛”，ChatGPT會對拍攝到的現(xiàn)實(shí)畫面進(jìn)行實(shí)時(shí)詳細(xì)解說，讓該男士可以通過畫面描述“看”到這個(gè)世界。

用戶可以用ChatGPT對準(zhǔn)身邊的物品要求其用指定語言翻譯，新模型也輕松搞定。

也能夠根據(jù)圖像做出更深層次的判斷。例如，ChatGPT可以通過用戶的手勢判斷石頭剪刀布的輸贏。

超強(qiáng)語音，實(shí)時(shí)交互

OpenAI 的高管還演示了 ChatGPT 的強(qiáng)大口語功能。例如，他展示了如何通過對話讓ChatGPT對數(shù)學(xué)問題進(jìn)行實(shí)時(shí)指導(dǎo)、講睡前故事和獲得編碼建議。

ChatGPT 既能用自然、人聲說話，也能用機(jī)器人的聲音說話，還能唱出部分回答。甚至能夠讓兩臺ChatGPT進(jìn)行對話，一方輸入為客服，一方為客戶，雙方有模有樣地進(jìn)行協(xié)商并最終解決問題。

未來，GPT-4o的語音對話功能將不斷改進(jìn)，變得更加自然、實(shí)時(shí)，并有可能實(shí)現(xiàn)實(shí)時(shí)視頻功能。例如，用戶可以向 ChatGPT 展示一場實(shí)時(shí)體育比賽，讓其進(jìn)行實(shí)時(shí)講解。

OpenAI計(jì)劃在未來幾周內(nèi)推出具有這些新語音模式的alpha 版模型，Plus 用戶將享有提前訪問權(quán)限。

用戶點(diǎn)擊右下角的耳機(jī)圖標(biāo)即可開始語音對話

此外，ChatGPT還可以進(jìn)行同聲傳譯，其質(zhì)量和速度都不錯(cuò)，各大翻譯直呼“直接失業(yè)”。

"這是我們第一次在易用性方面邁出一大步”， Murati 在進(jìn)行現(xiàn)場演示時(shí)說道，“這種交互變得更加自然，也更加容易。”

"新的語音（和視頻）模式是我用過的最好用的功能，"OpenAI 首席執(zhí)行官Sam Altman在發(fā)布后的一篇博文中寫道，"感覺就像電影里演的那樣，在現(xiàn)實(shí)里真實(shí)體驗(yàn)到還是讓我有點(diǎn)吃驚的。AI能夠與人類實(shí)現(xiàn)實(shí)時(shí)交互是一項(xiàng)難以達(dá)到的成就。"

AI也能通人性？

在發(fā)布會上，OpenAI還展示了新模型檢測用戶情緒的功能。例如，在ChatGPT聆聽了一位高管的呼吸聲后，似乎察覺到了他的緊張情緒，鼓勵(lì)他冷靜下來。而在聽到員工夸張的呼吸聲后，ChatGPT甚至用女音損了他一句 “ 你又不是吸塵器！ ”

很明顯，新模型能聽出發(fā)言人呼吸聲的輕重，并且會富有情感的適時(shí)開玩笑。

除了通過聲音識別情緒，新模型也能從用戶面部表情準(zhǔn)確識別其情緒。例如，有用戶輸入了幾張自己不同表情的照片，讓AI識別其情緒，而其輸出的描述幾乎完美。

同時(shí)，從上圖可以看到，ChatGPT在對第二張照片進(jìn)行描述時(shí)自動與第一張照片進(jìn)行了比較。這就是新模型具備的記憶功能，它將可以“記住”過去與用戶的對話并從中學(xué)習(xí)，使得每段對話都不再是孤立的存在。

AI競賽日益激烈

新版本發(fā)布之際，OpenAI 力求在日益激烈的AI競賽中保持領(lǐng)先地位。其主要競爭對手——包括谷歌和 Meta——正不斷更新大型語言模型，優(yōu)化Chatbot，并將AI技術(shù)應(yīng)用到其他各種產(chǎn)品中。

就在OpenAI 發(fā)布會的第二天，谷歌的年度 I/O 開發(fā)者大會將在美國加州開幕。屆時(shí)，谷歌將分享關(guān)于Android 15和AI的最新消息。預(yù)計(jì)谷歌將在會上宣布其 Gemini AI 模型的更新。與新的 GPT-4o 一樣，谷歌的 Gemini 也是多模態(tài)的，這意味著它可以解釋和生成文本、圖像和音頻。此外，下個(gè)月蘋果備受矚目的年全球開發(fā)者大會也接踵而至，屆時(shí)蘋果有望展示其最新的AI戰(zhàn)略，盡管具體內(nèi)容尚未對外公布。

對微軟來說，GPT 新版本的發(fā)布無疑是個(gè)好消息，因?yàn)槲④浺呀?jīng)向 OpenAI 投資了數(shù)十億美元，將其AI技術(shù)嵌入到微軟自己旗下的產(chǎn)品中。

針對所有用戶，OpenAI還推出了新的 MacOS 版 ChatGPT 桌面應(yīng)用程序，旨在使用戶操作更加方便快捷。只需一個(gè)簡單的鍵盤快捷鍵（Option + Space），用戶就可以立即向 ChatGPT 提問，也可以直接在應(yīng)用程序中截圖進(jìn)行對話。

更新后的技術(shù)和功能將在未來幾個(gè)月內(nèi)推廣到 ChatGPT。目前來看，雖然打著“對所有用戶免費(fèi)”的旗號，免費(fèi)用戶所能使用的功能還是有限的，且在使用新模型達(dá)到一定次數(shù)后，ChatGPT將自動恢復(fù)到GPT-3.5 。而Plus 用戶的消息限制將是免費(fèi)用戶的 5 倍，團(tuán)隊(duì)和企業(yè)用戶的限制將更高。

目前已有超過 1 億人在使用 ChatGPT，但OpenAI的目標(biāo)不止于此。此次更新大大優(yōu)化了ChatGPT的使用體驗(yàn)，提升了交互能力，增強(qiáng)了語音對話功能，這將會為OpenAI吸引越來越多的用戶。

最后，最近谷歌和 Meta 正將 AI 集成到更日常的消費(fèi)類產(chǎn)品中（例如 Instagram 和 Google Assistant），OpenAI又推出此款新模型，由此可見，這些大型科技公司的技術(shù)正在向更普及和更易用的方向發(fā)展。

【聲明】內(nèi)容源于網(wǎng)絡(luò)

0

0

揚(yáng)帆出海

互聯(lián)網(wǎng)出海服務(wù)平臺幫助中國企業(yè)揚(yáng)帆出海

內(nèi)容 2004

粉絲 3

揚(yáng)帆出海互聯(lián)網(wǎng)出海服務(wù)平臺幫助中國企業(yè)揚(yáng)帆出海

總閱讀692.7k

粉絲3

內(nèi)容2.0k

<samp id="ceiy6"><em id="ceiy6"></em></samp>

<small id="ceiy6"><rt id="ceiy6"></rt></small>

<bdo id="ceiy6"></bdo>

<code id="ceiy6"></code>