粉嫩av在线观看|无码视频网站亚洲理论在线|Av在线中文亚洲|99这里都是精品|国产精品成人女人久久|欧美日韩高清免费播放一区二区三区|久久久久久桃九九九国产精品|成人一级黄片国外超级A片|欧美特级毛片国产精品H视频|看特黄A级片亚洲另类区

大數(shù)跨境
0
0

資訊丨xAI官宣Grok API開啟公測(cè),唯一模型grok-beta表現(xiàn)能否達(dá)到預(yù)期?

資訊丨xAI官宣Grok API開啟公測(cè),唯一模型grok-beta表現(xiàn)能否達(dá)到預(yù)期? 302.AI
2024-11-08
1326
導(dǎo)讀:11月6日,備受矚目的2024年美國(guó)總統(tǒng)選舉結(jié)果終于揭曉,馬斯克公開支持的美國(guó)共和黨總統(tǒng)候選人特朗普獲得最終勝利。
11月6日,備受矚目的2024年美國(guó)總統(tǒng)選舉結(jié)果終于揭曉,馬斯克公開支持的美國(guó)共和黨總統(tǒng)候選人特朗普獲得最終勝利。
 作為特朗普的“榜一大哥”馬斯克,是人工智能初創(chuàng)公司xAI的始人之一和主要投資者。在11月4日,xAI剛剛官宣Grok API正式開啟公測(cè)。
 根據(jù)xAI公司官方發(fā)布的文檔,可以看到xAI的API目前只有一個(gè)模型——“grok-beta”。
從官方文檔了解到,grok-beta性能與 Grok 2 相當(dāng),但效率、速度和功能有所提高。grok-beta上下文長(zhǎng)度為128000 token,能夠處理更長(zhǎng)的文本輸入,理解更復(fù)雜的上下文關(guān)系。此外,grok-beta還支持函數(shù)調(diào)用和自定義系統(tǒng)提示詞。
官方關(guān)于grok-beta的信息描述并不多,其功能或技術(shù)特點(diǎn)尚未完全公開。但可以確定的是,grok-beta就是xAI下一代模型的初版本。
>  在302.AI上使用
 目前,302.AI已經(jīng)支持了grok-beta模型,用戶可以快速獲取上手實(shí)測(cè)。那接下來(lái),我們一起通過(guò)302.AI實(shí)測(cè)grok-beta模型看下表現(xiàn)如何。
302.AI提供按需付費(fèi)的服務(wù)方式,為用戶提供了更高的靈活性,能夠精準(zhǔn)地控制開支。
實(shí)測(cè)使用到的工具有:模型競(jìng)技場(chǎng),聊天機(jī)器人,具體獲取方式如下:
模型競(jìng)技場(chǎng):
1、進(jìn)入302.AI,點(diǎn)擊使用工具——工具超市——工作效率,找到模型競(jìng)技場(chǎng)后創(chuàng)建工具:
2、進(jìn)入模型競(jìng)技場(chǎng)后,左側(cè)勾選需要的模型,右側(cè)輸入提示詞提問(wèn)即可,通過(guò)模型競(jìng)技場(chǎng)能夠直觀對(duì)比各個(gè)模型的表現(xiàn):
聊天機(jī)器人:
1、點(diǎn)擊使用機(jī)器人——找到聊天機(jī)器人——模型選擇grok-beta,選擇完成后點(diǎn)擊【創(chuàng)建聊天機(jī)器人】
2、進(jìn)入聊天機(jī)器人后選擇點(diǎn)擊設(shè)置,可以打開實(shí)時(shí)預(yù)覽功能:
>  模型實(shí)測(cè)對(duì)比
1、推理能力
對(duì)比模型:gpt-4o、claude-3.5-sonnet-20241022、grok-beta
使用工具:302.AI的模型競(jìng)技場(chǎng)
提示詞如下:
先來(lái)看下gpt-4o回答,雖然答案長(zhǎng),但是最終的答案是錯(cuò)誤的:
再來(lái)看下claude-3.5-sonnet-20241022的回答,答案正確:
最后來(lái)看下grok-beta的回答,也是錯(cuò)誤的:
2、理解能力
對(duì)比模型:gpt-4o、claude-3.5-sonnet-20241022、grok-beta
使用工具:302.AI的模型競(jìng)技場(chǎng)
提示詞:我目前有兩根香蕉,我昨天吃掉一根,現(xiàn)在還有幾根?
這個(gè)看似簡(jiǎn)單的數(shù)學(xué)問(wèn)題實(shí)際上可以測(cè)試出模型的文本理解能力,但是根據(jù)三個(gè)模型的回答來(lái)看,只有GPT-4o回答正確,而Claude-3.5-sonnet-20241022和grok-beta均落入了語(yǔ)境陷阱里:
3、代碼能力
對(duì)比模型:grok-beta、claude-3.5-sonnet-20241022
使用工具:302.AI的聊天機(jī)器人——Artifacts功能
提示詞:使用React和SVG圖形創(chuàng)建一個(gè)簡(jiǎn)單的2D生存游戲,玩家需要在10x10網(wǎng)格板上生存盡可能長(zhǎng)時(shí)間,避開AI對(duì)手,收集物品以增加分?jǐn)?shù)。
可以看到結(jié)果grok-beta基本能把整個(gè)游戲的框架制作出來(lái),可以理解藍(lán)色為AI,走動(dòng)的紅色為玩家,但是缺乏可以增加分?jǐn)?shù)的物品元素:
對(duì)比grok-beta的效果,可以看到claude-3.5-sonnet-20241022生成的游戲更加完整,玩家、AI、可以增加分?jǐn)?shù)的物品三個(gè)元素都有:
>  總結(jié)
通過(guò)實(shí)測(cè)發(fā)現(xiàn),grok-beta在推理能力方面能力不如Claude 3.5-sonnet和其他同類產(chǎn)品般理想,而在文本理解能力和代碼生成能力上,盡管grok-beta展現(xiàn)出了不錯(cuò)的理解層次,但在應(yīng)對(duì)復(fù)雜場(chǎng)景時(shí)仍有一定的局限性。不過(guò),grok-beta只是初始版本,目前發(fā)現(xiàn)出不足并不是壞事,這能夠及時(shí)發(fā)現(xiàn)問(wèn)題并通過(guò)后續(xù)的改進(jìn)提升相關(guān)性能。
目前grok-beta模型為純文本版本,而xAI透露預(yù)計(jì)在下周將發(fā)布一個(gè)可以攝取圖像的多模態(tài)版本,或許我們期待下一版本的grok-beta看看。當(dāng)然,302.AI也會(huì)持續(xù)給用戶更新相關(guān)資訊,為大家?guī)?lái)更多模型性能和功能的實(shí)測(cè)!
【聲明】?jī)?nèi)容源于網(wǎng)絡(luò)
302.AI
分享更新更全面的AI資訊。
內(nèi)容 173
粉絲 1
302.AI 分享更新更全面的AI資訊。
總閱讀78.1k
粉絲1
內(nèi)容173