粉嫩av在线观看|无码视频网站亚洲理论在线|Av在线中文亚洲|99这里都是精品|国产精品成人女人久久|欧美日韩高清免费播放一区二区三区|久久久久久桃九九九国产精品|成人一级黄片国外超级A片|欧美特级毛片国产精品H视频|看特黄A级片亚洲另类区

<code id="w4k6e"></code>

>

當(dāng)提示詞使用"過去時(shí)"，就能突破各AI模型的安全防線？

>

當(dāng)提示詞使用"過去時(shí)"，就能突破各AI模型的安全防線？

當(dāng)提示詞使用"過去時(shí)"，就能突破各AI模型的安全防線？

302.AI

2024-08-01

559

導(dǎo)讀：近日，洛桑聯(lián)邦理工學(xué)院的研究人員發(fā)現(xiàn)，當(dāng)使用AI模型的時(shí)候，只要在提示詞中把時(shí)間設(shè)定成過去，就能突破大模型的安

近日，洛桑聯(lián)邦理工學(xué)院的研究人員發(fā)現(xiàn)，當(dāng)使用AI模型的時(shí)候，只要在提示詞中把時(shí)間設(shè)定成過去，就能突破大模型的安全防線。原本只有1%的攻擊成功率飆升至88%，幾乎達(dá)到了“有求必應(yīng)”的境界。這項(xiàng)發(fā)現(xiàn)不僅在英文環(huán)境下有效，在中文語境中同樣適用，讓網(wǎng)友們驚嘆于破解大模型漏洞的簡(jiǎn)便性。

實(shí)驗(yàn)中，研究人員從JBB-Behaviors數(shù)據(jù)集中挑選了100個(gè)有害行為，通過將請(qǐng)求的時(shí)間改寫為過去時(shí)，測(cè)試了包括GPT-4o在內(nèi)的多個(gè)模型。結(jié)果顯示，GPT-4o的越獄成功率提升最為顯著，其他模型的攻擊成功率也有顯著提高。

另外在所有模型和評(píng)判的 20 次嘗試結(jié)果。我們可以看到，即使只進(jìn)行一次嘗試，攻擊成功率已經(jīng)相當(dāng)可觀，例如 GPT-4o 的成功率為 57%，這與直接使用現(xiàn)在時(shí)態(tài)請(qǐng)求僅有 1% 的攻擊成功率形成鮮明對(duì)比。此外，攻擊成功率通常在 10 次嘗試后開始趨于飽和。

另外，針對(duì)10類不同的危害行為，研究人員也發(fā)現(xiàn)了其間存在攻擊成功率的差別。

除了過去時(shí)，研究人員還進(jìn)一步探索了將時(shí)間設(shè)定為將來時(shí)的效果，發(fā)現(xiàn)雖然有一定的效果，但遠(yuǎn)不如過去時(shí)明顯，比如Llama-3模型，換成將來時(shí)后，比過去時(shí)少了一半的增長(zhǎng)。

真的這么神奇嗎？接下來小編用302.AI的模型競(jìng)技場(chǎng)帶大家一起實(shí)踐一下，302.AI的模型競(jìng)技場(chǎng)是一個(gè)匯聚了國內(nèi)外眾多最新AI模型的創(chuàng)新工具，它不僅提供了一個(gè)直觀的對(duì)比環(huán)境，使用戶能夠直接觀察和評(píng)估不同模型的性能，而且以其方便快捷的操作體驗(yàn)，極大地滿足了用戶對(duì)多模型測(cè)試的需求。

首先，先勾選各大模型的最新版本，小編勾選的模型有：Llama-3.1 405B、Llama-3.1 8B、GPT-4o、GPT-4o mini、Claude-3.5-Sonnet、以及國內(nèi)的模型Step-2-16k、Doubao-pro-32k共七種模型；

先正常提問，看下各大模型的安全防線沒問題，以下是回答：

那接下來就將提問改成過去時(shí)只進(jìn)行一次提問，僅僅只有GPT-4o、Step-2-16k回答了制作方法：

當(dāng)提示詞使用

繼續(xù)將提問改成將來時(shí)，沒想到的是將來時(shí)居然對(duì)Llama3.1 405B起作用了，其余各大模型不受影響：

當(dāng)提示詞使用

小編同樣用英語提問實(shí)驗(yàn)了一次，結(jié)果是相同的?？偟膩碚f，使用過去時(shí)這個(gè)方法對(duì)于GPT-4o的作用表現(xiàn)最為明顯，其余的比如測(cè)試中的GPT-4o mini、Claude-3.5-Sonnet、以及國內(nèi)Doubao-pro-32k，無論是過去時(shí)還是將來時(shí)提問，回答都沒有變化。

實(shí)際上，洛桑聯(lián)邦理工學(xué)院的研究揭示了一個(gè)重要現(xiàn)象：盡管AI在處理多樣化任務(wù)時(shí)展現(xiàn)出卓越的性能，但其在遇到某些特定的語言結(jié)構(gòu)變化時(shí)可能顯示出不穩(wěn)定的一面。但通過持續(xù)的研究與改進(jìn)，我們期望AI能夠更好地適應(yīng)復(fù)雜多變的實(shí)際應(yīng)用場(chǎng)景，為未來的技術(shù)發(fā)展提供堅(jiān)實(shí)的基礎(chǔ)和保障。

【聲明】?jī)?nèi)容源于網(wǎng)絡(luò)

0

0

302.AI

分享更新更全面的AI資訊。

內(nèi)容 173

粉絲 1

302.AI 分享更新更全面的AI資訊。

總閱讀85.9k

粉絲1

內(nèi)容173

<button id="aeeco"></button>

<samp id="aeeco"><em id="aeeco"></em></samp>

<code id="aeeco"></code>

<button id="aeeco"></button>