以太坊交易所 以太坊交易所
Ctrl+D 以太坊交易所
ads
首頁 > Gateio > Info

看不下去AI胡說八道,英偉達出手給大模型安了個“護欄”_STR:SoccerInu

Author:

Time:1900/1/1 0:00:00

來源:量子位

作者:蕭簫

大模型們胡說八道太嚴重,英偉達看不下去了。

他們正式推出了一個新工具,幫助大模型說該說的話,并回避不應該觸碰的話題。

這個新工具名叫“護欄技術”,相當于給大模型加上一堵安全圍墻,既能控制它的輸出、又能過濾輸入它的內容。

一方面,用戶誘導大模型生成攻擊性代碼、輸出不道德內容的時候,它就會被護欄技術“束縛”,不再輸出不安全的內容。

另一方面,護欄技術還能保護大模型不受用戶的攻擊,幫它擋住來自外界的“惡意輸入”。

以太坊域名服務ENS:15位獲勝者贏得bug bash獎勵:金色財經報道,以太坊域名服務ENS在社交媒體宣布,在完成bug bash審議之后,最終共有15位獲勝者,他們對V3 ENS Manager應用程序提出的改進和Bug建議將被采納并會帶入到主網。據悉,7位獲勝者因發現Bug贏得1 ETH獎勵,其他8位獲勝者將獲得0.375 ETH獎勵。[2023/3/25 13:26:12]

現在,這個大模型護欄工具已經開源,一起來看看它的效果和生成方法。

防止大模型胡言亂語的三類“護欄”

根據英偉達介紹,目前NeMoGuardrails一共提供三種形式的護欄技術:

話題限定護欄、對話安全護欄和攻擊防御護欄。

粉絲代幣平臺Socios代幣持有者可競拍獲得意大利超級杯“比賽得分球”:1月17日消息,粉絲代幣平臺Socios宣布,通過Socios購買粉絲代幣的球迷將有機會在本周三AC米蘭和國際米蘭之間舉行的意大利超級杯比賽中,贏得一個“比賽得分球”。

據悉,用戶必須同時擁有足夠數量的任何一支球隊的粉絲代幣和Socios代幣,如果符合條件,粉絲們將參加拍賣。該“比賽得分球”將裝有芯片,充當“真實性證書”,無論誰贏得球,都將使用芯片驗證其所有權。[2023/1/17 11:15:42]

話題限定護欄,簡單來說就是“防止大模型跑題”。

SBF將在兩周內進行Twitter Space直播:11月29日消息,BitBoy Crypto創始人Ben Armstrong在Twitter上宣布,他將在未來兩周內與SBF合作進行一場Twitter Space。

他在推文中表示,“SBF已經同意在接下來的兩周內和我一起舉辦一場Twitter Space。你可以確認我們已經通過話。”

此前,有人看到Ben Armstrong在SBF位于巴哈馬的住所外露營。Ben Armstrong在此處向SBF喊話并進行了直播,“Sam,你在哪里?我們在找你,我只是想和你談談。我知道你在那里。過來說說你的故事,我們談談吧。”[2022/11/29 21:10:31]

大模型具備更豐富的想象力,相比其他AI更容易完成創造性的代碼和文字編寫工作。

歐洲央行正在研究用于銀行間結算的分散式賬本技術:9月26日消息,歐洲央行執行委員會成員Fabio Panetta表示,歐洲央行 (ECB) 正在研究分散式賬本技術 (DLT) 在提高銀行間結算效率方面的“潛力”。

據悉,分散式賬本(distributed ledger)是一個分散的數據庫,由大型網絡中的各個參與者獨立維護和更新。根據Fabio Panetta的說法,中央銀行數字貨幣(CBDC)通常被定義為一種新型的基于 DLT 的中央銀行數字貨幣,可以專門用于結算銀行間轉賬。(CoinDesk)[2022/9/26 5:51:34]

但對于特定場景應用如寫代碼、當客服而言,至少用戶不希望它在解決問題時“脫離目標范圍”,生成一些與需求無關的內容。

這種情況下就需要用到話題限定護欄,當大模型生成超出話題范圍的文字或代碼時,護欄就會將它引導回限定的功能和話題上。

對話安全護欄,指避免大模型輸出時“胡言亂語”。

胡言亂語包括兩方面的情況。

一方面是大模型生成的答案中包括事實性錯誤,即“聽起來很有道理,但其實完全不對”的東西;

另一方面是大模型生成帶偏見、惡意的輸出,如在用戶引導下說臟話、或是生成不道德的內容。

攻擊防御護欄,即防止AI平臺受到來自外界的惡意攻擊。

這里不僅包括誘導大模型調用外部病APP從而攻擊它,也包括黑客主動通過網絡、惡意程序等方式攻擊大模型。護欄會通過各種方式防止這些攻擊,避免大模型癱瘓。

所以,這樣的護欄要如何打造?

如何打造一個大模型“護欄”?

這里我們先看看一個標準的“護欄”包含哪些要素。

具體來說,一個護欄應當包括三方面的內容,即格式規范、消息和交互流。

首先是格式規范,即面對不同問題的問法時,規定大模型要輸出的內容。

例如被問到“XX文章是什么”,大模型必須給出特定類型的“文章”,而非別的東西;被問到“誰發表了什么”,大模型必須給出“人名”,而非別的回答。

然后是消息定義,這里以“用戶問候”話題為例,大模型可以輸出這些內容:

最后是交互流的定義,例如告訴大模型,怎么才是問候用戶的最好方式:

一旦問候用戶的機制被觸發,大模型就會進入這個護欄,規規矩矩地問候用戶。

具體工作流程如下:首先,將用戶輸入轉換成某種格式規范,據此生成對應的護欄;隨后,生成行動步驟,以交互流指示大模型一步步完成對應的操作;最后,根據格式規范生成輸出。

類似的,我們就能給大模型定義各種各樣的護欄,例如“應對用戶辱罵”的護欄。

這樣即使用戶說出“你是個傻瓜”,大模型也能學會冷靜應對:

目前,英偉達正在將護欄技術整合進他們的AI框架NeMo中,這是個方便用戶創建各種AI模型、并在英偉達GPU上加速的框架。

對“護欄”技術感興趣的小伙伴們,可以試一試了~

Tags:SBFSTRSOCWITSBF價格Streamer InuSoccerInuSHIBAWITCH幣

Gateio
新的 Crypto 沃土是阿聯酋?Coinbase 瞄準中東市場擴張以應對美國監管挑戰_CRYPT:CRY

Coinbase首席執行官BrianArmstrong贊揚了阿拉伯聯合酋長國對Crypto監管的前瞻性方針.

1900/1/1 0:00:00
探討美聯儲的全球困境_元宇宙:區塊鏈工程專業學什么課程的

銀行恐慌已經接近尾聲,但美聯儲已經重新開始實行緊縮政策,這不僅會導致不可避免的破產和隨后的救助,還會增強美國中央銀行的全球影響力,美聯儲將很快采取行動來收緊的金融政策.

1900/1/1 0:00:00
AI成為了米哈游們的“必選項”_AIG:Webchain

作者:胡描編輯:羅麗娟 今年以來,游戲公司紛紛投資AI公司、成立AIlab、自建AI模型。無論是AIGC對游戲制作的降本增效,還是其沖破當前游戲工業化極限的可能性,都讓游戲企業成為了新一輪AI浪.

1900/1/1 0:00:00
MakerDAO推出DeFi借貸協議Spark_Maker:DAI

金色財經報道,穩定幣發行商MakerDAO宣布推出Spark,這是一種以DAI穩定幣為中心的DeFi借貸協議。DAI是第四大穩定幣,市值為47億美元,僅次于USDT、USDC和BUSD.

1900/1/1 0:00:00
掙大錢,靠周期,ChatGPT 會創造出一個100 萬億美金的超級賽道_ATG:ybchain

原創:顏艷春 來源:筆記俠 原文標題:《掙大錢,靠周期》內容來源:2023年4月25日,盛景大咖談.

1900/1/1 0:00:00
LDO遭多家機構拋售?一覽四月份部分VC和聰明錢的鏈上活動_ITA:Radiant Capital

原文作者:ThorHartvigsen,加密?KOL原文編譯:Felix,PANews四月份,部分?VC?和聰明錢有一些大的投資組合變化.

1900/1/1 0:00:00
ads