全球最大規(guī)模AI黑客大賽將開啟

發(fā)布時間 2023-05-10

5月10日消息,美國白宮在上周四宣布,OpenAI、谷歌、Antrhopic、Hugging Face、微軟、英偉達(dá)與Stability AI等頂尖人工智能提供商,將在DEF CON 31上共同參與對他們的生成式人工智能系統(tǒng)的公開安全評估。DEF CON是每年8月在拉斯維加斯召開的黑客大會,此次安全競賽由人工智能黑客社區(qū)AI Village主辦。


自去年開始,ChatGPT等大語言模型(LLM)迅速成為加快寫作和交流任務(wù)的流行方式,但官方承認(rèn)這些模型中也存在固有風(fēng)險?;煜⒃姜z和偏見等問題給安全專業(yè)人士和公眾帶來了挑戰(zhàn)。正因為如此,白宮科學(xué)、技術(shù)和政策辦公室才支持對這些新的生成式AI模型進(jìn)行極限測試。


白宮在聲明中表示,“這項獨立測試將為研究人員和公眾提供關(guān)于這些模型的關(guān)鍵信息,并使得人工智能公司和開發(fā)人員能夠采取措施以解決在模型中發(fā)現(xiàn)的問題?!甭暶鬟€提到,此次活動符合拜登政府提出的《人工智能權(quán)利法案》和國家標(biāo)準(zhǔn)與技術(shù)研究院(NIST)的《人工智能風(fēng)險管理框架》。


在AI Village發(fā)布的活動公告中,組織方Sven Cattell、Rumman Chowdhury和Austin Carson將其稱為“有史以來規(guī)模最大的人工智能模型紅隊演習(xí)”。將有數(shù)千人參與對公共人工智能模型的評估,期間使用的評估平臺由Scale AI負(fù)責(zé)開發(fā)。


所謂“紅隊”測試,是指安全專家嘗試在組織系統(tǒng)中發(fā)現(xiàn)漏洞或缺陷,以提高整體安全性和彈性的過程。AI Village創(chuàng)始人Sven Cattell表示,“只有讓更多的人了解如何開展紅隊測試和評估人工智能模型,才能解決這些模型中的各種問題。”通過對人工智能模型組開展最大規(guī)模的紅隊演習(xí),AI Village和DEF CON希望能培養(yǎng)出處理人工智能系統(tǒng)漏洞的研究者社區(qū)。


事實證明,大語言模型的鎖定難度遠(yuǎn)超想象,部分原因在于所謂“提示詞注入”技術(shù)。人工智能研究員Simon Willison詳細(xì)介紹了提示詞注入的危險,這種技術(shù)可以令語言模型偏離正軌,執(zhí)行創(chuàng)建者想要回避的操作。


在DEF CON大會期間,參與者將通過主辦方提供的筆記本電腦定時訪問多個大語言模型。奪旗式積分系統(tǒng)將鼓勵大家測試各種潛在威脅。最終,得分最高的參與者將獲得英偉達(dá)高端GPU作為獎品。AI Village公告中寫道,“我們將公布從此次競賽中得到的啟發(fā),幫助其他想要做類似嘗試的人們。希望越來越多的人能知曉該如何使用大語言模型,了解這些模型的局限性?!?/span>


DEF CON 31將于8月10至13日在拉斯維加斯凱撒宮酒店舉辦。