© 2020 Plug Media Services Limited. All Rights Reserved. [n2]
Many-shot jailbreaking
人工智能
令 AI 回答「不應答的問題」 Anthropic 發表越獄論文盼業界謀對策
開發性能超越 GPT-4 的大型語言模型「Claude 3」的 Anthropic 日前發表一篇論文,詳細解說如何突破大型語言模型 LLM 限制,令 LLM 回答本來被禁止回答的問題的技術「Many-shot jailbreak(多發越獄)」。他們希望讓更多 AI 研究人員了解問題,加快開發解決方法。