365阅读
1回复

[智能应用]SIUO 跑分被提出：评估多模态 AI 模型的安全[5P] [复制链接]

上一主题下一主题查看指定楼层

在线huozm32831

UID: 329002

精华: 1097
职务: 超级斑竹
级别: 玉清道君

发帖: 106166

金币: 2179

道行: 19523

原创: 29307

奖券: 17275

斑龄: 190

道券: 10126

获奖: 0

座驾

设备: EOS—7D

摄影级: 专家级认证

在线时间: 20019(小时)
注册时间: 2007-11-29
最后登录: 2024-11-23

只看楼主倒序阅读使用道具楼主发表于: 06-25

— 本帖被兵马大元帅执行加亮操作(2024-07-01) —

IT之家 6 月 25 日消息，最新发表在 arXiv 的研究论文指出，包括 GPT-4V、GPT-4o 和 Gemini 1.5 在内的大部分主流多模态 AI 模型，处理用户的多模态输入（例如一起输入图片和文本内容）之后，输出结果并不安全。

这项研究标题为《跨模态安全调整》（Cross-Modality Safety Alignment），提出了一个全新的“安全输入但不安全输出”（SIUO），涉及道德、危险行为、自残、侵犯隐私、信息误读、宗教信仰、歧视和刻板印象、争议性话题以及非法活动和犯罪等 9 个安全领域。

研究人员说，大型视觉语言模型（LVLM）在接收多模态输入时很难识别 SIUO 类型的安全问题，在提供安全响应方面也遇到困难。
在接受测试的 15 个 LVLM 中，只有 GPT-4v（53.29%）、GPT-4o（50.9%）和 Gemini 1.5（52.1%）的得分高于 50%。
研究人员表示为了解决这个问题，需要开发 LVLM，以便将所有模式的见解结合起来，形成对情景的统一理解。它们还需要能够掌握和应用现实世界的知识，如文化敏感性、道德考虑因素和安全隐患等。
研究人员还指出，LVLMs 需要能够通过对图像和文本信息的综合推理，理解用户的意图，即使文本中没有明确说明。

共1条评分，金币+25

兵马大元帅

金币 +25

优秀文章，支持！n神马都是浮云

06-26

山庄提示：道行不够，道券不够？---☆点此充值☆

分享到 淘江湖新浪 QQ微博 QQ空间开心人人豆瓣网易微博百度鲜果白社会飞信

在线jjybzxw

UID: 551814

精华: 0
职务: 超级斑竹
级别: 得道成仙

发帖: 103165

金币: 1096966

道行: 1951

原创: 2163

奖券: 2124

斑龄: 28

道券: 567

获奖: 0

座驾

设备

摄影级

在线时间: 24795(小时)
注册时间: 2008-10-01
最后登录: 2024-11-24

只看该作者沙发发表于: 06-25

申请VIP---在山庄畅通无阻还送FTP单独下载账号!

该研究指出了当前多模态 AI 模型在处理用户输入时的安全性问题，并提出了“安全输入但不安全输出”（SIUO）的概念，涵盖了多个安全领域。这表明，尽管 AI 模型在理解和处理多模态数据方面取得了进展，但它们在识别和输出安全内容方面仍面临挑战。

研究人员强调，为了提高这些模型的安全性，需要开发能够综合所有模式见解的 AI 系统，这些系统应该能够理解和应用现实世界的知识，包括文化敏感性、道德考虑因素和安全隐患等。此外，这些模型还应该能够通过综合推理图像和文本信息来理解用户的意图，即使这些意图在文本中没有明确表达。

这一发现对于 AI 模型的开发者和使用者来说都是重要的。开发者需要考虑到这些安全性问题，并努力改进 AI 模型，以确保它们能够安全地处理和输出多模态数据。使用者则需要意识到这些潜在的风险，并在使用 AI 模型时采取适当的措施，以保护用户和数据的安全。

共1条评分，金币+10

兵马大元帅

金币 +10

优秀文章，支持！n神马都是浮云

06-26

如何不发帖就快速得到金币和道行

发帖回复

返回列表


	关闭您还没有登录，快捷通道只有在登录后才能使用。立即登录还没有帐号？赶紧注册一个


	关闭选中1篇全选

帖子

[智能应用]SIUO 跑分被提出：评估多模态 AI 模型的安全[5P] [复制链接]