文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

MLCommons宣布成立人工智能安全工作组

2024-11-30 06:11

关注

人工智能系统为社会提供了巨大利益的潜力,但它们并非没有风险,如有害性、错误信息和偏见。与其他复杂技术一样,社会需要行业标准的安全测试来实现效益,同时将风险降至最低。

新平台将支持定义从测试库中选择的基准,并将输出汇总为有用的、可理解的分数——类似于其他行业的标准,如汽车安全测试评级和能源星级分数。

这项工作的当务之急是支持更严格、更可靠的人工智能安全测试技术的快速发展。AIS工作组将利用其成员和更大的人工智能社区的技术和运营专业知识,帮助指导和创建人工智能安全基准技术。

埃因霍温理工大学机器学习(ML)副教授Joaquin Vanschoren表示:“广泛的人工智能社区正在制定的安全基准具有开放性和动态性,这为制定和实现共同目标创造了真正的激励。”“如果任何人看到未解决的安全问题,他们都可以提出新的测试。我们有一些世界上最聪明的人聚在一起实际解决这些问题,使用基准意味着我们将清楚地了解哪些人工智能模型最能解决安全问题。”

初始重点将是开发大型语言模型(LLM)的安全基准,以斯坦福大学基础模型研究中心(CRFM)及其语言模型整体评估(HELM)的研究人员所做的开创性工作为基础。除了建立在HELM框架的基础上并纳入其许多安全相关测试外,工作组还希望一些公司将其内部用于专有目的的人工智能安全测试外部化,并与MLCommons社区公开分享,这将有助于加快创新步伐。

基础模型研究中心主任Percy Liang表示:“我们开发HELM这一模块化评估框架已经有大约2年的时间了。我很高兴能与MLCommons合作,利用HELM进行人工智能安全评估,这是我思考了7年的课题,随着强大的基础模型的兴起,这一课题变得极其紧迫。“

AIS工作组认为,随着测试的成熟,标准的人工智能安全基准将成为人工智能安全方法的重要组成部分。这与负责任的人工智能技术发展和基于风险的政策框架相一致,例如几家科技公司于2023年7月向美国白宫做出的关于安全、安保和信任的自愿承诺、NIST的人工智能风险管理框架以及欧盟即将出台的《人工智能法》

MLCommons支持行业和学术界的广泛利益相关者开发共享数据、工具和基准,以更有效地构建和测试人工智能系统。MLCommons执行董事David Kanter表示:“我们很高兴能与会员合作。……明年,我们将专注于构建和部署人工智能安全基准,首先从开源模型开始,目的是在初步方法得到验证后,将基准更广泛地应用于其他LLM。”

首次参与AIS工作组的包括一个由人工智能专家组成的多学科小组,包括:Anthropic、Coactive AI、Google、Inflection、Intel、Meta、Microsoft、NVIDIA、OpenAI、高通,以及埃因霍温理工大学的学者Joaquin Vanstoren、斯坦福大学的Percy Liang和芝加哥大学的Bo·Li。学术界和产业界的研究人员和工程师以及民间社会和公共部门的领域专家均可参加工作组。点击阅读原文,了解如何参与AIS工作组。

关于MLCommons

MLCommons是构建人工智能基准的世界领导者组织。它是一个开放的工程联盟,其使命是通过基准和数据让每个人都能更好地进行机器学习。MLCommons的基础始于2018年的MLPerf基准,该基准作为一组行业指标迅速扩展,以衡量机器学习性能并提高机器学习技术的透明度。MLCommons与其125多名成员、全球技术提供商、学者和研究人员合作,专注于通过基准和指标、公共数据集和最佳实践为整个机器学习行业构建工具的协同工程工作。

来源:Ai时代前沿内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯