公告原文:https://www.tc260.org.cn/front/postDetail.html?id=20231011143225
这是国内首个专门面向生成式 AI 安全领域的规范意见稿,也是对 7 月网信办等七部门推出的《生成式人工智能服务管理暂行办法》的支撑。
征求意见稿首次提出生成式 AI 服务提供者需遵循的安全基本要求,涉及语料安全、模型安全、安全措施、安全评估等方面。
下文介绍了该文件部分要点。
要求:提供者不应使用未经主管部门备案的基础模型进行研发。在训练过程中,应将生成内容安全性作为评价生成结果优劣的主要考虑指标之一。
在每次对话中,应对使用者输入信息进行安全性检测,引导模型生成积极正向内容。
《要求》提出,建立语料来源黑名单,不得使用黑名单来源的数据进行训练。应对各来源语料进行安全评估,单一来源语料内容含违法不良信息超 5% 应将其加入黑名单。
应使用包含个人信息的语料时,获得对应个人信息主体的授权同意,或满足其他合法使用该个人信息的条件。
应使用包含人脸等生物特征信息的语料时,获得对应个人信息主体的书面授权同意,或满足其他合法使用该生物特征信息的条件。
在训练过程中,应将生成内容安全性作为评价生成结果优劣的主要考虑指标之一。
全文:https://www.tc260.org.cn/upload/2023-10-11/1697008495851003865.pdf