适用场景
面向直接向中国境内公众提供生成式人工智能服务(如大模型、AI应用)的中国出海企业,特别是在产品研发、上线或更新阶段需要满足国内监管备案与安全评估要求的企业。
核心要点
1. 明确适用主体与评估性质
安全评估主要适用于直接向境内公众提供生成式人工智能服务的组织或个人(即“提供者”)。该评估是《生成式人工智能服务管理暂行办法》的配套要求,与算法备案及常规的互联网安全评估不同,是企业国内上线运营的关键合规步骤。
2. 核心评估维度:语料安全
评估重点审查训练数据的来源、内容与标注。来源需合法(如遵守开源协议、商业授权),内容需过滤违法不良信息并进行知识产权与个人信息合规评估。语料标注需有明确的人员、规则与质量保证体系。
3. 核心评估维度:模型安全与服务透明度
要求基础模型应经过备案,模型生成内容需安全、准确、可靠。服务需保持一定透明度,例如向用户披露服务适用人群、使用的基础模型及服务局限性,以保障用户知情权。
4. 必备安全措施与持续合规
企业需落实未成年人保护、用户输入信息用于训练的告知与关闭选项、生成内容标识、投诉举报机制等具体安全措施。模型发生重要更新或升级后,需重新进行安全评估并备案,实现持续合规。
实务建议
- 立即对照《安全基本要求》建立语料来源黑名单,并对训练数据开展知识产权与个人信息合规评估。
- 建立并优化内容过滤机制,综合运用关键词库、分类模型及人工抽检,确保语料与生成内容安全达标。
- 在服务显著位置设计信息披露模块,明确告知用户服务基础模型、局限性及适用人群等信息。
- 完善用户协议与隐私政策,明确用户输入信息用于训练的规则,并提供便捷的关闭选项。
- 按照标准要求提前准备生成内容测试题库、拒答测试题库等评估材料,以备查验。
风险提示
- 切勿混淆此安全评估与算法备案或常规互联网安全评估,它们是不同的监管程序,需分别准备和申请。
- 避免对用户提问进行随意拒答,仅能对明显的违法不良信息拒绝生成,否则可能不符合评估要求。
- 注意模型更新可能触发重新评估,需提前界定“重要更新”的标准,并与监管部门保持沟通。
- 训练数据知识产权评估在实践中存在模糊地带,需谨慎处理并关注立法动态,不能完全忽视此风险。