适用场景
面向开发、部署或使用AIGC大模型及相关产品的中国出海企业,尤其是在产品上线、运营及内容生成阶段,需关注数据、网络安全、知识产权及行政备案等合规要求。
核心要点
1. 大模型运行合规基石
大模型脱离训练数据集独立运行后,仍需确保训练数据源头合规,并严格遵守通用大模型的许可协议,尤其在微调或开发衍生版本时,避免侵权及协议冲突。
2. AIGC产品行政与数据安全
AIGC产品提供者需承担信息内容责任,履行算法备案、用户协议签订等行政义务。同时,跨境数据传输和用户数据安全是核心挑战,需审慎评估并采取本地化部署或严格合规措施。
3. 用户输入与数据污染防范
用户输入内容可能存在知识产权侵权、涉密或违法风险,若将其用于模型优化,可能“污染”现有数据集。企业应采取隔离存储、数据清洗及明确用户协议等措施防范风险。
4. 生成内容合规与责任
AIGC生成内容可能引发著作权侵权、人格权侵犯等争议。产品提供者需通过算法优化、建立过滤系统及完善用户协议来降低风险,并明确自身作为信息内容提供者的责任。
5. 许可协议冲突与技术隔离
在AIGC产品前端开发中,第三方代码许可协议可能与底层大模型开源协议冲突,限制修改和商用。应运用封装、管道通信等技术手段进行有效隔离,避免违约。
实务建议
- 从源头确保训练数据合法合规,优先使用原创、已授权或清洗优化的数据。
- 与私有数据持有人签订详细合作协议,明确数据权属、模型归属、生成内容权属及收益分配,并确保数据无瑕疵。
- 严格遵守通用大模型的许可协议,识别并避让不允许修改的部分,注明修改内容,并关注开源、商用、非竞争条款。
- 在前端开发中,利用封装代码、管道通信等技术手段,隔离可能与开源协议冲突的第三方代码。
- 履行《生成式人工智能服务管理暂行办法》等法规要求的行政义务,包括签订服务协议、处理个人信息、内容标识、投诉举报机制及算法备案。
- 优先考虑将境外大模型本地化部署或在境内私有云运行,以强化数据安全并规避跨境数据传输风险。
- 审慎评估API嵌入境外大模型可能涉及的数据范围和敏感度,按规定进行数据出境安全评估或签署标准合同。
- 尽量避免将用户输入内容直接用于模型训练;如确需使用,应隔离存储、进行清洗,并在用户协议和界面中明确告知并获得用户同意。
- 建立健全关键词过滤系统,禁止生成暴力、仇恨或侵犯人格权的内容,并确保过滤内容不回写入数据集。
- 优化算法以增强AIGC生成内容的转化性,降低与训练数据相似度,实现更“独立”的创作。
- 在用户协议中明确生成内容知识产权归属用户(平台取得永久授权),并设置免责条款,但需注意其有限性。
风险提示
- 大模型作为核心权利节点,是数据内容权利人维权的首要对象,面临版权侵权和私人信息滥用诉讼风险。
- 微调大模型使用的私有数据涉及商业秘密和受竞争法保护的数据权益,法律风险远高于公开网络数据,无法主张合理使用抗辩。
- 大模型许可协议可能涉及多个不同协议,且包含传染性开源、非竞争等条款,需仔细识别和遵守。
- AIGC产品提供者被法规明确为信息内容责任主体,需承担网络信息安全义务,仅凭免责条款难以完全免除责任。
- 绝大多数面向社会公众开放且“具有舆论属性或社会动员能力”的AIGC产品都负有算法备案义务。
- 用户输入内容可能“污染”合规数据集,增加侵权和违法风险。
- 境内AIGC产品嵌入境外大模型API涉及用户数据跨境传输,可能触及《数据安全法》《个人信息保护法》等严格监管要求。
- AIGC产品具备编辑能力可能侵犯原作品修改权、自然人肖像权、法人名誉权或构成不正当竞争。
- AIGC生成内容是否构成著作权法意义上的“作品”仍有争议,提供者较难通过技术中立抗辩完全免责。