适用场景
从事生成式人工智能(AIGC)研发、服务提供的中国出海企业,在模型训练、数据处理及产品上线运营阶段均需重点关注。
核心要点
1. 核心争议:训练行为是否构成侵权
目前存在两种主要观点。一种主张AI训练数据属于‘合理使用’或‘非表达性使用’,不构成侵权,以促进产业发展。另一种则认为未经授权的复制、分析行为侵犯了复制权、改编权等,不应盲目扩大‘合理使用’范围,需保护创作者权益。国内司法实践(如杭州互联网法院相关案例)已开始倾向于在一定条件下支持‘合理使用’抗辩。
2. 国内监管框架与立法动态
国内暂无直接法律规定,但《生成式人工智能服务管理暂行办法》等文件明确要求训练活动不得侵害他人知识产权。相关安全规范及学者建议稿正在探讨建立‘合理使用’制度,其趋势是在不影响作品正常使用、不损害权利人合法权益的前提下,可能为训练数据使用开辟空间。企业需密切关注立法进展。
3. 海外立法实践与司法风向
各国态度不一。日本修法为数据分析行为提供了一定豁免。欧盟通过版权指令规定了文本与数据挖掘(TDM)的例外情形,但整体保护严格。美国依赖版权法‘合理使用’四要素进行个案判断,司法态度尚不明朗,但作为AI产业龙头,政策可能倾向产业发展。出海企业需针对性研究目标市场法规。
4. 当前司法实践的关键考量
国内已有数起AIGC版权纠纷诉讼。法院审理时开始区分‘输入端’(训练阶段)与‘输出端’(生成内容)的责任。对于训练阶段,可能考虑使用目的、是否影响作品正常使用、是否不合理损害权利人利益等因素来判断是否构成‘合理使用’,而非要求企业对海量数据逐一审查。
实务建议
- 建立数据来源审核机制:优先采购已获授权数据、使用开源或无版权数据、公共领域内容,或利用合成数据进行训练。
- 完善平台内部治理:设立知识产权侵权投诉渠道,对用户举报或明显侵权内容及时采取删除等措施,履行平台注意义务。
- 优化用户协议与风险提示:在服务协议中明确用户上传内容需拥有合法授权,并提示生成内容可能存在的知识产权风险及用户责任。
- 探索创新商业合作模式:关注并考虑与数据供应商、出版商建立合作,如采用收入分成、技术反哺等联盟或计划,合法获取优质数据。
- 进行版权侵权风险识别:在数据用于训练前,开展知识产权侵权风险筛查,避免使用存在高风险的数据。
风险提示
- 误区:认为‘合理使用’是万能免责牌。即使司法有所倾向,企业仍需积极履行合规义务,否则仍可能面临诉讼与赔偿风险。
- 注意:完全依赖‘避风港原则’和格式条款规避责任存在局限。法院会综合审查平台是否尽到合理注意义务。
- 警告:忽视目标国法律差异风险巨大。欧美日等法域对训练数据的版权规定差异显著,不可套用国内经验。
- 注意:输出端内容侵权风险不容忽视。即使训练数据争议未决,AI生成的内容若与他人作品实质性相似,仍可能构成侵权。