适用场景
涉及开发、使用、出口或转让先进人工智能模型(特别是大语言模型、生成式AI模型)的中国出海企业,尤其是在模型训练、部署或开源共享阶段的企业。
核心要点
1. 管制核心:AI模型参数
美国新规管制的核心物项是人工智能模型在训练阶段习得的参数(如权重、偏置),而非模型结构或超参数。这些参数是模型能力的直接载体,一旦被获取,即可用于使用或二次开发。
2. 关键门槛:模型复杂度
管制仅针对训练总运算量超过10^26次操作的“复杂模型”。运算量计算涵盖所有数学运算,且与实际硬件和算法实现无关。需特别注意,若模型训练中超过10%的运算量依赖于某个未公开的数据生成模型,则生成该数据的运算量(甚至训练该生成模型的运算量)也需累加计算。
3. 安全区:公开参数模型
参数已完全公开(如开源在Hugging Face、ModelScope等平台)的模型通常被排除在管制之外。但基于开源模型进行二次训练(如微调)后,若新增运算量超过2.5*10^25次或原模型运算量的25%(以高者为准),则衍生模型可能重新被纳入管制范围。
4. 明确排除项
数据预处理(如标注、分词)的成果、非训练习得的超参数,以及运算量未达阈值的“简单模型”,均不在本次管制范围内。这为企业划定了一定的合规安全边界。
实务建议
- 在开发或获取AI模型前,务必由技术团队评估其训练总运算量,并与10^26次操作的门槛进行比对。
- 若业务涉及使用合成数据训练模型,需严格核算数据生成模型带来的运算量,避免触发10%的累加规则。
- 考虑将模型参数在公认的开源平台完全公开,以利用“公开排除”条款,但需注意后续重大微调可能带来的管制风险。
- 建立内部模型出口审查流程,对运算量接近门槛或使用未公开数据生成模型的模型进行重点评估。
- 保留完整的模型训练日志和运算量计算记录,以备合规核查。
风险提示
- 切勿简单套用法规中的示例公式(如6ND FLOP)计算复杂模型的运算量,必须根据实际模型结构进行专业评估。
- 警惕“分步训练”或“使用多个变体模型生成数据”等安排,法规已设防规避条款,相关运算量可能被合并计算。
- 对“经申请可获取”的模型(如某些早期闭源模型)保持谨慎,其参数不属于“无限制公开”,相关活动可能受管制。
- 即使模型最终性能相似,通过算法优化实际减少的运算量是合规的关键,单纯的技术包装无法规避管制。