来源:国浩律师事务所
发布日期:2025年09月22日
摘 要
本文系统性研究了人工智能(AI)模型许可协议的法律框架与挑战。由于传统软件许可模式在AI领域存在局限性,以OpenMDW为代表的新型许可协议应运而生。OpenMDW许可协议在权利授予、义务设定及风险分配上均存在创新。但OpenMDW许可协议存在未能完全解决的三个核心法律难题:模型参数的知识产权属性、免责条款与强制性法律法规的冲突、以及知识产权清理义务转嫁用户的有效性。本文通过对美、欧、中三大法域的比较法分析,揭示了当前AI模型许可在法律适用上的不确定性,并对未来AI许可制度的完善与发展提出前瞻性思考。
目 录
一、引言:人工智能模型许可的法律困境与研究路径
二、OpenMDW许可协议的文本分析与法律释义
三、OpenMDW许可协议面临的未决法律问题
四、结论与展望
01
引言:人工智能模型许可的法律困境与研究路径
(一) 从代码到数据:AI模型的本质变革
软件的本质是一系列由人类编写的、明确的、可执行的指令集合,即源代码。其逻辑是确定的,其行为是可预测的。而AI模型,尤其是深度学习模型,其核心不再是人类编写的指令,而是一个巨大的、经过训练的结构化数据。
一个完整的AI系统是一个复杂的复合体,通常包括四个关键部分:
1. 代码 (Code):用于执行训练、优化、推理等过程的软件代码。这是AI系统中最接近传统软件的部分。
2.模型架构 (Model Architecture):定义了神经网络层级、神经元数量和连接方式的蓝图。它规定了模型的结构,但本身不包含任何“知识”。
3.训练数据 (Training Data):用于“喂养”模型的海量信息,如文本、图像或声音。模型从这些数据中自动学习和归纳模式。
4.模型参数 (Model Parameters):一组由数百万甚至数万亿个参数构成的海量数值。这些参数并非由人类直接编写,而是通过在训练数据上运行算法代码自动调整和优化得出的结果。模型参数是模型“知识”的载体,是其能够进行预测和生成的核心,也是整个AI系统中最具价值、同时在法律上最模糊的部分。
因此,AI模型的本质特征是从人类编写的逻辑(Code)向机器学成的模式(Data)的根本性转变。传统软件许可协议主要围绕受版权法明确保护的源代码构建,而AI模型的核心资产——模型参数——其法律属性模糊不清,这正是当前AI许可领域陷入法律困境的根源。
(二) AI模型许可的法律困境
传统软件许可协议(如MIT、Apache 2.0等)主要围绕源代码这一核心客体构建,源代码作为一种作品,其受版权法保护的地位是明确的。然而,AI模型的关键组成部分——模型参数——的知识产权属性却较为模糊。它们可能同时涉及版权、专利、商业秘密乃至数据库权等多种、重叠且在不同法域规定各异的知识产权制度,也可能无法落入任何一种现有的知识产权制度之中,这给许可协议的构建带来了巨大的法律不确定性。这种法律框架的错配导致现有AI许可领域呈现出碎片化的状态,开发者与使用者往往需要从零开始谈判专门的、互不兼容的许可协议,一定程度上阻碍了技术合作与创新 [注1] 。
(三) 现有许可模式的类型与局限
当前AI模型的许可实践大致可分为三类,但每一类在应用于AI时都暴露出显著的局限性。
第一类是宽松型许可 (Permissive Licenses)。以MIT和Apache 2.0许可证为代表,它们对使用者施加的限制很少,允许将开源组件用于商业和专有软件中,且无需公开衍生作品的源代码。因其高度的灵活性和商业友好性,成为最受欢迎的开源许可模式之一。 [注2] 然而,这类为传统软件设计的许可证并未充分考虑到AI模型的特殊构成,无法有效处理模型参数、训练数据等非代码部分的权利问题,从而留下了法律风险敞口。 [注3] 当前大量知名模型采用此类许可协议,如Deepseek R1, Qwen3等。
第二类是著佐权许可 (Copyleft Licenses)。以GNU通用公共许可证(GPL)家族为代表,其核心要求是基于许可材料创作的衍生作品必须以相同或兼容的著佐权许可协议发布,确保开源生态的持续开放。当应用于AI模型时,著佐权许可面临着一个核心的法律难题:如何界定AI模型的“衍生作品”。一个经过微调(fine-tuning)的模型是否构成衍生作品?模型生成的输出(output)是否也受原模型许可证的约束?这些问题在法律上尚无定论,给使用者带来了合规上的不确定性。当前采用此类许可协议模型较少,主要代表为目标识别模型YOLO。
第三类是用途限制型许可 (Use-Restricted Licenses)。这是随着AI伦理风险日益凸显而出现的新兴许可类别,其典型代表是“负责任人工智能许可”(Responsible AI Licenses, RAILs)。 [注4] 此类许可协议中包含“行为使用条款”(behavioral-use clauses),明确禁止将模型用于特定有害目的,如传播虚假信息、生成恶意深度伪造内容、非法歧视或侵犯人权等。许多大型科技公司发布的“开放”模型,如Meta的Llama 3和Google的Gemma,也采用了类似的定制化许可,融合了宽容型许可的开放性与严格的用途限制。这类许可虽然回应了社会对AI伦理的关切,但其“用途限制”条款与开源促进会(OSI)定义的开源基本原则——即不得歧视任何个人、团体或应用领域——存在根本冲突。 [注5] 因此,也有人质疑,采用此类许可的模型实际并非严格意义上的“开源”。
AI许可模式的演进反映了两种核心理念之间的张力:一方面是源自传统开源软件运动的、追求最大化自由与无限制创新的激进宽容主义;另一方面是面对AI技术潜在的巨大社会风险时,日益增长的风险管控与伦理规制的现实需求。
(四) OpenMDW的诞生背景与研究意义
为了解决AI生态系统中的法律摩擦和不确定性,Linux基金会发起了“模型开放度框架”(Model Openness Framework, MOF),旨在为AI模型的“开放”提供一个跨越代码、架构、参数、数据和文档等多维度的清晰分类标准。为了将MOF付诸实践,业界需要一个简单、标准、专为AI模型技术栈设计的宽容型许可协议。在此背景下,OpenMDW(Open Model Development Warrant)许可协议应运而生。 [注6]
OpenMDW旨在成为AI模型和数据领域的“MIT许可证”,通过提供一个清晰、全面的法律框架,降低开发者和用户的法律风险,促进开放模型的协作与商业化应用。本文将以OpenMDW为样本,深入探讨其文本构造与法律意涵,并以此为切入点,揭示当前AI模型许可在知识产权基础、责任分配和义务转移等方面悬而未决的法律难题。
02
OpenMDW许可协议的文本分析与法律释义
OpenMDW许可协议的设计体现了一种明确的价值取向:优先保障交易的确定性和商业化应用的便利性。其核心功能在于为下游商业开发者扫清法律障碍,降低交易成本。
(一) 授权范围:“无限制地处置模型材料”
OpenMDW-1.0版本的核心授权条款为:“特此免费授予许可,允许无限制地处置模型材料,包括其中包含或体现的所有版权、专利、数据库权和商业秘密权利。”此处的“模型材料”(Model Materials)被宽泛地定义为协议项下提供的所有材料,包括模型、架构、参数、相关数据、文档和软件。
“处置”(deal in)一词并非知识产权法中的标准术语,而是借鉴自MIT等高度宽松型许可证,意在尽可能广泛地涵盖所有可能的行为,包括但不限于使用、复制、修改、合并、发布、分发、再许可及销售等,且不附加任何应用领域或地域上的限制。
与传统软件许可相比,OpenMDW的一个显著创新是明确地将专利权、数据库权和商业秘密权纳入授权范围。这直接回应了传统软件许可证(如MIT)在专利授权方面长期存在的模糊性问题,旨在为使用者提供更全面的法律确定性。
(二) 用户义务:最低限度的合规要求
与宽泛的授权范围相对应,OpenMDW对用户施加的义务被降至最低。当用户分发“模型材料”的任何部分时,仅需履行两项义务:(1)在分发包中保留一份许可协议的副本;(2)保留“模型材料”中包含的所有原始版权和来源声明。
该协议的结构设计刻意规避了任何形式的“著佐权”(Copyleft)条款。
这意味着,用户基于OpenMDW材料开发的衍生模型或应用程序,可以完全采用专有许可进行发布,而无需承担强制公开义务。这一设计最大化了协议的宽容度和互操作性,旨在鼓励和促进开放模型在商业产品中的广泛集成与应用。
(三) 专利报复条款的法律效力
为了维护开源生态的稳定,防止专利武器化,OpenMDW引入了专利报复条款。该条款规定:“如果您针对任何个人或实体提起、维持或自愿参与诉讼,主张‘模型材料’直接或间接侵犯任何专利,则本协议授予您的所有权利和许可即告终止。”这一设计借鉴了Apache 2.0等成熟开源许可协议的最佳实践。
该条款是一种防御机制,旨在阻止社区内部的专利攻击。如果一个用户(被许可人A)利用其专利权起诉另一个用户(被许可人B)使用OpenMDW材料的行为构成侵权,那么A自己使用这些材料的许可权利将被自动终止。当然,虽然此类条款诞生已经有几十年的历史,但在全球范围内,仍未有围绕该类条款的直接适用的司法判例可供参考。
(四) 模型输出的法律地位:不受限制的自由
OpenMDW明确切割了模型与其生成内容之间的法律关联。协议规定:“本协议不对使用‘模型材料’所产生的任何输出的使用、修改或分享施加任何限制或义务。”
该条款直接回应了AI许可领域中一个核心的模糊地带——AI生成内容的法律地位问题。通过在合同层面明确宣布模型输出不受许可协议约束,OpenMDW为用户提供了尽可能宽的自由度,用户可以自由地对生成内容进行商业化使用而无需担心来自模型提供方的权利主张。
然而,需要强调的是,许可协议的约定不能超越法律。该条款仅能约束协议双方,即模型提供方不能对输出主张权利。如果模型输出被法院认定侵犯了第三方(如训练数据版权方)的合法权益,用户并不能依据此条款免于承担侵权责任。
03
OpenMDW许可协议面临的未决法律问题
尽管OpenMDW在设计上力求清晰与全面,但它建立在一个充满法律不确定性的领域。其最终效果与可持续性,取决于三个尚未解决的根本性法律问题。
(一) 许可的基石:模型参数知识产权属性的模糊性
任何许可协议的法律效果,都根植于其客体(被许可的资产)享有明确的知识产权保护。如果AI模型参数不受任何知识产权的保护,那么所谓的“许可”在法律上可能失去意义,退化为一份普通的合同,其约束力,特别是对抗第三方的能力,将大打折扣。
1.模型参数的多重知识产权路径分析
模型参数作为一组通过自动化训练过程生成的海量数值,其能否以及如何受到现有知识产权制度的保护,在全球范围内都是一个悬而未决的难题。
(1) 版权
保护的主要障碍:在美国等奉行“人类作者”原则的法域,版权保护的核心是人类的原创性表达。模型参数由算法自动生成,缺乏直接的人类创造性劳动,这构成了其获得版权保护的最大障碍。美国版权局和联邦法院已多次明确,完全由机器生成的作品不受版权保护。 [注7] 此外,权重的数值本身是纯功能性的,可能因“思想与表达合并原则”(Merger Doctrine)而被排除在版权保护之外。 [注8]
支持保护的论点:有学者认为,不能将模型参数简单视为纯粹的机器生成物。模型开发者在选择模型架构、筛选和处理训练数据、设计训练算法和调整超参数等贯穿整个开发过程中的一系列智力投入,共同体现了其“独创性的精神构想”,而计算机在此过程中仅是实现该构想的工具。 [注9] 从这个角度看,最终生成的模型参数是开发者智力创造活动的直接产物。尽管目前尚无司法判例直接认定模型参数受版权保护,但这种强调人类在创作过程中智力贡献的思路,为未来寻求版权保护提供了一种可能的论证路径。
衍生作品的风险:一个更为严峻的挑战是,模型参数可能被视为其训练数据的侵权衍生品。 [注10] 尽管有观点认为模型训练类似于人类学习,属于“转换性使用”(transformative use),应构成合理使用 [注11] ,但当模型能够复现(即“记忆”并输出)其训练数据中的受版权保护内容时,这种观点便受到挑战。
(2) 专利
专利法保护的是新颖、创新且实用的技术方案。AI模型的算法、训练方法或独特的网络架构可能获得专利保护,但模型参数本身作为静态的数值集合,通常很难成为专利的客体。 [注12]
(3) 商业秘密
将模型参数作为商业秘密保护是一种常见策略。但与传统软件不同,其公开后的法律效果存在争议。对于软件而言,一旦源代码被公开,其设计思路与技术细节便一览无余,商业秘密地位随之丧失。然而,AI模型的权重参数本身对人类而言是不可读的、无意义的数值集合。即便权重被公开发布,其背后训练过程中形成的技术诀窍、数据处理技巧或独特的架构选择是否仍然构成受保护的商业秘密,是一个有待技术和法律实践进一步探索的前沿问题。
(4) 数据库权
这是欧盟特有的一种权利,旨在保护对数据库内容的获取、核实或呈现作出“实质性投资”的制作者。模型训练过程耗费巨大的计算资源,可被视为一种“实质性投资”。因此,有观点认为,由海量权重构成的参数文件可以被视为一个受特殊权利保护的数据库。但这同样面临争议,例如,权重的产生过程是“获取”已有数据还是“创造”全新数据,将直接影响到其是否可以享有数据库权利。 [注13]
2.OpenMDW的应对策略及其内在矛盾
面对上述法律模糊性,OpenMDW采取了一种务实但可能存在内在矛盾的策略。它并未试图解决权重究竟受何种知识产权保护的根本问题,而是在许可协议中列举了所有可能的权利类型(版权、专利、数据库权、商业秘密),并一揽子地授予许可,并且采取了非封闭式的列举方法。这种做法旨在为用户提供最大程度的合同确定性:无论未来法律如何发展,用户都已获得了相应的授权。
然而,这种合同层面的确定性是建立在法律基础的不确定性之上的。许可协议的价值主张是提供法律上的安全港,但这个港湾本身却建立在流沙之上。如果法院最终裁定模型参数在特定法域内不受任何知识产权保护,那么OpenMDW在该法域内的许可授权条款将失去意义。当然,OpenMDW的历史使命也是在当前的法律迷雾之中,点亮一盏明灯,待迷雾散去,模型的知识产权保护变得明确,市场上也自然会产生与之相适应的许可协议。
(二) 责任的边界:免责与侵权风险的分配
与大多数开源软件许可一样,OpenMDW包含了全面的免责条款。协议明确规定,“模型材料”以“按现状”(AS IS)的方式提供,不附带任何明示或默示的保证,并且在任何情况下,提供方均不对因使用“模型材料”而产生的任何索赔、损害或其他责任承担责任。这些条款旨在将模型性能缺陷、安全漏洞或使用模型造成损害的全部风险转移给下游用户。 [注14] 然而,这种彻底的风险转移策略在面对全球日益严格的AI监管和产品责任法律体系时,其法律效力同样受到了挑战。
1.与中国强制性法律的冲突
中国的法律体系对格式合同中的免责条款设有严格的限制,尤其是在涉及消费者权益和人身财产安全领域。
《中华人民共和国民法典》第五百零六条明确规定:“合同中造成对方人身损害的,或者因故意、重大过失造成对方财产损失的免责条款无效。”《中华人民共和国消费者权益保护法》进一步规定:“经营者不得以格式条款等方式,作出排除或者限制消费者权利、减轻或者免除经营者责任、加重消费者责任等对消费者不公平、不合理的规定,否则条款无效。”《中华人民共和国产品质量法》对生产者和销售者因产品缺陷造成人身、财产损害的,规定了严格的侵权责任。
因此,如果一个基于OpenMDW许可的模型被集成到面向消费者的应用中,并且由于模型的缺陷(如产生错误的医疗建议、控制自动驾驶汽车失误)导致用户人身伤害或重大财产损失,那么OpenMDW中的“AS IS”和“不承担责任”条款是否会因违反上述强制性法律规定而被中国法院认定为无效存在重大的不确定性。这无疑使得对外开源模型的许可方承担了很多不确定的风险。
2.与欧盟AI以及产品责任法规的抵触
欧盟通过《人工智能法案》(EU AI Act)和新修订的《产品责任指令》(Product Liability Directive, PLD)构建了一个全面的AI治理与责任框架。
《人工智能法案》采用风险分级管理方法,对“高风险AI系统”的“提供者”(provider)施加了一系列贯穿全生命周期的、不可转嫁的合规义务,包括建立风险管理体系、确保数据质量、备存技术文档、保障人类监督等。 [注15] 尤其是当模型足够强,欧盟监管部门可能将其认定为“具有系统性风险”,进而为其施加较为严格的义务,模型开发者可能无法简单凭借协议中的条款实现免责。
进一步的,新《产品责任指令》将软件(包括AI系统)明确纳入“产品”范畴,适用严格责任原则。这意味着,当存在缺陷的AI产品造成损害时,受害者无需证明生产者存在过错。 [注16] 该指令还特别考虑了AI的特性,将因模型自学习或网络安全漏洞导致的损害也纳入了生产者责任范围。
在欧盟的法律框架下,OpenMDW的免责条款在多大程度上能够免除模型发布者的责任,仍有待执法部门的进一步明确。
(三) 义务的转移:尽职调查责任的用户转嫁问题
OpenMDW许可协议要求:“您应自行负责清理可能适用于模型材料或其任何使用的任何其他人的权利,包括但不限于模型材料中包含或体现的任何人的版权或其他权利。”该条款试图将一项艰巨的法律义务完全转移给被许可方,但这对被许可方来说可能是完全不可行且难以实现的。
1.用户履行该义务的现实不可能性
该条款要求每一位使用者在利用模型材料前,都必须完成对其中所涉第三方知识产权的尽职调查和权利清理(IP clearance)。然而,对于现代大型AI模型而言,履行这一义务在实践中是完全不可能的。
首先,基础模型的训练数据集往往包含来自互联网的海量内容,其具体来源和构成通常是模型提供方的核心商业秘密,不会对外公开。用户无法获知模型究竟“学习”了哪些受版权保护的材料。
其次,AI模型的“黑箱”特性使得外界几乎无法通过技术手段逆向分析出模型参数与特定训练数据之间的对应关系。
最后,即便能够获知部分训练数据来源,对一个动辄包含数万亿数据点的庞大数据集进行全面的权利状态审查,即便目前世界各国已经出现模型训练合理使用的相关案例,但完成此类尽职调查所需的人力、财力和时间成本也是任何企业都无法承受的。唯一在理论上有可能完成这项工作的,只有最初收集数据并进行模型训练的提供方。
进一步的,与传统软件不同,软件的被许可方可以通过阅读源代码发现其中的瑕疵或法律风险,这样被许可方自行承担责任存在了一定的合理性。但针对AI模型来说,被许可方因缺乏有效手段对模型内部进行核查,OpenMDW的责任转嫁条款可能并不能当然有效。
2.条款效力的可抗辩性:以“不公平条款”理论为视角
将一项事实上不可能完成的义务强加于合同相对方,使得该条款的法律效力可能受到挑战。具体来说:
程序上的不公平 :OpenMDW作为一份标准化的许可协议,用户只能选择全盘接受或放弃使用,不存在任何谈判空间,这构成了典型的“格式条款”。同时,模型提供方与被许可方之间存在巨大的信息不对称(提供方掌握训练数据信息,用户则一无所知)。这些因素都构成了程序上的不公平。
实质上的不公平 :该条款的内容偏向一方。它将模型训练阶段可能产生的、巨大的、潜在的侵权风险(即AI行业的“版权债务”)完全转嫁给处于信息和能力最弱势地位的下游用户,而将最有能力控制和评估该风险的提供方完全免责,可能构成对被许可方的不公。但考虑到,OpenMDW本身作为开放模型许可协议的一种,许可方免费对外开放了其投入巨额资本训练出的模型,在此情况下,如何权衡许可方的利益以及被许可方责任,仍存在着很大的不确定性。
04
结论与展望
OpenMDW许可协议是应对人工智能时代法律挑战的一次重要且富有建设性的尝试。它借鉴了开源软件运动的成功经验,通过设计一个简洁、宽容且明确覆盖多种知识产权的框架,有效解决了传统软件许可在AI领域的适用性不足问题,为促进AI模型的开放与协作提供了宝贵的工具。
然而,本研究也揭示了OpenMDW及其所代表的纯粹宽容型许可模式所面临的三个深层次、悬而未决的法律挑战。首先,整个许可框架的基石——模型参数的知识产权属性——在全球范围内仍处于高度不确定的状态,这使得许可授权的法律基础尚不稳固。其次,协议中“按现状”提供和完全免责的条款,其效力在特定场景下可能受到挑战。最后,协议试图将知识产权清理这一在实践中几乎不可能完成的尽职调查义务完全转嫁给用户,其效力存疑。
这些挑战表明,源自软件世界的、以“责任完全转移”为核心的传统开源许可哲学,可能难以完全适应AI技术所带来的新型风险和复杂的价值链结构。AI模型,特别是被广泛应用的基础模型,已不再是简单的开发工具,而日益成为具备强大社会影响力的基础设施。其许可制度的设计,必须在促进创新自由与有效分配法律责任之间寻求更为精妙的平衡。
展望未来,人工智能模型的许可制度可能会朝着更加混合化、精细化的方向发展。对于立法者和司法机构而言,当务之急是尽快明确模型参数等AI核心要素的法律地位,考虑设立一种平衡各方利益的“准知识产权”(sui generis)保护制度,并为善意遵循行业最佳实践的AI开发者提供“安全港”保护,以激励负责任的创新。AI许可协议的演进,将是开源社区文化、商业利益驱动和公共政策监管三方力量持续博弈与融合的过程,其发展值得法律界与科技界持续关注。

注释及参考文献
上下滑动查看全部
[1] See Matt White: The Open Source Legacy and AI’s Licensing Challenge, 2025.5.22, https://www.linuxfoundation.org/blog/the-open-source-legacy-and-ais-licensing-challenge
[2] See Liran Tal: Open Source Licenses: Types and Comparison, https://snyk.io/articles/open-source-licenses/
[3] 前引1.
[4] See Responsible AI Licenses: Responsible AI Licenses, https://www.licenses.ai/
[5] See Sid Sijbrandij: AI weights are not open "source", 2023.1.27, https://www.opencoreventures.com/blog/ai-weights-are-not-open-source
[6] See https://openmdw.ai/license/
[7] See U.S. Copyright Office: Copyright and Artificial Intelligence, Part 2 Copyrightability Report, https://www.copyright.gov/ai/Copyright-and-Artificial-Intelligence-Part-2-Copyrightability-Report.pdf
[8] See Nuno Sousa e Silva: Are AI models’ weights protected databases?, 2024.1.18, https://legalblogs.wolterskluwer.com/copyright-blog/are-ai-models-weights-protected-databases/
[9] See Andrew Marble: Copyright for AI Model Weights, 2023.7.10, https://www.marble.onl/posts/model_weight_copyrights.html
[10] Hassan Uriostegui: AI-Copyright Weights: A New Frontier in Intellectual Property Law, 2023.6.10, https://medium.com/twinchat/ai-copyright-weights-a-new-frontier-in-intellectual-property-law-d8ee1b6c55ee
[11] 前引10。
[12] Nxp: Intellectual Property Aspects Of Machine Learning, https://www.nxp.com/docs/en/white-paper/IPMLWP.pdf
[13] 前引8。
[14] Jess H. Drabkin Gerard M. Stegmaier: The key features of AI licensing, https://www.reedsmith.com/en/perspectives/ai-in-entertainment-and-media/2024/02/the-key-features-of-ai-licensing
[15] High-level summary of the AI Act, https://artificialintelligenceact.eu/high-level-summary/
[16] Taylor Wessing: New product liability risks for AI products, https://www.taylorwessing.com/en/synapse/2025/ai-in-life-sciences/new-product-liability-risks-for-ai-products

作者简介

陶冶
国浩南京合伙人
业务领域:软件和互联网、人工智能
邮箱:taoye@grandall.com.cn

相关阅读
【 特别声明:本篇文章所阐述和说明的观点仅代表作者本人意见,仅供参考和交流,不代表本所或其律师出具的任何形式之法律意见或建议。】








