律页科技 Logo
首页
解决方案
效能律所私有AI中枢AI 智能作业系统
品牌AI影响力升级数字人代运营
资源观点
资源文书资源法律导航
观点法律社区律页声音
有关律页
团队介绍加入律页联系律页
律页科技 Logo
首页
律页

产品与解决方案

首页律所私有AI中枢AI 智能作业系统AI 影响力升级 (GEO)AI数字人代运营

资源与观点

文书资源法律导航法律社区律页声音

关于律页

团队介绍加入律页联系律页

用户协议

数据使用声明Cookie使用政策文档发布协议隐私条款用户服务条款

关注我们

律页公众号

律页公众号

律页微博

律页微博

2023-2026 北京律页网络科技有限公司版权所有ICP经营许可 京B2-20254773京ICP备2023007930号-4京公网安备11010502056436号
北京律页网络科技有限公司 联系方式: 400-966-9558地址: 北京市朝阳区新华科技大厦13层1316室
全部问题
话题
话题
标签
榜单

张鹏飞|企业数据税的法理重构与制度设计

行业观点
专业人士
发表于 02 月 14 日修改于 02 月 14 日

来源:上海市法学会 东方法学

发布日期:2026年02月14日    


数字经济时代,聚合数据已成为影响资源配置的关键要素。现有法律框架将其视为企业私有财产,这一定性面临多重挑战,数据使用的外部影响难以回应,用户对数据价值的贡献未获承认,私法工具的规制能力也显不足。聚合数据兼具公共价值与市场属性,宜界定为准公共资源,企业角色相应地从所有者转为特许使用者。据此,数据税不宜套用传统税收框架,而应定性为资源特许权使用费,以反映用户、企业、政府共同参与数据价值创造这一事实。税制设计上,可构建数据使用规模指数作为计税依据,将月活跃用户数、数据处理量、数据敏感度等指标纳入考量,同时采用累进税率,以规避数据价值评估的技术难题,并兼顾效率与公平。

一、问题的提出

数字经济时代,数据在价值创造中发挥着重要作用,但真正具有价值的并非零散的个体数据,而是经过汇集、处理和分析后形成的“聚合数据”。所谓聚合数据,是指将大量用户的行为记录、交易信息、社交互动等原始数据,通过技术手段整合后形成的数据集合。它属于《数据安全法》所界定的“数据”,但有其特殊性,即经过规模化整合,整体价值远超各部分之和。同时,它与《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》所区分的“数据资源”和“数据资产”亦有交叉,但不等同。数据资源侧重于数据的静态存量,是对原始数据进行清洗、整理、归类后的“有序集合”,数据资产侧重于数据的经济性,而聚合数据则侧重于规模化整合后的功能质变,即从记录工具转化为预测工具,从而具备揭示群体行为模式、预测社会趋势、影响资源配置的能力。然而,这种价值在分配上却呈现出显著的不对称性。少数科技巨头凭借对聚合数据的实际控制,获取了数字经济的绝大部分红利。与之形成鲜明对比的是,作为原始数据源泉的亿万用户和提供基础设施的政府,却在价值分配中被边缘化。这种失衡不仅加剧了数字鸿沟和贫富分化,更在一定程度上动摇了数字经济可持续发展的社会基础,也构成了本文论证聚合数据应受公法规制的事实基础。

面对这一时代性挑战,学界和实务界展开了多方面探索,但也遭遇了困境。理论研究主要沿着数据产权配置、数据交易税收、数据价值评估三条路径展开,实践层面则展开了政策尝试。欧洲推行的数字服务税因其单边性质,引发了国际贸易争端,美国对实施该税的12个国家启动301调查,并威胁对其征收报复性关税。经济合作与发展组织(OECD)主导的双支柱方案虽致力于构建全球共识,但在税收联结点和利润分配规则等核心议题上仍存在根本性分歧。上述努力之所以收效甚微,根源在于它们试图以工业时代的税收逻辑规制信息时代的新型资源。相应地,现有研究的不足集中体现在以下几个层面。在产权定性上,既有研究未能突破私有财产与公共物品的二元框架,而聚合数据恰恰兼具私人投入与公共贡献的双重属性,这一混合特征被长期忽视。在征税逻辑上,无论是所得税还是流转税的传统路径,都未能充分认识数据作为战略资源的独特性质。在制度设计上,学界尚未提出一套既能准确反映数据使用强度又能有效规避价值评估困境的可操作方案。

上述困境表明,有必要从私法视野转向公法框架、从征税逻辑转向资源主权逻辑。笔者认为,可行的思路是将聚合数据界定为一种准公共资源,将企业重新定位为特许使用者而非所有者,并据此将数据税定性为资源特许权使用费。在此基础上,进一步设计以数据使用规模为核心的税制方案。这种设计在技术上规避了数据价值评估的困境,在制度上亦有助于实现激励相容,既能保护企业的创新动力,又能兼顾公共利益。

二、数据财产属性的传统范式及其困境

当前,学界将数据纳入规制框架的主要路径,是将其类比为企业私有财产或知识产权加以保护。这一范式以经典财产权理论为基础,旨在为企业的数据收集、存储与处理活动提供法律激励与排他性保护。在此框架下,数据被定性为无形资产,企业得以对其进行许可与转让,亦可援引商业秘密条款排斥他人的非法获取,由此形成数据参与市场交易的早期规则。然而,当数据生产的规模发生结构性变迁后,这一基于个体权利与有形财产逻辑构建的范式开始面临正当性危机。

(一)

私权框架无力回应外部影响

在功能定位上,传统私有财产权范式受制于其权利本位的内在逻辑,难以有效回应数据所产生的外部性问题。外部性作为经济学的核心概念,旨在刻画市场交易中未被价格机制内部化,进而对第三方产生非计价性盈亏影响的正、负溢出效应。在传统财产权理论的分析框架中,此类外部影响可通过明晰产权与市场交易机制加以内部化。然而,当这一理论框架被适用于数据领域时,其解释力显现出明显不足。

私有财产权制度的理论基础可追溯至科斯定理。依该定理,在交易成本足够低的条件下,无论产权如何初始配置,市场机制均可通过自愿交易实现资源的优化配置。但科斯定理的有效性取决于若干前提假设,即利益相关方数量有限且身份可识别、影响范围明确可界定、交易成本维持在合理水平。数据所产生的外部影响,恰恰突破了上述假设的适用边界。2018年的Facebook剑桥分析事件即是典型例证,该案中,约8700万用户的个人数据被不当用于政治广告的精准投放。该事件的影响不仅限于数据泄露本身,更在于其通过操纵信息流动、塑造认知偏见、干预投票行为,使数据的不当使用直接介入了民主选举这一宪政体制的核心机制。其后果已非个体隐私侵害或商业不正当竞争所能涵括,而是演化为全社会须共同承受的制度性风险。

与数据可能产生的负外部性类似,其积极影响往往突破个体范畴而呈现明显的公共价值。谷歌通过对数十亿条搜索查询记录实施分析处理,关于H1N1流感传播趋势的预测结果得以生成,该预测较美国疾控中心发布的官方报告提前约两周时间完成。这一实例表明,依托大数据技术构建的公共卫生预警机制,其受益主体已超越企业自身及用户群体边界,扩展至社会整体健康治理架构之中。新冠疫情时期广泛推行的健康码系统同样具有典型意义,它将碎片化个人健康信息进行整合转化后,成为可供疫情防控全局使用的公共资源。这些实践表明,数据创造的价值与潜在风险均具备外溢特性,传统产权制度框架难以完全覆盖其影响范围。

面对这种外部影响,科斯定理在数据领域难以适用。首要表现为利益相关方难以界定。数字平台在运营过程中,数据、算法与用户之间形成复杂的互动关系,数据价值不是一次性释放的,而是随着技术迭代和应用场景变化持续演进。数据使用的影响往往会扩散,当前的数据收集行为可能在若干年后通过新的算法技术,影响到当下尚未预见的群体。换言之,“谁是利益相关方”这个问题本身在变化,事前难以确定。其次是影响范围难以界定。数据使用的后果往往涉及隐私、自主性、民主参与、社会信任等多个维度。有学者指出,数据侵权产生的多样性损害难以通过统一模式进行认定,其损害范畴已从现实的财产损失延伸至后续损害导致的风险与社会评价的降低。这使得数据侵权的边界呈现出模糊且持续扩展的态势,与传统产权纠纷中“甲侵害乙之产权”的简单结构存在明显差异。最后是交易成本过高。产权理论强调交易成本是影响市场资源配置的重要因素,而在数据领域,这种成本已接近极限。即使能够识别所有利益相关方,与海量用户协商数据使用条款的成本也足以阻碍任何市场化方案的实施。上述特征表明,数据外部性超越了产权明晰和市场交易所能解决问题的范畴,私有财产权框架的理论前提在此受到挑战。

(二)

对用户贡献的结构性忽视

在外部性问题之外,传统私有财产权范式在价值论层面亦存在缺陷,未能充分体现用户在数据价值创造中的贡献。这一问题不仅导致理论解释上的困难,更造成权利配置上的失衡。

传统财产权理论的正当性基础植根于洛克的劳动财产论。在《政府论》中,洛克提出了影响深远的命题,即当个人将其劳动混合于自然资源时,便获得了对该资源的所有权。这一理论为现代财产权制度提供了道德基础,其核心逻辑在于,财产权应当归属于那些通过劳动创造价值的主体。沿循这一逻辑,数字平台企业主张其对数据享有财产权似乎具有表面上的合理性,即企业投入了巨额资本建设技术基础设施,雇佣了大量工程师开发算法系统,承担了数据存储和处理的运营成本,因此理应享有数据资产的所有权。

然而,将洛克理论应用于数据领域存在三重根本性缺陷。第一,洛克的劳动混合论预设了一个“自然状态”下的无主物作为劳动对象,但数据并非无主的自然资源,而是用户行为的直接产物。每一条搜索记录、每一次点击、每一笔交易,其原初形态都是用户主动生成的行为痕迹。企业的“劳动”并非作用于无主之物,而是作用于用户已然创造的信息素材。这种对原始素材来源的忽视,导致了数据三权分置架构在逻辑起点上便存在权利正当性的隐忧。第二,洛克理论以劳动的“混合”为产权取得的关键,但在数据领域,企业的技术加工与用户的行为生成之间并非简单的混合关系,而是相互依存的共生结构。若无用户持续不断地生产原始数据,企业的算法便失去了运转的基础;若无企业的技术整合,用户的碎片化行为亦难以转化为系统性价值。这种共生性使得任何单方面的产权主张都缺乏充分的道德基础。第三,也是更为根本的一点,洛克理论暗含一项“足够且同样好”的但书条款,即个人的财产占取不得损害他人获取同等资源的机会。然而,数据的网络效应导致“赢家通吃”的市场格局。先发平台凭借数据积累形成的竞争优势具有自我强化的特性,后来者即便付出同等劳动,亦难以获得相应的回报。这种结构性不平等使数据收益分配在事实上偏离了劳动的补偿逻辑,从而陷入洛克式财产权合法性的悖论。

若进一步考察数据价值的实际生成过程,可以发现一种有别于传统要素投入的共创模式:用户的行为贡献构成价值创造的基础性要素。用户在平台上的浏览、搜索、点击、评论、交易等各类活动,均在持续生产原始数据。这些分散的个体行为经由聚合,形成平台运营所依赖的数据资源池。假设某社交平台的全部用户于同一时刻停止使用,则无论该平台的算法多么先进、服务器多么强大,其商业价值将即刻丧失;反之,若仅是技术系统发生故障,只要用户基础仍在,平台通常可借助技术更替恢复运营。相较之下,可见用户贡献具有不可替代性,而技术投入则在相当程度上具有可替代性。

这种共创模式在法理上的意义需要从分配正义的视角加以审视。亚里士多德在《尼各马可伦理学》中提出的分配正义原则强调,正义应当按照各方的贡献比例进行分配。罗尔斯在《正义论》中进一步发展了这一思想,主张社会合作所产生的利益应当在参与者之间公平分配,尤其是差别原则要求任何不平等的安排都必须有利于最不利者。依据这些正义理论,用户为数据价值创造作出了基础性贡献,在权利配置与利益分配中完全忽视其地位,便构成结构性不正义。传统私有财产权范式恰恰系统性地遮蔽了这一贡献结构,将数据价值的全部权益归于企业,这是其正当性危机的深层根源。

(三)

私法工具失灵

传统私有财产权范式面临的第三重困境,是其赖以运作的具体私法工具在数据治理领域的失灵。当数据的规模、影响和战略价值超越私人事务的边界,商业秘密法、合同法、侵权法等私法机制便暴露出一定的局限性。

商业秘密保护是企业主张数据财产权的首选法律工具。根据各国商业秘密法的一般规定,符合秘密性、价值性和保密措施三要件的信息可获得法律保护。然而,将这一框架应用于数据领域时,会遭遇多重困境。首先,秘密性要件与数据的流通本性存在内在冲突。数据的价值恰恰在于流动和使用,而非静态保存。当企业为了实现数据价值而不得不与第三方共享数据时,商业秘密的保护基础便趋于瓦解。其次,商业秘密的保护对象是“信息”本身,而非信息所蕴含的“洞察”。当企业A利用数据训练出一个预测模型,企业B通过独立研发得出相似模型时,后者并不构成对商业秘密的侵犯,因为这一过程中被保护的是原始数据,而非从数据中提取的规律。这种保护的有限性,使得商业秘密法难以应对数据时代的核心竞争形态。最后,商业秘密法的救济机制以事后追责为主,对于数据泄露可能造成的系统性风险缺乏预防能力。

合同法构成数据交易的基本法律框架,但其在数据治理领域的效用同样受到制约。合同法的运作依赖于当事人地位平等、意思表示自由、信息对称充分等核心假设。在数字平台与用户的关系中,上述假设难以成立。用户面对冗长晦涩的隐私政策,实际上既无协商能力,亦无拒绝空间,只能在全盘接受与放弃使用之间作出选择。此种格式条款虽在形式上具备合同成立的要件,却使意思自治原则流于空洞。更值得关注的是合同相对性原则带来的局限。依据该原则,合同效力仅及于缔约双方,但数据使用的影响往往溢出合同关系,波及不特定第三人乃至社会公众。当平台依据用户协议收集数据并将其用于算法训练时,由此引发的歧视性定价或信息操纵,其受害者往往并非原合同的当事人。对于这种超越合同相对性的系统性影响,合同法难以提供有效的规制手段。

侵权法作为私法体系的最后防线,理论上可以为数据滥用的受害者提供救济。然而,实践中侵权法在数据领域同样面临结构性困境。第一,损害认定的困难。数据滥用造成的损害往往是弥散性的、累积性的、难以量化的。当用户因数据画像而遭受价格歧视时,其甚至无法察觉自己受到了损害,遑论证明损害的存在和程度。第二,因果关系的模糊。从数据收集到最终损害,往往经历算法处理、模型训练、决策应用等多个环节,传统的因果关系认定规则难以适用。第三,举证责任过重。侵权法以过错责任为一般原则,但在算法决策的场景下,企业往往可以主张其遵循了行业惯例、采取了合理措施,从而规避过错认定。即使采用严格责任,证明特定数据使用行为与特定损害之间的关联,仍近乎不可能。

传统私法工具在数据治理中的失灵并非偶然。遵循“利益说”的逻辑,私法以保护私人利益、调整私人关系为宗旨,制度设计上以个体权利为本位,以事后救济为主要手段。然而,当数据的规模突破临界点后,其性质便溢出私法所能涵盖的范围。数据所牵涉的利益已不再局限于企业与用户之间的分配问题,而是扩展至社会信息生态、市场竞争秩序乃至国家数据安全等公共领域。相关的制度实践印证了这一判断。2020年中国将数据列为第五大生产要素,欧盟相继出台《数据治理法》与《数据法》构建专门规范体系,美国则对涉及敏感数据的外资并购启动国家安全审查程序。上述立法与政策动向表明,数据治理的制度需求已超越私法所能承载的范畴,公法工具的引入势在必行。

综上,将数据限定在私有财产的传统法律框架内,存在范式上的错位。这一框架因循工业时代的财产观念,在面对数字时代的挑战时,已在三个层面暴露出内在紧张关系,即在功能定位上,外部性难以内化;在价值分配上,用户贡献被忽视;在制度工具上,私法机制的规制效力不足。这些困境的日益凸显表明,应当超越传统私法视野,探索一种能够平衡个体激励与公共利益的新法理范式。

三、数据作为“准公共资源”的法理新解

传统的私有财产权范式在理论与实践层面遭遇困境,有必要探索新的法理框架。这一新框架的重点在于调整数据的法律定位,将聚合数据理解为一种兼具公共价值与市场属性的准公共资源。本部分的论证分三步展开:第一步追溯数据从个体信息向战略资源的演变过程,揭示其公共属性的客观基础。第二步界定聚合数据作为准公共资源的独特属性。第三步在前述分析的基础上,重新界定企业在数据价值链中的法律角色,为后续制度设计提供法理依据。

(一)

数据从个体信息到战略资源的质变

在数字经济时代,真正的权力转移并非发生在传统的政治或经济领域,而是隐匿在算法决策权与数据的占有之中。当数据开始决定谁能获得贷款、什么商品被推送、哪些信息可以传播时,掌控数据的主体实际上就掌控了一种新型的分配权力,其所分配的不是物质财富,而是机会、注意力和可能性。这种权力的特殊之处在于,不是通过强制而是通过算法运作,不是依靠法律而是依靠代码执行,其看似中立客观,实则深刻地重塑着社会的资源配置格局。

然而,数据并非天然具备这种权力属性。在个体信息状态下,数据不过是分散的、静态的、低价值的记录符号。这些碎片化的信息既无法相互关联,也难以产生预测能力,更谈不上影响资源配置。因此,这种新型分配权力的形成并非一蹴而就,而是遵循着一个从量变到质变的演进路径。当我们审视数据是如何从零散的信息碎片演变为支配性的权力工具时,会发现其中存在两个关键的转化机制:首先是聚合数据所产生的“涌现效应”,使其获得超越个体总和的预测能力;其次是这种价值被特定主体垄断后形成的“数据护城河”,其将能力优势转化为结构性的支配地位。正是这两重机制的叠加,完成了数据从信息到权力的跃迁。

首先,在价值生成层面,数据聚合催生了一种奇特的“涌现效应”,即其整体价值远超个体价值的算术总和。在个体信息时代,数据的价值是线性累加的,一千条用户记录的价值约等于一条记录的一千倍,其功能局限于描述已发生的事实。然而,当亿万条这样的数据被系统性地汇聚,便可能发生性质上的转变。以全球领先的流媒体平台Netflix为例,其推荐系统正是这种涌现效应的典型体现。Netflix通过整合超过2亿用户的观看历史、暂停时刻、重播片段、搜索记录等海量行为数据,构建出复杂的用户偏好模型。这些点击和停顿,在被聚合与算法加工后,能够精准预测用户尚未意识到的观影偏好。这种预见性并非源于任何单条数据质量的提升,而是源于海量数据整合后算法对隐藏模式的精准捕捉。

值得注意的是,这种涌现效应的产生需要满足特定的条件组合。质变的临界点包含三个要素:数据规模达到能够覆盖目标群体行为模式的量级;算法能力足以识别复杂的非线性关系;市场地位使得数据优势能够转化为实际的商业价值。一家仅有数万用户的电商平台,即便拥有先进的推荐算法,其预测能力依然有限;某些机构虽然积累了海量数据,但由于缺乏相应的技术能力和应用场景,这些数据可能处于未被充分利用的状态。只有当这些条件同时满足时,量变才会引发质变。数据会在达到临界规模后,从离散的信息点转变为连续的知识网络,从单纯具有记录功能跃升到同时具有预测功能。

其次,这种涌现效应一旦形成并被特定主体掌控,便可能转化为重塑市场结构的竞争壁垒。当领先者成功将数据优势转化为产品优势时,一个自我强化的循环便开始运转。更多的数据带来更好的算法表现,更好的用户体验吸引更多用户,从而产生更多的数据。这种马太效应在数字时代被显著放大。市场研究显示,TikTok的用户月均使用时长已超过30小时,在主流社交媒体平台中处于领先地位,这在一定程度上反映了其推荐算法在维持用户黏性上的效率。与此同时,谷歌通过处理全球超过90%的搜索查询,获得了显著的数据优势。这种海量、实时的用户反馈,使其能够持续优化搜索算法,进而在搜索结果的相关性、准确性和即时性上,构筑竞争对手难以追赶的质量优势。

这种数据形成的竞争壁垒,与传统的市场优势有所不同。品牌可以通过营销实现重塑,成本可以通过规模化实现追赶,技术可以通过研发实现突破,但数据壁垒具有独特的累积性和自强化特征。历史数据无法回溯获取,先发优势会持续巩固。当这种优势达到一定程度,平台便不仅是市场的参与者,还可能成为市场规则的影响者。数字平台通过算法在相当程度上决定着什么信息可以被看见、商品以什么价格呈现、信贷资源如何分配,乃至人们的社交网络如何构建。这已经超出普通商业竞争的范畴,具有一定的准公共性质。当一个私人实体能够单方面影响大量用户的信息环境和选择空间时,其所掌控的数据就不再是简单的企业资产,而是一种影响广泛的战略性资源,即一种虽由私人控制,却会对公共福祉产生系统性影响的特殊资源。

因此,从个体信息到战略资源,这一质变过程呈现出三个方面的转变。在价值维度上,从线性累加转向涌现增值;在功能维度上,从被动记录转向主动预测;在权力维度上,从分散的市场要素转向集中的结构性力量。这一转变表明,在算法时代,数据资源的掌控可能成为一种新的权力来源,这一转变构成重新审视聚合数据法律属性的逻辑起点。

(二)

“准公共资源”的属性辨析

前文已论证,聚合数据在价值上已演变为一种战略性资源。然而,要为其寻找适配的法律治理框架,须首先对其法律属性加以澄清。有效的治理体系应建立在对规制对象准确定性的基础之上。当某一资产系统性地展现出超越传统分类的混合属性时,强行套用既有范畴可能会导致治理失效。因此,面对聚合数据这一新型资源,探索反映其独特性质的分类方式,成为制度设计的前提性工作。为准确把握聚合数据的特征,可借用萨缪尔森等学者确立的分析框架。该框架以“竞争性”和“排他性”为二维坐标,将物品划分为四种基本形态。将聚合数据置于此框架下审视时,可以发现其呈现出跨象限的复杂特征。

首先,聚合数据在使用上具有公共物品的核心特征,即非竞争性。这构成它与传统物理资源的根本差异。一份石油一旦被炼油厂A使用,便无法再被炼油厂B使用,这是典型的资源消耗。聚合数据则不同。以2023年北京市开放的实时交通流量数据为例,依托北京市公共数据专区的授权运营机制,该数据能够同时被高德地图用于路线优化,被滴滴用于运力调配,被城市规划院用于交通模拟,被环保部门用于排放监测。数据在被多方使用后,其信息内容并未减损,反而因多维度的应用产生了更大的社会价值。这一规律在众多领域可以得到验证,从服务于疾病预防与药物研发的医疗健康数据,到指导农业、航空、旅游等产业的气象数据,再到被零售、金融、物流等部门共同使用的消费数据。数据的价值不会因共享而减损,反而可能因应用的多元化而增值。这种特性与知识、算法等信息产品相似,是其非竞争性本质的体现。

其次,在现实的商业实践中,这种理想的开放性受到技术与法律壁垒的限制,从而呈现出一种更为复杂的“准排他性”。一方面,与国防、灯塔这类纯公共物品不同,数据在物理层面具有可排他性。加密算法、访问控制、接口限制等技术手段,能够有效阻止未经授权的访问,将数据保护在各自的系统之中。另一方面,数据使用所产生的影响却具有非排他性。当平台利用其掌控的数据进行定价歧视、信息投放或信用评级时,其产生的市场扭曲、信息茧房、社会分层等后果,会弥散到整个社会,影响到数据主体之外的群体。外卖平台算法对骑手劳动的影响溢出到劳动权益和城市交通安全领域;短视频平台推荐机制引发青少年沉迷问题,不仅触及个体权利保护,其产生的教育焦虑、认知偏差等社会影响更已远超平台用户本身。因此,数据领域呈现出一个独特的现象,即数据控制者能够排他地占有数据本身,却难以排他地控制数据使用所产生的外部效应。这正是准排他性的内涵所在。

这种介于开放与封闭之间的状态,不仅使数据的产权边界趋于模糊,更在治理层面带来了挑战。在数据利用领域,虽无物理消耗,但数据的无序竞争同样可能导致公共价值的损耗。当前所面临的用户隐私焦虑上升、数据泄露事件频发、社会信任度下降等现象,在一定程度上源于平台在商业驱动下的过度数据采集和滥用。从数据安全审查事件到人工智能应用引发的数据合规争议,这一轨迹显示了数据治理问题的紧迫性。正如奥斯特罗姆在其研究中所指出的,共有池塘资源的可持续利用需要明确的规则、有效的监督和分级的制裁机制。这一观点对于数据治理同样具有参考价值。

上述分析指向一个结论,即聚合数据可被界定为一种独特的“准公共资源”。这一定性并非概念游戏,而是一次法理上的澄清,其中“准”字承载着关键的规范意义。在概念谱系上,准公共资源区别于经济学中的纯公共物品与共有资源。纯公共物品如国防、灯塔,兼具非竞争性与非排他性,而聚合数据虽具非竞争性,却可通过技术手段实现排他控制,故非纯粹意义上的公共物品。共有资源如公海渔场、公共牧场,虽具非排他性,却因竞争性消耗而面临枯竭风险;而聚合数据不存在物理消耗,其治理难题体现为信任侵蚀而非资源耗尽。正是这种非典型的混合属性,使“准”字成为必要的限定。这一定性系统概括了聚合数据的三重面向:其非竞争性赋予了它服务公共利益的潜力,体现出公共物品的属性;其准排他性为市场主体的创新投入提供了必要的回报空间,呈现出混合产权的特征;而其公地悲剧风险则要求公共干预与监管,凸显出公共治理的必要性。

在权属层面,准公共资源定性并非主张数据应归国家所有,这与宪法规定的自然资源国家所有权存在本质区别。矿藏、水流等自然资源的国家所有,是基于资源的先在性和稀缺性而确立的初始产权安排。依“公权说”之见,此类资源国家所有权本质上是“国家支配国有资源的财产性权力”,表现为一种“具有支配性内容和功能的管理权”。而数据的原初生成依赖于用户行为,其产权基础是分散的、多元的、动态形成的,不存在一个先验的自然状态可供国家主张所有权。因此,准公共性强调的并非权属归公,而是功能上的公共性。聚合数据在事实上产生了公共物品的效果与公共风险,因而需要公共治理的介入。在治理层面,“准”字标识的是一种介于纯粹市场调节与完全行政管制之间的混合治理模式。它既承认企业在数据收集、加工、应用中投入的资本与劳动应获得合理回报,又要求企业承担与其数据控制力相称的公共责任。这种承认私益、课以公责的制度安排,正是准公共资源区别于私有财产和公有财产的特征。

将聚合数据界定为准公共资源,意味着应当摒弃纯粹私有化或公有化的简单思路,转而设计一种能够兼顾公共价值、市场激励与公共监管的治理框架,采取特许授权、有偿使用、收益共享、责任共担等制度安排。这一定性,既是构建聚合数据治理制度的逻辑起点,也是后文论证特许使用模式的法理基础。

(三)

企业从数据所有者到特许使用者的角色重塑

前文已论证,聚合数据作为一种兼具多重属性的准公共资源,其治理需要相应的制度安排。由此引出一个核心问题,即那些实际掌控和开发这些准公共资源的企业,其法律角色应当如何界定?如前所述,数据价值的创造呈现出用户贡献与企业投入相互依存的共生结构。这种双重贡献的现实决定了任何简单的权利归属方案都将面临困难。完全的私有化忽视用户的基础性贡献,完全的公有化则可能抑制企业的创新动力。如何在两者之间寻求平衡,成为制度设计需要回应的问题。

现代产权理论为理解数据资源的权利配置提供了有益视角。产权并非对物的单一支配,而是一组权利的集合。这种认识有助于超越数据权属中非公即私的简单二分,进而探索更具灵活性的制度安排。具体而言,可以在承认数据资源公共属性的同时,依法保护企业基于其实质性投入所形成的开发与利用利益。对权利进行分层配置,既尊重数据价值创造过程的复杂性,也为设计兼顾各方诉求的治理制度留下余地,特许权模式或可为此提供参照。盐铁专营、铁路电信特许、矿产开采许可,这些制度安排虽出现在不同历史时期,却有共同的逻辑:当一种资源因战略重要性或外部性而具备准公共属性时,特许经营便成为治理的可选方案。即政府保留对关键资源的所有权与控制权,同时引入市场机制激励私营部门提升效率,公共利益与市场效率由此得以兼顾。数据领域可以借鉴这一思路。企业大规模开发利用数据资源,在性质上类似于对准公共物品进行商业化使用。开采矿产需要许可,使用无线电频谱需要牌照;对数据开展实质性商业开发的企业,同样可以被定位为特许使用者。企业使用数据的资格并非与生俱来,而是经由法律程序获得授权。授权机制的要义不在于限制创新,而在于厘清权责,让企业对制度环境有稳定的预期。

当然,数据的特有属性决定了需要对传统特许模式加以调整。与具有天然排他性和消耗性的自然资源不同,数据可以被多个主体共享而不减损其价值。因此,数据领域的特许不应是排他性的垄断授权,而应是开放性、竞争性的准入管理。符合法定条件的多家企业均可获得授权,但须统一履行保护个人信息、维护数据安全、遵守竞争秩序以及支付合理对价等公共义务。电信行业的发展历程为此提供了参照。该行业从独家垄断走向多家特许经营,表明妥善设计的特许制度非但不会阻碍技术发展,反而可能促进服务创新。在具体制度设计上,可遵循比例原则,根据数据处理活动的风险高低与公共影响大小,实施差异化的管理策略。对于风险较低的一般数据活动,可采取备案等简易程序;对于涉及大量个人数据或敏感信息的处理行为,则应实行较严格的许可管理;而对于具有市场支配地位的大型平台,有必要参照公用事业进行专门监管。这种分层治理的思路,意在实现精准规制,避免监管资源的错配。

从数据所有者到特许使用者的概念转变,意味着数字时代企业法律角色与社会责任的重新界定。企业不再被单纯视为数据的完全支配者,而是在社会授权与监督之下,对具有公共属性的数据资源进行开发利用的受托主体。这一角色定位的调整,为探索以特许权使用费为形式的数据资源税制度提供了法理依据。

四、将数据税定性为“资源特许权使用费”的正当性

经由前文的法理分析,聚合数据作为一种准公共资源、企业作为其特许使用者的法律定位已经明确。这一定性意味着,企业对数据的使用并非基于所有权的当然权能,而是源于对社会性资源的特许取用,因此为其支付相应对价便具有法理上的正当性。问题在于,此种对价应采取何种法律形式。是将其纳入既有的以流转额或利润为税基的税种框架,还是为其设定一种更能体现上述法理逻辑的独立形式?本章的核心任务在于论证:将这种对价定性为资源特许权使用费,较其他税收形式更具制度合理性。

(一)

从征税逻辑到主权逻辑

当前国际数字税收改革面临的困境,其根源并非技术细节的不完善,而在于既有方案仍囿于工业时代的征税思维,试图以此规制信息时代的价值流动。这种认知错位所导致的制度失灵,在数字服务税(DST)的实践中表现得较为明显。自2019年法国率先开征数字服务税以来,已有超过30个国家推出或正在酝酿类似税制。这一系列单边制度实践反映了各国面对税基侵蚀时的普遍焦虑。然而,DST在制度构造上存在若干难以克服的缺陷。

首先,法理基础不足。DST本质上是针对特定数字服务营业额征收的流转税,这一设计面临两方面的理论困境。其一,征税对象的选择性缺乏充分依据:为何仅对搜索引擎、社交媒体、在线市场等特定服务征税,而不涉及其他同样依赖数据的行业?这种选择性征税有违税收中性原则。其二,以营业额而非利润作为税基,偏离了所得税量能课税的基本原则。一家亏损但营收较大的初创企业,可能承担比盈利企业更重的税负,这在税收公平层面难以自洽。这种理论上的脆弱性亦反映在各国立法的规范设计中。无论是法国还是英国的数字服务税立法,文本中均包含“日落条款”,即一旦OECD主导的全球解决方案达成,本国DST将自动废止。这种过渡性定位本身即表明:DST并非理想的长期制度安排,而是国际共识缺失情况下的权宜之计。

其次,在执行层面,基于营业额的征税模式亦有其局限。跨国数字企业通常拥有复杂的组织架构,可借助转移定价安排调整收入在不同税收管辖区的确认。较为典型的操作是,企业将算法、品牌、用户数据库等无形资产置于低税率国家的子公司名下,再以支付特许权使用费的形式将收入转移出去。欧盟委员会的数据显示,数字企业的平均有效税率约为9.5%,而传统企业约为23.2%。数字服务税开征后,这一差距并未显著收窄。

最后,国际层面的争议更难以化解。数字服务税系各国单边立法的产物,难免带有贸易保护的色彩。当征税门槛和税率设计指向特定国家的科技企业时,贸易摩擦就会随之而来。美国贸易代表办公室在其立场文件中明确表示,数字服务税“不公平地针对美国企业”,构成“歧视性贸易壁垒”。这一判断触发了美国《1974年贸易法》第301条款的适用。2019年至2023年间,美国对法国、英国、意大利等12个实施DST的国家启动301调查,并威胁将对其征收报复性关税。原本旨在维护税收公平的DST,反而引发贸易摩擦,这在一定程度上反映了征税逻辑的内在矛盾。

面对上述困境,需要考虑一种不同的思路,即从基于税收管辖权的征税逻辑,转向基于资源主权的管理逻辑。这一转换有其历史基础与法理支撑。资源主权原则是现代国际法的重要组成部分。1962年联合国大会第1803号决议《关于自然资源永久主权的宣言》明确宣告,各国对其自然财富和资源享有永久主权,须按照国家发展和人民福祉的利益来行使。这一原则经过数十年的国际实践,已成为习惯国际法的一部分。从北海大陆架案所确立的“自然延伸”原则,到渔业管辖权案对“优惠权利”的肯认,国际法院的一系列判例都明确了主权国家对其管辖范围内资源享有管理与收益的合法性。将这一法律原则延伸至数据领域,具有一定的逻辑基础。数据虽具有无形性和流动性,但其产生具有明确的地域性。每一条数据都源于特定地理位置的用户行为,体现了特定社会群体的集体贡献。中国用户在淘宝上的浏览记录、美国用户在Facebook上的分享内容、欧洲用户在Google上的搜索信息,这些行为数据的来源地是可以识别的。数据的产生依托于特定国家的基础设施,源于该国公民的行为贡献,受该国法律的规制和保护,据此主张对数据资源的主权管理,在法理上具有正当性。

历史经验为这一思路提供了参照。回顾资源治理的演进,可以观察到一种规律:当某种资源上升为战略性生产要素时,建立基于主权的管理体制往往成为各国的政策选择。19世纪的煤炭开采权、20世纪的石油特许权,均循此逻辑。其中石油资源的治理经验尤其值得关注。20世纪60至70年代,中东产油国通过主张石油资源主权,逐步改变了由西方石油公司主导的利益分配格局。沙特阿拉伯、科威特、阿联酋等国通过征收石油特许权使用费、提高资源税率等措施,不仅提升了本国的财政收入,也确立了资源主权在国际经济秩序中的地位。

由征税逻辑转向主权逻辑,相应地要求对这种对价的法律属性作出重新界定。资源特许权使用费既非传统意义上的税收,亦非行政事业性收费,而是一种基于准公共资源商业化开发的对价性收入。与行政事业性收费相比,两者的法理基础不同。行政事业性收费是行政机关为特定相对人提供公共服务或实施行政管理而收取的成本补偿,其正当性在于“谁受益、谁付费”的对等原则。资源特许权使用费并非对行政服务的补偿,而是对准公共资源商业价值的分享;企业付费的依据不是接受了某项行政服务,而是使用了具有公共属性的数据资源。资源特许权使用费与传统税收相比,差异同样明显。所得税遵循量能课税原则,以纳税人的支付能力为税基;流转税以商品或服务的流转额为税基,体现的是对交易行为的课征。资源特许权使用费的税基既非利润,亦非营业额,而是资源使用规模,这一设计逻辑与矿产资源权利金相近。与资源税相比,两者虽均涉及资源开发,但政策目标有所不同。我国现行资源税主要针对矿藏、水流等自然资源的开采行为,侧重于促进资源节约与代际公平。数据作为非消耗性资源,其治理难题体现为信任侵蚀,而非资源枯竭,因此数据特许权使用费的政策目标并非限制使用,而在于实现收益共享。在财政收入体系中,资源特许权使用费可类比于电信频谱拍卖收入或土地出让金:国家以公共利益代表的身份对具有公共属性的资源实施管理,并从商业化开发中获取合理分成。

(二)

分配方案更能反映价值共创本质

前文已论证,数据价值的生成是用户、企业与公共基础设施共同作用的结果,用户的行为贡献构成其中不可或缺的基础性要素。由此产生的问题是:现行税制能否合理反映这一共创结构?在传统企业所得税的计算中,企业可扣除的成本包括员工工资、设备折旧、研发支出等各项经营费用。这套规则形成于工业时代,彼时的价值创造主要依赖企业内部的要素投入,上述扣除项目大体能够涵盖主要的成本构成。但在数字经济条件下,用户数据已成为关键生产要素,公共基础设施构成平台运营的基本前提,而这两类贡献在税基计算中均未得到体现。由此,企业在账面上承担全部成本,亦因此享有全部利润;用户的数据贡献被视为无偿取得的资源,政府的基础设施投入被当作既定的外部条件。价值的创造是多方参与的,但价值的归属却是单方独占。这种独占局面的形成,与数字产品交易的虚拟化特征密切相关。数据要素的流转具有无形性,税务机关难以对其进行精准捕捉,因此给现行税制留下了规制盲区。

资源特许权使用费模式可有效解决上述问题。这一模式将聚合数据界定为准公共资源,在制度层面确认用户的贡献者地位。企业为使用数据资源支付的费用,在性质上构成对用户集体贡献的对价。征收主体虽为国家机关,回馈社会却经由公共支出途径得以实现。具体而言,这些收入可用于数字素养教育、数据安全保障、隐私保护执法等与数据治理直接相关的公共服务,亦可用于更广泛的社会福利支出。对于那些为数据池作贡献较多的活跃用户群体而言,他们将通过公共服务的改善而间接获得回报。这种安排虽不同于直接向用户支付报酬的方案,但在操作层面更具可行性,亦能避免个体化支付所面临的身份识别与金额计算难题。与此同时,资源使用费的收入亦可为政府投资数字基础设施提供资金支持。政府通过投资数字基础设施,降低了平台运营成本;平台以较低成本向用户提供服务,驱动数据在交互中生成;企业依托数据创造商业价值,并以资源使用费的形式向社会支付对价;政府获得收入后,继续投入新一轮的基础设施建设。在这一循环中,各方的贡献均应当获得相应的制度回应,形成正向的激励结构。这种安排实现了数据要素在共建共治共享社会治理格局下的循环流动,与现行税制下利益单向流动的状况相比,制度设计更为均衡。

当然,这一模式并不否定企业应得的合理利润。企业在技术研发、算法优化、服务运营等方面的投入,理应获得相应的市场回报。资源特许权使用费的征收对象是数据资源的使用行为,而非企业的全部经营活动。企业仍可通过技术创新与优质服务在市场竞争中获取优势,其合法利润不受影响。区别仅在于,企业不能再将其他参与方的贡献视为可无偿取得的资源,而须为使用具有公共属性的数据支付合理对价。这一安排在保障企业经营自由的同时,亦实现对用户贡献的制度性承认。

(三)

能够有效应对国际税收规避

数字经济的全球化在创造巨大价值的同时,也对国际税法体系构成严峻挑战。跨国数字企业借助算法驱动的商业模式,得以将经济实质与税收归属相分离,由此造成的税基侵蚀已成为各国需要共同面对的治理难题。资源特许权使用费模式通过重构“税收联结点”与“税基”这两个核心要素,为应对上述挑战提供了新的制度思路。

第一,重构税收联结点。传统国际税法以“常设机构”作为确立税收管辖权的基础。这一规则初步形成于19世纪90年代,其内在逻辑是:企业须在一国设有固定营业场所,该国方可对其营业利润行使征税权。在工业经济时代,物理存在与经济在实质上存在高度关联,这一规则得以运作良好。然而,数字经济的兴起使上述关联趋于瓦解。据OECD的估算,数字企业通过服务器转移、合同拆分、实体虚化等安排,每年造成全球税收损失约1000亿至2400亿美元。这一问题的症结在于,数字经济中的价值创造已不依赖物理场所,而是通过算法与数据流得以实现,传统规则因此丧失了规制效力。

“资源特许权使用费”模式正是在这一背景下应运而生的解决方案。该模式不再以物理存在作为税收管辖的依据,转而以“数据资源的地理来源”作为新的税收联结点。这一转变的法理基础是资源主权原则:正如一国对其领土内的石油、矿藏享有主权,对于在其地理疆域内产生并汇聚为战略资源的数据,该国亦可主张相应的管理权限。以数据地理来源为联结点,具有若干制度上的优势。在确定性方面,用户所在地可通过注册信息与IP地址加以识别,较可任意迁移的服务器位置更为稳定。在合理性方面,数据产生于特定国家的社会经济活动,体现了该国用户的集体贡献,据此确立税收管辖符合受益地征税原则。在可执行性方面,现代技术使数据流向的监测与验证成为可能,无需依赖传统的实地核查。这一联结点的另一特征在于其客观性。企业虽可将法律实体注册于低税率地区,将服务器部署于其他国家,但用户所在地与数据来源地这一事实本身难以改变。只要企业使用了某国用户的数据资源,便与该国形成了税收管辖上的实质关联,这一关联不因法律架构的设计而消解。

当然,以“数据资源地理来源”为联结点并非没有挑战。其首要问题在于用户跨国活动时的来源地判定:当一位中国公民在欧洲旅行时使用某平台服务,其产生的数据究竟应归属于中国还是欧洲?当一家企业同时处理来自数十个国家的用户数据时,如何避免重复征税或征税真空?类似的问题在传统资源领域同样存在,例如石油资源的跨境油田开发、公海渔业资源的分配,都曾引发过管辖权争议。为应对这一挑战,需要构建多层次的国际协调机制。在双边层面,可参照现有税收协定中“居民国与来源国”的利益分配模式,通过双边协议明确数据来源地的判定规则与税收分配比例。在多边层面,可在OECD双支柱框架基础上,推动就数据来源地判定标准、争议解决机制、信息交换规则等方面形成国际共识。在技术层面,可借助区块链等分布式账本技术,建立跨境数据流动的可追溯机制,为来源地判定提供技术支撑。诚然,国际共识的达成需要时间,但这并不妨碍各国率先在国内法中确立资源主权原则。正如20世纪产油国对石油资源主权的单边主张,最终推动了国际能源秩序的调整。

第二,重构税基。传统企业所得税以利润为税基,而利润在跨国企业的复杂架构中极易通过转让定价加以操纵。苹果公司的“双层爱尔兰”架构即为典型:其通过向低税率地区的子公司支付高额知识产权费用,将利润从高税率国家转出,部分年份的有效税率低于0.05%。这种利用无形资产转移利润的安排在数字经济领域具有普遍性。转让定价规则要求关联交易符合独立交易原则,但当交易标的为算法、数据、品牌等无形资产时,“公平价格”的认定就充满了不确定性,这为利润转移提供了操作空间。面对这一困境,可考虑进行范式转换,即以“数据资源使用规模”替代“利润”作为税基。这一转换在反避税层面具有内在优势。利润作为会计概念,可通过成本分摊、关联交易定价等手段在不同税收管辖区之间转移。而数据“使用规模”则是客观存在的物理事实,用户数量、数据处理量、交互频次等指标均有技术记录可循,难以通过法律架构的设计加以操纵。同时,数据的网络效应决定了企业将缺乏压低用户规模的商业动机。对于依赖广告收入的平台而言,隐瞒真实用户数不仅可能误导投资者,亦会削弱其对广告商的吸引力,这在商业逻辑上难以成立。因此,以“使用规模”为税基,能够从制度设计上压缩利润转移的操作空间。在资源经济学领域,对资源消耗的量化始终是课税的基础。水资源费按立方米计征,矿产资源税按开采吨数核定;其内在法理在于,资源使用量是可被客观测量的物理事实,能够将税基从主观判断的不确定性中解放出来。当代数字税收实践亦沿循类似思路,无论是法国基于用户数量与平台收入的方案,还是英国、意大利等国对交易次数的关注,都体现了用可验证的使用指标替代易被操纵的利润指标这一共同取向。

五、基于“数据使用规模”的税制设计

前文从法理层面完成了对数据属性的重新定位,确立了将数据税定性为“资源特许权使用费”的理论基础。然而,再完善的理论构想,若缺乏可操作的制度设计,终将沦为纸上谈兵。本部分的核心任务,是将抽象的法理逻辑转化为具体的制度安排,构建一套既符合数字经济内在规律又具备现实可行性的税制方案。这一制度设计必须回答三个关键的技术性问题:谁应当承担纳税义务?如何科学地衡量其纳税能力?采用何种税率结构才能实现效率与公平的平衡?这三个问题环环相扣,共同构成税制设计的完整链条。

(一)

以“资源开发者”为纳税主体

资源税的正当性根基在于“谁受益,谁付费”的基本正义原则。据此,纳税主体的确定应当指向那些对数据资源拥有实质性开发权力并从中获益的主体。

数据价值链涉及多类主体:作为数据主体的用户提供原始信息,数据处理者执行技术操作,数据使用者应用数据成果,而数据控制者则掌控整个价值创造过程。在上述主体中,数据控制者与前述标准最为契合,应当成为数据资源税的纳税义务人。根据欧盟《通用数据保护条例》第4条的定义,数据控制者是“单独或与他人共同决定个人数据处理目的和方式的主体”,而数据处理者仅是“代表控制者处理个人数据的主体”。这种区分的关键在于决策权的归属。数据价值的实现需要经历收集、处理、分析、应用的完整链条,每个环节的决策都会影响最终价值的高低。以Google为例,该公司决定收集哪些用户数据、如何处理这些数据、将数据用于何种商业目的,这些战略性决策直接决定了数据能否以及如何转化为经济价值。正是这种决策权,使数据控制者成为数据价值创造的实质决定者,也使其成为数据开发的主要受益者。相比之下,作为基础架构提供商(IaaS)的云服务商,仅在既定框架下执行技术操作,其所获取的仅是提供标准化劳务的常规利润。由于其对数据价值创造的方向没有决定权,在法理上不应成为数据资源税的纳税主体。将数据控制者确定为纳税主体,不仅符合“谁受益谁纳税”的原则,亦具有征管上的可行性。法国数字服务税将“提供数字界面的企业”作为纳税人,英国则将“向英国用户提供社交媒体服务、搜索引擎或在线市场的企业”纳入征税范围,两者实质上都指向拥有数据处理最终决定权的主体。各国之所以作出相似选择,是因为只有掌控数据价值链的主体,才具备纳税的能力,亦便于税务机关进行征管。

确定纳税主体后,随之需要解决的是征税门槛问题。若对所有使用数据的企业统一征税,看似公平,实则忽视了数字经济的结构特征。这一领域的市场份额和利润高度集中于数字寡头,向年营收有限的初创企业征税,征管成本可能超过税收收入本身。更值得警惕的是,高额合规成本会形成事实上的市场进入壁垒。门槛设计在域外立法中已有先例。欧盟增值税制度对小企业设有豁免,OECD双支柱方案亦设定了全球营收门槛。不过,数据资源税若仅以营收为门槛,恐有不足。企业规模与数据使用强度之间并不总成正比,例如一家营收较高的传统制造企业,其数据使用量可能远低于营收规模较小但以数据为核心资产的科技企业。有鉴于此,可考虑设置双重门槛,要求企业同时达到一定全球营收标准,且其数据使用规模(如月活跃用户数量或年处理数据量)符合规定阈值,方需承担纳税义务。这一设计将绝大多数初创及中小企业排除在外,仅使那些已从数据利用中获得实质性收益、具有显著市场力量的大型平台承担与其资源占用相称的公共责任。这在保护创新活力的同时,亦有助于缓解市场过度集中的扭曲效应。

(二)

以“数据使用规模指数”为计税依据

数据资源税制度能否有效运作,取决于其计税依据是否具备合理性与可操作性。如前所述,以数据资源的使用规模作为税基,相较于以利润为税基,在理论上更为合理,在实践中也更具可行性。然而,“使用规模”本身是一个抽象概念,必须将其转化为具体、可量化的指标体系,方可作为计税基础。为此,可以设计一个综合性的“数据使用规模指数”。该指数并非依赖单一指标,而是通过多个相互关联的维度,力求全面地刻画企业利用数据资源的实际强度与特征。

指数的构建首先需要考量数据获取的广度。对此,月活跃用户数量是这一维度的核心观测指标。该指标能够反映企业所触达数据来源的范围,也是衡量其数据资源潜在规模的基础。在具体计量时,可采用对数处理方式,以体现用户规模扩张带来的边际效应递减规律。同时,可引入地域调整系数,使指标能够反映企业在不同法域开展业务所面临的差异化合规成本,尤其是对于数据规制较为严格的地区。数据处理强度是另一个需要考量的维度,其主要观察企业在数据存储、传输与计算方面的实际投入。用户广度相当于数据储量,处理强度则体现开采加工的程度。各行业的数据处理模式差异较大,可对不同类型的处理行为按其在价值创造中的作用赋予权重,并参照行业基准进行标准化,以便横向比较。同时,数据本身的属性差异同样值得关注。个人健康档案与公开气象信息所涉及的权益风险不在一个层面,按敏感程度对数据分级并配置权重有其必要。这样做既能使税基更贴近数据的实际价值构成,也能借助税收手段,增加高敏感数据的使用成本,促使企业在数据收集环节有所节制。此外,可考虑设置市场校准因子。其思路是观察数据驱动型业务收入在企业总收入中的占比,与行业一般水平相比较后生成调整系数,用于修正前述维度计算所得的初始值。这一因子提供了市场端的观测视角,能够补充反映数据商业转化的实际状况。不过,该因子的权重不宜过高,否则企业可能通过调整业务分类或收入确认方式规避税负。上述四个维度从用户触达、处理活动、数据类型、市场表现等方面切入,构成数据使用规模指数的基本框架,为数据要素领域的税收治理提供了一种可供探讨的技术路径。

在征管实践中,企业可按季度自行申报各项指标。在大数据、人工智能、区块链、云计算等数字技术的驱动下,税务机关则可通过技术接口、云服务商报告、第三方流量监测等渠道,进行交叉验证。为平衡监管刚性与合规灵活性,可引入安全港规则,即企业申报数据与验证结果的偏差若在合理范围内,便视为合规,从而在确保税基真实性的同时,降低企业的合规负担。技术监测成本与企业合规负担是制度落地需要考虑的现实约束。对此,可采取若干缓释措施。季度申报周期与标准化指标体系可降低数据归集的边际成本;鼓励企业采用经认证的第三方数据管理工具,有助于实现合规流程的自动化;随着数据治理基础设施的完善,监测成本亦将逐步降低。

当然,上述指数设计在实践中仍会面临若干挑战。在赋值方法上,数据敏感度权重的具体数值涉及价值判断。对此可考虑采用专家咨询、公众听证、动态调整的三阶段机制。首先,由数据伦理、信息安全、法学等领域专家形成初步权重建议;其次,通过公众听证程序吸纳各方意见;最后,建立定期评估机制,根据技术发展和社会观念变化进行调整。在行业基准上,不同行业的数据使用模式差异显著,统一基准可能造成行业间的不公平。对此可以考虑建立行业分类与规模分层相结合的差异化基准体系,由行业主管部门会同税务机关,针对互联网平台、金融科技、医疗健康、智能制造等行业分别制定基准值,并根据企业规模进行分层调整。在国际协调上,指标口径的跨国统一面临挑战。各国对于月活跃用户的定义、数据处理量的计量方法、敏感数据的分类标准,可能存在差异。对此,短期内可通过双边税收协定中的相互协商程序解决个案争议;中期内,可推动在OECD或联合国层面,制定技术指南,形成国际通行标准;长期来看,各国在数据治理领域的规则趋同是可以预期的方向。

(三)

构建公平调节型累进税率结构

在确立了以数据资源使用规模指数为计税依据之后,税率结构的设计成为制度构建的重要环节。税率不仅是决定财政收入的技术参数,亦承载着一定的价值导向。单一税率在征管上固然简便,却难以回应数据经济中价值与风险的非线性关系特征。因此,可考虑构建一种将规模累进与风险调节相结合的税率体系。

税收公平原则作为现代税法的基本原则,其核心不仅在于纳税主体法律地位的平等,更在于实现负担能力与公共贡献之间的均衡。在此指引下,数据资源税采用阶梯式累进税率,是“多用者多付”这一正义观念的制度体现。其正当性可从两个层面加以论证。其一,从受益原则与支付能力原则审视,累进税率具有内在的合理性。单一税率虽在形式上实现了比例公平,即所有纳税主体适用相同的名义税率,但在实质层面可能导致负担的不均衡。原因在于,数据资源的价值创造遵循网络效应与规模报酬递增的规律。一个拥有10亿用户的平台,其从每个用户处获取的平均价值,通常高于一个拥有1000万用户的平台。数据使用规模的扩大不仅带来企业收益的增加,亦带来其市场支配力的提升。因此,数据使用规模可作为衡量企业受益程度与支付能力的代理变量。与规模正相关的累进税率,即规模指数越高的企业承担越高的边际税率,是对“受益更多者应贡献更多”这一税收公平原则的回应。

其二,从分配正义的角度审视,累进税率亦有助于缓解数据资源向少数平台过度集中的趋势。比例税率对各类市场主体适用同一标准,形式上一视同仁,但运行效果未必均衡。中小企业和初创公司对成本变动较为敏感,税负增加可能压缩其经营空间;头部平台则凭借营收规模和利润水平,在承受税负方面更具余地。由此观之,统一税率未必能够改善竞争格局,反而可能固化既有的市场结构,抬高后进入者的竞争门槛。对此,可能存在相关质疑:对大型企业适用更高税率,是否构成基于规模的差别对待,有违税收中性原则?回应这一问题,须厘清形式平等与实质公平的关系。大型平台承担更重税负,理由不在于规模本身,而在于其数据活动产生的外部效应更为显著。这些平台从具有公共属性的数据资源中获取了可观收益,其商业决策对市场竞争格局产生了广泛影响,大规模数据处理活动亦给隐私保护与社会信任带来压力。使税负水平与外部影响相匹配,正是实质公平原则的要求。

如果说规模累进结构主要回应的是“量”的问题,那么引入与数据风险权重联动的动态调节机制,则是为了回应“质”的差异。这一机制将税率与企业处理数据的类型和风险挂钩,其合理性在于对负外部性的内部化以及对企业行为的激励引导。不同类型的数据,其被滥用时可能造成的社会风险与个体损害存在差异。匿名的天气数据与个人的生物识别、基因数据,其潜在的负外部性不可等量齐观。若税制对此不加区分,可能在客观上激励企业优先收集价值较高但风险亦较高的敏感数据。动态调节机制通过对使用高风险敏感数据比例较高的企业适用更高的附加税率,运用价格机制促使企业将数据处理行为可能产生的社会成本计入自身的商业成本。这一设计亦符合庇古税的原理,即通过税收弥合私人成本与社会成本之间的差距,引导市场主体作出更符合社会整体利益的决策。

在更深层次上,该机制亦可发挥行为引导功能,激励企业在数据处理中更加注重隐私保护。由于附加税率的存在,企业在进行数据战略规划时须进行成本收益权衡。过度收集和使用高风险数据将直接增加税收负担。这种可预期的经济后果,可望激励企业从源头采取更为审慎的数据策略,推动企业践行数据最小化原则,只收集和处理为实现特定目的所必需的数据。与此同时,企业亦可能加大对隐私增强技术的研发投入,通过差分隐私、联邦学习等技术手段降低数据敏感度,从而获得更低的税率适用。这在客观上将合规成本转化为技术创新的动力。

往期精彩回顾

上海市法学会官网

http://www.sls.org.cn

图片

相关话题
  • 一句“哪个少爷吸了?”是对“违法犯罪记录封存”有多大误解?
  • 学术前沿|贾 宇:推动慎刑原则在更大范围内达成共识,是我们这一代学人的使命
  • 梅夏英:目前制定统一“人工智能法”时机尚未完全成熟 | 人工智能立法的两个理论支点
  • 尚权研究丨张雨:一名毒辩律师对吸毒记录封存问题的看法和想法
  • 百宸观点 | 从Meta收购Manus观察中国AI创业者选择新加坡的考量 ——战略布局、架构设计与落地实操全指南
  • 【大有沙龙会议纪要】 第十三期大有公法沙龙热烈讨论“行政主体的概念回归”