本文作者:蓝狐

京沪之间⑥|王晓冬:公共数据开发的原则、问题和建议

京沪之间⑥|王晓冬:公共数据开发的原则、问题和建议摘要: ...

【编者的话】

微信号:MD80086
添加微信好友, 获取更多信息
复制微信号

“在北京,看上海”,“澎湃下午茶/京沪之间”系列于2024年5月17日正式启动。“京沪之间”旨在解析中央政策,探讨上海思路。

第一场研讨会,畅谈中国经济转型中的上海战略。第二场研讨会,聚焦国际金融中心建设。第三场研讨会,关注科技金融。第四场研讨会,讨论新税制与新业态。第五场研讨会,探析什么是高质量孵化器。第六场研讨会,讨论公共数据开放利用与上海建设国际数字之都。

第六场研讨会,邀请了国家信息中心公共技术服务部发展规划处处长王晓冬,北京交通大学信息管理与理论国际研究中心特聘教授张向宏,赛智产业研究院院长、北京赛智时代信息技术咨询有限公司CEO赵刚,上海数据交易所副总经理、上海市数商协会秘书长卢勇。

以下为王晓冬的演讲精要。王晓冬提出了公共数据在运营中要解决的八个问题。

国家信息中心公共技术服务部发展规划处处长王晓冬

公共数据是最易落实“数据二十条”的数据类型

公共数据的开发与利用已讨论多年。早在2006年《信息资源开发利用指导意见》就已出台。很多今天想要推进的工作,那时就已经有所构思,只是当时条件尚不成熟。如今,在市场化配置改革的背景下,数据逐渐从资源转变为新的要素,公共数据的研究与开发利用迎来了更好的时机。

近期发布的《关于加快公共数据资源开发利用的意见》,是落实《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》(“数据二十条”)的重要抓手。数据二十条对公共数据、企业数据和个人数据三类数据做出了明确界定。从实践情况看,公共数据可能是最容易落地的数据类型,这与其基础性、通用性、权威性、公益性和可控性等特点密切相关。

其中,公共数据的基础性体现在它通常是各类基础数据库的集合。这些数据是各行各业进行基础信息校验的关键。例如,涉及个人信息的二要素(姓名、身份证)、三要素(姓名、身份证、手机)的基础信息验证在各行业中的需求很大。

公共数据的权威性源于其得到了行政行为的背书。随着数据涉及的利益日益复杂,公共数据在法律和行政事务中发挥着重要作用。尤其公共数据现在常在司法过程中作为证据使用,具备法律效力。

公共数据的公益性也非常明确。在讨论数据要素市场时,企业数据往往难以集中和汇总,而公共数据则可以通过行政手段进行集中汇聚,是各地数据集建设和国家数据局推动的重要方向。

如何界定公共数据?

理论上,企业数据、个人数据和公共数据的分类视角不在一个维度。实践中,三者之间也有很大的交叉。例如目前,最大的企业数据集是法人库,而最大的个人数据集则是人口库。这三类数据的规模差异很大,公共数据的分量最大。从“数据二十条”来看,其中16处提到公共数据,4处提到企业数据,个人数据则主要集中在信息保护和个人信息保护的范畴。

但是,这些概念之间存在交叉关系。比如企业数据或个人数据达到一定规模时,它们就可能具有公共数据的属性。也可以形象地说:数据的尽头就是公共数据。只要数据达到一定规模,往往很难剥离其公益属性,因为它最终会涉及个人信息和个人利益。因此,公共数据非常重要,因为它的特性最为鲜明。

这也说明,公共数据并不仅仅掌握在政府部门的手中,许多平台、企事业单位也在汇集大量的企业数据和个人数据。从另一个角度看,公共数据包含大量涉及企业和个人的数据,它是一个整体概念,企业数据和个人数据更多是从数据主体的角度来界定。

“数据二十条”在制度上实现了破冰,在权益上进行了强化,并在公益上进一步加强,确保公共数据“取之于民,用之于民”。创新上则留有一定的空间,特别是在如何授权运营、分类分级推进等方面,为各行业和地方留出了创新探索的发展空间。

在“数据二十条”中,还有两个需要注意的问题。第一,在界定企业数据时,有一个定语,明确对于“不涉及个人信息和公共利益的数据”,市场主体享有依法依规持有、使用、获取收益的权益。在实际工作中,各类市场主体在生产经营过程中产生的大量数据涉及个人信息和公共利益,界定难度也较大。

第二,安全兜底是一个重要方面。“数据可用不可见”,这一点对授权运营的下一阶段具有指导意义。目前看,一些机构的原始数据存在流出情况,甚至通过一些灰色手段在流转。

将公共数据授权事项纳入“三重一大”

基于各行各业对公共数据的普遍需求,国家数据局出台了《关于加快公共数据资源开发利用的意见》,以及《公共数据资源登记管理暂行办法》《公共数据资源授权运营实施规范(试行)》等两个配套性文件,加上正在制定的公共数据产品指导定价相关文件,形成了“1+3”的政策体系。

《关于加快公共数据资源开发利用的意见》是国家数据局成立以来研究制定的首个中央文件,是贯彻落实党的二十届三中全会精神的重要改革举措,是定规则、把方向的重大制度安排,是数据基础制度建设的重要一环,释放了鼓励发展的鲜明政策导向。《意见》的核心内容可概括为“1125”:促进公共数据合规高效流通使用的一条主线,提高数据资源开发利用水平的一个目标,着力激发供数动力和着力释放用数活力的两个着力点,以及五方面具体举措。

其中《意见》的重大突破在于将公共数据授权事项纳入“三重一大”(编者注:即重大事项决策、重要干部任免、重要项目安排、大额资金的使用,必须经集体讨论做出决定的制度)决策范畴,旨在明确公共数据的授权、经营和使用权归属。

与其他领域不同,这是通过行政赋权的方式确定的,而非组织机构天然拥有。具体而言,某个部门的信息中心并不自然具备数据持有权,必须通过上级管理机构纳入“三重一大”决策,以避免局限于局部利益,因为公共数据授权运营的核心在于超越局部利益进行考量。

此外,将来还要搭建统一的公共数据登记,需要回答谁来登记,登记什么和如何登记等问题。目前最主要的问题是,登记是一种“存证”,是一种法律语言,后面是法律的背书,就像婚姻登记、住房登记那样。但数据的权属主体,现在来看更多是形式上的存证,因为不会有实质性审查。

做好公共数据运营要解决的六个问题

要确保公共数据运营顺利推进,还需解决以下六方面关键问题:

第一,数据概念和内涵不清晰的问题。尽管已有明确定义,但在实际操作中仍落地困难。尤其是企事业单位的数据边界划分较为棘手,比如很多国企对此领域表现出浓厚兴趣,但纠结于数据应归类为公共数据还是企业数据。此外,企业数据的开发利用及文件间的衔接也需进一步强化。尽管各项定义已给出,但如何清晰划分数据边界仍是核心问题。

关于公共数据与企业数据的界定,特别是企业在生产经营过程中合法获取和持有的数据(如12306掌握的个人售票信息),其开发利用需明确规定。相关政策文件应相互衔接,确保政策的宏观一致性,避免企业因不清楚适用哪些政策而产生困惑。

第二,关于公共数据应开放还是授权运营的争议。开放是将所有权、经营权和使用权完全放出,而授权运营则保留政府部门的所有权,转让使用权和经营权。由于数据具有可记录、可批量下载的特性,开放可能导致数据流出难以收回,带来不可控风险。相比之下,授权运营不仅在操作对象上更具指向性,主要面向专业机构,还对供给条件有更严格要求,能够确保“原始数据不出域”以保障数据的安全与可控。

从供给收益角度看,授权运营具有反哺机制,能够吸引技术、人才和资本的投入,并以更有针对性的方式组织运营,降低风险。相比之下,开发公共数据的风险较高,简单的开放并不能解决所有问题,后续的潜在风险和顾虑需谨慎考虑。

政策导向是明确的,未来授权运营领域有巨大空间,而开放数据主要适用于基础性、通用的公共服务数据。重要的是,授权运营不应削弱公共数据的开放基础效应,这是一个明确的界限。不能将原本可以开放的数据,因考虑到法律风险或潜在威胁而全部收回,这需要在尺度上做出合理把握。

第三,公共数据的权属决定问题。今天无论哪个机构获取数据,都希望将其变现并自行开发利用。解决这一问题的方法是上文提到的,将数据纳入“三重一大”管理体系。三重一大的重要意义在于,它能够超脱部门利益和局部利益,从全局角度出发,考虑全社会的数据使用成本,并促进整个经济社会数字化转型的活力。通过这一管理体系,该问题已在一定程度上得到解决。

第四,公共数据开发利用的机制与模式问题。一是缺乏对公共事业单位和企业所掌握数据的明确指引。建议对公共数据进行分类管理,根据不同机构掌握的数据属性,实施分类分级授权运营。二是现在许多机构和地方的研究人员未充分考虑授权运营的退出机制。三是《十四五规划纲要》明确提出要探索数据的公共服务,但部门利益分割和数据资产问题依然存在,尤其是数据局与业务厅局之间的关系,这需要进一步统筹和协调。四是公共数据的可控性强,汇集价值巨大,但由于孤岛效应和标准不统一,数据的质量问题严重。五是公共数据本质上是个人数据和企业数据的结合,涉及广泛的个人隐私与安全问题。六是平台建设问题、建设模式、技术手段及现有平台体系的适配性也是当前面临的挑战。应建立公共数据授权平台,首先实现数据的集中授权模式。

第五,如何确定公共数据的定价和收益成为了难题。关于定价和收益问题,相关文件尚未出台,这一问题确实较为复杂:一方面,应大力推进公共数据授权运营,但另一方面,作为生产要素的数据,其价值不应免费释放。

收益方面,无论是采用成本法还是收益法,都无法充分体现数据的特殊性。成本法可能低估数据的巨大效益,而收益法又无法全面衡量数据开发利用过程中的增值。比如,某些数据可能对某些人没有价值,但对他人却能创造巨大效益。因此,定价应采用混合模式。

在公共数据领域,政府应发挥指导定价的作用。政府并不直接设定具体价格,而是提供定价指导,帮助明确合理的成本与收益空间,确保遵循市场规律。此外,由于不同部门的数据需求迫切程度不同,定价应在合理范围内形成指导性的价格区间。

第六,公共安全与合规问题不容忽视。数据汇集后自然会带来更大的安全责任和风险,尤其是在数据流动的背景下。以往,数据安全主要依赖于静态防护,而今天,数据流动需要实现动态安全,需确保数据在流转过程中的全程监管和安全防护。目前,静态安全技术尚未完全适应动态安全的需求,这就需要技术手段的进一步发展和完善。

此外,合规性同样至关重要,特别是在审计和合规检查方面。尽管政策已对数据管理进行一定程度的松绑,但审计和合规检查仍然面临巨大的挑战。当前,运营模式的成熟度在各地差异较大,不同地区的探索尚不完全一致。全流程动态披露机制在相关文件中已有明确要求,必须在透明的环境下运营,避免私下授受。同时,审计作用应得到充分发挥,确保数据运营的合规性与透明度。

为解决上述问题,需要加快相关立法进程。目前,现有文件尚未上升至法律层面,而调节生产关系需要依赖法律手段。由于政策文件的动态性较强,具体提法可能与政策导向存在不一致。因此,应加强数据立法工作,从国家层面统一数据条例,避免地方性数据条例的差异带来市场障碍。数据相关概念和内涵应通过法律手段进行严谨界定,并在政策制定和颁布过程中确保宏观一致性。在政策贯彻落实过程中,应系统集成推进,避免不同文件之间的交叉和重复导致的混乱。

数据开放工作的原则和建议

在推进公共数据授权运营过程中需遵循以下四个原则。一是公益原则,要确保数据的基本公益属性,避免完全商业化。二是增值原则,要推动数据的不断增值,使其使用价值逐步提高。三是竞争原则,要加强各地竞争,避免由单一机构主导。四是回馈原则,要构建数据循环,连接治理、公益和商业场景。治理场景与数字政府相关,公益场景是数字社会建设,商业场景则是数字经济。通过授权运营,形成数字政府、数字社会和数字经济的闭环,避免数字化发展进入“孤岛”状态。

具体而言,对改善以上问题,我还要补充以下几个建议。

首先,要注意主管部门与业务部门的协同,平衡好地方数据局的权责,避免过度集中或分散的模式带来的困难。例如,上海等城市可以采取集中模式,而其他地方则需根据具体情况灵活选择。

第二,要注意数据局的角色,并非所有数据都需通过数据局进行授权运营。例如,企业掌握的数据,如12306的个人售票信息,需在企业平台进行授权运营,因其数据同时具有公共和企业属性,难以简单区分。

第三,应推动公共数据转化为标准化的产品和服务,进入市场流通。授权运营不仅要满足企业需求,还应确保数据服务广泛受益,而非仅限于少数企业。 

第四,财政部推行的公共数据资产化工作需谨慎推进,避免风险过大。许多地方的资本化运作虽名为市场化,但最终由政府承担风险,需特别审慎。

第五,数据应根据不同类型(政务数据、市政数据、产业数据等)进行分类授权运营。场景驱动是数据运营的重要经验,必须根据实际需求推进,而不是空泛概念。

第六,定价规则应根据场景和领域进行灵活调整,避免一刀切。技术手段,如隐私计算、区块链等,可增强数据授权运营的可控性和公平性。不同主体参与的数据平台应具备包容性。

第七,政府和企业平台的打通是未来发展的重点,尤其是国企和央企的数据,需整合成更大的公共数据集,激发潜在价值。

总体而言,数据授权运营不仅是技术和市场的挑战,更是政策和管理层面的复杂问题,需通过灵活的机制设计,确保公平、安全、可持续地推动公共数据的开发与利用。

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,6人围观)参与讨论

还没有评论,来说两句吧...