2025-02-05 17:45 浏览量:145
引言
当前,我国数据资源流通的“采-存-管-用”规模已基本形成,但“供-流-用-管”等环节仍存在诸多问题,具体问题如下:
数据资源供给质量参差不齐
数据资源供给水平受到数据质量、规模、结构以及采集和治理能力等多方面因素影响。不同地区、不同行业和机构在数据来源以及数据采集处理技术上存在显著差异,导致数据资源质量参差不齐,影响数据流通效率和效果。例如,一些机构或企业拥有高质量、大规模、结构化的数据资源及先进的数据采集和治理能力,而另一些则相对薄弱。这种不均衡现象在金融、医疗等领域表现得尤为突出。
数据资源流通路径不畅
传统数据流通方式面临安全与效率问题,新技术虽具潜力但尚不成熟。传统数据流通方式往往以数据包形式或明文数据API接口对接,数据安全风险高,难以保障数据所有者利益,且在数据实时处理、分析预测等方面存在局限性。例如物流行业需实时数据来优化配送路径和仓储管理,但传统技术面对海量数据效率低下,“双十一”期间快递公司因传统数据流通模式无法满足实时处理需求,导致配送效率低下、客户体验不佳。当前,隐私计算、区块链等新兴技术虽能保障数据安全流通,但技术互联互通仍面临挑战。
数据资源利用不易
数据使用方难以精准获取高价值数据且难以安全合规使用。数据供需信息不对称、数据深度分析能力不足等,导致数据使用方难以从海量数据中获取高价值数据,同时数据质量参差不齐、对原始数据深加工不足等问题导致数据整体价值不高。此外,数据安全与隐私保护技术的不成熟也制约了数据资源的高效利用。
数据安全监管不力
随着云计算、大数据及物联网技术的应用,数据生成量和存储量急剧增加,安全风险也不断增加,同时人们对数据隐私保护及安全合规需求提高,需完善法律法规并采用更高级智能的数据安全技术应对。
数据资源流通顶层理论框架设计
为了解决数据资源流通中存在的问题,实现数据资源价值最大化,迫切需要构建一套科学合理、全面系统的数据资源流通顶层理论框架。本文从全局角度出发,研究分析数据资源流通利用过程中所涉及的关键角色、流通模式等,搭建一个涵盖数据“供-流-用-管”全生命周期的顶层理论框架,为后续数据空间建设提供理论参考。
数据资源流通关键环节分析
基于数据资源流通“供得出”“流得动”“用得好”“管得住”“保安全”的需求,分析数据资源“供-流-用-管”环节涵盖的关键数据行为,以及为实现这些数据行为所需要的技术路径支撑。
供得出:数据供得出的前提是“有数”、关键是“质量”。自动识别、自动导入、自动录入、数据接口等数据采集技术可支持数据快速、高效地采集;数据清洗、数据结构化、数据标准化、数据标注、数据自动分类分级、多元异构数据融合等数据治理技术可提升数据质量;湖仓一体架构技术、云边协同等数据存储技术可保证数据高效、快捷、安全地存储和服务;最后通过编目技术等生成数据目录,为数据供出做好准备。
流得动:流得动的前提是数据要有价值,关键是要有一套可信的数据资源流通环境。数据合成、数据编织、数据分析等数据加工分析技术可有效地挖掘数据价值;数据标识、区块链、隐私计算、空间连接器、数据加密等数据资源流通技术可以确保数据资源流通环境的安全可信。
用得好:用得好的关键是数据产品与需求实现精准对接。分布式目录、数据搜索等发布索引技术,以及数据封装、数据分析、大模型等分析应用技术可支持数据产品价值释放。
管得住:管得住的核心是“安全合规”。多因素身份认证、数字签名等可信身份认证技术,信源加密、信道加密等可信传输技术,区块链、存证和证据交叉认证等存证与追溯技术,数据登记、跨域管控、数据安全审计、合规审计等监管与审计技术,共同支持数据资源流通全链条合规溯源。
数据资源流通关键角色定义
在数据资源流通面临诸多挑战的情况下,明确数据流通参与方角色职责对于构建有效的数据流通体系至关重要。本文通过研究各参与方在数据资源流通各环节的职责,设计划分五大关键角色:数据提供方作为数据源头,其数据质量和管理水平直接影响后续流通环节;数据服务方通过专业服务挖掘并提升数据价值;数据运营方则搭建平台促进交易流通;数据使用方在合规使用数据的同时反馈问题,形成新的数据资源回流给数据提供方;数据监管方监督整个流程保障权益。这些角色相互协作、相互制约,共同推动数据资源流通利用。在实际操作中,角色之间关系并非一成不变,一个组织可能承担多个角色,并且随着市场发展还可能出现新的角色。
数据提供方:负责收集、生成和管理原始数据,确保数据完整性、准确性和数据质量。制定数据共享和使用的规则条件,遵守数据安全和隐私保护的相关法规。
数据服务方:提供数据清洗、标准化、结构化等专业的数据工具和数据加工服务,建设数据专区、数据加工厂等,开发数据分析模型和算法,提供数据价值评估、质量评估、能力评估等服务,确保数据服务过程的安全性和隐私性。
数据运营方:建立合规、互信、安全的技术体系,搭建和维护数据交易和流通平台,制定数据交易规则、流程、定价机制,促进数据供需双方的对接和交易流通,释放数据价值。
数据使用方:保护数据所有者和相关主体的权益,确保数据使用的合规性和安全性。按照约定的条件和规则使用数据,对使用数据产生的结果负责。同时,反馈数据质量问题,提供改进建议。
数据监管方:监督数据流通过程中各参与方行为,保障国家数据安全和各参与方权益。处理数据滥用、侵权等违法违规行为,推动数据要素市场健康发展。
数据资源流通主要模式设计
从应用层面讲,我国数据资源流通存在应用场景丰富、多元等特点,导致数据资源流通模式复杂多样,难以统一。本文提出集中式、分布式、分级式和混合式四种数据资源流通模式,可基本覆盖国内数据资源应用场景。用户根据具体情况选择合适的流通模式,或者结合多种流通模式,以实现数据资源的最优流通。集中式流通模式依托统一数据平台,具备高度集中化管理和运营的优势,能有效保障数据交易的规范性和安全性,但存在灵活性不足等问题;分布式流通模式在特定行业或领域展现出更高的灵活性和自主性,却面临数据标准化程度和监管难度的挑战;分级式流通模式适应行政管理体制,可有效保护地方权益,但技术差异可能影响数据标准化和互操作性;混合式流通模式灵活性强,可平衡各方利益诉求,但系统设计、实施和运维复杂度较高。通过合理设计流通模式,我们能够为数据资源流通利用体系框架的搭建奠定坚实基础,进而推动数字经济的全面发展。
集中式
该模式依托统一的数据交易市场和运营平台,所有数据提供方在此平台发布数据产品,数据使用方通过平台检索、购买和获取数据,平台提供统一的定价、结算、评价等服务。集中式流通模式特点在于高度集中化的管理和运营、标准化的数据交易流程和规则,便于监管和质量控制,有利于形成统一的数据定价机制,便于实施统一的安全和隐私保护措施,可实现数据的高效匹配和大规模流通。
分布式
该模式通过数据目录进行点对点交易和数据传输,不依赖中央平台,企业可直接发布数据产品信息,数据供需双方直接进行数据流通共享。分布式流通模式在特定行业或领域具有更高的灵活性和自主性,但此种模式数据标准化程度取决于数据提供方,数据质量难以保障,且点对点的数据共享交易使得监管难度较大。分级式该模式通常按行政层级(如省、市、区)建立数据目录和交易系统,各级系统之间建立连接,实现跨级数据共享流通。层级化的数据管理和流通体系可对不同层级的数据实施差异化管理。分级式流通模式可更好地适应各地行政管理体制,保护地方权益,但不同级别的系统可能存在技术差异,影响数据标准化和互操作性。
混合式
该模式可根据实际需求在不同领域或层面采用不同模式进行互联互通,如省市层面采用集中式、行业内部采用分布式、行政区域采用分级式,同时通过统一标准和接口实现不同模式间的互联互通。混合式流通模式灵活性强,能平衡各方利益诉求,可根据具体情况选择最优方案,并逐步演进以适应不同发展阶段的需求。但混合式流通模式的系统设计、实施和运维的复杂度较高,需要更高水平的管理和协调能力。
结论
本文通过剖析数据资源“供-流-用-管”流程面临的问题,从全局角度构建数据资源流通顶层理论框架。分析数据资源流通的关键环节并明确各环节的技术支撑,确保数据流通各阶段顺利进行;定义数据资源流通的关键角色,明确个体角色职责,保障流通体系有效运转;设计集中式、分布式、分级式和混合式四种数据资源流通模式以满足不同数据流通场景需求。此框架的建立为后续数据空间建设提供了理论参考,有助于提升数据资源的流通效率,推动数字经济健康、高效地发展。
来源(公众号):数据治理体系
热门文章