目录 全文解读 (一)编制数据资产台账 (二)开展数据资产登记 (三)完善授权运营机制 (四)健全收益分配机制 (五)规范推进交易流通 关于印发《数据资产全过程管理试点方案》的通知 为贯彻落实党中央、国务院关于数字经济的决策部署,充分激发数据资产潜能,防范数据资产价值应用风险,推动数字经济高质量发展,财政部选取部分中央部门、中央企业和地方财政部门(以下统称试点单位),从2025年初至2026年底,组织开展数据资产全过程管理试点。根据《财政部关于印发〈关于加强数据资产管理的指导意见〉的通知》(财资〔2023〕141号)等文件精神,我们研究制定了《数据资产全过程管理试点方案》,将围绕数据资产台账编制、登记、授权运营、收益分配、交易流通等重点环节,试点探索有效的数据资产管理模式,完善数据资产管理制度标准体系和运行机制。现印发给你们,请对照《数据资产全过程管理试点方案》,结合本单位实际,认真开展试点工作,抓好贯彻落实。 原文地址:https://www.gov.cn/zhengce/zhengceku/202412/content_6994953.htm 全文解读 方案总目标:围绕数据资产重点环节开展试点,形成工作指引,打造标杆案例,为完善制度积累经验。 试点范围:7部门、6企业、16个地区。 试点时间:2025年1月至2026年12月,分阶段推进试点任务。 工作机制:财政部牵头,建立央地协同机制,指导试点单位工作。 主要内容:数据资产台账编制,资产登记,授权运营,收益分配,交易流通。 重点风险:严禁利用行政事业单位数据资产进行担保,新增政府隐性债务。严禁行政事业单位借授权有偿使用数据资产的名义,变相虚增财政收入。 重点解读 (一)编制数据资产台账 原文:(一)编制数据资产台账。基于数据资源目录,加强数据资源汇集、治理,提升数据资源质量,按照数据资产定义,组织梳理试点单位符合数据资产范围和确认条件的数据资源,形成规范化的数据资产管理台账,摸清数据资产底数。 内容解读:这部分内容强调建立规范化的数据资产管理体系,要求试点单位对数据资源进行全面梳理和质量提升。数据资产台账的编制需要基于数据资源目录,通过汇集和治理来确保数据质量,并严格按照数据资产的定义和确认条件进行筛选。 实际意义:数据资产台账的建立为机构管理数据资源提供了系统化的方法,有助于组织了解自身拥有的数据资产状况,为后续的数据运营和价值挖掘奠定基础。这就像企业的固定资产清单,能够清晰展示组织拥有的数据资源。 示例:假设某市政府部门需要对其掌握的市民服务数据进行梳理。通过编制数据资产台账,他们可以将分散在不同部门的市民信息、办事记录、服务评价等数据进行分类整理,建立起结构化的数据资产目录,有效识别可用于改善公共服务的高价值数据。 (二)开展数据资产登记 原文:(二)开展数据资产登记。支持有关主体将持有或控制的数据资产应登尽登,纳入授权运营范围的公共数据资产要严格按照资产管理要求进行登记。试点地方财政部门依托预算管理一体化系统,统一登记内容,规范登记程序,发放数据资产证书,作为数据资产对外授权使用的凭证。试点单位就数据资产基本信息、权利信息、使用信息、管理信息等登记资产卡片。稳步推进行政事业单位和国有企业所持有或控制的数据资产纳入本级政府国有资产报告工作,接受本级人大常委会监督。 内容解读:这部分内容确立了数据资产登记制度,要求相关主体将符合条件的数据资产进行全面登记。登记内容包括资产基本信息、权利信息、使用信息和管理信息等,并通过预算管理一体化系统进行统一管理,确保数据资产受到规范化监管。 实际意义: 数据资产登记制度的建立有助于明确数据资产的权属关系,为数据资产的合法使用和流通提供依据。同时,将数据资产纳入国有资产报告体系,强化了对公共数据资产的监督管理。 示例: 某国有医院拥有大量的医疗数据,通过数据资产登记系统,将患者就诊记录、治疗方案、医疗费用等数据进行规范化登记,获得数据资产证书。这不仅明确了医院对这些数据的管理权责,也为后续数据在医学研究、公共卫生决策等领域的应用提供了法律保障。 (三)完善授权运营机制 (三)完善授权运营机制。建立并完善数据资产授权运营管理制度和工作机制,明确授权运营条件,确保具备相应条件的主体,依法合规开展授权运营工作。公共数据资产对外授权运营,要严格按照资产管理权限,探索规范的资产使用和处置审批程序。结合实际探索采取整体授权、分领域授权、依场景授权等不同模式,开展数据资产的使用权和经营权授权。强化授权运营事中事后监管,建立定期评估和动态调整机制,根据市场运营效果,调整或收回授权运营事项。 内容解读:这部分内容建立了数据资产授权运营的制度框架,规定了授权条件和运营规则。政策支持采用整体授权、分领域授权和场景授权等多种模式,同时要求建立评估和监管机制,确保授权运营的规范性和效果。 实际意义:授权运营机制的建立为数据资产的市场化运营提供了可行路径,既保障了数据所有者的权益,又促进了数据价值的充分释放。动态调整机制的设置则有助于及时优化运营策略。 示例:某城市交通管理部门可以将其掌握的交通流量数据,通过场景授权的方式,授权给智慧交通服务提供商。服务商可以基于这些数据开发实时导航、交通预测等应用,而交管部门则定期评估运营效果,确保数据使用符合公共利益。 (四)健全收益分配机制 (四)健全收益分配机制。按照“谁投入、谁贡献、谁受益”原则,积极探索以协议形式约定各方从收益分配中获取合理比例等机制,实现在分配方式、激励措施等方面的灵活配置,保障各权利主体依法依规享有收益权利。数据资产各权利主体依法纳税并按国家规定上缴相关收益,由本级财政部门按规定纳入预算管理。试点期间,行政事业单位数据资产有偿使用和处置收入,按照本级国有资产和预算管理的相关规定执行。 内容解读:该内容确立了"谁投入、谁贡献、谁受益"的收益分配原则,鼓励通过协议形式约定各方收益比例,并要求将相关收入纳入预算管理体系。政策特别强调了行政事业单位数据资产有偿使用的规范管理。 实际意义:合理的收益分配机制激励了各方参与数据资产开发和利用的积极性,同时通过规范化管理确保了收益分配的公平性和透明度。这有助于形成可持续的数据资源开发利用模式。 示例:某政府部门与企业合作开发旅游大数据平台,可以通过协议明确规定,政府提供基础数据获得30%收益,企业负责技术开发和运营获得70%收益,并将政府收益部分纳入财政预算管理。 (五)规范推进交易流通 (五)规范推进交易流通。鼓励探索多样化价格形成机制,构建既有利于提高供给积极性,又能够实现可持续发展的公共数据资产价格形成机制。推动用于公共治理、公益事业的公共数据资产有条件无偿使用,探索用于产业发展、行业发展的公共数据资产有条件有偿使用。有关主体基于运营主体提供的公共数据资产,再次开发加工形成的数据产品或服务,价格由市场决定。鼓励充分发挥数据企业和第三方专业服务机构作用,通过数据交易所等机构加强供需对接,开展场内公开交易,促进数据资产有效流通、价值实现和信息公开。 内容解读:该内容鼓励建立多样化的价格形成机制,区分公共治理、产业发展等不同用途,采取有偿或无偿方式促进数据流通。同时支持通过数据交易所等专业机构开展规范化交易。 实际意义:差异化的定价机制既保障了公共数据的社会效益,又促进了数据要素市场的发展。专业交易机构的引入则为数据交易提供了规范化平台,降低了交易成本。 示例:某数据交易所可以为政府部门的环境监测数据建立分级定价机制,用于环境保护研究的可免费使用,而用于商业决策的则采用市场定价,企业可以通过交易所规范购买和使用这些数据。 总结 《数据资产全过程管理试点方案》旨在通过选择中央部门、企业和地方财政部门,围绕数据资产台账编制、登记、授权运营、收益分配和交易流通等环节,规范数据资产管理流程,形成有效模式。试点时间为2025至2026年,强调加强组织领导,形成经验,严格风险防控,以促进数字经济高质量发展和数据资产价值应用。 来源(公众号):DATA数据社区
2025-01-21 09:42 18
目录 1、公共数据产品概述 2、主要的公共数据产品及其应用 3、公共数据产品的未来趋势 一、公共数据产品概述 1. 定义公共数据产品 公共数据产品是指利用政府、科研机构、社会组织等公共部门通过调查、统计、监测等方式采集的,面向社会公众和行业用户开放共享的数据资源,通过加工、分析、挖掘、可视化等处理形成的信息产品和应用服务。 与其他数据产品相比,公共数据产品有以下几个显著特点:一是数据源头的公信力高,数据真实可靠;二是数据获取途径合法合规,符合国家相关法律法规要求;三是数据内容丰富多元,涵盖经济社会发展的方方面面;四是数据形态多种多样,包括结构化数据、非结构化数据、时空数据等不同类型。因此,开发利用好公共数据产品,对于提升政府治理能力、优化公共资源配置、驱动经济转型升级具有重要意义。 2. 公共数据产品的分类 公共数据产品可以从不同维度进行分类。从数据来源看,可分为政府数据产品、科研数据产品、社会数据产品等;从应用领域看,可分为经济金融、民生服务、城市管理、生态环境等不同行业的数据产品;从服务对象看,可分为面向政府部门、企事业单位、社会公众等不同用户群体的数据产品。当然,一个数据产品可能兼具多种属性,需要从多角度去理解把握。 二、主要的公共数据产品及其应用 1. 地理信息数据产品 地理信息数据产品是应用最广泛、市场需求最旺盛的公共数据产品之一。各级测绘地理信息部门通过卫星遥感、航空摄影、野外调绘等方式获取了海量的地理空间数据,在此基础上研发了一系列数字地图产品和位置服务,为各行各业提供了不可或缺的数据支撑。 (1)数字地图的建设与应用 数字地图是以数字形式表示的地球表面及其附属要素的地图,通过数字化、矢量化、符号化等处理形成能够在计算机上显示和使用的电子地图。数字地图产品主要包括基础地理信息数据、交通地名地址数据、三维地形地貌数据等,广泛应用于国土资源管理、城乡规划、应急管理等领域。例如,在国土空间规划中,利用高分辨率卫星影像和数字高程模型等数据,可以精确测算土地利用现状和开发强度,为科学编制规划提供依据。在应急救援中,基于数字地图可以快速查询事发地周边的道路、水系、居民点等信息,并模拟灾情的发展趋势,为科学决策和救援行动提供支撑。 (2)地理编码服务的提供与使用 地理编码(geocoding)是将描述性的地址信息(如街道号、地名等)转换为空间坐标(如经纬度)的过程。地理编码服务通过整合全国范围内的地址数据,建立地址-坐标的映射关系,使得用户能够快速、准确地完成地址匹配和定位。地理编码在移动出行、电子商务、即时配送等领域有广泛应用。例如,在网约车服务中,用户提交上车地址后,系统通过调用地理编码服务将地址转换为经纬度坐标,再匹配周边的车辆,从而实现高效派单。在外卖配送中,商家和骑手通过地理编码服务对配送地址进行标准化,再结合路径规划服务优化配送路线,提高配送效率。地理编码服务还可以用于客户数据的空间可视化分析,帮助企业洞察市场格局、优化网点布局等。 (3)路径规划与导航的实现 路径规划是指根据设定的起点、终点和出行方式,利用路网数据和算法模型,自动生成最优出行路线的过程。数字地图产品商通过整合道路、交通、地名地址等多源数据,构建高质量的路网模型,并研发多种路径规划算法,可以为用户提供驾车、公交、步行等多种出行方式的路线推荐。在路径规划的基础上,匹配车辆的实时位置信息,再叠加路况、限行等动态交通信息,就形成了车载导航系统,引导驾驶员沿最优路线到达目的地,并根据实际路况动态调整路线。路径规划与导航服务在交通运输、物流配送、旅游出行等领域应用广泛。 例如,在货运物流领域,利用路径规划可以科学制定运输计划,合理调度车辆,缩短运输时间,节约运输成本。一些物流企业将订单信息、仓储网点、车辆信息等接入路径规划系统,实现了调度业务的自动化和智能化。在旅游出行中,游客通过手机地图 APP 的路径规划功能,可以方便地查询景点之间的推荐路线,制定合理的出游计划。一些景区还提供电子导游服务,游客通过扫描景点二维码,就可以在手机上呈现丰富的语音讲解、图片视频、实景导航等内容。 2. 人口统计数据产品 人口统计是国家统计局组织开展的重大国情国力调查,通过全面系统地采集人口规模、结构、分布、流动等方面的数据,为党和政府制定国民经济和社会发展政策、规划提供科学依据。人口普查数据、流动人口数据、人口抽样调查数据等是重要的人口统计数据产品,在政务管理、商业决策、学术研究等方面发挥着重要作用。 (1)人口普查数据的加工与发布 人口普查是以国家为单位,以户为调查单元,对全国境内的居民及其社会经济特征进行的一次全面调查。我国从1953年开始,每十年进行一次人口普查。普查所获取的海量人口数据,需要经过审核、汇总、交叉分析等一系列处理,形成不同地区、不同层级的人口数据库和统计资料,再通过人口普查数据发布平台等渠道对外公布。 人口普查数据产品的典型应用包括:制定国民经济和社会发展五年规划,测算国内生产总值、人均收入等宏观经济指标;推算城镇化率、老龄化率等社会发展指标;核定各地人大代表名额、划分选举区;调整行政区划、优化公共资源配置;开展人口预测和政策模拟等。例如,根据第七次全国人口普查数据测算,2020年我国60岁及以上人口占比约为18.7%,首次突破2亿大关。各地据此完善养老保障政策,扩大养老服务供给,积极应对人口老龄化挑战。 (2)人口流动数据的采集与分析 伴随工业化、城镇化的快速推进,我国人口跨区域流动日益频繁。准确掌握流动人口的规模、去向、特征等信息,对于编制区域协调发展规划、提供均等公共服务、维护社会和谐稳定具有重要意义。公安部门利用户籍管理系统采集人口迁移数据,交通运输部门利用铁路、民航售票系统采集客流数据,通信运营商利用手机信令数据分析人口流动轨迹,各类数据汇聚后形成了较为全面的人口流动数据产品。 人口流动数据的典型应用包括:研判节假日客流高峰特点,调配运力资源,引导错峰出行;测算城市常住人口和户籍人口,推算城镇化率和流动人口规模;分析重点流动人口群体的居住、就业状况,提供个性化公共服务;评估重大疫情、自然灾害等突发事件对人口流动的影响,优化应急管理和风险防控措施。例如,2020年初新冠肺炎疫情暴发后,许多城市利用人口流动大数据及时识别中高风险地区,精准划定管控范围,向在沪归国人员推送健康提示,为疫情防控工作提供了数据支撑。 (3)人口结构数据的挖掘与应用 人口结构数据主要包括人口的性别、年龄、民族、受教育程度、职业、婚姻状况等信息,一般可以通过人口普查、人口抽样调查、社会经济调查等渠道采集。通过深入挖掘人口结构数据,可以洞察人口变动趋势、社会分层状况、代际差异特点,为制定有针对性的公共政策和商业决策提供参考。 人口结构数据的典型应用包括:根据人口年龄结构预测未来养老金缺口,推进养老保险制度改革;根据人口受教育程度分布优化教育资源配置,促进教育公平;根据婴幼儿数量增长情况规划母婴健康服务网络,完善生育政策;根据家庭结构变化趋势预测住房需求,引导房地产市场健康发展。例如,国家统计局公布的数据显示,2020年我国大学生毕业生新增就业人数达855万,教育程度较高。一些城市结合毕业生专业特点,积极搭建就业服务平台,举办网上招聘会,开发更多适合年轻人的就业岗位,提升了人力资源配置效率。 3. 经济金融数据产品 经济金融数据产品主要包括反映宏观经济运行、行业发展趋势、市场价格变动、企业生产经营等状况的数据资源,具有及时性强、权威性高、覆盖面广等特点。这些数据产品既包括政府有关部门发布的官方统计数据,也包括金融机构、科研单位、第三方数据服务机构提供的市场化数据。 (1)宏观经济数据的监测与预测 宏观经济数据主要反映一国整体经济运行状况,包括经济增长、就业、物价、国际收支等指标。政府有关部门定期发布的统计公报、经济运行简况、经济形势分析等,是最重要的宏观经济数据产品。一些金融机构、咨询公司、大学等,也会结合官方数据和市场调查数据,编制PMI指数、消费者信心指数等宏观经济领先指标,开展短期经济预测。 宏观经济数据在宏观调控、产业规划、投资决策等领域有广泛应用。例如,央行根据经济增长和通胀数据动态调整货币政策,及时应对经济下行压力。发改委根据经济运行情况调整产业结构,着力培育新的经济增长点。企业则利用宏观经济预测结果科学安排生产经营活动,准确把握市场机遇。 (2)行业经济数据的整合与分析 行业经济数据反映特定行业领域的运行态势,包括行业总产值、投资规模、进出口贸易、市场价格等指标。商务部、工信部、农业农村部等行业主管部门会定期发布行业统计数据,行业协会、研究机构、咨询公司也会提供相关的市场调研数据。通过整合分析行业经济数据,有助于企业分析判断行业发展趋势、竞争态势,并制定相应的经营策略。 例如,2020年疫情对餐饮、旅游、交通等行业冲击较大。商务部会同国家统计局评估疫情对餐饮行业的影响,出台针对性扶持政策。餐饮协会搜集会员单位复工复产数据,分享行业自救经验。龙头餐企利用大数据技术分析顾客消费行为变化,调整营销策略,开拓外卖、零售等新业务。各方联动,共同推动餐饮行业加快回暖。 (3)企业财务数据的比较与评估 企业财务数据直接反映企业的资产负债、盈利能力、现金流等状况,主要包括资产负债表、利润表、现金流量表等会计报表。上市公司必须定期披露财务报告,向社会公众提供真实、准确、完整的财务信息。一些金融信息服务商还会汇总个体企业的财务数据,编制行业财务指标,为投资者和监管者提供参考。 企业财务数据的典型应用包括:通过纵向对比分析企业财务状况变化趋势,预判企业未来经营风险;通过横向比较分析不同企业的盈利水平、资产质量,优选投资标的;通过比对同类企业的成本费用构成,找出挖潜增效空间。例如,某投资机构利用上市公司财报数据,分析对比医药制造业的研发投入强度、营收增速等指标,结合行业政策、技术趋势等因素,优选了一批成长性好、市场前景广阔的创新药企,并给予重点投资。 4. 交通运输数据产品 交通运输部门掌握的数据资源品类丰富、时效性强,主要包括铁路、公路、水路、航空等运输方式的基础设施、运输工具、客货运量、物流供应链等数据,以及路况、事故、气象等与交通相关的动态信息。通过采集、融合、共享这些数据,可以生成多样化的交通运输数据产品,服务于综合交通运输体系建设、智慧交通管理、物流组织优化等领域。 (1)实时路况数据的采集与发布 路况信息的及时性和准确性是影响出行效率和安全的关键因素。借助视频、雷达、电子车牌等路侧设备以及浮动车数据,可以实时采集道路交通流量、车速、拥堵指数等路况数据,并通过路况信息发布平台、手机地图APP等渠道进行公开。 实时路况数据在交通管理、出行服务等领域应用广泛。例如,交管部门利用路况数据动态调整信号配时方案,引导车流疏导,缓解交通拥堵。导航服务商根据实时路况信息为驾驶员智能推荐最优出行路线。一些城市还利用路况大数据进行交通需求预测、交通规划仿真等,为重大交通基础设施建设、重要活动交通组织提供科学决策支持。 (2)公共交通数据的整合与应用 公共交通数据主要包括公交线路、站点、班次、客流、IC卡刷卡记录等,分散在不同的业务系统中。通过数据采集和融合,建立统一的公交大数据平台,可以全面支撑公交服务规划与调度、客流预测与引导等管理应用。 例如,利用公交IC卡数据分析不同站点、线路在不同时段的客流强度,优化公交线网布局,减少空驶率。利用站点客流预测模型动态调整车辆投入,缓解"公交拥挤"问题。在突发事件应急处置中,实时监测周边公交客流变化,及时采取应急接驳等措施。在重大活动公共交通组织中,提前预测客流高峰,合理设置公交专用道和接驳站点。 (3) 物流配送数据的优化与决策支持 物流配送效率直接影响配送成本和客户满意度。通过集成订单、运力、路径等数据,优化配送线路、提高装载率,可以显著提升物流效率。一些互联网平台聚合海量的物流需求数据和运力资源数据,为商家、货主、车主提供智能匹配服务,提高物流行业整体运行效率。 例如,菜鸟物流利用大数据算法优化仓储操作和干线运输,仅用3年时间就将旗下的2300多个运营中心连接成服务范围覆盖全国的物流网络。京东物流自主研发了包裹路由、运力调度、机器人分拣等智能系统,大幅提升了自动化、智能化水平。顺丰即配根据客户需求预测、路径规划、包裹跟踪等数据,为客户提供高时效、高质量的即时配送服务。这些创新性的物流数据应用,不断刷新着人们的物流时效体验。 5. 环境气象数据产品 生态环境、气象水文等领域积累了大量观测监测数据,这些数据对于污染防治、防灾减灾、应对气候变化、保障人民生命财产安全具有重要作用。近年来,生态环境部、气象局等部门加强环境气象数据共享开放,研发了一系列面向政府、公众、企业等不同主体的数据产品,在环境管理、气象服务、公众科普等方面发挥着越来越重要的作用。 (1)空气质量数据的监测与预警 环保部门通过遍布全国的空气质量监测站,实时采集二氧化硫、二氧化氮、PM2.5等空气污染物浓度数据,形成全国空气质量实时发布系统。同时,利用大气污染扩散模型,结合气象预报数据,可以对未来一段时间的空气质量进行预测预警。空气质量数据服务于生态环境治理和民生保障。 例如,北京市依托大气污染源动态管控平台,通过污染物排放清单、污染过程模拟、高污染预警等数据分析,精准实施重污染应急管控措施。许多城市发布空气质量预报,提示公众在重污染天气减少户外活动,关注身体健康。一些环保企业利用空气质量大数据,优化环保设施布局,提供环境咨询等专业服务。 (2)水资源数据的管理与调度 我国是水资源短缺的国家,节约用水、科学调度水资源对保障经济社会可持续发展具有重要意义。水利部门利用卫星遥感、水文监测站等手段,获取全国江河湖库水量、水质、供用水量等数据,建立水资源管理信息系统。汇聚数据后,可以分析流域来水规律、用水结构,优化水资源配置,提高水资源利用效率。 例如,黄河流域管理机构利用调度决策支持系统,通过水雨情预报、水库群联合调度、灌溉需水预测等数据分析,优化上中下游梯级电站和千万亩农田的供水调度,在保障防洪和供水的同时最大限度地发电,创造了显著的经济效益。在应对气候变化、保护水生态等方面,水资源数据也发挥着关键作用。 (3)气象预报数据的分析与服务 准确的天气预报可以最大限度地降低气象灾害的影响。气象部门利用气象卫星、雷达、自动站等多源数据,运行数值天气预报模式,生成全国和区域尺度的气温、降水、风向风速等要素的预报产品。与此同时,针对暴雨、干旱、雷电等灾害性天气开展专题预警服务,并通过手机、电视、广播等渠道向社会发布。 气象预报数据服务于防灾减灾和生产生活。例如,气象部门会商防汛、水利、应急等部门,及时发布暴雨预警,提前转移危险区域群众,最大限度减少灾害损失。农业部门利用气象预报数据指导农事活动,提高农业生产的科学化水平。电网公司根据雷电预警信息优化输电线路检修计划,最大限度地保障电网安全稳定运行。 6. 医疗卫生数据产品 医疗卫生数据资源丰富、专业性强,涉及疾病控制、公共卫生、医疗服务、医疗保障等多个领域。通过整合人口健康信息、电子病历、医保结算、药品流通等数据,可以洞察疾病谱变化趋势、合理配置医疗资源、加强药品监管、完善医保支付政策,推动"健康中国"战略的实施。 (1)疾病监测数据的收集与分析 疾病预防控制机构通过传染病网络直报系统、院内感染监测系统等,实时收集传染病疫情、院感病例等数据,及时掌握疾病流行趋势,为疾病防控决策提供支撑。例如,2020年疫情发生后,疾控机构利用"信息化助力疫情防控"系统,通过疫情监测、流行病学调查、密切接触者管理等数据分析,精准识别风险人员,阻断疫情传播。 (2)医疗资源数据的优化配置 医疗资源配置不平衡、不合理是制约民生发展的短板之一。卫生健康委、医保局等部门汇聚医疗机构、医务人员、医疗设备、诊疗项目、药品耗材等数据,建立区域医疗资源管理平台,有助于分析不同地区医疗资源的数量、质量、结构,找出资源配置不合理的薄弱环节,为深化医疗供给侧改革提供依据。 例如,江苏省依托区域医疗资源监管信息系统,利用医疗资源数据进行可及性分析,并根据常住人口、患病率等因素,测算并优化调整区域医疗资源配置,进一步缩小省内和城乡医疗资源配置差距。浙江省利用"最多跑一次"改革,打通医疗、医保、医药数据,推行"一站式"结算,减轻患者负担。 (3)健康管理数据的应用与服务 随着"互联网+医疗健康"的推进,可穿戴设备、智能硬件、移动医疗等创新应用不断涌现,产生了海量的用户生理、行为等数据。通过对这些数据的采集、管理、分析,可以为个人提供全方位、动态化、精细化的健康管理服务。 例如,平安好医生利用人工智能技术,通过海量病历数据训练智能导诊模型,可以根据用户的症状、体征等信息,快速匹配疾病,推荐就诊科室,提高分诊效率。一些基层医疗机构利用家庭医生签约服务平台,汇聚签约居民的体检报告、诊疗记录、用药情况等数据,从而有针对性地提供健康教育、慢病管理、预约诊疗等服务,切实提升居民健康水平。 三、公共数据产品的未来趋势 随着数字政府、智慧城市、数字经济等战略的深入实施,公共数据产品已经成为提升国家治理效能、优化公共服务供给、培育经济发展新动能的重要抓手。未来,公共数据产品开发将呈现以下发展趋势: 数据融合与协同: 打破自然资源、交通、医疗、金融等领域数据壁垒,推动跨层级、跨部门、跨区域数据汇聚共享,提升公共数据的关联性、丰富性和价值密度。通过数据融合,创新开发主题库、专题库等融合数据产品,支撑产业协同、城市协同、区域协同。 智能化与个性化服务: 利用人工智能、大数据分析等技术,开发智能预测预警、辅助决策、精准画像等智能应用,提供更加精准、高效的公共服务。针对不同群体的个性化需求,提供个性化的信息推送、交互体验等服务,不断提升用户体验。 开放共享与社会参与: 进一步扩大数据开放共享的深度和广度,构建全国统一的公共数据开放体系。鼓励社会力量参与公共数据产品开发,培育数据要素市场。营造全社会共同利用、共同治理数据资源的良好生态。发挥数据资源的放大、溢出和倍增效应,催生更多数据驱动的创新应用。 来源(公众号):DATA数据社区
2025-01-20 10:31 14
目录 1. 开展数据资源全面梳理 2. 开展数据资源质量评估 3. 规范化识别数据资产 4. 规范化编制数据资产台账 一、开展数据资源全面梳理 数据资源是编制数据资产台账的基础。组织须在全局视角下,以业务活动和管理活动为导向,系统全面地梳理汇总散落在各处的数据资源,并依据一定的标准规则进行分门别类,这是摸清数据家底的必由之路。 1.1 厘清数据资源范围 组织的数据资源是海量的、多源异构的,存在于业务系统、办公系统、运维监控日志等各类IT系统中,呈现出碎片化的特点。开展数据资源梳理首先需要明确梳理对象和范围。一方面,从横向来看,既要覆盖总部各部门,也要辐射分支机构,既要涵括在线的结构化数据库,也要兼顾离线的非结构化数据。另一方面,从纵向来看,不但要梳理当前应用的业务数据,也要考虑归档的历史数据。唯有梳理对象全面系统,才能最大程度还原组织的数据资源全貌。 1.2 盘点现有数据资源 在明晰梳理范围后,组织需要动员各单位负责人开展数据普查,对本单位应用系统中的数据表/文件进行逐一登记造册,包括数据内容、数据量、数据格式、更新频率、所在位置等关键要素。鼓励采用问卷调查、座谈讨论、一对一访谈等方式,多渠道获取数据资源的静态信息和动态信息。同时,组建数据资产管理团队,利用数据发现工具扫描主要业务系统,提取数据资源的技术元数据,并与单位填报的数据资源信息表进行比对校验,以期获得全面准确的数据资源盘点清单。 1.3 对数据资源进行分类 面对盘点采集到的海量数据资源,还需要进行系统梳理分类,理出头绪。一般可基于数据的业务属性、管理属性、安全属性等开展多维度分类: 1. 基于业务属性,可将数据资源划分为人力资源数据、财务数据、客户数据、产品数据等; 2. 基于管理属性,可将数据资源划分为业务主题数据、共享交换数据、统计报表数据、归档数据等; 3. 基于安全属性,可将数据资源划分为公开数据、内部数据、秘密数据、机密数据等。基于科学的分类标准,将松散分布的数据资源进行规整归类,能够便于组织从全局视角分析其结构性特征,也为后续的数据资产评估、共享开放管理等提供基础支撑。 二、开展数据资源质量评估 海量的数据资源并非全都能够作为数据资产登记造册,其能否转化为数据资产,很大程度上取决于数据质量的高低。组织要根据数据资产的内在价值属性,制定科学合理的数据质量评估指标,开展数据资源质量评估,剔除劣质数据,筛选优质数据资产。 2.1 明确数据资产价值评估维度 数据的价值属性是数据资产的本质特征。我们通常从以下几个维度来考量数据资产的价值:一是数据的基础属性,如数据的完整性、准确性、时效性、一致性等,直接决定数据产品的质量;二是数据的稀缺性,独特性强、替代品少的数据价值相对较高;三是数据的关联性,不同来源数据的关联整合能够产生更大价值;四是数据的应用价值,在业务经营管理和数据要素市场中应用广泛的数据价值更高。因此,组织要在全面评估数据资产多重价值属性的基础上,构建起科学规范的数据资产价值评估指标。 2.2 制定数据质量评估标准 数据质量是数据资产价值的决定性因素,直接影响数据应用的有效性。为客观评判数据资源的质量优劣,支撑数据资产遴选,组织须针对不同类型的数据资源,分别制定结构化数据和非结构化数据质量评估的标准规范。一般来说,结构化数据质量评估的关键指标包括:完整性、准确性、一致性、及时性、唯一性等;针对非结构化数据,还应考虑可读性、相关性、可解释性等指标。在明确评估指标后,各指标还需设定相应的阈值标准,以判定数据资源是否达到规定的质量要求。同时,建立健全数据质量评估的规章制度,明确评估的流程方法、职责分工、结果应用等,确保数据质量评估工作持续规范地开展。 2.3 开展数据资源质量评分 质量评估标准建立后,组织就可以对全量的数据资源开展质量评估工作。一方面,各数据提供单位对本部门的数据资源开展自评,对照质量评估指标,逐条打分,计算数据资产的质量评分;另一方面,组织抽调业务骨干和数据专家组成评估小组,采取抽样或者全面评估的方式,对各单位的数据资源质量开展复核评分,将自评得分和复评得分进行加权平均,形成数据资源的最终质量评分。数据资源质量评分可作为数据资产遴选的重要依据,当评分达到规定标准时,该数据资源可被确定为组织的数据资产;当评分较低时,组织要及时反馈,并督促相关单位开展数据质量的清洗、修复、完善,直至符合数据资产的质量要求。 三、规范化识别数据资产 数据资源经过盘点分类、质量评估后,还需要进一步从中识别可被纳入数据资产管理范畴的对象,明确界定数据资产的内涵外延,规范化梳理形成数据资产目录,这是编制数据资产台账的重要基础。 3.1 明确数据资产的定义 什么是数据资产?由于缺乏统一规范,不同组织对数据资产有不同理解。一般而言,数据资产是以数据资源为基础,经过标准化的采集、汇聚、治理、加工,最终可被广泛应用,产生实际效益或潜在价值的数据产品。这一定义揭示出数据资产的本质特征:一是数据资产的物理载体是数据;二是数据资产须经过标准化处理形成;三是数据资产具有广泛的应用性;四是数据资产能够产生现实效益或潜在价值。因此,识别数据资产要以数据资源为基础,同时还要考察其质量、标准化程度、应用广度以及价值属性等多重因素。 3.2 确立数据资产的判别标准 基于数据资产的概念内涵,组织要建立一套规范的数据资产判别标准,明晰哪些数据资源可被纳入数据资产范畴。通常采用的判别标准如下: 1. 数据资源的准确性、完整性、一致性、时效性等数据质量指标达到规定标准; 2. 数据资源已经过治理加工,并采用组织认可的技术标准、数据标准和元数据标准; 3. 数据资源在全组织范围具有通用性,能够支撑共性业务的开展; 4. 数据资源能够为组织创造实际效益或潜在价值,例如提升经营管理效率、优化业务流程、创新产品服务等。只有全面满足上述标准的数据资源才能被视作组织的数据资产。各单位可对照数据资产判别标准,逐一评估筛选本单位的数据资源,形成本单位的数据资产识别清单。 3.3 形成规范的数据资产目录 组织汇总各单位的数据资产识别清单,经过论证评估、去重合并,最终梳理形成统一规范的组织级数据资产目录。数据资产目录一般采用主题-类目-表级的三级目录结构,并遵循统一的命名规则、编码规则。在一级主题目录中,可根据组织的核心业务,设置人力资源、财务资源、业务运营等主题;在二级类目目录中,可根据各主题的分类需求,划分人员、组织、考勤等类目;三级表级目录中则是一张张具体的数据表或文件。这样的目录结构清晰规整,为数据资产全生命周期管理提供了基本框架。 3.4 构建数据资产管理模型 在明确界定数据资产、梳理形成目录的基础上,组织还需要进一步构建数据资产管理的框架模型,包括: 1. 基础元数据:数据资产台账的基础信息,如资产名称、资产编码、数据项、数据量、更新频率、责任部门等; 2. 技术元数据:数据资产的技术属性,如字段名称、字段类型、字段长度、主键外键、索引等; 3. 业务元数据:刻画数据资产的业务属性,如业务口径、业务规则、使用部门、共享范围等; 4. 质量元数据:反映数据资产质量现状,如完整性、准确性、唯一性等数据质量评估指标值; 5. 安全元数据:确保数据资产安全可控,如敏感度标识、脱敏规则、访问权限、使用痕迹等; 6. 价值元数据:体现数据资产的应用价值,如资产等级、访问频次、使用评价、产生效益等。 建立全面系统的元数据框架,能够从不同视角对数据资产进行刻画,为数据资产全生命周期管理提供重要依据,是数据资产管理走向精细化、规范化的必由之路。 四、规范化编制数据资产台账 数据资产目录梳理完毕后,组织就可以规范化编制数据资产台账了。数据资产台账作为管理数据资产的电子"账本",直观记录了数据资产的家底情况,是开展数据资产管理的重要工具。 4.1 设计数据资产台账信息项 数据资产台账通过一系列结构化的信息项对数据资产进行描述管理。因此,台账信息项的设计直接关系到数据资产管理的广度和深度。一般来说,数据资产台账信息项的设计要全面覆盖数据资产管理模型的各项元数据,同时还要兼顾全组织的管理需求和未来发展需要。在实际设计过程中,组织一方面要全面梳理各业务部门和管理部门对数据资产管理的共性需求,争取将各方关注的重点内容纳入台账进行规范化管理;另一方面要高瞻远瞩,适度考虑支撑数据资产质量持续改进、价值深度利用、安全管控等未来发展需要。通过需求引导、头脑风暴、参考借鉴等方式,设计形成全面系统、满足多方需求的数据资产台账信息项。 4.2 规划数据资产台账结构 在明确数据资产台账信息项后,还需要进一步设计台账的整体结构。一般采用主档和副档相结合的方式:在主档中登记数据资产的基础信息,作为数据资产目录清单;在副档中分类登记数据资产的其他管理信息,包括技术信息、业务信息、质量信息、安全信息、价值信息等,与主档形成一对多的关系。主档可直接利用已形成的数据资产目录,而副档则须依据元数据的分类进行结构化设计,形成独立的关联表。通过主副档的有机结合,既可对数据资产进行分类分级管理,又能保证数据资产信息的集中统一、关联分析。 4.3 开展数据资产台账信息采集 高质量完整的信息是数据资产台账发挥效用的前提。各数据资产提供单位作为第一责任主体,要全面收集所辖数据资产的台账管理信息,并确保真实性、准确性、完整性。一方面,提供单位要组织开展数据普查,通过问卷调查、人工填报等方式,采集数据资产的业务属性、管理属性等人工可获取的信息;另一方面,要通过技术手段提取数据资产的技术元数据,运行数据质量分析工具评估数据资产质量现状,并适时开展数据资产价值评估。同时,提供单位还要建立台账信息定期更新机制,明确各项信息的更新周期、更新流程、责任人员,确保台账信息的持续准确、动态更新。 4.4建立数据资产台账编制规范 为保证数据资产台账编制过程规范有序,成果标准统一,组织要制定数据资产台账编制规范,明确编制的原则、流程、方法以及成果要求。编制规范一般包含以下主要内容:一是编制原则,如全面性、规范性、一致性、动态性等;二是编制主体,明确牵头部门、配合部门以及各自职责;三是编制流程,包括启动、采集、录入、审核、发布等环节的时间节点和交付成果;四是编制方法,对台账的填报、录入、校验方式进行详细说明;五是成果要求,规定台账的填报格式、命名规则、质量标准等。编制规范的建立,能够指导和规范数据资产台账的编制活动,为打造高质量的数据资产管理"台账"提供制度保障。 数据资产台账作为组织数据资产管理的核心工具,其编制是一项系统、持续的工作。组织需要以高度的责任心和耐心,一步一个脚印地开展,才能编制形成全面、准确、规范的数据资产台账。同时,台账的编制不是目的,而是实现高效管理、充分利用数据资产的手段。组织在台账编制过程中,还要重视对台账的应用实践,在实践中不断总结优化,持续提升数据资产管理的规范化、精细化水平。唯有如此,才能充分发挥数据资产的价值功效,为组织数字化转型升级提供坚实的数据底座。 来源(公众号): DATA数据社区
2025-01-16 11:08 30
指标平台掀起数智风暴:AI 对话已达 95% 准确率、100% 可解释! (本文:指标平台 = 元数据管理平台) 安全可靠:是智能数字决策的前提 01 | 应用痛点 元数据管理平台无法满足快速、智能查询需求 随着企业业务规模的迅速扩展和数字化进程的持续深化,越来越多的企业依赖大量精准的数据指标来进行精细化运营管理和辅助战略决策,凸显出构建完善元数据管理平台在企业内部的重要性。但在“元数据管理平台”应用过程中,因管理不统一、指标口径不一致、流程不规范,从而导致了重复建设、资源浪费、沟通成本增加,以及数据结果可信度下降等问题: 1. 指标重复建设与无效开发 指标开发重复:技术团队经常接到相似的指标开发需求,但缺乏统一的指标检索功能,难以快速判断是否已有类似指标,导致重复建设,浪费资源。 缺乏标准化定义:指标定义缺乏统一的标准,不同部门可能基于不同的业务逻辑开发类似指标,结果数据不一致,影响决策的准确性。 2. 业务人员对数据的理解与使用困难 指标选择困难:业务人员在查询指标时,面对数量众多的指标表和字段,不清楚应选择哪个指标,统计口径和适用场景也不明确,增加了使用数据的难度。 理解门槛高:元数据缺乏详细的业务解释或说明,导致非技术用户难以准确理解字段的意义和用途。 3. 元数据维护滞后导致查询错误 表结构变化未及时更新:当数据库的表结构发生变化(如字段新增、删除或调整),元数据没有及时同步更新,导致查询结果不准确,甚至出现错误。 版本混乱与重复沟通:由于元数据不及时更新,技术和业务团队需要反复沟通确认字段含义和统计规则,耗时耗力。 4. 元数据不准确、不一致问题 命名不一致:相同的业务含义在不同表中使用不同的字段名或表名,增加理解难度。 数据冲突:不同表中相同的字段名代表的含义或统计口径不同,数据结果可能存在冲突,用户无法判断取舍。 数据质量缺乏保障:部分元数据可能存在遗漏或记录错误,进一步影响数据使用的准确性。 5. 不同部门之间缺乏统一管理标准 分散管理:各部门独立管理元数据,导致平台缺乏全局视图,用户难以跨部门查询和理解元数据。 标准不统一:不同部门使用不同的元数据管理方式,导致命名规则、统计逻辑等出现分歧,影响跨部门协作效率。 6. 缺乏智能化与便捷性 低效查询:现有元数据管理平台无法支持自然语言查询,用户需要依赖复杂的SQL语句或繁琐的菜单搜索,降低查询效率。 缺少智能推荐:平台无法根据用户需求智能推荐相关指标或字段,用户需要手动筛选,耗费大量时间。 7. 无法支持复杂的血缘关系分析 血缘追踪难:复杂数据血缘关系(如ETL流程、表与表之间的依赖关系)缺乏直观可视化展示,用户难以快速了解数据来源和流转路径。 影响分析滞后:表结构或字段变动后,无法快速识别对下游系统和指标的影响,可能引发系统性错误。 8. 平台可扩展性和用户体验不足 功能单一:现有平台功能无法满足数据查询之外的需求,如数据质量监控、指标健康分析等。 交互体验差:平台界面复杂、搜索不便,用户体验差,进一步限制了元数据的使用频率和价值发挥。 这些痛点清晰地反映了元数据管理平台在实际应用中的不足,同时也为后续平台优化和智能化升级指明了方向。 02 | 方案一:元数据平台优化 如果问题更多在于数据治理、元数据管理策略不完善或平台本身的技术限制,可能需要优化现有元数据管理平台,而不是直接建立知识库。 在搭建知识库之前,您可以先评估以下方法: 优化元数据管理平台 增强搜索功能:加入全文搜索、模糊匹配和自动推荐功能。 可视化血缘分析:通过图表清晰展示表间关系和数据流向。 动态更新:对表的访问频率、调用次数等进行定期统计并展示。 数据治理体系完善 冗余表清理:识别并优化低使用率或重复的表。 建立数据分层:划分核心表、辅助表和历史表,减少查找范围。 开发数据搜索引擎 语义搜索:使用自然语言处理(NLP)技术,使用户可以以自然语言查询数据。 智能推荐:根据用户查询历史或业务场景,推荐相关数据表或字段。 03 | 方案二:元数据知识库和智能助手 构建一个元数据管理知识库和智能助手需要以下步骤: 1. 数据准备 元数据收集: 表结构信息:表名、字段名、数据类型、索引、主外键等。 数据血缘:表与表之间的关系,如ETL流程和依赖关系。 表使用统计:访问频率、最近更新时间等。 数据字典:字段含义、业务描述。 清洗与整合: 去重:合并冗余表或字段信息。 标准化:统一元数据格式和命名规则。 2. 技术架构 存储层:使用关系型数据库或NoSQL存储元数据,结合全文搜索引擎(如Elasticsearch)。 逻辑层:建立数据查询引擎,支持多种查询模式(如SQL查询、图数据库查询)。 应用层: 知识库前端界面:方便用户浏览和搜索元数据。 智能助手:通过NLP技术(如ChatGPT、Rasa)实现智能问答和推荐。 3. 功能设计 智能搜索:支持自然语言搜索和复杂查询。 血缘追踪:可视化展示数据血缘关系,支持逐级钻取。 智能推荐:基于用户行为和历史记录,推荐相关表或字段。 访问日志:记录用户查询和访问频率,优化知识库内容。 4. 技术实现 NLP技术: 构建语义搜索引擎,理解用户查询意图。 结合预训练语言模型(如BERT)进行分类和提取。 图数据库: 使用Neo4j或类似工具存储和查询复杂血缘关系。 API层: 提供标准化接口供其他系统调用。 5. 持续维护 定期更新元数据,保持与实际业务一致。 收集用户反馈,优化知识库功能。 来源(公众号): 源动数据-网点选址和效能管理
2025-01-15 16:48 46
随着大数据时代的来临,数据已成为企业的核心资产和竞争力的源泉。然而,海量、多源、异构数据的汇聚,也给数据管理带来诸多挑战:数据质量参差不齐、数据割裂缺乏统一视图、数据安全隐私面临威胁……在这一背景下,人工智能(AI)技术的崛起,为破解数据管理难题带来了新的曙光。AI以其高效、智能、自适应的特性,正在深刻重塑数据管理的方方面面,让数据资产焕发新的生机。 一、机器学习优化数据治理流程 数据治理是数据管理的顶层设计和统领全局的纲领,涵盖数据标准、质量、安全、生命周期管理等诸多维度。传统的数据治理多依赖人工制定规则、手动执行流程,难以适应数据规模激增、业务需求快速变化的大数据时代。机器学习以其自动化、自适应的学习能力,为数据治理注入新的动力,推动治理流程的优化重塑。 1. 异常检测与数据质量监控 数据质量是数据价值发挥的基石,粗糙的"原料"只能酿造劣质的"美酒"。传统的数据质量监控,多依赖人工设置阈值、编写规则,存在滞后性和主观性。基于机器学习的异常检测技术,能够从海量数据中自主学习"正常"的模式和边界,及时发现数据质量问题,大幅提升监控的实时性和全面性。 无监督学习算法如孤立森林isolation forest、Birch聚类等,能够从多维度挖掘数据间的内在关联,识别"离群点",实现无需预定义规则的异常检测。有监督学习算法如SVM、随机森林Random Forest等,能够从已标注的异常数据中总结规律,生成高准确率的异常分类模型,自动判别新来数据的健康状况。 此外,机器学习还能建立数据质量的台账和血缘,追溯异常数据的来源、影响范围,形成"监测-诊断-优化"的全流程质量管控。 2. 智能数据分类与数据溯源 海量的企业数据,往往散落在各个业务系统和部门中,缺乏统一的分类体系和管理视图。AI可以作为数据分类的利器,自动探查数据的特征和关系,生成多维度、细粒度的数据地图。 例如,无监督学习中的主题模型LDA,能从企业文档库中抽取潜在语义主题,发现内在关联的文档簇,形成自动文档分类。图神经网络等算法,能从复杂的数据关系网络中学习数据的表示向量,刻画数据间的相似性,实现数据的聚类。多视图学习能融合数据的结构化特征和非结构化语义,进行更全面、精准的分类。 当企业数据地图绘就,每一个数据都不再是信息孤岛,而是全局拼图中有机联系的一环。数据溯源也随之实现了自动化。机器学习能分析数据血缘和影响链路,当业务需求或数据结构发生变化,自动推演、定位下游的影响范围,及时调整数据流程与计算逻辑,大幅降低数据治理成本。 二、知识图谱构建与数据资产盘点 企业数据资产管理的目标,在于将数据转化为可持续创造价值的核心资产。要做到这一点,传统的面向过程的管理模式已然不敷使用,需要从"数据"跃迁到"知识"的层次,从全域视角理解数据的内涵价值、相互关联。知识图谱技术应运而生,它融合了机器学习、自然语言处理、语义网等多种AI技术,能够从结构化和非结构化数据中抽取实体、关系、属性,形成语义丰富的知识网络,既是知识提炼的"机器",也是数字资产盘点的"明镜"。 1. 自动化元数据提取 元数据是对数据的结构化描述,如数据的业务归属、访问权限、质量标准等,是数据管理的核心要素。传统的元数据管理高度依赖人工录入和维护,当数据规模庞大,难免疏漏。AI可实现元数据的自动化提取,将非结构化、半结构化的数据"翻译"成结构化的知识要素。 例如,命名实体识别技术能自动发现数据表、字段名称中蕴含的业务实体,如"CRM_Customer_Detail"中的"Customer"。自然语言处理技术能解析数据字典、业务文档,提炼数据资产的定义、业务规则等语义信息。本体学习等技术能从数据模式、约束中学习本体知识,构建数据血缘元数据。 从杂乱数据中"淘金",AI让数据的业务价值浮出水面,盘活沉睡的数字资产,形成企业统一的"知识地图",让管理者对数据资产的全貌了然于胸。 2. 数据血缘与影响分析 元数据提取呈现了数据的静态视图,而数据血缘则刻画了数据资产的动态生命周期。机器学习能够从ETL流程、数据库日志等数据中,自动抽取数据的上下游依赖关系,生成端到端的数据血缘图。 在此基础上,知识推理技术能够揭示数据变化的因果链条和影响范围。例如,当源系统数据模型调整时,知识图谱能推演出下游的数据应用、报表受到的级联影响,让数据治理做到"心中有数"。当业务需求变化,需要调整数据口径时,数据血缘图能快速定位上游"源头活水",指引数据优化,实现需求敏捷响应。 可以预见,AI驱动的自动化元数据管理和数据血缘分析,将成为未来数据治理的利器,实现数据资产全生命周期的"透明化"管理,让数据创造价值的路径更加清晰。 三、AI提升数据安全与隐私保护水平 随着数据资产的聚集,其安全性、合规性、私密性也日益成为企业的核心诉求。传统的数据安全防护,多依赖静态的访问控制规则和加密手段,在动态多变的安全威胁面前,显得被动和滞后。AI为数据安全智能赋能,通过云监测、行为建模、威胁情报等手段,构筑起更加主动、弹性、韧性的安全防护体系。 1. 数据脱敏与隐私保护 合规与隐私已成为数据价值开发的重要前提。当企业内外部数据需要交换共享时,如何在确保合规的前提下,最大化挖掘数据价值,成为亟需破题的难题。AI可为数据脱敏和隐私保护赋能,在源头实现数据的"净化"和"无害化"。 例如,机器学习能够自动发现和定位数据集中的敏感信息,如身份证号、手机号等,实现PII(个人隐私信息)的精准识别。进而,差分隐私、同态加密等隐私保护技术,能在保留数据统计特性的前提下,实现数据集的扰动和脱敏,即便是脱敏数据泄露,也难以追溯到个人。联邦学习更是允许在不泄露原始数据的前提下,实现多方数据的共享建模。 这些AI隐私保护技术,让数据交换不再是"鱼与熊掌不可兼得",而是在合规与价值之间实现平衡,为数据要素的自由流动扫清障碍。 2. AI驱动的数据访问控制 传统的数据访问控制,多依赖静态的"人-角色-权限"三元组,存在粒度粗、维护成本高等问题,难以适应数据资产管理的精细化、动态化需求。机器学习可为访问控制赋予更多动态智能因子,实现更精准、安全的权限管理。 其一,用户与实体行为分析(UEBA)技术,能从海量数据访问日志中学习用户的行为模式,构建行为基线和威胁情报,及时识别非法、越权的数据访问行为,让数据监管如"千里眼"般洞悉微末。 其二,图神经网络、关系嵌入等技术,能够从企业的组织架构、业务流程等复杂网络中,学习员工的角色特征,自动生成细粒度的数据访问策略。当组织架构、人员职责变化时,访问权限可自适应调整,大幅降低权限管理的时间成本。 此外,AI还能基于用户画像,实现数据访问的精细化定制。例如,对于数据分析人员,自动推荐相关数据表并开通访问权限;而对于业务人员,则推送数据看板和报告,避免误操作风险。 总之,AI让数据访问控制不再是"一刀切",而是因需而变、因人而异,在确保合规安全的同时,让数据价值有的放矢地流向需求点,实现数据价值最大化。四、自然语言处理简化数据访问 四、自然语言处理简化数据访问 在数据资产管理中,数据消费的难度也是一大痛点。传统的数据分析,需要用户具备一定的IT技能,如SQL、Python等。这不仅提高了数据应用的门槛,也制约了数据价值的释放。自然语言处理(NLP)技术的进步,为打通人与数据的鸿沟带来了新的可能,用户能够用自然语言直接"对话"数据,大幅降低数据获取和洞见萃取的难度。 1. 智能问答系统 智能问答是NLP最成熟的应用场景之一。用户以自然语言提问,系统通过语义理解和知识推理,自动生成答案。将智能问答技术引入数据分析,能让业务用户直接用口语化的问题获取数据洞见,大幅简化使用流程。 例如,用户问"我们的销量top10客户有哪些",问答系统能理解其语义为一个topN查询,生成对应的SQL,自动访问数据仓库并返回结果。当用户进一步追问"他们的订单金额同比增长如何"时,系统能在上下文中推断出"他们"指代上文提到的top10客户,关联相关数据表,计算出订单金额的时间序列,并以可视化图表形式返回。 在问答系统中,知识库是关键。它以知识图谱的形式,对数据仓库的表、字段、关系进行语义建模,构建数据资产的"百科全书"。机器学习、深度学习算法在知识库中寻找问题的答案线索,实现从自然语言到结构化查询(如SQL)的自动转译,让数据直接"开口说话"。 2. 语义搜索与数据推荐 当用户需求难以用一个问题直接表达,或尚不明确具体分析思路时,语义搜索和推荐可为其探索数据提供向导。用户以关键词形式表达大致诉求,系统自动理解搜索意图,找出语义相关的数据资产,形成个性化推荐。 例如,用户以"销售漏斗分析"为关键词搜索,系统能抓取查询的核心语义,在数据资产目录中发现"客户管理"、"营销活动"、"商机转化"等相关主题,自动生成数据集锦和分析报告模板,供用户参考启发。 在搜索与推荐引擎中,NLP技术贯穿始终。词汇-短语-句子嵌入(embedding)能够捕捉查询语义;文本相似度计算、主题聚类等算法能发现语义关联的数据表;协同过滤、强化学习等算法能基于用户的历史行为和关注点,生成个性化推荐。 可以说,NLP让数据资产管理从"千人一面"走向"千人千面",用户无需学习复杂的数据模型和检索语法,即可轻松游弋在数据的海洋中,找到"心仪"的数据资产,用最短的路径抵达洞见的彼岸。 结语 AI正在以"智能+"的形态,驱动数据管理走上智能化、自动化的崭新征程。智能数据治理让数据有迹可循、有源可溯;智能数据资产盘点让数据价值一览无余、跃然纸上;智能安全隐私保护让数据合规有度、流动有序;智能数据服务让萃取价值轻松惬意、洞见唾手可得。 放眼未来,AI与数据管理将加速融合、交叉创新,形成一个良性循环:AI从数据中汲取智慧,反哺数据管理流程;而经过AI淬炼的高质量数据资产,又为AI的进一步演进提供更优质的"燃料"。二者携手共进,定将开创数据价值最大化的新局面。 来源(公众号): DATA数据社区
2025-01-13 10:44 67
随着全球经济进入数字化时代,越来越多的企业意识到数字化转型的紧迫性。然而,数字化转型不仅仅是技术升级,更是企业战略、文化、组织结构和运营模式的全方位变革。尽管数字化转型已成为企业追求可持续发展的重要手段,但现实中,许多企业在推进数字化转型过程中面临诸多挑战,甚至陷入常见的误区。本文将总结数字化转型的三大真相,深入分析企业在转型过程中常遇到的难点和误区,并提出切实可行的建议,以帮助企业实现成功的数字化转型。 一、真相一,数字化转型不仅是技术问题,更是战略问题 挑战:数字化转型的本质是战略性变革 许多企业将数字化转型简单理解为技术升级或引入新的IT系统,但实际情况远不止如此。数字化转型的核心在于企业整体战略的转型,而不仅仅是技术的应用。企业在进行数字化转型时,需要从组织文化、业务流程、客户体验等多个层面进行深度变革,以适应数字经济的快速发展。 许多企业在数字化转型中,往往忽视了战略规划的重要性,片面追求技术先进性,导致最终数字化项目的失败。例如,某些企业购买了大量的先进技术设备或软件系统,但由于没有明确的数字化战略和业务目标,这些技术无法有效融入到企业运营中,甚至成为负担。 误区:认为技术投资等同于数字化转型 常见的误区之一是将技术投资视为数字化转型的全部。很多企业花费巨资引入最先进的技术,却忽视了业务流程的改造和组织文化的调整。事实上,技术只是数字化转型的一部分,企业需要结合自身的战略需求,制定清晰的数字化路线图,并将其融入到企业的长期发展规划中。 建议:制定清晰的数字化战略 为了避免技术与业务脱节的情况,企业在推动数字化转型时,首先需要制定明确的数字化战略。企业应通过深入分析市场环境、竞争态势、客户需求,结合自身的核心竞争力,设定具体的数字化目标。同时,企业应确保技术应用与业务流程变革同步进行,通过流程优化、数据驱动决策和跨部门协作,真正实现数字化转型的价值。 二、真相二,文化与人才是数字化转型的关键驱动因素 挑战:组织文化与员工技能的匹配 数字化转型不仅仅是引入新技术,更涉及组织文化的变革和人才结构的重塑。企业的数字化转型往往会面临来自内部组织文化的阻力,尤其是在传统企业中,员工可能对新技术感到不适应,或对改变现有的工作方式感到抵触。这种文化上的不适应会极大地阻碍数字化转型的顺利推进。 此外,数字化转型对员工技能的要求也提出了新的挑战。很多传统企业的员工缺乏数字化思维和技术操作能力,难以适应快速变化的数字化环境,进而导致数字化转型的效果不如预期。 误区:忽视了员工在数字化转型中的重要性 企业在推进数字化转型时,常常过分依赖外部技术供应商或咨询公司,忽视了内部员工的培养和组织文化的调整。事实上,员工是推动数字化转型的核心力量。如果企业忽视员工的角色,无法营造支持创新的组织文化,即使拥有先进的技术,也很难发挥出真正的效能。 建议:加强人才培养与文化变革 为了顺利推进数字化转型,企业需要加强对员工的培训,提升他们的数字化技能和技术操作能力。同时,企业应鼓励员工接受新的工作方式,营造创新、灵活和开放的组织文化。高层管理者还应通过积极的领导力,引导企业内部形成对数字化转型的共识和认同感,以确保组织上下在转型过程中保持一致性和协同性。 三、真相三,数据是数字化转型的核心资产,但其价值未被充分挖掘 挑战:数据资源的整合与应用难度大 在数字化转型过程中,数据被视为最重要的生产要素之一。企业通过收集、分析和应用海量数据,可以优化运营效率、提升客户体验并推动业务创新。然而,现实中,很多企业在数据资源的整合与应用方面存在较大的困难。一方面,企业的数据来源多样且分散,难以形成统一的数据库;另一方面,数据质量问题、隐私保护和安全风险等问题,也给数据的有效应用带来了挑战。 误区:低估了数据管理和分析的复杂性 很多企业在数字化转型中,对数据的重要性有一定的认识,但往往低估了数据管理和分析的复杂性。企业可能花费大量资源收集数据,却无法对其进行有效的管理和分析,导致数据价值难以充分发挥。此外,一些企业过于依赖历史数据,忽视了数据预测分析和实时决策的能力,导致决策滞后于市场变化。 建议:构建强大的数据治理体系 为了充分挖掘数据的价值,企业需要构建强大的数据治理体系,包括数据采集、存储、管理、分析和应用的全流程管理。首先,企业应统一数据标准,确保数据的准确性和一致性。其次,企业应加强对数据隐私和安全的保护,防止数据泄露和滥用。最后,企业应大力引入大数据分析工具和人工智能技术,通过数据驱动的决策,提升业务的敏捷性和创新能力。 来源(公众号):AI战略数字转型
2025-01-13 10:22 68
在数字化转型的时代背景下,数据治理已成为企业提升核心竞争力的关键。其中,数据标准化作为数据治理的重要组成部分,对确保数据质量、提升数据价值、保障数据安全具有不可替代的作用。本文将探讨数据标准化的构建策略与实施路径,为企业实现高效数据治理提供参考。 数据标准化的重要性 数据标准化是通过制定一套由管理制度、管控流程和技术工具共同组成的体系,来对数据定义、分类、格式、编码等进行标准化管理。对企业而言,数据标准化意味着对数据类型、长度、归属部门等定义一套统一的规范,以保障不同业务系统之间对同样的数据理解统一和使用统一。 数据标准化的重要性体现在以下几个方面: 消除数据不一致:通过统一的数据标准,可以消除数据存储结构、定义、理解以及来源的不一致性,从而实现企业级单一数据视图的形成,促进信息资源共享。 提升数据质量:数据标准可以作为新建系统的参考依据,减少数据转换,提高数据质量。同时,数据标准还可以支撑系统改造,促进系统集成。 提高工作效率:对业务人员而言,数据标准建设可提升业务规范性,保障人员对数据业务含义理解一致;对技术人员而言,数据标准可以提升系统实施工作效率,降低出错率。 支撑经营决策:数据标准建设可以提供更加完整、准确的数据,支撑经营决策和精细化管理。 数据标准化的构建策略 数据标准化的构建策略主要包括以下几个方面: 明确战略定位:将数据治理纳入整体战略规划中,明确数据治理在企业数字化转型中的核心地位,以及其对业务决策、产品创新、风险防控等方面的支撑作用。 设定具体目标:根据企业实际情况,设定清晰、可量化的数据治理目标,如提升数据质量、增强数据安全性、促进数据共享与利用等。 成立数据治理委员会:由高层管理者牵头,跨部门组建数据治理委员会,负责数据治理战略的制定、监督执行及效果评估。 制定数据政策:建立全面的数据政策体系,包括数据分类分级、数据访问控制、数据质量管理、数据安全保护等方面的政策。 在构建数据标准化的过程中,还需要特别注意以下几个方面: 参考国际和行业标准:在制定企业数据标准时,应首先收集现行的国家标准或行业标准,再根据企业需求确定数据标准的范围。 数据标准分类规划:数据标准可以从数据结构、数据内容来源、技术业务三个维度进行分类,如结构化数据标准、非结构化数据标准、基础类数据标准、派生类数据标准、业务数据标准和技术数据标准等。 定义数据标准体系框架和分类:在数据标准调研的基础上,结合行业最佳实践,定义企业自身的数据标准体系框架和分类。 数据标准化的实施路径 数据标准化的实施路径主要包括以下几个阶段: 数据标准设计制定:定义数据标准及相关规则,包括对数据标准的主题、信息大类、信息小类、信息项、数据类型、数据长度、数据定义、数据规则等进行规划设计。 评审与修订:在完成初步的数据标准定义后,征询数据管理部门、数据标准部门以及相关业务部门的意见,并进行意见分析和标准修订。 标准发布:最终发布数据标准,并在执行过程中加强对业务人员的数据标准培训、宣贯工作。 数据采集清洗:通过ETL工具将数据从来源端经过抽取、转换、加载至目的端,确保数据的准确性和完整性。 数据库设计与存储:基于业务理解,设计数据库表结构,并根据数据资源清单设计数据采集清洗流程,将整洁干净的数据存储到数据库或数据仓库中。 元数据管理:对基础库和主题库中的数据项属性进行管理,并将数据项的业务含义与数据项进行关联,便于业务人员理解数据库中的数据字段含义。 数据质量管理:建立数据质量管理和校验的流程,包括数据清洗、数据验证和异常处理等,确保数据的准确性和完整性。 数据安全管理:确定数据的安全要求和分类标准,如敏感度、保密性、可用性等,并建立数据的安全管理和保护的流程。 在数据标准执行过程中,还需要特别注意以下几个方面: 评估确定落地范围:选择某一要点作为数据标准落地的目标,如业务的维护流程、客户信息采集规范、某个系统的建设等。 制定落地方案:深入分析数据标准要求与现状的实际差异,以及落标的潜在影响和收益,并确定执行方案和计划。 推动方案执行:推动数据标准执行方案的实施和标准管控流程的执行。 跟踪评估成效:综合评价数据标准落地的实施成效,跟踪监督标准落地流程执行情况,收集标准修订需求。 数据标准化的持续优化 数据标准并非一成不变,而是会随着业务的发展变化以及数据标准执行效果而不断更新和完善。 在数据标准维护的初期,需要完成需求收集、需求评审、变更评审、发布等多项工作,并对所有的修订进行版本管理。 中期应完成数据标准日常维护工作与数据标准定期维护工作。 后期应重新制定数据标准在各业务部门、各系统的落地方案,并制定相应的落地计划。 来源(公众号):数据治理体系
2025-01-10 09:37 80
1.数据,是指任何以电子或其他方式对信息的记录。数据在不同视角下被称为原始数据、衍生数据、数据资源、数据产品和服务、数据资产、数据要素等。 2.原始数据,是指初次产生或源头收集的、未经加工处理的数据。 3.数据资源,是指具有价值创造潜力的数据的总称,通常指以电子化形式记录和保存、可机器读取、可供社会化再利用的数据集合。 4.数据要素,是指投入到生产经营活动、参与价值创造的数据资源。 5.数据产品和服务,是指基于数据加工形成的,可满足特定需求的数据加工品和数据服务。 6.数据资产,是指特定主体合法拥有或者控制的,能进行货币计量的,且能带来经济利益或社会效益的数据资源。 7.数据要素市场化配置,是指通过市场机制来配置数据这一新型生产要素,旨在建立一个更加开放、安全和高效的数据流通环境,不断释放数据要素价值。 8.数据处理,包括数据的收集、存储、使用、加工、传输、提供、公开等。 9.数据处理者,是指在数据处理活动中自主决定处理目的和处理方式的个人或者组织。 10.受托数据处理者,是指接受他人委托处理数据的个人或者组织。 11.数据流通,是指数据在不同主体之间流动的过程,包括数据开放、共享、交易、交换等。 12.数据交易,是指数据供方和需方之间进行的,以特定形态数据为标的,以货币或者其他等价物作为对价的交易行为。 13.数据治理,是指提升数据的质量、安全、合规性,推动数据有效利用的过程,包含组织数据治理、行业数据治理、社会数据治理等。 14.数据安全,是指通过采取必要措施,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。 15.公共数据,是指各级党政机关、企事业单位依法履职或提供公共服务过程中产生的数据。 16.数字产业化,是指移动通信、人工智能等数字技术向数字产品、数字服务转化,数据向资源、要素转化,形成数字新产业、新业态、新模式的过程。 17.产业数字化,是指传统的农业、工业、服务业等产业通过应用数字技术、采集融合数据、挖掘数据资源价值,提升业务运行效率,降低生产经营成本,进而重构思维认知,整体性重塑组织管理模式,系统性变革生产运营流程,不断提升全要素生产率的过程。 18.数字经济高质量发展,是指围绕加快培育新质生产力,以数据要素市场化配置改革为主线,通过协同完善数据基础制度和数字基础设施、全面推进数字技术和实体经济深度融合、持续提升数字经济治理能力和国际合作水平,实现做强做优做大目标的数字经济发展新阶段。 19.数字消费,是指数字技术、应用支撑形成的消费活动和消费方式,既包括对数智化技术、产品和服务的消费,也包括消费内容、消费渠道、消费环境的数字化与智能化,还包括线上线下深度融合的消费新模式。 20.产业互联网,是指利用数字技术、数据要素推动全产业链数据融通,赋能产业数字化、网络化、智能化发展,推动业务流程、组织架构、生产方式等重组变革,实现产业链上下游协同转型、线上线下融合发展、全产业降本增效与高质量发展,进而形成新的产业协作、资源配置和价值创造体系。 21.城市全域数字化转型,是指城市以全面深化数据融通和开发利用为主线,综合利用数字技术和制度创新工具,实现技术架构重塑、城市管理流程变革和产城深度融合,促进数字化转型全领域增效、支撑能力全方位增强、转型生态全过程优化的城市高质量发展新模式。 22.“东数西算”工程,是把东部地区经济活动产生的数据和需求放到西部地区计算和处理,对数据中心在布局、网络、电力、能耗、算力、数据等方面进行统筹规划的重大工程,比如人工智能模型训练推理、机器学习等业务场景,可以通过“东数西算”的方式让东部业务向西部风光水电丰富的区域迁移,实现东西部协同发展。加快推动“东数西算”工程建设,将有效激发数据要素创新活力,加速数字产业化和产业数字化进程,催生新技术、新产业、新业态、新模式,支撑经济高质量发展。 23.高速数据网,是指面向数据流通利用场景,依托网络虚拟化、软件定义网络(SDN)等技术,提供弹性带宽、安全可靠、传输高效的数据传输服务。 24.全国一体化算力网,是指以信息网络技术为载体,促进全国范围内各类算力资源高比例、大规模一体化调度运营的数字基础设施。作为“东数西算”工程的2.0版本,具有集约化、一体化、协同化、价值化四个典型特征。 25.元数据,是定义和描述特定数据的数据,它提供了关于数据的结构、特征和关系的信息,有助于组织、查找、理解、管理数据。 26.结构化数据,是指一种数据表示形式,按此种形式,由数据元素汇集而成的每个记录的结构都是一致的,并且可以使用关系模型予以有效描述。 27.半结构化数据,是指不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层的一种数据化结构形式。 28.非结构化数据,是指不具有预定义模型或未以预定义方式组织的数据。 29.数据分析,是指通过特定的技术和方法,对数据进行整理、研究、推理和概括总结,从数据中提取有用信息、发现规律、形成结论的过程。 30.数据挖掘,是数据分析的一种手段,是通过统计分析、机器学习、模式识别、专家系统等技术,挖掘出隐藏在数据中的信息或者价值的过程。 31.数据可视化,是指通过统计图表、图形、地图等图形化手段,将数据中包含的有用信息清晰有效地传达出来,以便于数据使用者更好地理解和分析数据。 32.数据仓库,是指在数据准备之后用于永久性存储数据的数据库。 33.数据湖,是指一种高度可扩展的数据存储架构,它专门用于存储大量原始数据和衍生数据,这些数据可以来自各种来源并以不同的格式存在,包括结构化、半结构化和非结构化数据。 34.湖仓一体,是指一种新型的开放式的存储架构,打通了数据仓库和数据湖,将数据仓库的高性能及管理能力与数据湖的灵活性融合起来,底层支持多种数据类型并存,能实现数据间的相互共享,上层可以通过统一封装的接口进行访问,可同时支持实时查询和分析。 35.隐私保护计算,是指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算的一类信息技术,保障数据在产生、存储、计算、应用、销毁等数据流转全过程的各个环节中“可用不可见”。隐私保护计算的常用技术方案有安全多方计算、联邦学习、可信执行环境、密态计算等。常用的底层技术有混淆电路、不经意传输、秘密分享、同态加密等。 36.安全多方计算,是指在一个分布式网络中,多个参与实体各自持有秘密数据,各方希望以这些数据为输入共同完成对某函数的计算,而要求每个参与实体除计算结果、预期可公开的信息外均不能得到其他参与实体的任何输入信息。主要研究针对无可信第三方情况下,安全地进行多方协同的计算问题。 37.联邦学习,是指一种多个参与方在保证各自原始私有数据不出数据方定义的可信域的前提下,以保护隐私数据的方式交换中间计算结果,从而协作完成某项机器学习任务的模式。 38.可信执行环境,是指基于硬件级隔离及安全启动机制,为确保安全敏感应用相关数据和代码的机密性、完整性、真实性和不可否认性目标构建的一种软件运行环境。 39.密态计算,是指通过综合利用密码学、可信硬件和系统安全相关技术,实现计算过程数据可用不可见,计算结果能够保持密态化,以支持构建复杂组合计算,实现计算全链路保障,防止数据泄漏和滥用。 40.区块链,是分布式网络、加密技术、智能合约等多种技术集成的新型数据库软件,具有多中心化、共识可信、不可篡改、可追溯等特性,主要用于解决数据流通过程中的信任和安全问题。 来源:国家数据局
2025-01-09 17:35 48
2014年,大数据首次写入政府工作报告,大数据逐渐成为各级政府关注的热点;2019年10月,十九届四中全会首次将数据纳入生产要素范畴;2023年2月,中共中央、国务院印发的《数字中国建设整体布局规划》,将数据要素放到一个更为宏大的“数字中国”图景中;3月7日,十四届全国人大会议上,根据国务院关于提请审议国务院机构改革方案的议案,我国将组建国家数据局。随着国家政策的密集发布,数据作为关键生产要素的地位进一步明确。 数据成为数字经济的关键生产要素 数据并非从诞生起就是生产要素。近二十年来,人类采集数据、处理数据的能力有了质的跃升,经济活动数字化转型加快,数据才逐渐具备成为生产要素的性质,对提高生产效率的乘数作用凸现。激活数据要素的根本目的是以多样、创新的方式投入生产,为经济社会生产创造更大的价值。 数据要素究竟如何发挥其作为生产要素的价值,需要进一步分析厘清。随着信息技术的发展和产业应用的演化,数据要素投入生产的途径可分为三次价值释放过程,即数据支撑业务贯通、数据推动数智决策、数据流通对外赋能,如上图所示。需要注意的是,之所以说这三次价值是数据要素价值释放的三条途径,是因为一方面这三次价值之间存在一种递进关系,后者往往以前者为基础;另一方面,这三条途径存在一种并列关系,这些价值可以且有必要同时予以关注、同时充分释放。 一次价值:数据支撑业务贯通 数据投入生产的一次价值体现在支撑政府、企业等组织的业务系统运转,实现业务间的贯通。首先,数据经由各个业务系统的设计而产生,经过业务系统的规范,在特定范围内实现标准化的数据得以不断积累,逐渐汇聚成可利用的资源。其次,这些数据也支撑着业务系统的正常运转,通过计算机对数据的读写,实现业务初步的标准化、自动化管理和运营。最后,一定程度标准化的数据具备了通用性,数据得以贯通了线下与线上的界限,贯通业务流程间的界限,甚至有贯通组织内部业务领域间的界限的能力。总之,业务系统搭建起来、数据在系统中运转起来时,就已经在生产活动中释放出价值。 从投入生产的执行环节看,数据支撑业务贯通直观表现为提高劳动等生产要素的利用率。技术要素与之类似,通过将技术投入生产环节,实现业务流程中对部分劳动、岗位的替代,发挥其乘数作用。在这个意义上,就像将技术投入生产释放价值一样,发挥数据要素作用的首要工作是充分认识数据要素的作用,真正在业务中用到数据、贯通业务。 此时,数据以业务系统为单元集中产生、单一存储,相应的治理工作也以增、删、改、查、对齐、合并等常规的数据库管理为主,多集中于局部业务领域的流程改善和相关业务数据的贯通。虽然此阶段数据并未得到深度整合与分析,但无论是开发系统积累数据,还是操作数据规范业务流程,还是利用数据贯通业务,它们都是数据世界内的生产活动,创造出相应的价值。 因此,数据的一次价值是是实现数字化转型、提高组织内部经营管理效率的第一步。为推动数据的一次价值释放,政府、企业等组织的主要工作重心是业务数据化及各类业务信息系统建设。例如,二十年前,我国以“两网、一站、四库、十二金”工程为代表的电子政务建设全面开展,经过多年推进,各级政府业务信息系统建设和应用成效显著,通过业务数据化的方式实现了数据在系统中的有效运转和贯通,公共服务水平得到全面提升,为当今的数字政府建设奠定了基础。这一阶段,组织内部所持有的数据种类相对单一、计算的要求简单,技术门槛较低,关键是深入挖掘业务需求,明确业务数据化方向。当前仍有大量行业、大量企业未能有效实现数字化转型,“流程靠跑、查询靠问”的传统工作模式拖累了生产效率的提升。 总之,数据要素的一次价值如同寻找矿洞、积累矿藏,是数据要素流通的基础工作。在众多行业和企业尚不具备业务数据化能力的背景下,对这些行业和企业谈论数据要素市场还为时过早。更好发挥数据要素作用,需要帮助这些行业和企业释放数据要素的一次价值,用数据支撑起业务贯通。随着业务需求的挖掘和业务信息系统的建设,大量宝贵的业务数据不断积累,组织内业务系统数据独立存储、共享壁垒高筑的情形不再适应生产经营发展的需要,数据统一管理、贯通使用的场景不断涌现,为进一步挖掘数据的生产要素价值奠定了重要基础。 二次价值:数据推动智能决策 数据要素投入生产的二次价值释放体现在,通过数据的加工、分析、建模,可以揭示出更深层次的关系和规律,使生产、经营、服务、治理等环节的决策更智慧、更智能、更精准。一方面,通过对大量数据的管理和分析,组织内部的决策者可以实现“用数据说话、用数据决策”,运用数据呈现出的关键指标与信息评估发展态势,即时有效防范化解风险,创新行动方略;另一方面,数据分析也直接嵌入到系统中,与业务紧密融合,即时的数据挖掘、分类、预测、聚类等直接向业务赋予智能化的价值。 这两方面中,数据都是通过带来新信息、实现认知层面的升级来创造生产价值。从控制论的角度看,物质、能量和信息是构成世界的三大基石,信息不是物质也不是能量。如同土地要素是所有生产经营活动的物质基础,资本要素提高了物质交换的效率,劳动要素和技术要素促进了能量的转移与转换,数据要素可以支撑起对信息这一基石的创造与转换。与其他要素相比,对信息的把握与运用是数据要素价值释放的独特所在。数据要素的二次价值中,“决策”一词是广义的含义,既包括人的抉择与决策,又包括业界所说的机器“智能化决策”。 人和机器都可以根据各种信息、规律、规则做出选择,人可以用数据更好地认识形势和规律,人的能力难以认知到的业务规则可以交给机器认知。从根本上讲,数据二次价值释放是深层关系与规律的挖掘带来的认知突破,提供了独特的观察视角,由此构建出理解、预测乃至控制事物运行的新体系,从而摆脱了经验和人工的局限。 当前,一些头部制造业企业已建立起针对业务管理和经营决策的完整数据链,部分关键的经营管理决策动作可以被数据替代,从而实现通过业务智能化优化管理岗位用工结构;各大银行充分整合中小企业的经营数据,挖掘更准确的企业客户画像与信用评分,由此决定中小企业贷款风险评估结果,为中小企业低成本融资提供可能。 可以看到,数据要素不仅可以投入于自有业务支撑分析决策,还能够与其他生产要素的交融,形成新的要素组合和要素结构。数据驱动的智慧化、智能化决策通过与传统要素的业务化结合,可以实现更少的要素资源投入创造更多的物质财富和服务,从而优化传统生产要素的经营与配置,使传统要素价值倍增,提升全要素生产效率,实现生产率跃升、产业链优化和竞争力重塑。 总之,数据要素的二次价值具有其他生产要素不具备的独特性,是数据要素价值释放的核心所在。数据要素流通的重要目标也是回馈二次价值的释放,使数据在认知决策层的价值惠及广大主体,因此数据要素二次价值的基础也必须筑牢。为推动数据要素二次价值的释放,各组织需主动提升数据意识和数据挖掘能力,在数据分析、人工智能等技术的辅助下,构建数据自动化、智能化采集、处理、执行的新生产体系,消除人的认知误区和主观偏见,发挥数据要素在生产力竞争中的关键作用。 战略决策者可以结合对业务目标的深刻理解,利用大量数据挖掘呈现的结果做出更具智慧的决策,执行层可以充分利用数据分析结果,让人通过智能的关联、图谱等做出更有效的选择,让机器寻找关键的函数、标签、画像,实现自动化的预测、分析,使数据的二次价值回馈一次价值,业务运转变得更加智能。 三次价值:数据流通对外赋能 数据要素投入生产的三次价值释放让数据流通到更需要的地方,让不同来源的优质数据在新的业务需求和场景中汇聚融合,实现双赢、多赢的价值利用。流通赋能是数据要素价值飞跃的一个关键。一方面,数据具有规模报酬递增效应,越大规模、越多维度的数据融合汇聚创造的价值倍增,金融、物流、通信、汽车等等经济活动中的各类事项均可被多方来源的数据赋能,企业自有数据与外部数据的充分融合可以实现数据应用价值的最大化。因此,随着各组织对数据一次价值、二次价值的释放,各组织对于数据的渴求已经超越了自身产生的数据。 另一方面,现阶段大量数据集中于少数主体,数据要素分布不均、结构失衡的问题较为突出。数据具有的低成本复制性可以改变要素投入生产的结构,更大规模、更广范围的数据要素利用不会增加过多额外成本,但可以产生超额利润,带来社会福利增加。“数据二十条”强调促进全体人民共享数字经济发展红利,数据要素流通可以激发数据的正外部性,使数据价值惠及广大市场主体和全体人民。 历史经验表明,生产要素并不必然需要流通,但流通有助于进一步释放生产要素价值。农业领域,土地要素自古释放着生产粮食的价值。土地流转政策的改革与落地,让土地在供方和需方间有效流转,进一步促进了农民获得财产性增收,激活了农业剩余劳动力的转移。参考土地要素流转经验,结合数据要素自身属性,数据要素的三次价值释放需要各组织有效管理自有数据,提升高质量数据供给能力,挖掘外部数据引入需求。需求与供给间存在对立统一的关系,各组织及相关服务商需要关注多元化能力的提升。一次数据流通过程中,数据供给方和需求方虽然不是同一主体,但一个主体可以兼具数据供给者和需求者的身份,在不同业务场景中进行转换。 在追求利益的市场自发手段调节下,需求能够牵引供给,供给也能创造需求。供给方与需求方的数据框架在相互对齐的过程中,不断扩大相应的市场规模,增加新的经济增长点,从而实现在多元场景中持续释放数据要素的业务价值、经济价值和社会价值。 为实现数据供需双方高效规范匹配,数据要素市场培育逐渐成为行业关注焦点。市场的基本含义是各方在共识规约下自由参与交换的场所。数据要素市场就是以数据供方、需方为主体,以各种形态的数据为对象,以流通为手段,从而实现参与方各自诉求的场所,是一系列制度和技术支撑的复杂系统,数据供给、业务需求、流通模式、权利关系、价格机制、技术条件、配套设施等都是数据要素市场的构成要件。因此,数据要素市场的培育应在保障安全和隐私的前提下,本着自由流动、普惠发展的原则进行鼓励和规范,使各项工作有力支撑起数据要素价值的充分释放。 结论 推动数据要素发展,是对当今技术与产业背景的深刻把握,是抢抓数字经济时代国际竞争制高点的关键举措。发展数据要素应聚焦于数据要素价值的释放。数据要素三次价值释放规律突出了数据要素本身的作用机理,在一定程度上连接起政府、企业等组织的业务数据化、数据业务化、数据资产化具体操作与整体经济社会增长、全要素生产率提升。 关于数据要素及其价值释放的基本规律还需要持续深入挖掘和阐释,但数据要素的三次价值提示我们:数据要素发展是一项系统工程,既涉及组织内部的数据应用,又涉及全社会的普惠发展;既涉及数据资源的配置,又涉及数据对配置其他资源的作用。需要强调的是,我们今天说数据在流通中可以实现价值增值和飞跃,并不意味着我们已经完全进入第三次价值的阶段。 部分组织对数据应用的感知仍然模糊,又受限于资金、人才、技术水平不足,覆盖生产活动全流程、全产业链的数据链仍不完善,尚不具备业务数据电子化或分析决策智能化的能力。这种条件下,这类组织即使引入外部数据也无法有效利用,无法形成回馈业务发展的价值回路。因此,数据要素发展需要统筹推进,一次价值和二次价值仍需要持续释放,在更广泛实现业务贯通和数智决策的基础上,全面发挥数据流通对外赋能的价值。 来源(公众号):三界逆熵实验室
2025-01-08 18:18 61
热门文章