2023-03-27 14:40 浏览量:951
2022年1月12日,浙江省市场监督管理局批准发布了省级地方标准DB33/T 2426-2022《公共数据元管理规范》省级地方标准(文本见附件下载)。该标准规定了公共数据元的属性、构成和管理的要求,标准适用于各级机关、团体、企事业单位、社会组织等公共管理和服务机构开展公共数据元的管理与使用工作。
Specification for the management of public data element
2022-01-12 发布 2022-02-12 实施
前言
1 范围
2 规范性引用文件
3 术语和定义
4 公共数据元属性
5 公共数据元构成
6 公共数据元管理
附录 A(资料性) 公共数据元管理流程图
本标准按照GB/T 1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定起草。
请注意本标准的某些内容可能涉及专利。本标准的发布机构不承担识别专利的责任。本标准由浙江省大数据发展管理局提出、归口并组织实施。
本标准起草单位:浙江省大数据发展中心、数字浙江技术运营有限公司、浙江省标准化研究院、北京国脉互联信息顾问有限公司、杭州市数据资源管理局、宁波市大数据发展管理局、温州市大数据发展管理局、湖州市大数据发展管理局、嘉兴市大数据中心、绍兴市大数据发展管理局、金华市大数据发展管理局、衢州市大数据发展管理局、舟山市大数据发展管理局、台州市大数据发展中心、丽水市大数据发展管理局。
本标准主要起草人:金加和、俞巍滔、平正强、毛远庆、赵程遥、齐同军、杜永华、池邦芬、笪猛霄、屠勇刚、包自毅、张新丰、顾闻、徐振华、张晓玮、杜战、徐峰、杜辉、甄理、张斌、俞文群、陈力琼、陈玮萍、毛蕾、韩建良、陈华飞、毛勇增、李永孟、林国、王玲玲、叶剑超、王文达、张佳佳、王路燕、孟一丁、王静姝、陈乐燕、朱娇娜。
本标准为首次发布。
本标准规定了公共数据元的属性、构成和管理的要求。
本标准适用于各级机关、团体、企事业单位、社会组织等公共管理和服务机构开展公共数据元的管理与使用工作。
下列文件中的内容通过文中的规范性引用而构成本标准必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本标准;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本标准。GB/T 7027—2002 信息分类和编码的基本原则与方法
GB/T 18391.1—2009 信息技术 元数据注册系统(MDR) 第1部分:框架GB/T 19488.1—2004 电子政务数据元 第1部分:设计和管理规范DB33/T 2350—2021 数字化改革术语定义
DB33/T 2351—2021 数字化改革 公共数据分类分级指南
GB/T 18391.1—2009、GB/T 19488.1—2004和DB33/T 2350—2021界定的以及下列术语和定义适用于本标准。
3.1
公共数据元 public data element
在多个公共管理和服务机构的系统应用中共同使用的数据元。
3.2
数据项 data item
数据记录中最基本的、不可再分的可命名数据单位,用于描述实体的某种属性。
3.3
一数一源 one data item one source
公共管理和服务机构按照一类数据有且只有一个权威来源机构和系统应用的要求,在法定职权范围内生产、存储与提供公共数据。
注: 一数即一个数据项,一源即数据的唯一来源机构和生产该数据的系统应用。
3.4
公共数据来源机构 public data source agency
生产、提供公共数据的组织机构,公共数据元信息编制与维护的主体。
3.5
公共数据管理机构 public data management agency
归集、管理公共数据的组织机构,公共数据元信息审核与发布的主体。
3.6
公共数据使用机构 public data user agency
申请、应用公共数据的组织机构,公共数据元信息使用的主体。
4.1 属性设置
4.1.1 基础属性
公共数据来源机构生产、存储的公共数据应具备7项公共数据元基本属性,具体包括:标识符、中文名称、英文名称、定义、数据类型、数据格式、值域。
4.1.2 扩展属性
公共数据来源机构将公共数据归集至公共数据管理机构,或共享至公共数据使用机构前,应补充完善10项公共数据元扩展属性,具体包括:对象类词、表示词、敏感级别、计量单位、关系、公共数据来源机构、所属应用、备注、版本、发布日期。
4.2 约束要求
公共数据元属性应以字符串形式进行描述,各属性的具体约束条件按表1所示。
表1 公共数据元属性约束条件表
序号 | 属性类别 | 属性名称 | 定义 | 约束 | 出现次数 | 备注 | ||
1 | 基础属性 | 标识符 | 用于唯一表示公共数据元的编码 | 必选 | 1:1 | 按照5.2给出的公共数据元编码规则表示 | ||
2 | 中文名称 | 赋予公共数据元的单个或多个中文字词的指称 | 必选 | 1:1 | — | |||
3 | 英文名称 | 赋予公共数据元的单个或多个英文字词的指称 | 必选 | 1:1 | 使用小写英文表示,特定用语或缩略词可使用大写英文表示,英文字词之间使用连字符“-”连接 | |||
4 | 定义 | 表达一个公共数据元的本 | 必选 | 1:1 | — | |||
质特性并使其区别于其他 | ||||||||
公共数据元的陈述 | ||||||||
5 | 数据类型 | 用于表示公共数据元的数值、字符或其他表示的类型 | 必选 | 1:1 | 包括:字符型 C、数值型 N、货币型 Y、日期型 D、日期时间型T、逻辑型 L、备注型 M、通用型 G、双精度型 B、整型 I、浮点型 F 等 | |||
6 | 基础属性 | 数据格式 | 公共数据元值的表示格式,以及最大/最小字符长度等 | 必选 | 1:1 | — | ||
7 | 值域 | 公共数据元的允许值的集合 | 条件选择 | 0:1 | 当公共数据元存在可枚举值域时,该属性应当描述;当公共数据元的值域不胜枚举时,该属性可为空 | |||
8 | 扩展属性 | 对象类词 | 公共数据元名称的组成部分,表示管理的对象 | 可选 | 0:n | — | ||
9 | 表示词 | 公共数据元名称的组成部分,表示公共数据元的表现形式 | 可选 | 0:1 | — | |||
10 | 敏感级别 | 公共数据元的数据安全敏感等级 | 可选 | 0;1 | 由高至低分别为:敏感数据(L4 级)、较敏感数据(L3级)、低敏感数据(L2级)、不敏感数据(L1级),按照DB33/T 2351—2021中第5章的规定的要求进行划分与管理 | |||
11 | 计量单位 | 属于数值型的公共数据元值的计量单位 | 条件选择 | 0:1 | 存在计量单位时,该属性应当描述 | |||
12 | 关系 | 公共数据元与其他公共数据元之间的关系的描述 | 可选 | 0:n | 按照5.3给出的公共数据元关系表示 | |||
13 | 公共数据来源机构 | 生产、提供公共数据的组织机构,公共数据元信息编制与维护的主体 | 必选 | 1:1 | 应按照“一数一源”原则界定 | |||
14 | 所属应用 | 生产该公共数据的系统应用名称 | 可选 | 0:1 | 应按照“一数一源”原则界定, 若通过人工填报等线下方式生 产或存储公共数据,该属性可为空 | |||
15 | 备注 | 公共数据元的相关注释 | 可选 | 0:1 | — | |||
16 | 扩展属性 | 版本 | 公共数据元发布版本的标识 | 必选 | 1:1 | 应按照唯一标识表示,版本的命名格式为“V主版本号.次版本号”,主版本号、次版本号由自然数表示,公共数据元变更后的版本按照以下规则修订: 若公共数据元变更改变了原有的数据交换与使用关系,则递增主版本号,并重置次版本号;若公共数据元变更不影响原有的数据交换与使用关系,则保留主版本号,并递增次版本号 | ||
17 | 发布日期 | 公共数据元发布的日期 | 必选 | 1:1 | 由数据管理机构制定,采用“YYYYMMDD”格式表示 | |||
注: 公共数据元属性的各项约束条件说明如下。
a) 属性名称:赋予公共数据元属性的唯一指称。 b) 定义:表示公共数据元属性特征的陈述。 c) 约束:界定公共数据元属性是否应当出现的描述,包括以下取值: 1) 必选:该属性应当描述; 2) 可选:该属性允许但不是应该描述; 3) 条件选择:该属性在特定条件下应当描述。 d) 出现次数:界定公共数据元属性可赋予属性值数量的描述,包括以下取值: 1) 0:1:表示没有或只有 1 个属性值; 2) 0:n:表示没有或有 n 个属性值; 3)1:1:表示有且只有 1 个属性值; 4)1:n:表示有 1 个或 n 个属性值。 e) 备注:表示公共数据元属性相关的注释。 |
5.1 公共数据元分类
5.1.1 分类方法
公共数据元应按照GB/T 7027—2002中6.2给出的线分类法进行分类,即按公共数据元的信息来源特征,逐次地分为若干层次,每个层次又分为若干类目。同一分支的同层级类目之间构成并列关系,不同层级类目之间构成隶属关系。
5.1.2 分类结构
依据信息对象的来源属性,将公共数据元分为以下7项一级分类、34项二级分类,分类类目应当覆盖已归集公共数据,一级分类应维持不变,二级分类可按需扩展,三级分类由公共数据来源机构根据语境自行归纳总结,具体分类结构见表2。其基础分类如下:
a) 自然人类:自然人类公共数据元主要来源于公安、民政、人力社保等部门,规定了公共数据中的自然人基本信息、资产信息、社会活动、荣誉资质、涉事涉法等类数据的定义与属性, 具体包括姓名、民族、证件号码、婚姻状况、文化程度、从业状况等公共数据元;
b) 法人类:法人类公共数据元主要来源于市场监管、发改、经信等部门,规定了公共数据中的法人基本信息、资本与资产、许可、资质与荣誉、纳税、参保与缴费、生产经营、行政执法、司法信息、信用评价等类数据的定义与属性,具体包括统一社会信用代码、法人名称、住所、营业收入、许可编号、资质等级等公共数据元;
c) 信用类:信用类公共数据元主要来源于发改、市场监管、财政等部门,规定了公共数据中的自然人信用信息、企业信用信息、社会组织信用信息、事业单位信用信息、政府机构信用信息、特征人群及领域信用信息等类数据的定义与属性,具体包括荣誉类型、评价等级、舆情内容、列入经营异常名录原因、行政处罚决定书文号、司法案件案号等公共数据元;
d) 自然地理类:自然地理类公共数据元主要来源于自然资源、生态环境、气象等部门,规定了公共数据中的基础地理信息、地质信息、土地信息、覆被信息、海洋信息、生态环境信息、气象灾害信息等类数据的定义与属性,具体包括联系地址、经度、纬度、空间坐标系、地面分辨率、地理标识符、气温、场所用途等数据元;
e) 感知类:感知类公共数据元主要来源于建设、公安等部门,规定了公共数据中的感知采集信息、感知设备信息等类数据的定义与属性,具体包括感知对象、数据传送方式、数据摘要、设备参数、技术特征信息等数据元;
f) 统计类:统计类公共数据元主要来源于统计、经信等部门,规定了公共数据中的统计指标信息、统计制度信息、统计目录信息、统计报表信息等类数据的定义与属性,具体包括指标名称、指标编码、统计周期、统计时间、指标数据值、统计层级、统计模型等数据元;
g) 其他类:其他类公共数据元规定了除自然人类、法人类、信用类、自然地理类、感知类、统计类外的各类数据的定义与属性,包括但不限于政策文件信息、公告信息、算法模型信息。
表2 公共数据元分类结构表
序号 | 一级分类 | 二级分类 | ||
1 | C | 法人类 | A | 基本信息 |
2 | B | 资本与资产 | ||
3 | C | 许可、资质与荣誉 | ||
4 | D | 纳税、参保与缴费 | ||
5 | E | 生产经营 | ||
6 | F | 行政执法 | ||
7 | G | 司法信息 | ||
8 | H | 信用评价 | ||
9 | D | 自然人类 | A | 基本信息 |
10 | B | 资产信息 | ||
11 | C | 社会活动 | ||
12 | D | 资质荣誉 | ||
14 | E | 信用类 | A | 自然人信用信息 |
15 | B | 企业信用信息 | ||
16 | C | 社会组织信用信息 | ||
17 | D | 事业单位信用信息 | ||
18 | E | 政府机构信用信息 | ||
19 | F | 特征人群及领域信用信息 | ||
20 | F | 自然地理类 | A | 基础地理信息 |
21 | B | 地质信息 | ||
22 | C | 土地信息 | ||
23 | D | 覆被信息 | ||
24 | E | 海洋信息 | ||
25 | F | 生态环境信息 | ||
26 | G | 气象灾害信息 | ||
27 | G | 感知类 | A | 静态感知信息 |
28 | B | 动态感知信息 | ||
29 | C | 感知采集信息 | ||
30 | D | 感知设备信息 | ||
31 | H | 统计类 | A | 统计指标信息 |
32 | B | 统计制度信息 | ||
33 | C | 统计目录信息 | ||
34 | D | 统计报表信息 | ||
35 | Z | 其他类 | — | — |
5.2 公共数据元编码
公共数据元标识符编码规则如图1所示,采用8位字符表示,分别由三部分组成:
—— 第 1 位代码:1 位大写英文字符(A-Z),表示一级类目。见表 2 中的一级分类;
—— 第 2 位代码:1 位大写英文字符(A-Z),表示二级类目。见表 2 中的二级分类;
—— 第 3、4 位代码:2 位阿拉伯数字(00-99),表示三级类目,“00”表示该公共数据元无三级类目;
—— 第 5、6、7、8 位代码:4 位阿拉伯数字(0001-9999),代表每一类目下公共数据元的顺序号。
图1 公共数据元编码示意图
5.3 公共数据元关系
公共数据元之间存在以下关系,各种关系的表示格式见表3所示:
a) 派生关系。描述了公共数据元之间的继承关系,一个较为专用的公共数据元是由一个较为通用的公共数据元通过调整加工派生而来。例如公共数据元“学生姓名”派生于公共数据元“姓名”;
b) 组成关系。描述了整体与部分的关系,一个公共数据元由其他多个公共数据元组成。例如公共数据元“所在地区”由“所在省”、“所在市”、“所在区县”、“所在街道”等公共数据元组成;
c) 替代关系。描述了公共数据元与变更、废止前的历史公共数据元的替代关系。例如公共数据元“纳税人识别号”替代了公共数据元“国税税务登记证号”;
d) 连用关系。描述了公共数据元与其他公共数据元一起使用的关系。例如公共数据元“调查结果”与公共数据元“调查对象”连用。
表3 公共数据元关系表示格式
关系 | 表示符号 | 示例 |
派生关系 | derive-from | “derive-from ⅱ”表示该公共数据元由公共数据元ⅱ派生而来 |
组成关系 | compose-of | “compose-of ⅱ、ⅲ、ⅳ”表示该公共数据元由公共数据元ⅱ
ⅲ、ⅳ共同组成 |
替代关系 | replace-of | “replace-of ⅱ”表示该公共数据元替代了公共数据元ⅱ |
连用关系 | link-with | “link-with ⅱ”表示该公共数据元与公共数据元ⅱ共同使用 |
注: “ⅱ”、“ⅲ”、“ⅳ”为公共数据元的标识符。 |
6.1 管理原则
公共数据元的管理应遵循下列原则:
a) 各类公共数据元应由牵头负责的公共数据来源机构进行管理;
b) 应有计划、有步骤地建立和执行公共数据元管理规程;
c) 公共数据元应集中控制管理,分别实施;
d) 每一项公共数据元应进行动态的更新和维护。
6.2 管理流程
6.2.1 管理流程概述
公共数据元的管理流程包括公共数据元新增、变更或废止的提交、审核、发布、使用及记录,公共数据元新增、公共数据元变更和公共数据元废止的管理流程图见附录A。
6.2.2 提交
对需要新增、变更或废止的公共数据元,公共数据来源单位应按照以下流程提交公共数据元信息。
a) 公共数据元新增。对于存在使用需求,但未建立相应标准的公共数据元,公共数据来源机构应按照 GB/T 19488.1—2004 中 6.1 给出的数据元提取和分析流程,通过业务功能建模、业务流程建模、信息建模、数据元提取步骤,识别得到公共数据元,并通过公共数据元属性提取得到符合第 4 章要求的数据元属性,形成并提交完整的公共数据元信息。
b) 公共数据元变更。对于已经发布的公共数据元,应定期开展适用性评估,对偏离现实数据使用需求的公共数据元,公共数据来源机构应提交拟变更的公共数据元属性,根据公共数据元变更影响结果修改版本号,并说明公共数据元变更的原因。
c) 公共数据元废止。当已经发布的公共数据元出于必要原因无法继续使用时,公共数据来源机构应提交公共数据元废止申请,并提供公共数据元废止的申请依据。
6.2.3 审核
对于公共数据来源机构提交的公共数据元新增、变更、废止申请,公共数据管理机构应按照以下流程,在15个工作日内完成公共数据元信息的审核。
a) 公共数据管理机构对提交的数据元信息开展技术审查,具体包括以下审查要点:
1) 公共数据元新增。应重点审查公共数据元是否与现有公共数据元重复、是否与其他公共数据元冲突、公共数据元属性是否合理、是否属于公共数据来源机构管理范围等内容;
2) 公共数据元变更。应重点审查公共数据元属性是否合理、公共数据元变更的成本与效益、公共数据元变更的风险隐患等内容;
3) 公共数据元废止。应重点审查公共数据元废止依据的充分必要性、公共数据元废止的风险隐患等内容。
b) 公共数据管理机构应协同公共数据来源机构确定公共数据使用机构清单,将通过技术审查的公共数据元信息向相关机构征求意见,并将意见整理汇总后反馈至公共数据来源机构。
c) 公共数据来源机构应根据技术审查意见及征求意见,修改公共数据元信息后提交技术终验, 或中止公共数据元审核流程。
注: 公共数据元变更、废止的风险隐患包括:因数据保密性缺失对组织机构及社会公众的权益造成损害、因数据完整性缺失对业务造成重大冲击,导致业务中断、因数据可用性缺失导致系统应用运行中断、因数据可控性缺失造成数据传输与存储范围失控、因数据不可否认性缺失造成数据可信度下降等。
6.2.4 发布
公共数据元审核通过后,公共数据管理机构应通过一体化智能化公共数据平台及时发布公共数据元新增、变更、废止等信息,并告知公共数据使用机构进行更新同步。公共数据元变更或废止时,公共数据使用机构应依据公共数据元信息变化情况,对关联的系统应用、数据目录、数据仓等进行调整适配, 保障数据应用的连续性与完整性。
6.2.5 使用
公共数据元的使用方式包括直接使用和派生使用:
a) 直接使用。在语境指向唯一且明确的情况下,公共数据来源机构和公共数据使用机构应按照公共数据管理机构发布的信息要求,直接使用公共数据元开展公共数据的归集、共享、开放和应用;
b) 派生使用。当语境指向不唯一或不明确,公共数据来源机构和公共数据使用机构可结合自身业务特点,对各类公共数据元的对象词或特性词加以限定,形成新的公共数据元。派生使用公共数据元的数据类型、数据格式、值域等属性不应与原公共数据元存在矛盾。
示例1:“姓名”、“统一社会信用代码”等公共数据元可以直接使用。
示例2:对于公共数据元“姓名”,教育部门可将其派生为“学生姓名”;对于公共数据元“统一社会信用代码”, 市场监管部门可将其派生为“生产企业统一社会信用代码”。
6.2.6 记录
公共数据来源机构及公共数据管理机构应记录以下公共数据元相关信息,确保公共数据元的可追溯性:
a) 公共数据来源机构应留存公共数据元的编写规则信息;
b) 公共数据来源机构提出、公共数据管理机构审核发布过程中应记录现行使用的公共数据元信息;
c) 公共数据管理机构应留存曾受理的公共数据元新增、变更、废止申请的相关资料;
d) 公共数据管理机构、公共数据来源机构应留存批准变更、废止前的历史版本信息;
e) 公共数据来源机构、公共数据管理机构应留存使用了现行或历史版本公共数据元的数据目录、数据仓等相关数据资源。
A.1 公共数据元新增
公共数据元新增管理的流程图见图A.1。
图A.1 公共数据元新增管理流程图
A.2 公共数据元变更
公共数据元变更管理的流程图见图A.2。
图A.2 公共数据元变更管理流程图
A.3 公共数据元废止
公共数据元变更管理的流程图见图A.3。
图A.3 公共数据元废止管理流程图
——-