国内外大数据标准化现状及发展方向
2018-10-09

  大数据标准化工作意义重大。全球已步入大数据时代,作为继云计算后的新一代信息技术,大数据技术和产业的发展和应用已经对政府、企业决策和人们的生活方式产生深远的影响。

  当前,各种大数据存产品和面向各行业的大数据应用层出不穷,急需通过标准化的途径规范认知,整合资源,促进各方达成共识,为我国大数据产业的健康发展打下基础,为数据安全应用提供保障,同时促进大数据交易等新兴服务模式规范发展。加强大数据标准化研制工作,对推动我国大数据产业进程,加快技术与标准的相互融合,落实大数据国家战略具有重要意义。

  自2012年起,ITU-T、ISO/IEC、CCSA等国内外标准化组织相继开展大数据标准化工作,目前已发布了多项大数据标准。本文从大数据标准体系框架出发,介绍了当前国内外大数据标准化领域的重点方向及取得的成果,并分析了这些方向未来的标准化发展方向。

  大数据标准化体系框架

  标准化工作需要科学的顶层设计,大数据标准化也不例外。制定体现大数据技术特点的、完善的标准体系框架对制定高质量、体系化的大数据标准至关重要。基于这一认识,在工信部和国标委的领导下,我国在2014年成立了全国信息技术标准化技术委员会大数据标准工作组(以下简称“信标委大数据标准工作组”),统筹开展我国大数据标准化工作。该工作组结合国内外大数据标准化情况、国内大数据技术发展现状、大数据参考架构及标准化需求,提出了我国的大数据标准体系框架。

  该大数据标准体系总体上由七个类别的标准组成,分别为:基础标准、数据标准、技术标准、平台和工具标准、管理标准、安全和隐私标准、行业应用标准。

  在大数据不同的发展阶段,有着不同的标准化需求与工作重点。总的来说,在标准化的起步阶段,以术语、参考架构等基础性标准为研究重点。而随着大数据技术的发展和应用的普及深入,其它类别的标准的重要性也不断显现出来,同时不同国家的标准化重点也会有不同侧重。例如,随着“中国制造2025”规划的提出,工业大数据相关应用在我国呈现出快速发展的势头,相应的与工业大数据相关的标准化工作也成为行业应用标准的热点。

  当前国内外大数据标准化热点领域

  (1)基础标准

  基础标准为整个标准体系提供包括总则、术语、参考模型等基础性标准,是整个标准体系的基石,其重要性不言而喻。在这一领域,ISO/IEC制定了ISO/IEC 20546—《信息技术-大数据-概览与术语》以及ISO/IEC 20547—《信息技术-大数据-参考架构》系列标准,参考架构系列标准包括框架与应用、用例与需求、参考架构、安全和隐私、标准化路线图等5个分册,作为大数据基础性标准考虑得相当全面。而ITU-T的SG13也发布了ITU-T Y.3600—《基于云计算的大数据需求与能力》,作为该研究组大数据系列标准的基础,该标准定义了大数据生态系统中的相关角色及其活动,并规范了基于云计算的大数据的需求和能力。遗憾的是,ISO/IEC与ITU-T这两大国际标准化组织并没有像当初制定云计算标准时那样联合制定术语和参考架构这样的基础性标准,联合制定的标准无疑具备更大的影响力和更高的可参考性。在国内,信标委大数据标准工作组也发布了《信息技术 大数据 术语》和《信息技术 大数据 技术参考模型》等基础性标准。可以说,在基础标准方面,国内外都已取得了相当多的成果,为大数据标准工作的进一步发展打下了良好的基础。

  (2)数据标准

  数据标准主要针对底层数据相关要素进行规范。包括数据资源和数据交换共享两部分,其中数据资源包括元数据、数据元素、数据字典和数据目录等,数据交换共享包括数据交易和数据开放共享相关标准。

  大数据的核心价值在于对多个不同来源的数据进行关联分析,因此包括数据交易、数据开放共享在内的相关标准就显得尤为重要。只有参与方遵循共同的标准,数据的交易与开放共享才能更为高效。在这一领域,ITU-T已发布了Y.3601—《大数据-数据交换框架与需求》,同时以此为基础正在制定《大数据-数据溯源需求》、《大数据-数据集成概览和功能需求》、《大数据-数据保留概览与需求》、《大数据-元数据框架与概念模型》等一系列数据标准。而在国内,由于政务信息开放、贵阳大数据交易所成立等事件的驱动,数据资源和数据交换共享标准成为数据标准领域的热点,包括《信息技术 大数据开放共享》系列标准(包括总则、政府数据开放共享基本技术要求、开放程度评价、政府资源目录体系等多个分册)、《信息技术 数据交易服务平台》系列标准(包括通用功能要求、交易数据描述等)在内的多个标准正在研制,未来还将研制大数据开放数据集基本要求和标识管理,数据交易的交易流程、数据管理、风险评估及交易质量评估等方面的标准。

  (3)管理标准

  管理标准作为数据标准的支撑体系,贯穿于数据生命周期的各个阶段,主要对数据管理、运维管理和评估三个层次进行规范。

  数据是企业的宝贵资产已成为业内共识,但如何对数据资产进行有效管理目前还处在非常原始的阶段,业界急需数据资产管理标准对相关工作进行规范指导。ITU-T SG16在今年7月刚刚立项了一个国际标准《数据资产管理框架》,该标准主要定义了数据资产的基本概念,梳理了数据资产管理的需求,提出了数据资产管理的框架。在国内,CCSA成立了大数据技术标准推进委员会(CCSA TC601),其中的数据资产管理工作组专门从事数据资产管理方面的标准化研究工作,已发布了《数据资产管理实践白皮书(2.0)》,目前正在编写3.0版本。未来TC601将继续进行主数据、数据标准和数据质量等标准制订,并研究数据资产管理评估的模型。

  (4)安全和隐私标准

  数据安全和隐私保护作为数据标准体系的重要部分,贯穿于整个数据生命周期的各个阶段。

  大数据安全虽仍继承了传统数据安全保密性、完整性和可用性等特性,但也有其特殊性,主要表现在个人隐私保护、跨境数据流动等方面。欧盟于今年5月颁布的《通用数据保护条例》(General Data Protection Regulation,简称GDPR),也进一步凸显了大数据时代数据隐私保护的重要性。

  在安全标准领域,ITU-T SG17正在制定多个大数据安全国际标准,包括《移动互联网服务中大数据分析的安全需求与框架》、《大数据即服务的安全指南》、《大数据基础设施及平台的安全指南》、《电信大数据生命周期管理安全指南》等。而在国内,全国信息安全标准化技术委员会下设了大数据安全标准特别工作组(SWG-BDS),专门进行大数据相关标准的研究,目前已发布了《信息安全技术 个人信息安全规范》、《信息安全技术 大数据服务安全能力要求》两项国家标准,同时还在制定《大数据安全管理指南》、《个人信息安全影响评估指南》、《个人信息去标识化指南》、《数据安全能力成熟度模型》、《数据交易服务安全要求》、《数据出境安全评估指南》等多项国家标准。下一步,该工作组将重点开展大数据安全参考框架、个人信息安全、数据交换共享相关安全以及大数据安全检测评估相关标准的研制。

  (5)行业应用标准

  行业应用类标准主要是针对大数据为各个行业所能提供的服务角度出发制定的规范。该类标准指的是各领域根据其领域特性产生的专用数据标准,包括工业、政务、服务等领域。

  由于这一领域的标准针对性较强,因此国际标准组织较少涉及这一领域,而同样也由于其较强的针对性和指导作用,国内热点行业的标准化工作则比较活跃。尤其是在工业大数据领域,信标委大数据标准工作组下设工业大数据专题组,制定中的国家标准包括《信息技术 大数据 工业应用参考架构》、《信息技术 大数据 产品要素基本要求》、《智能制造 对象标识要求》、《智能制造 制造对象标识解析体系应用指南》。CCSA TC601也成立了工业大数据工作组,进行相关标准的研究。其它比较活跃的行业还有政务领域,信标委大数据标准工作组同样下设政务大数据专题组,CCSA TC601也成立了政务大数据工作组。