数据资产为王,如何解析企业数字化转型与数据资产管理的关系?
原文链接:数据资产为王,解析企业数字化转型与数据资产管理的关系
视频回顾:点击这里
课件获取:点击这里
一、数据资产背景介绍
随着企业数字化转型的深入,数据体量爆炸式增长,如何控制数据生产成本、发现有价值的数据,提高数据ROI,成了企业数字化转型中后期的关键任务,这也是数据资产管理的终极目标。
而在数字化转型过程中并不是一帆风顺,往往会遇到很多问题。如何控制生产成本、发现恶性成本因素、量化生产成本?如何发现价值数据、梳理数据分布、分析数据价值?这都是企业是实现企业数字化转型路上需要思考的问题。
如何解决上述问题,关键点在于利用方法论+工具思路构建数据资产管理平台。
二、数据资产管理方法论
那么如何给予方法论进行数据资产管理呢?我们可以从以下几个方面入手:
1、如何梳理数据:元数据管理
在梳理数据之前,我们首先要明确三个目标:
-
目标一:明确有哪些数据
-
目标二:理解这些数据的作用
-
目标三:便捷统一的查询入口
明确完目标后,根据元数据管理五步法,我们来进行数据梳理:
-
第一步:采集元数据
-
第二步:定义元模型
-
第三步:维护元数据
-
第四步:元数据质量
-
第五步:元数据查询
2、如何提升数据规范性:数据标准+数据模型
元数据采集上来之后,要做的第二个事情就是数据标准和数据模型,这个步骤和元数据管理并没有非常明确的切分,但在一般企业做数据资产管理时一般会先做元数据管理,因为见效比较快。
传统的数据开发方式会出现许多问题,例如:表名缺乏约束规范,无法直观的从表名判断出输出层级、数据含义;字段缺乏注释;字段名不严谨,status等于状态,不等于订单状态;没有定义数据生命周期lifecycle等。
而规范方式在底层对数仓分层、主题域等进行规范设计,建立数据标准然后统一进行模型设计,之后进行模型审核然后模型发布,提升整体的数据规范性。
3、如何提升数据治理
技术部门与业务部门共同确定数据质量提升场景,从业务场景出发,从上至下建设,不能由开发人员想到什么临时校验什么,包括:
-
从业务场景出发,解决实际的业务数据问题,明确建设目标,保障执行策略无偏差
-
线下调研、收集、整理数据问题,按业务目标进行分类管理
-
根据业务分类进行规则集管理,根据数据质量反馈不断优化、沉淀规则集
4、如何量化数据价值
量化数据价值从两个方向入手,一个是数据成本,一个是数据价值。
数据成本包括建设成本及资源成本两块,建设成本无法单算,只能根据项目成本(中台建设、交付实施等项目)、人力成本进行估算;而资源成本则可以量化,也是我们需要重点关注的部分,包括存储单价、计算单价等。
数据价值直接收益和间接收益,直接收益是指对于部分跨集团数据共享、数据封装对外销售的场景,可直接量化收入;间接收益是指大部分数据是服务企业内的业务开展,无法直接进行量化收益,只能间接从这两个维度分析价值:数据使用热度、数据上下游依赖。
通过数据成本和数据价值的合理测算,我们就能量化数据价值。
三、数据资产产品介绍
上面我们为大家讲了很多方法论的内容,那么有没有一款产品能够切实解决企业问题,帮助企业搭建数据资产管理平台呢?在这里我们为大家介绍袋鼠云数栈的数据资产产品——湖仓数据资产(DataAssets)。
**湖仓数据资产管理平台(DataAssets),**通过元数据管理、数据标准规范设计、数据质量提升、数据热度和成本计算,优化数据生产成本、量化数据收益价值,广泛应用于湖仓建设的中后期阶段。
湖仓数据资产管理平台的产品特点是通过统一平台以达到治理闭环的效果。
产品主要包含以下几个功能:
- 接入元数据进行管理
- 元数据查询
- 数据标准管理
- 数据模型管理
- 数据质量管理
同时产品具备以下价值
- 梳理/管理企业数据
全面采集、管理、盘点数据,让大家知道并理解企业有哪些数据
- 提升数据规范性
建设数据标准体系,通过数据模型的自动引入,完成规范的模型设计
- 提升数据质量
通过事前规则配置、事中规则执行、事后质量报告,及时发现问题数据,有效避免问题的影响扩散
- 量化数据价值
通过分析数据的成本、收益,合理评估每份数据的价值
四、数据资产客户案例
接下来我们分享三个使用客户的实际案例,为大家介绍数据资产管理平台如何切实的帮助客户解决问题。
- 金融:某支付集团一站式元数据管理平台
- 金融:某银行数据质量治理提升项目
- 制造:某芯片制造企业统一数据资产管理平台
袋鼠云开源框架钉钉技术交流群(30537511),欢迎对大数据开源项目有兴趣的同学加入交流最新技术信息,开源项目库地址:http://github.com/DTStack
- 想要精准营销,从学习搭建一套对的标签体系开始丨DTVision分析洞察篇
- 袋鼠云思枢:数驹DTengine,助力企业构建高效的流批一体数据湖计算平台
- DataOps不是工具,而是帮助企业实现数据价值的最佳实践
- 开源项目丨Taier1.2版本发布,新增工作流、租户绑定简化等多项功能
- 当我们在聊「开源大数据调度系统Taier」的数据开发功能时,到底在讨论什么?
- 开源交流丨批流一体数据集成工具ChunJun同步Hive事务表原理详解及实战分享
- 大数据开源项目,一站式全自动化全生命周期运维管家ChengYing(承影)走向何方?
- 基于开源流批一体数据同步引擎ChunJun数据还原—DDL解析模块的实战分享
- 数据资产为王,如何解析企业数字化转型与数据资产管理的关系?
- 走好数据中台最后一公里,为什么说数据服务API是数据中台的标配?
- 基于开源大数据调度系统Taier的Web前端架构选型及技术实践
- 实时开发平台建设实践,深入释放实时数据价值丨04期直播回顾
- 袋鼠云数栈基于CBO在Spark SQL优化上的探索
- 离线数仓建设,企业大数据的业务驱动与技术实现丨03期直播回顾
- 蛟分承影,雁落忘归——袋鼠云一站式全自动化运维管家ChengYing(承影)正式开源
- 数据指标体系如何搭建才最有效,从0到1带你快速入门丨02期直播回顾
- 玩转集群配置中心,一文带你了解Taier控制台
- 争夺存量用户关键战,助力企业构建完美标签体系丨01期直播回顾
- 开源项目丨Taier 1.1版本正式发布,新增功能一览为快
- ChunJun支持异构数据源DDL转换与自动执行 丨DTMO 02期回顾(内含课程回放 课件)