聊一聊数据仓库的 KPI 怎么定

栏目: 数据库 · 发布时间: 5年前

内容简介:首先,要明确的一点是那么我们可以换一个角度,从数据仓库要解决的问题来考虑。那么,怎样既体现了服务业务,又体现了提高了整体的数据服务能力呢?这就是下面要讨论的 KPI 怎么定。

首先,要明确的一点是 数据最终是要服务于业务的! 但是,数据仓库一般又不直接对接于业务,而更多地对接数据分析系统、用户画像系统和推荐或广告系统等。因此不容易用业务指标来衡量数据仓库的效果。

那么我们可以换一个角度,从数据仓库要解决的问题来考虑。 简单地讲,数据仓库要做的是提高数据能力、提高数据分析效率、提高数据质量 的。

那么,怎样既体现了服务业务,又体现了提高了整体的数据服务能力呢?这就是下面要讨论的 KPI 怎么定。

0x02 怎样定 KPI

定 KPI 在某种程度上也可以理解为工作的评价标准。对于数据建设来讲,我们可以从工作内容是否可量化的角度来考虑。

个人认为真正价值最高的是那部分不可量化或者不容易量化的工作内容。这些工作可以是:一、数据仓库整体的设计(比如主题设计、通用维度的设计、数据分层的设计);二、数据规范的设计(比如说表和字段命名规范、 Sql 编写规范)。

对于这部分内容,居士建议可以通过写文档的形式体现,最终统计出这些工作带来的效果( KPI 之一 ):

  1. 比如说需要写多少和数据仓库设计相关的文档
  2. 有哪些业务相关的表将会按照你的设计来卡发
  3. 优化了多少数据分析的流程

上面的内容更多的像是品牌影响力,不容易体现具体的工作产出。我们聊一下相对容易量化的工作内容。比如说中间表对业务方的支持情况,解决了多少业务的痛点,提高了多少的数据质量等等。

具体到点的话,大致可以总结出下面的一些内容( KPI 之二 ):

  1. 将要解决哪些业务问题(多少业务、多少报表用了你的中间表)

  2. 将会替换多少原始表的使用频率(比如数据分析查询你的表的次数,以前都是查原始日志的)

  3. 将要解决了多少数据口径不一致,数据质量的问题(可以加上告警,统计出来提前发现了多少数据问题)

0x03 举个栗子

上面列了一些居士大致思考的一些点,在具体写 KPI 的时候,可以从中选三四条。

举个简单的栗子,仅供参考:

  1. 完成数据仓库的设计,包括主题设计、数据分层和表字段命名等内容,完成10篇以上 Wiki
  2. 完成店铺主题相关的中间表的设计和开发,满足90%的数据分析需求。
  3. 完成基本的数据监控功能,能够监控关键数据的数据迟到、掉零、环比等内容。

大致解释一下,根据上面的栗子,在半年后做工作汇报的时候可以大致这样写:

  1. 已完成数据仓库设计相关文档的编写,总计25篇 Wiki,总阅读量10w。
  2. 已完成店铺主题相关的中间表的设计和开发,共计15张中间表,日均访问次数400次,占店铺主题相关总任务数的98%。
  3. 完成基本的数据监控功能,共计监控380张业务表,提前发现了14起数据异常。

0xFF 总结

上面就是数据仓库相关的 KPI 该怎么定的内容,具体的内容要和现实的业务情况相结合,因此本文仅起到抛砖引玉的作用,希望读者朋友们看后能有一些启发。

不足之处多多指出,一起交流进步。

祝各位童鞋升职加薪,早日走向人生巅峰。


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Linux设备驱动程序

Linux设备驱动程序

科波特 / 魏永明、耿岳、钟书毅 / 中国电力出版社 / 2006-1-1 / 69.00元

本书是经典著作《Linux设备驱动程序》的第三版。如果您希望在Linux操作系统上支持计算机外部设备,或者在Linux上运行新的硬件,或者只是希望一般性地了解Linux内核的编程,就一定要阅读本书。本书描述了如何针对各种设备编写驱动程序,而在过去,这些内容仅仅以口头形式交流,或者零星出现在神秘的代码注释中。 本书的作者均是Linux社区的领导者。Jonathan Corbet虽不是专职的内核......一起来看看 《Linux设备驱动程序》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码

XML、JSON 在线转换
XML、JSON 在线转换

在线XML、JSON转换工具