聊一聊数据仓库的 KPI 怎么定

栏目: 数据库 · 发布时间: 6年前

内容简介:首先,要明确的一点是那么我们可以换一个角度,从数据仓库要解决的问题来考虑。那么,怎样既体现了服务业务,又体现了提高了整体的数据服务能力呢?这就是下面要讨论的 KPI 怎么定。

首先,要明确的一点是 数据最终是要服务于业务的! 但是,数据仓库一般又不直接对接于业务,而更多地对接数据分析系统、用户画像系统和推荐或广告系统等。因此不容易用业务指标来衡量数据仓库的效果。

那么我们可以换一个角度,从数据仓库要解决的问题来考虑。 简单地讲,数据仓库要做的是提高数据能力、提高数据分析效率、提高数据质量 的。

那么,怎样既体现了服务业务,又体现了提高了整体的数据服务能力呢?这就是下面要讨论的 KPI 怎么定。

0x02 怎样定 KPI

定 KPI 在某种程度上也可以理解为工作的评价标准。对于数据建设来讲,我们可以从工作内容是否可量化的角度来考虑。

个人认为真正价值最高的是那部分不可量化或者不容易量化的工作内容。这些工作可以是:一、数据仓库整体的设计(比如主题设计、通用维度的设计、数据分层的设计);二、数据规范的设计(比如说表和字段命名规范、 Sql 编写规范)。

对于这部分内容,居士建议可以通过写文档的形式体现,最终统计出这些工作带来的效果( KPI 之一 ):

  1. 比如说需要写多少和数据仓库设计相关的文档
  2. 有哪些业务相关的表将会按照你的设计来卡发
  3. 优化了多少数据分析的流程

上面的内容更多的像是品牌影响力,不容易体现具体的工作产出。我们聊一下相对容易量化的工作内容。比如说中间表对业务方的支持情况,解决了多少业务的痛点,提高了多少的数据质量等等。

具体到点的话,大致可以总结出下面的一些内容( KPI 之二 ):

  1. 将要解决哪些业务问题(多少业务、多少报表用了你的中间表)

  2. 将会替换多少原始表的使用频率(比如数据分析查询你的表的次数,以前都是查原始日志的)

  3. 将要解决了多少数据口径不一致,数据质量的问题(可以加上告警,统计出来提前发现了多少数据问题)

0x03 举个栗子

上面列了一些居士大致思考的一些点,在具体写 KPI 的时候,可以从中选三四条。

举个简单的栗子,仅供参考:

  1. 完成数据仓库的设计,包括主题设计、数据分层和表字段命名等内容,完成10篇以上 Wiki
  2. 完成店铺主题相关的中间表的设计和开发,满足90%的数据分析需求。
  3. 完成基本的数据监控功能,能够监控关键数据的数据迟到、掉零、环比等内容。

大致解释一下,根据上面的栗子,在半年后做工作汇报的时候可以大致这样写:

  1. 已完成数据仓库设计相关文档的编写,总计25篇 Wiki,总阅读量10w。
  2. 已完成店铺主题相关的中间表的设计和开发,共计15张中间表,日均访问次数400次,占店铺主题相关总任务数的98%。
  3. 完成基本的数据监控功能,共计监控380张业务表,提前发现了14起数据异常。

0xFF 总结

上面就是数据仓库相关的 KPI 该怎么定的内容,具体的内容要和现实的业务情况相结合,因此本文仅起到抛砖引玉的作用,希望读者朋友们看后能有一些启发。

不足之处多多指出,一起交流进步。

祝各位童鞋升职加薪,早日走向人生巅峰。


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

机器学习基础教程

机器学习基础教程

(英)Simon Rogers,、Mark Girolami / 郭茂祖、王春宇 刘扬 刘晓燕、刘扬、刘晓燕 / 机械工业出版社 / 2014-1 / 45.00

本书是一本机器学习入门教程,包含了数学和统计学的核心技术,用于帮助理解一些常用的机器学习算法。书中展示的算法涵盖了机器学习的各个重要领域:分类、聚类和投影。本书对一小部分算法进行了详细描述和推导,而不是简单地将大量算法罗列出来。 本书通过大量的MATLAB/Octave脚本将算法和概念由抽象的等式转化为解决实际问题的工具,利用它们读者可以重新绘制书中的插图,并研究如何改变模型说明和参数取值。......一起来看看 《机器学习基础教程》 这本书的介绍吧!

SHA 加密
SHA 加密

SHA 加密工具

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换