文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

为什么你的数据仓库项目推进不下去?

2024-12-03 18:44

关注

本文转载自微信公众号「木东居士」,作者木东居士 。转载本文请联系木东居士公众号。 

 为什么你的数据仓库项目推进不下去?

0x00 前言

最近很多小伙伴都来找居士咨询类似的问题:

不同的团队会面临不同的难题,今天居士简单聊一下这几年自己亲身经历以及帮助一些小伙伴解惑后的一些感想。

废话少说,直接上正题。分为三个角度讨论:

  1. 体系搭建
  2. 业务理解
  3. 沟通管理

这三个角度,也是我认为一个每一个数据仓库项目负责人要具备的核心能力。下面分别从这三个角度进行分享。

0x01 体系搭建能力

说句心里话,大部分互联网公司的数据仓库,其实是不需要特别复杂和专业的数据模型的。

因此,大家要先有足够的信心去认为,你按照设计出来的数据仓库体系,是能cover住大部分业务场景的。此处可以去参考居士之前的数据仓库文章。

那么,为什么还要提这个体系搭建能力呢?

这里想强调的是,你对于数据仓库整体的规划和思考能力。切记不要纸上谈兵,搞一堆什么模型,什么分层,其实没有什么用的,不能真正解决问题的设计,都是假的。

抛开这些模型之类的乱七八糟的角度来看,居士举几个例子,这些例子其实能解决你很多问题,而这些方案带来的效率提升,就会让你能感觉到数据仓库的带来的价值。

记住一点,不要指望一种表设计能满足100%的需求,如果有,请告诉我。

一、Bitmap表

举个例子,用户活跃Bitmap表。

表结构:

这么一张表,在day_act_bitmap字段里面存放用户的历史活跃情况,能满足绝大部分关于活跃统计的需求。

如果感觉不够,再在里面补充几个维度,再加个周活跃,年活跃,这不就ok了?

二、用户维度行为宽表

表结构:

这么一张用户维度的宽表,又能帮你满足一大波需求

三、业务统计大宽表

类似前面的,不再解释了。

这种设计还有很多,就不一一列举了~

这些设计都不是多么严谨的模型设计,但是很有用,也能解决很多问题。大家可以把这些小trick整合到数据仓库模型设计中。

有了真正能解决业务需求模型能力之后,就是如何让大家执行了。特别是规范制定后大家不遵守该怎么办?一般有下面几种方式:

  1. 制定可执行的规范,一定是可操作的,不要搞太虚的,比如大家可以思考一下,自己的数据分层设计,能否明确两个层次的的具体差别是什么?能否做到可以不用思考按照规范就能确定分层
  2. 通过流程&管理手段保证执行
  3. 化系统化强制执行,不遵守不能建表,不能写入数据

具体用哪种方式就看具体的场景了。在大部分团队的前期,居士推荐前两种结合。

0x02 业务理解能力

抛开业务设计的数据仓库模型,都是在耍流氓。

这一块有挺多想说了,想了想也不知道该说什么了。简单聊一下换位思考吧。

假设你是一个业务产品经理。

假设你是一个数据分析师。

假设你是一个推荐算法工程师。

回过头看一下自己的表结构设计,靠谱不,合理不。

如果体会不到,就去找一些关系好的同事,看看他们在你的数据基础上做了多少工作才能让数据可用?多听一下吐槽。

为什么要做这些?

当你的用户对你的产出不满的时候,你做的东西是没有价值的,没有价值的东西是不能长久的。

所以,具备良好的业务理解能力是保证你的数据仓库项目能顺利推进下去的核心动力。

0x03 沟通管理能力

前段时间做过一次分享,提到了一个观点:如果一个项目失败了,90%的锅都应该在项目经理这里,而这90%的因素里面,至少有90%是因为沟通问题。

根据沟通的对象,可以把沟通问题划分为下面几个方面:

思考一下:

上面这些是大部分同学的数据仓库项目推进不下去的过程中会遇到的问题。

抛开上面这些容易看到和关注的点,还有下面这些内容大家是否考虑到?

如果考虑到了,该如何去解决?是否有经验?

以上都是沟通问题。

关于管理的问题暂时就不多提了,参考项目管理即可,关于项目管理的内容大家可以去考一个pmp的证书,证书没什么用,主要是学一些东西,再结合互联网的特色应用起来即可。

0xFF 总结

总结一下吧,从居士的角度来讲,当你的数据仓库项目推进不下去的时候,优先考虑的是沟通的问题,良好的沟通能解决大部分的困难。

优秀的业务理解是决定你的成果能被其他人接受的可能性。

最后,适当且合理的体系搭建能力,能助力你显得更优秀。

 

来源:木东居士内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯