第一阶:搞数据
数据分析最怕啥?
没思路?
没模型?
没图表?
都不是!
数据分析最怕:没数据!无论是做啥分析,搞数据,始终是第一位的工作。尽可能多地搞数据,是第一位要求。不然一切免谈。
只不过,同数仓开发不同,数据分析关注的数据,是面向业务主题的。数据服务的产品、运营、销售、营销、售后部门,到底有什么数据,需要什么数据,是数据分析师必须梳理清楚的。
具体来说,包括:指标/维度两部分。如何衡量是否清晰?可以问自己,以下问题是否清楚。
1、我服务的部门是……
2、该部门属于利润中心/成本中心
3、该部门的KPI指标是……
4、该部门的主要流程是……
5、该部门流程中,已采集数据是……
6、该部门现有过程指标是……
7、该部门组织架构是……
8、该部门服务对象分类是……
9、该部门常用分类维度是……
其中:
1、2、3是用来明确主要KPI指标的,这是数据分析的源头和关键
4、5、6是用来搭建过程指标体系的,解释KPI指标如何达成
7、8、9是用来筛选关键分类维度的,当KPI指标波动,从这些维度做拆解
很多同学习惯于在现有宽表上跑数,向上不清楚业务流程、业务目标,向下不清楚数据来源、数据采集,每天忙着按需求单跑数,连跑的数是啥意思都不懂。这样就限制死了自己的发展空间,无法进一步提升能力了。
第二阶:定基线
做到第一阶,至少能看懂自己跑的数据了,知道每个数据是用在哪个部门,哪项工作。下一步最关键的是……?
有的同学可能不假思索地说:建模!还没到这一步哈。下一步关键的是:定基线。知道自己看的数据,常规形态是啥样的。知道什么算正常,什么算不正常。
这一步非常重要!因为数据本身没有含义,数据+标准才有含义。而并非所有指标,业务方都会给出标准的。很可能,只有销售数据才有具体到每天的考核标准,其他数据得凭经验、凭常识、凭分析定出基线(如下图)。
很多同学无法解读数据,做的分析不被业务认可,都是因为没有跨过这一台阶。最常见的,看到指标跌了,盲目做了一堆交叉,然后业务方轻飘飘地:“这是正常波动”。
然而第二天又有同样幅度波动,业务方却急着烟熏火燎:“这么大波动你都看不到吗!”……被这么折腾几次,就会信心全无,怀疑人生。所以想进步,就不能被业务方牵着鼻子走,得自己有定基线能力。
第三阶:拆因素
跨过第二阶后,数据分析师已经对业务常见走势,有充足的了解。并且,自己有能力做判断,就能识别出异常状态。并非所有的异常都不可控,有相当多的异常是可观测因素导致的,比如宏观环境,比如营销动作、推广计划。此时,要先有能力先把这些明显可识别的“白犀牛”整明白,再来谈其他“黑天鹅”问题。
看到这里,肯定有同学会说:“老师,这个简单,我的PEST,SWOT,4P已经按捺不住了,来吧!”然鹅,没卵用。你看那么多PEST的文章,有一篇教过你怎么量化P、E、S、T四个指标不???
所以这一台阶,叫“拆因素”,即把这些影响业务的因素,拆解到可以量化的,能用一个或几个数据指标表现,并能与内部数据结合分析的程度。拆因素可能有若干数据形态,比如:
1、0、1形态:有XX因素、没有XX因素
2、分类形态:同一事件,A\B\C三种状态
3、连续形态:能用一个连续型指标,代表该因素
具体怎么拆,是需要大量分析工作做基础的,最后能沉淀下来的,就是最有价值的经验。
第四阶:测细节
跨过第三阶段后,数据分析师能对明显的,重大的影响因素做出判断。想要进一步提升,就得深入到细节中,了解活动到底怎么做的,产品到底怎么设计的,用户到底需求什么。这些已经触及业务的核心,因此很难短时间内搞清楚,需要长期积累。
想做这一步,有2个关键工作要做。
其一:打标签。
越是触及业务核心,连续型指标能描述的情况就越少,越需要打标签。类似用户情绪、喜好、产品功能点、营销逻辑,都是靠标签来描述和量化的。准确地打标签,将业务量化,做出清晰的分类,是高级数据分析师的技能。不是说把数据库里的,现有的维度表拖出来就完事。
其二:做实验。
可能有同学会说:ABtest我现在也经常干,为啥感觉不到进步呢。注意,现在的ABtest,很多是产品驱动的,不是数据驱动的。鬼知道产品经理从哪里搞了2个版本,扔过来就测,然后让数据分析师解释差异。这是非常本末倒置的,只会让人陷在琐碎的数据里。
一个正式的实验,是:
1、有清晰的改进目标
2、有清晰的改进逻辑
3、有关键改善过程指标
4、有环境控制变量
5、有组间差异预判
谋定而后动。这样才能在解读实验数据的时候剔除各种杂糅因素,得到正确结论。当然,想做到这一步,需要业务的配合和参与。如果业务真的很喜欢自说自话,就靠数据分析师个人能力,至少推动剔除一些明显容易杂糅的因素。
第五阶:理逻辑
迈过第四个台阶,数据分析师本人已经可以实现:描述问题-发现问题-解释问题-检验效果的闭环了。单纯站在数据角度,已经是个完整的能力闭环。
但仅有数据能力闭环是不够的,因为在企业里,相当多的问题不是来自技术,而是来自业务。更有甚者,是来自业务方的屁股决定脑袋,来自业务方急功近利、大干快上,来自业务方事前拍脑袋,事后拍大腿。
因此想要让数据更好地展现价值,就得有能力应对现实问题。在千头万绪中,梳理清楚问题逻辑,找到正确的答案,或者至少给自己找到脱身的办法(如下图)。
这时候“理逻辑”,重点是把口语表达的,不可量化的业务逻辑,转化成数据可验证的逻辑,并且选择合适的数据方法得出结论。除了数据能力,还需要数据分析师有业务洞察,有一些职场沟通技巧,才能完成任务。
第六阶:组模型
有了以上五个阶段的积累以后,你已经能完全在一个行业里混得如鱼得水了,不但能做好基础数据服务,也能协助业务做出业绩,更能以客观中立的态度赢得老板的信任。
此时,可以更进一步,提炼一些属于自己的模型出来:
如果用少数关键指标就能概括这个行业的问题,可以捏个业务模型
如果某个业务场景,用特征+算法能得到很准确的预测结果,就固定成该行业算法模型。
搞完了,记得也取四个英文字母做名字以体现档次。
做这一步,不仅是为了沉淀经验,提升逼格,更是为了迁移知识,扩展使用范围服务的。很难保证人一辈子都不换行,掌握了优秀分析能力的人,干一行就是一行专家。而迁移知识,靠的是模型的总结与经验积累,两者缺一不可。
小结
纵观整个成长阶梯,核心就是:数据分析师要能剥丝抽茧的解决复杂企业问题,这样培养能力,才是我们自己安身立命的法宝。
很多在校的,刚毕业的同学们,还习惯于沉浸在书本中,总觉得越难的知识越牛逼,一本统计学有19章,那第19章肯定比18章牛逼……这样单纯堆叠知识点,可以无穷无尽卷下去,但是对于提升实际能力帮助甚小,非常不推荐哈。真有兴趣搞这些,推荐去纯科研。
特别是,数据分析本身就是一个面向不确定性,用数据方法解决企业经营不确定性的工种。把数据采集上来,服务好管理层,推动业务实现业绩,至少就有一个公司数据部门总监位置在召唤,何乐而不为呢。与大家共勉!