liuyong2730

2020-06-14   阅读量: 1336

Excel

RFM模型案例练习 拓展

扫码加入数据分析学习群

昨天重新做了一遍课堂上的电商行业用户画像案例。在做帕累托图的时候有点想不起来设置细节了。今天再做一遍好多了。

很多细节的设置还是需要亲手操作才会记住。

先了解大概背景,然后明确分析的目的:用RFM模型划分用户类别,找到核心用户类别。

如何找到核心用户类别是最关键的。所谓核心用户类别,可以从如下几点着手:用户数量的累计占比,消费次数的累计占比,或者消费金额的累计占比。按照RFM有8个类别,那么累计占比与类别集合之间的关系应该符合二八定律,这样就可以用帕累托统计并展示了。

关于二八定律,或者二八效应,本质是少数造成主要的、重大的影响,多数造成少许的影响。

第一步 确认数据范围:给定的表格

第二部 理解数据的业务意义: 数据是2019年1至7月期间的,最细颗粒度在商品描述这个维度,一个流水号下有多个商品,一个用户购买一次产生一个流水号。

第三部 Recency,Frequence和Money值的计算,关键是F值的计算。

  • R和M只需做一个透视,值字段分别设置最大值和求和即可求出。
  • F值即一个用户对应多少个订单号。需要先去重准备数据:透视原始数据,得到不重复订单号,用vlookup从原始数据查找到对应的用户编号;再将准备好的数据透视,通过以用户编号为行标签,流水号作为值字段,并设置为计数。

第四步 将数据整合到一个新的表中,判断RFM程度,然后按照RFM模型做分类。可以先准备一个表格区域然后用Vlookup函数,也可以直接用IF层层嵌套判断。

个人觉得vlookup比较好。

  • 再判断R的程度时,我并没有计算与当前时点的时间差,直接用average计算所有最近消费日期的平均值,然后将每个用户的最近消费日期与之比较,与课上时间差与平均时间差的比较结果是一样的。因为average(当前时点-最近时点)= 当前时点 - average(最近时点)

最后一步 透视分类结果。我分别以累计用户数,累计消费次数,累计消费金额做为指标做帕累托图,求得核心用户类别都是“一般挽留、一般发展、重要价值”。

  • 一定要降序列排列
  • 累计百分比值显示方式为按某一字段汇总的百分比
  • 右键选择数据调整图例项的系类名称和系列值,系列值把0%加上,使起点位于原点
  • 勾选水平次要坐标轴,并将坐标轴位置设为在刻度线上
  • 系类选项里的分类间距设为0,并在填充里设置边框为白色
  • 将纵向主次坐标轴的最小值都设为0,最大值分别设为对应的总计值和100%

回顾整个分析过程,有点类似求解物理课上的应用题,给定已知某几个条件求某时刻的状态哈,有很多细节需要注意。

熟能生巧,加油!奥利给!

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
20.2130 4 1 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子