第十二章电子商务大数据分析技术
摘要:为了分析产品和用户的购物行为,数据集来源于阿里云天池搜索
1、 数据来源、分析目的和思路
为了分析产品和用户的购物行为,数据集来源于阿里云天池搜索:
该数据集包含约100万随机用户在2017年11月25日至2017年12月3日期间的所有行为(点击、购买、添加购买等)。数据集信息如下:
2商品编号:id4162024
3类别ID 9439
4类型行为类型:PV(产品详情页PV,相当于点击)、buy(产品购买)、cart(将产品添加到购物车)、fav(集合产品)100150807
2、 分析文本
从图中可以看出,11月25日至12月1日光伏发电量相对稳定,12月2日光伏发电量明显增加,达到本周***值,12月3日光伏发电量略有下降。据推测,由于12月2日和3日是***,PV增加。不过,这段时间不涉及节日。11月25日和26日也是***。其PV值应与12月2日、3日相似,可用作异常点分析,找出原因。根据PV,我们可以调整广告和其他资源的时间和数量,节约成本,提高营销效率。
网站的dau如下:
根据该数据计算出的每日活动与每日PV一致。异常点也在11月25日和26日,可以进一步分析。首先定位异常用户组,然后从内部和外部找出原因。外部因素包括pest和竞争对手,内部因素包括网站调整、产品价值、用户需求和营销计划。
定义:当天之前没有行为的用户是新用户,否则是老用户。每天统计新老用户数如下:
对于这一数据,从11月26日开始,12月1日新用户数缓慢减少到0,12月2日老用户数缓慢增加到突然增加。新老用户数量总体稳定。
日期次日保留率3天保留率5天保留率7天保留率
由于12月1日至12月3日新用户数为0,因此无法计算保留率;12月2日和12月3日活跃用户较多,对应这两天的保留率较高。一般情况下,保留率趋于逐渐降低,趋于稳定。一般来说,由于数据少、时间短,一般的保留曲线无法得到,但可以运用计算方法。另外,根据保留量和添加量可以预测日常生活。
结合经验,根据每个转化率,我们可以判断2017年11月25日至2017年12月3日期间的产品质量和网站销售额。
用户分析包括行为事件、转换、保留、分布、点击、用户行为路径、聚类、属性、粘性分析等。根据数据进行用户聚类分析。
根据用户id,统计每个用户的cart、fav、buy和PV四种行为。由于样本量大,采用k-means方法进行聚类。分析数据满足聚类要求。比较了聚类数3和聚类数4的结果。根据变量对分类的贡献和实际的分类特征,选择3号聚类。聚类结果如下:
卡特3128
Fav184型
购买232
三大类中,***类用户多,其特点是商品浏览量相对较少,购物车和购买率增加的商品数量相对较多;第二类用户少,其特点是商品数量相对较少在购物车中增加了收缴率和购买率,这是不活跃的类别;第三个类别在两个类别中的***个类别之间有很多用户和功能,商品浏览量相对多,用户更喜欢收集商品多于其他两个类别。对于分类,可以进行准确营销。
根据矩阵对用户进行分类,对不同类型的用户采取不同的措施,达到准确营销的目的。从图中可以看出,***象限是针对大量浏览和购买的用户。这样的用户在购物时更加谨慎,喜欢比较更多的商品。第二象限是针对浏览量少、购买量大、购物快捷准确、主动性强、无需为此类用户投入过多资源维护的用户。第三象限的用户浏览量减少,购买量减少。这样的用户可能不喜欢网上购物,也可能有很强的购物目的。对于这样的用户,可以采取广告和优惠券等措施。在第四象限,用户浏览量大,购买量小。对于此类用户,他们可以启动全面的缩减活动。在确定营销计划后,随机选择不同类型的用户对营销计划进行测试,然后通过假设检验对实施效果进行评价。