基于数据挖掘的电子商务推荐引擎
摘要:数据挖掘简称DM。它利用数据仓库中的海量数据挖掘数据之间的内在规律和内在规律,通过客户、市场、产品、销售等数据建立数据之间的关系,从中发现市场运行规律,为企业决策提供可靠依据。例如,通过对老客户的挽留分析,建立老客户流失预测模型,分析客户流失的原因,为企业采取有效措施挽留老客户提供决策支持;通过客户价值分析,将客户划分为不同的价值层次,对不同的客户采取不同的优惠政策,以达到留住高质客户的目的。
数据挖掘简称DM。它利用数据仓库中的海量数据挖掘数据之间的内在规律和内在规律,通过客户、市场、产品、销售等数据建立数据之间的关系,从中发现市场运行规律,为企业决策提供可靠依据。例如,通过对老客户的挽留分析,建立老客户流失预测模型,分析客户流失的原因,为企业采取有效措施挽留老客户提供决策支持;通过客户价值分析,将客户划分为不同的价值层次,对不同的客户采取不同的优惠政策,以达到留住高质客户的目的。
(1) 相关建议
关联规则的挖掘主要是挖掘一些数据的依赖关系。通过对关联规则的挖掘,我们可以发现哪些项目经常同时购买,或者用户在购买某些项目后通常会购买哪些其他项目。在挖掘这些关联规则之后,我们可以根据这些规则向用户推荐它们。
关联推荐可以帮助用户在满足某种需求后发现其他潜在需求,从而促进网站上其他产品的销售。营销中的关联推荐有两种:向上营销和交叉营销。
向上营销是对相似产品线或升级产品的推荐,而交叉营销是基于对相似但不同产品的推荐。
现在我们需要知道哪些产品是用户购买多的,这样才能更好地满足用户的潜在需求,促进网站的更多销售。这需要从用户***中找出购买iPod产品的人的比例,然后再购买一些其他产品。当这一比例达到预定的目标水平时,我们可以认为这两个产品之间存在关联,因此我们可以向购买了iPod但尚未购买产品B的用户推荐产品B。
关联规则中有两个关键指标:衡量产品是否值得关联的支持度和置信度。
支持=购买a和B产品的人数(组G)/购买所有产品的人数(组U)
置信度=购买a和B商品的人数(集合G)/购买a商品的人数(集合a)
网站需要设置小支持度和小信任度,当支持度和信任度达到一定值时,就可以确定商品a和商品B是否可以关联销售。在用户的购买行为中,用户a不仅购买商品B,还可以购买商品C、D、e等一系列产品,因此,只有置信水平大于小置信水平的商品组合才是相关的和可推荐的。也可以认为相关购买率***的宝宝是值得推荐的。
(2) 基于内容的推荐
基于内容的推荐的核心思想是根据推荐项目或内容的元数据来发现项目或内容的相关性,然后根据用户过去的历史偏好向用户推荐相似的项目。
图中显示了一个基于内容的推荐示例,即图书推荐系统。首先,我们需要对图书元数据进行建模,然后通过图书元数据来发现图书之间的相似性。因为书的类型是“武侠,爱情”,所以a和C被认为是相关的书。除了图书类型,为了实现更准确的推荐,还需要考虑作者的图书等信息,终实现推荐。对于用户a来说,他喜欢读a书,所以系统可以向他推荐类似的C书。
基于内容的推荐机制的优点是能够很好地模拟用户的口味,提供更准确的推荐。但也存在问题:只根据项目本身的元素特征,不考虑人们对项目的态度,需要根据用户过去的历史偏好提出建议,这对新用户来说存在“冷启动”问题。
(3) 协同过滤推荐系统
根据用户对项目或信息的偏好,找到项目或内容本身的相关性,或找到用户的相关性,然后根据这些相关性进行推荐。
根据所有用户对项目或信息的偏好,我们找到一个与当前用户的偏好和偏好相似的“邻居”用户组,然后根据这些K个邻居的历史偏好信息为当前用户推荐。
基本原则:
假设四个用户a、B、C和D对四本书C、D、e和F的评分如下:
用户B和C对这四本书的得分相似。我们可以推断,用户B和用户C具有相同或相似的口味和便利性。当用户B购买g书时,我们可以向用户C推荐g书。
这种推荐的前提是大量用户的参与。一旦缺乏用户对项目的评价,这种推荐就会失败,如果数据较少,推荐本身就不准确。
根据所有用户对商品或信息的偏好,找出商品和商品之间的相似性,然后根据用户的
假设用户a喜欢商品a和C,用户B喜欢商品a、商品B和商品C,用户C喜欢商品a,从这些用户的历史偏好可以分析出商品a和商品C是相似的。喜欢商品a的人都喜欢商品C,根据这些数据可以推断出用户C很可能喜欢商品C,所以系统会向用户C推荐商品C。
要实现这种数据挖掘,前提是要获得大量的数据,数据必须足够大才能找出规则,这是有说服力的,而数据的获取成为基本的保证。因此,无论是传统的还是新兴的电子商务企业,it技术都是企业必须关注的一个环节。忽视it技术,实施大数据操作是万不得已的选择
上一篇: 电子商务从业人员必备技能通用表数据分析