小朱520

2020-08-15   阅读量: 3814

机器学习

机器学习,关联规则中关于支持度,置信度,提升度的解释

扫码加入数据分析学习群


假设关联规则为x==》y

支持度的意思是事物x和y在总事物集出现的频次,

1.png好比牛肉和鸡肉同时购买的次数占整个订单集的数为三分之七就是它的支持度,以概率呈现,越大越好。

置信度是指买了x会买y的概率,公式为,买了x又买y的单次数除以所有买x的单次数,好比上图,如果x是牛肉,y是鸡肉,那么它的置信度为4/3.以概率呈现,概率越大说明这个x==》y的关联规则越好。

一般强关联规则都是需要支持度大于最小支持度(自己指定一个阈值)置信度大于最小置信度(同样自己指定)以后的数据集,当然这个最小置信度和最小支持度也是筛选的作用。

提升度:

3.png

解释为虽然计算机到游戏机的支持度也好,置信度也好,但是由于购买游戏机的频次占总事物10000的概率为0.75是大于这个0.67的所以这个关联规则是没有价值意义的。

提升度的公式为4.png一般在数据挖掘中提升度要大于3的时候,才会觉得这条关联规则有价值

37.1459 1 2 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子