以数据文件“马克威通用数据1.mkw”为例,演示单维关联规则的操作。数据显示了某超市一天中商品销售记录。其中用客户号记录顾客编号信息,商品号记录商品号信息。通过这些数据进行关联规则分析,找出相关程度较强的商品,以改善货架的堆放。
首先,在工作区内,打开建模分析工作流:“机器学习”→“关联规则”→“单维关联规则”,接着选择数据源,然后设置算法参数,最后双击运行按钮。其中各类参数的含义及设置如下:变量1为“用户喜好”,变量2为“浏览次数”,最小置信度设置为80%,最小支持度设置为10%,规则最大项数为4.
单维关联规则-属性设置选项说明
交易ID:交易ID是指客户标识,用户可以根据实际情况进行变通设置。
商品ID:商品ID是指商品标识,用户可以根据实际情况进行变通设置。
最小支持度:设置规则提取的最小支持度。
最小置信度:设置规则提取的最小置信度。
双击“运行”节点运行算法后,得到如下结果:
单维关联规则-树形结果列表 单维关联规则-强规则输入要求:数值型。
关联分析的目的是寻找给定数据记录中数据项之间隐藏的关联关系,描述数据之间的密切度。关联规则分析方法可用于诸多领域,如网络日志分析,预警系统等。
“关联规则”(Association Rules)是数据挖掘的主要技术之一,用于从庞大的数据库中寻找有用或有趣的模式和规则。关联规则最初产生于购物篮分析,它通过发现顾客放入其购物篮中不同商品之间的联系,分析顾客购买行为中隐含的有趣模式,从而指导销售商制订营销策略。单维关联规则特指只涉及单个属性项的关联规则。
基本概念
事务:一个事务包含一个唯一的事务标识符,和一个组成事务的“属性-值”列表。在事务数据库中,每条记录代表一个事务。事务可用标识符TID表示。
事务集:事务数据库中事务的集合,可用表示。事务集一般也可认为是记录的集合。
项:事务数据库中的“属性-值”对,例如“是否购买计算机=yes”,其中“是否购买计算机”为事务数据库中的某个属性字段,“yes”是这个属性字段的一种取值。
项集:项的集合,可表示为,其中每个为项。包含个项的项集称为“-项集”。
支持度(support):对于关联规则,支持度是指事务集中既满足也满足的事务个数占不重复总事务个数的百分比,可表示成。
置信度(confidence):对于关联规则,置信度是指在事务集D的子集——满足的事务集中,同时又满足的事务占A这个子集的百分比,可以表示成,即:。
最小支持度和最小置信度:在关联规则计算中需要设置的两个参数,依据这两个参数可以提取出有价值的关联规则。
频繁项集:满足最小支持度的项集。
强规则:同时满足最小支持度和最小置信度的关联规则。
输出结果:
单维关联规则:列出频繁项集和强规则。
订购用户 | 订购时间 | 年限 | 运行环境 | 版本 |
1786****815 | 2023-03-10 14:12:48 | 1年 | Windows | 单机版 |
1529****256 | 2019-05-30 13:25:02 | 1年 | Windows | 单机版 |
1388****448 | 2019-04-04 09:58:21 | 1年 | Windows | 单机版 |
1801****427 | 2019-02-18 19:07:33 | 1年 | Windows | 单机版 |
1811****398 | 2018-07-23 13:13:07 | 1年 | Windows | 单机版 |
1580****630 | 2018-07-17 10:05:56 | 1年 | Windows | 单机版 |
1861****145 | 2018-03-11 10:47:37 | 1年 | Windows | 单机版 |
1302****267 | 2018-01-09 09:38:57 | 1年 | Windows | 单机版 |
1398****856 | 2018-01-05 22:43:24 | 1年 | Windows | 单机版 |
1398****856 | 2018-01-04 02:06:08 | 1年 | Windows | 单机版 |