(1)以数据文件“马克威通用数据1.mkw”为例,演示FP频繁增长模式算法的操作。首先,在工作区内,打开建模分析工作流:“机器学习”→“FP-Tree”,接着选择数据源,然后设置算法的参数,最后点击运行按钮。
其中各类参数的含义为:
商品字段:所有商品
事务字段:一个事务表示一条记录
设置好参数如下所示:
(2)输出结果
输入数据类型:数值型数据
频繁模式增长算法采用分治策略,挖掘全部的频繁项集但不产生候选。该算法应用广泛,如可用在保险领域、生物学领域、地震研究等领域中。
具体的如可用于消费市场价格分析,猜测顾客的消费习惯;网络安全领域中的入侵检测技术;可用在用于高校管理中,根据挖掘规则可以有效地辅助学校管理部门有针对性的开展贫困助学工作;也可用在移动通信领域中,指导运营商的业务运营和辅助业务提供商的决策制定等。
频繁模式增长算法(Frequent-patterngrowth,FP-Growth)是一种挖掘频繁项集的方法。
FP-Growth算法采用分治策略,将提供频繁项集的数据库压缩到一颗频繁模式树(Frequent-patterntree,FP-tree)上,但仍保留项集的关联信息,通过不断地迭代FP-tree的构造和投影过程来发现频繁模式。
FP-Growth算法将发现长频繁模式的问题转化为递归搜索一些较短模式,然后连接最不频繁项作为后缀;它是Apriori算法的优化处理,克服了Apriori算法在过程中重复地扫描数据库和产生大量的候选项集的问题。
输出结果:
输出用户需要的频繁关联规则
订购用户 | 订购时间 | 年限 | 运行环境 | 版本 |
1786****815 | 2023-03-10 14:12:48 | 1年 | Windows | 单机版 |
1335****121 | 2019-04-29 16:59:27 | 1年 | Windows | 单机版 |
1361****169 | 2019-04-01 17:30:32 | 1年 | Windows | 单机版 |
1801****427 | 2019-02-18 19:07:33 | 1年 | Windows | 单机版 |
1864****834 | 2018-09-25 15:47:28 | 1年 | Windows | 单机版 |
1811****398 | 2018-07-23 13:10:48 | 1年 | Windows | 单机版 |
1580****630 | 2018-07-17 10:05:56 | 1年 | Windows | 单机版 |
1833****130 | 2018-06-26 22:45:16 | 1年 | Windows | 单机版 |
1398****856 | 2018-01-05 22:43:24 | 1年 | Windows | 单机版 |
1398****856 | 2018-01-05 22:35:31 | 1年 | Windows | 单机版 |