传统关联规则算法的改进及其验证研究
作者: 桑沐晨 王业
摘要:针对传统的Apriori算法在处理大规模数据集时面临的计算复杂度高和内存消耗大的问题,提出了在使用二进制编码的Apriori算法并采用Ray分布式框架以及与Sample动态采样算法结合——RBE-Apriori算法。将事务、候选集、频繁项集转化为二进制,并使用Sample动态采样算法对候选集进行处理,在生成关联规则的过程中使用Ray分布式框架,可以有效的减少生成关联规则的时间,从而提高算法效率。通过实验结果表明,改进的算法相比于经典Apriori算法,在生成相同频繁项集下,组合次数减少了65%,生成关联规则的时间上减少50%。
关键词:数据挖掘;关联规则;Apriori算法;Apriori改进算法;频繁项集
中图分类号:TP301 文献标识码:A
文章编号:1009-3044(2024)04-0080-04
上一篇
点击页面呼出菜单
下一篇