思想:其发现关联规则分两步,第一是通过迭代,检索出数据源中所有烦琐项集,即支持度不低于用户设定的阀值的项即集,第二是利用第一步中检索出的烦琐项集构造出满足用户最小信任度的规则,其中,第一步即挖掘出所有频繁项集是该算法的核心,也占整个算法工作量的大部分。
在商务、金融、保险等领域皆有应用。
(简答题)
简述Apriori算法的思想,谈谈该算法的应用领域。
正确答案
答案解析
略
相似试题
(多选题)
Apriori算法所面临的主要的挑战包括()。
(多选题)
Apriori算法的计算复杂度受()影响。
(简答题)
如何提高Apriori算法的有效性?有哪些常见方法?
(简答题)
简述ID3算法的基本思想及其主算法和建树算法的基本步骤。
(简答题)
一个数据库有5个事务,如表所示。设min_sup=60%,min_conf=80%。 (a)分别用Apriori算法和FP-growth算法找出所有频繁项集。比较两种挖掘方法的效率。 (b)比较穷举法和Apriori算法生成的候选项集的数量。 (c)利用(1)所找出的频繁项集,生成所有的强关联规则和对应的支持度和置信度。
(简答题)
考虑如下的频繁3-项集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}。 (a)根据Apriori算法的候选项集生成方法,写出利用频繁3-项集生成的所有候选4-项集。 (b)写出经过剪枝后的所有候选4-项集。
(简答题)
简述k-means算法,层次聚类算法的优缺点。
(简答题)
简述K-means算法的基本操作步骤(包括算法的输入和输出)。
(简答题)
简述K-平均算法的输入、输出及聚类过程(流程)。