首页技能鉴定其他技能数据挖掘工程师
(简答题)

考虑下表数据集,请完成以下问题: (1)估计条件概率。 (2)根据(1)中的条件概率,使用朴素贝叶斯方法预测测试样本(A=0,B=1,C=0)的类标号; (3)使用Laplace估计方法,其中p=1/2,l=4,估计条件概率。 (4)同(2),使用(3)中的条件概率。 (5)比较估计概率的两种方法,哪一种更好,为什么?

正确答案


(5)当条件概率为0的时候,条件概率的预测用Laplace估计方法比较好,因为我们不想整个条件概率计算结果为0。

答案解析

相似试题

  • (简答题)

    考虑下表所示二元分类问题的数据集。 (1)计算按照属性A和B划分时的信息增益。决策树归纳算法将会选择哪个属性? (2)计算按照属性A和B划分时Gini系数。决策树归纳算法将会选择哪个属性?

    答案解析

  • (简答题)

    数据聚合需要考虑的问题有哪些?

    答案解析

  • (简答题)

    以下是一个商场所销售商品的价格清单(按递增顺序排列,括号中的数表示前面数字出现次数) 1(2)、5(5)、8(2)、10(4)、12、14(3)、15(5)、18(8)、20(7)、21(4)、25(5)、28、30(3)。 请分别用等宽的方法和等高的方法对上面的数据集进行划分。

    答案解析

  • (多选题)

    下面属于数据集的一般特性的有:()。

    答案解析

  • (填空题)

    数据集分为三类:()。

    答案解析

  • (简答题)

    考虑如下的频繁3-项集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}。 (a)根据Apriori算法的候选项集生成方法,写出利用频繁3-项集生成的所有候选4-项集。 (b)写出经过剪枝后的所有候选4-项集。

    答案解析

  • (填空题)

    分类器设计阶段包含三个过程:划分数据集、分类器构造和()

    答案解析

  • (简答题)

    划分聚类方法对数据集进行聚类时包含什么要点?

    答案解析

  • (判断题)

    基于邻近度的离群点检测方法不能处理具有不同密度区域的数据集。

    答案解析

快考试在线搜题