首页技能鉴定其他技能数据挖掘工程师
(单选题)

考虑值集{1、2、3、4、5、90},其截断均值(p=20%)是()。

A2

B3

C3.5

D5

正确答案

来源:www.examk.com

答案解析

相似试题

  • (单选题)

    考虑值集{12,24,33,2,4,55,68,26},其四分位数极差是:()。

    答案解析

  • (单选题)

    考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()。

    答案解析

  • (简答题)

    考虑如下的频繁3-项集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}。 (a)根据Apriori算法的候选项集生成方法,写出利用频繁3-项集生成的所有候选4-项集。 (b)写出经过剪枝后的所有候选4-项集。

    答案解析

  • (简答题)

    考虑下表数据集,请完成以下问题: (1)估计条件概率。 (2)根据(1)中的条件概率,使用朴素贝叶斯方法预测测试样本(A=0,B=1,C=0)的类标号; (3)使用Laplace估计方法,其中p=1/2,l=4,估计条件概率。 (4)同(2),使用(3)中的条件概率。 (5)比较估计概率的两种方法,哪一种更好,为什么?

    答案解析

  • (单选题)

    关于OLAP的特性,下面正确的是() (1)快速性(2)可分析性(3)多维性(4)信息性(5)共享性

    答案解析

  • (单选题)

    关于OLAP的特性,下面正确的是:()。 (1)快速性 (2)可分析性 (3)多维性 (4)信息性 (5)共享性

    答案解析

  • (简答题)

    以下是一个商场所销售商品的价格清单(按递增顺序排列,括号中的数表示前面数字出现次数) 1(2)、5(5)、8(2)、10(4)、12、14(3)、15(5)、18(8)、20(7)、21(4)、25(5)、28、30(3)。 请分别用等宽的方法和等高的方法对上面的数据集进行划分。

    答案解析

  • (简答题)

    假设描述学生的信息包含属性:性别,籍贯,年龄。有两条记录p、q及两个簇C1、C2的信息如下,分别求出记录和簇彼此之间的距离。(k-means算法的拓展) p={男,广州,18},q={女,深圳,20} C1={男:25,女:5;广州:20,深圳:6,韶关:4;19} C2={男:3,女:12;汕头:12,深圳:1,湛江:2;24}

    答案解析

  • (单选题)

    设X={1,2,3}是频繁项集,则可由X产生()个关联规则。

    答案解析

快考试在线搜题