首页技能鉴定其他技能数据挖掘工程师
(单选题)

对于下图所示的正倾斜数据,中位数、平均值、众数三者之间的关系是()

A中位数=平均值=众数;

B中位数>平均值>众数;

C平均值>中位数>众数;

D众数>中位数>平均值

正确答案

来源:www.examk.com

答案解析

相似试题

  • (单选题)

    在基本K均值算法里,当邻近度函数采用()的时候,合适的质心是簇中各点的中位数。

    答案解析

  • (简答题)

    假定用于分析的数据包含属性age,数据元组中age的值如下(按递增序): 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70。 (a)使用按箱平均值平滑对以上数据进行平滑,箱的深度为3。解释你的步骤。评论对于给定的数据,该技术的效果。 (b)对于数据平滑,还有哪些其它方法?

    答案解析

  • (多选题)

    对于数据挖掘中的原始数据,存在的问题有:()。

    答案解析

  • (判断题)

    可视化技术对于分析的数据类型通常不是专用性的。

    答案解析

  • (判断题)

    数据挖掘的目标不在于数据采集策略,而在于对于已经存在的数据进行模式的发掘。

    答案解析

  • (简答题)

    下表所示的相依表汇总了超级市场的事务数据。其中hot dogs指包含热狗的事务,指不包含热狗的事务。hamburgers指包含汉堡的事务,指不包含汉堡的事务。 假设挖掘出的关联规则是“hot dogs=>hamburgers”。给定最小支持度阈值25%和最小置信度阈值50%,这个关联规则是强规则吗? 计算关联规则“hot dogs=>hamburgers”的提升度,能够说明什么问题?购买热狗和购买汉堡是独立的吗?如果不是,两者间存在哪种相关关系?

    答案解析

  • (单选题)

    假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:()。

    答案解析

  • (单选题)

    考虑值集{12,24,33,2,4,55,68,26},其四分位数极差是:()。

    答案解析

  • (简答题)

    考虑下表所示二元分类问题的数据集。 (1)计算按照属性A和B划分时的信息增益。决策树归纳算法将会选择哪个属性? (2)计算按照属性A和B划分时Gini系数。决策树归纳算法将会选择哪个属性?

    答案解析

快考试在线搜题