对于下图所示的正倾斜数据,中位数、平均值、众数三者之间的关系是()
A中位数=平均值=众数;
B中位数>平均值>众数;
C平均值>中位数>众数;
D众数>中位数>平均值
正确答案
答案解析
相似试题
(单选题)
在基本K均值算法里,当邻近度函数采用()的时候,合适的质心是簇中各点的中位数。
(简答题)
假定用于分析的数据包含属性age,数据元组中age的值如下(按递增序): 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70。 (a)使用按箱平均值平滑对以上数据进行平滑,箱的深度为3。解释你的步骤。评论对于给定的数据,该技术的效果。 (b)对于数据平滑,还有哪些其它方法?
(多选题)
对于数据挖掘中的原始数据,存在的问题有:()。
(判断题)
可视化技术对于分析的数据类型通常不是专用性的。
(判断题)
数据挖掘的目标不在于数据采集策略,而在于对于已经存在的数据进行模式的发掘。
(简答题)
下表所示的相依表汇总了超级市场的事务数据。其中hot dogs指包含热狗的事务,指不包含热狗的事务。hamburgers指包含汉堡的事务,指不包含汉堡的事务。 假设挖掘出的关联规则是“hot dogs=>hamburgers”。给定最小支持度阈值25%和最小置信度阈值50%,这个关联规则是强规则吗? 计算关联规则“hot dogs=>hamburgers”的提升度,能够说明什么问题?购买热狗和购买汉堡是独立的吗?如果不是,两者间存在哪种相关关系?
(单选题)
假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:()。
(单选题)
考虑值集{12,24,33,2,4,55,68,26},其四分位数极差是:()。
(简答题)
考虑下表所示二元分类问题的数据集。 (1)计算按照属性A和B划分时的信息增益。决策树归纳算法将会选择哪个属性? (2)计算按照属性A和B划分时Gini系数。决策树归纳算法将会选择哪个属性?