（单选题）

对于下图所示的正倾斜数据，中位数、平均值、众数三者之间的关系是（）

A中位数=平均值=众数；

B中位数＞平均值＞众数；

C平均值＞中位数＞众数；

D众数＞中位数＞平均值

正确答案

答案解析

略

相似试题

（单选题）
在基本K均值算法里，当邻近度函数采用（）的时候，合适的质心是簇中各点的中位数。
答案解析
（简答题）
假定用于分析的数据包含属性age，数据元组中age的值如下（按递增序）： 13，15，16，16，19，20，20，21，22，22，25，25，25，25，30，33，33，33，35，35，35，35，36，40，45，46，52，70。（a）使用按箱平均值平滑对以上数据进行平滑，箱的深度为3。解释你的步骤。评论对于给定的数据，该技术的效果。（b）对于数据平滑，还有哪些其它方法？
答案解析
（多选题）
对于数据挖掘中的原始数据，存在的问题有：（）。
答案解析
（判断题）
可视化技术对于分析的数据类型通常不是专用性的。
答案解析
（判断题）
数据挖掘的目标不在于数据采集策略，而在于对于已经存在的数据进行模式的发掘。
答案解析
（简答题）
下表所示的相依表汇总了超级市场的事务数据。其中hot dogs指包含热狗的事务，指不包含热狗的事务。hamburgers指包含汉堡的事务，指不包含汉堡的事务。假设挖掘出的关联规则是“hot dogs=>hamburgers”。给定最小支持度阈值25%和最小置信度阈值50%，这个关联规则是强规则吗？计算关联规则“hot dogs=>hamburgers”的提升度，能够说明什么问题？购买热狗和购买汉堡是独立的吗？如果不是，两者间存在哪种相关关系？
答案解析
（单选题）
假定用于分析的数据包含属性age。数据元组中age的值如下（按递增序）：13，15，16，16，19，20，20，21，22，22，25，25，25，30，33，33，35，35，36，40，45，46，52，70，问题：使用按箱平均值平滑方法对上述数据进行平滑，箱的深度为3。第二个箱子值为：（）。
答案解析
（单选题）
考虑值集{12，24，33，2，4，55，68，26}，其四分位数极差是：（）。
答案解析
（简答题）
考虑下表所示二元分类问题的数据集。（1）计算按照属性A和B划分时的信息增益。决策树归纳算法将会选择哪个属性？（2）计算按照属性A和B划分时Gini系数。决策树归纳算法将会选择哪个属性？
答案解析