1,忽略元组。当类标号缺少是通常这么做,当每个属性缺省值的百分比变化很大时,他的效果非常差。
2,人工填写空缺值。这种方法工作量大,可行性低。
3,使用一个全局变量填充空缺值。
4,使用属性的平均值填充空缺值。
5,使用与给定元组属同一类的所有样本的平均值。
6,使用最可能的值填充空缺值。
(简答题)
在现实世界的数据中,元组在某些属性上缺少值是常有的。描述处理该问题的各种方法。
正确答案
答案解析
略
相似试题
(多选题)
在现实世界的数据中,元组在某些属性上缺少值是常有的。描述处理该问题的各种方法有:()。
(单选题)
假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:()。
(简答题)
假定用于分析的数据包含属性age,数据元组中age的值如下(按递增序): 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70。 (a)使用按箱平均值平滑对以上数据进行平滑,箱的深度为3。解释你的步骤。评论对于给定的数据,该技术的效果。 (b)对于数据平滑,还有哪些其它方法?
(判断题)
Web数据挖掘是通过数据库仲的一些属性来预测另一个属性,它在验证用户提出的假设过程中提取信息。
(单选题)
下列哪种可视化方法可用于发现多维数据中属性之间的两两相关性?()
(单选题)
下面哪个不属于数据的属性类型:()。
(填空题)
连续型属性的数据样本之间的距离有欧氏距离、曼哈顿距离和()
(填空题)
使用星型模式可以从一定程度上()查询效率。因为星型模式中数据的组织已经经过预处理,主要数据都在庞大的事实表中。
(多选题)
数据仓库在技术上的工作过程是()。