（简答题）

在现实世界的数据中，元组在某些属性上缺少值是常有的。描述处理该问题的各种方法。

正确答案

1，忽略元组。当类标号缺少是通常这么做，当每个属性缺省值的百分比变化很大时，他的效果非常差。
2，人工填写空缺值。这种方法工作量大，可行性低。
3，使用一个全局变量填充空缺值。
4，使用属性的平均值填充空缺值。
5，使用与给定元组属同一类的所有样本的平均值。
6，使用最可能的值填充空缺值。

答案解析

略

相似试题

（多选题）
在现实世界的数据中，元组在某些属性上缺少值是常有的。描述处理该问题的各种方法有：（）。
答案解析
（单选题）
假定用于分析的数据包含属性age。数据元组中age的值如下（按递增序）：13，15，16，16，19，20，20，21，22，22，25，25，25，30，33，33，35，35，36，40，45，46，52，70，问题：使用按箱平均值平滑方法对上述数据进行平滑，箱的深度为3。第二个箱子值为：（）。
答案解析
（简答题）
假定用于分析的数据包含属性age，数据元组中age的值如下（按递增序）： 13，15，16，16，19，20，20，21，22，22，25，25，25，25，30，33，33，33，35，35，35，35，36，40，45，46，52，70。（a）使用按箱平均值平滑对以上数据进行平滑，箱的深度为3。解释你的步骤。评论对于给定的数据，该技术的效果。（b）对于数据平滑，还有哪些其它方法？
答案解析
（判断题）
Web数据挖掘是通过数据库仲的一些属性来预测另一个属性，它在验证用户提出的假设过程中提取信息。
答案解析
（单选题）
下列哪种可视化方法可用于发现多维数据中属性之间的两两相关性？（）
答案解析
（单选题）
下面哪个不属于数据的属性类型：（）。
答案解析
（填空题）
连续型属性的数据样本之间的距离有欧氏距离、曼哈顿距离和（）
答案解析
（填空题）
使用星型模式可以从一定程度上（）查询效率。因为星型模式中数据的组织已经经过预处理，主要数据都在庞大的事实表中。
答案解析
（多选题）
数据仓库在技术上的工作过程是（）。
答案解析