原始业务数据来自多个数据库或数据仓库,它们的结构和规则可能是不同的,这将导致原始数据非常的杂乱、不可用,即使在同一个数据库中,也可能存在重复的和不完整的数据信息,为了使这些数据能够符合数据挖掘的要求,提高效率和得到清晰的结果,必须进行数据的预处理。
为数据挖掘算法提供完整、干净、准确、有针对性的数据,减少算法的计算量,提高挖掘效率和准确程度。
(简答题)
在数据挖掘之前为什么要对原始数据进行预处理?
正确答案
答案解析
略
相似试题
(多选题)
下面哪些问题是我们进行数据预处理的原因?()
(填空题)
进行数据预处理时所使用的主要方法包括:()、()、()和()
(单选题)
下面哪种数据预处理技术可以用来平滑数据,消除数据噪声?()
(单选题)
将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()
(简答题)
简述数据预处理方法和内容。
(简答题)
数据的预处理方法有哪些?
(填空题)
使用星型模式可以从一定程度上()查询效率。因为星型模式中数据的组织已经经过预处理,主要数据都在庞大的事实表中。
(单选题)
下面哪种不属于数据预处理的方法?()
(填空题)
分类的过程包括获取数据、预处理、分类器设计和()