首页技能鉴定其他技能数据挖掘工程师
(简答题)

简述数据预处理方法和内容。

正确答案

①数据清洗:包括填充空缺值,识别孤立点,去掉噪声和无关数据。
②数据集成:将多个数据源中的数据结合起来存放在一个一致的数据存储中。需要注意不同数据源的数据匹配问题、数值冲突问题和冗余问题等。
③数据变换:将原始数据转换成为适合数据挖掘的形式。包括对数据的汇总、聚集、概化、规范化,还可能需要进行属性的重构。
④数据归约:缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果。

答案解析

相似试题

  • (填空题)

    进行数据预处理时所使用的主要方法包括:()、()、()和()

    答案解析

  • (简答题)

    数据的预处理方法有哪些?

    答案解析

  • (简答题)

    简述数据清理的基本内容。

    答案解析

  • (简答题)

    简述数据仓库设计的三级模型的基本内容。

    答案解析

  • (单选题)

    下面哪种不属于数据预处理的方法?()

    答案解析

  • (简答题)

    常见的分箱方法有哪些?数据平滑处理的方法有哪些?

    答案解析

  • (简答题)

    简述处理空缺值的方法。

    答案解析

  • (简答题)

    简述缺失值的处理方法。

    答案解析

  • (判断题)

    基于邻近度的离群点检测方法不能处理具有不同密度区域的数据集。

    答案解析

快考试在线搜题