首页技能鉴定其他技能数据挖掘工程师
(简答题)

数据聚合需要考虑的问题有哪些?

正确答案

(1)模式识别:这主要是实体识别问题;
(2)冗余:一个属性是冗余的,即它能由另一个表导出,如果属性或维的命名不一致,也可能导致冗余,可以用相关分析来检测;
(3)数据值冲突的检测与处理:有些属性因表示比例或编码不同,会导致属性不同。

答案解析

相似试题

  • (简答题)

    一个数据仓库系统的建立通畅需要经过哪些步骤?

    答案解析

  • (简答题)

    数据聚合的目的是什么?

    答案解析

  • (多选题)

    下面哪些问题是我们进行数据预处理的原因?()

    答案解析

  • (多选题)

    对于数据挖掘中的原始数据,存在的问题有:()。

    答案解析

  • (简答题)

    何谓数据挖掘?它有哪些方面的功能?

    答案解析

  • (简答题)

    数据的预处理方法有哪些?

    答案解析

  • (简答题)

    聚类分析中常见的数据类型有哪些?

    答案解析

  • (简答题)

    常见的分箱方法有哪些?数据平滑处理的方法有哪些?

    答案解析

  • (简答题)

    何谓粒度?它对数据仓库有什么影响?按粒度组织数据的方式有哪些?

    答案解析

快考试在线搜题