数据挖掘工程师最新试题
(简答题)
分类的定义是什么?
(单选题)
关于混合模型聚类算法的优缺点,下面说法正确的是()。
(单选题)
()通过将属性域划分为区间,从而减少给定连续值的个数。
(单选题)
如果规则集中的规则按照优先级降序排列,则称规则集是()。
(简答题)
简述ID3算法的基本思想及其主算法和建树算法的基本步骤。
(名词解析)
数据规范化
(填空题)
ROLAP是基于()的OLAP实现,而MOLAP是基于多维数据结构组织的OLAP实现。
(单选题)
一个对象的离群点得分是该对象周围密度的逆。这是基于()的离群点定义。
(简答题)
为什么时间总是数据仓库或数据集市的维?
(简答题)
在现实世界的数据中,元组在某些属性上缺少值是常有的。描述处理该问题的各种方法。
(简答题)
什么是聚类?简单描述如下的聚类方法:划分方法,层次方法,基于密度的方法,基于模型的方法。为每类方法给出例子。
(简答题)
何谓文本挖掘?它与信息检索有什么关系(异同)。
(填空题)
“实时数据仓库”以为着源数据系统、决策支持服务和仓库仓库之间以一个()的速度交换数据和业务规则。
(填空题)
数据仓库中存在不同综合级别的数据。一般把数据分成4个级别:()、当前细节级、轻度综合级和高度综合级。
(简答题)
定义下列数据挖掘功能: 关联、分类、聚类、演变分析、离群点检测 使用你熟悉的生活中的数据,给出每种数据挖掘功能的例子。
(填空题)
聚类分析包括连续型、二值离散型、()和混合类型4种类型描述属性的相似度计算方法。
(简答题)
简述在多层关联规则挖掘中,在不同的层使用一致的支持度的优缺点。
(判断题)
分类和回归都可用于预测,分类的输出是离散的类别值,而回归的输出是连续数值。
(名词解析)
偏差型知识
(简答题)
数据的预处理方法有哪些?