数据挖掘工程师最新试题
(单选题)
帮助市场分析人员从客户的基本信息库中发现不同的客户群,通常所使用的数据挖掘功能是()。
(多选题)
从结构的角度看,数据仓库模型包括以下几类?()
(填空题)
基于网格的聚类方法的优点是:()
(单选题)
支持度(support)是衡量兴趣度度量()的指标。
(判断题)
对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。
(简答题)
为什么说数据仓库具有随时间而变化的特征?
(多选题)
数据清理的目的是处理数据中的()。
(单选题)
考虑值集{12,24,33,2,4,55,68,26},其四分位数极差是:()。
(名词解析)
关联知识
(简答题)
数据聚合的目的是什么?
(简答题)
列举关联规则在不同领域中应用的实例。
(名词解析)
关联规则
(简答题)
什么是ETL?
(填空题)
元数据是描述数据仓库内数据的结构和建立方法的数据,它为访问数据仓库提供了一个信息目录,根据数据用途的不同可将数据仓库的元数据分为()和业务元数据两类。
(判断题)
给定由两次运行K均值产生的两个不同的簇集,误差的平方和最大的那个应该被视为较优。
(单选题)
下面哪种数据挖掘方法可以用来检测孤立点?()
(简答题)
简述基于划分的聚类方法。划分的准则是什么?
(多选题)
在评价不平衡类问题分类的度量方法有如下几种,()。
(单选题)
以下属于可伸缩聚类算法的是()。
(单选题)
简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()。