数据挖掘工程师最新试题
(简答题)
一个典型的数据挖掘系统应该包括哪些组成部分?
(单选题)
存放最低层汇总的方体称为()。
(单选题)
某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()
(判断题)
具有较高的支持度的项集具有较高的置信度。
(名词解析)
数据挖掘
(简答题)
何谓OLTP和OLAP?它们的主要异同有哪些?
(填空题)
多维分析是指以“维”形式组织起来的数据采取切片、切块、()和旋转等各种分析动作,以求剖析数据,使拥护能从不同角度、不同侧面观察数据仓库中的数据,从而深入理解多维数据集中的信息。
(判断题)
Web数据挖掘是通过数据库仲的一些属性来预测另一个属性,它在验证用户提出的假设过程中提取信息。
(简答题)
简述数据的定义及类型。
(简答题)
数据挖掘技术对聚类分析的要求有哪几个方面?
(单选题)
考虑值集{1、2、3、4、5、90},其截断均值(p=20%)是()。
(单选题)
以下哪些分类方法可以较好地避免样本的不平衡问题,()。
(单选题)
哪种数据变换的方法将数据沿概念分层向上汇总?()
(单选题)
在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是:()。
(单选题)
OLAM技术一般简称为”数据联机分析挖掘”,下面说法正确的是:()。
(多选题)
下面哪些属于可视化高维数据技术?()
(多选题)
OLAP系统和OLTP系统的主要区别包括()。
(填空题)
在多维关联规则挖掘中,我们搜索的不是频繁项集,而是()
(简答题)
下表中列出了4个点的两个最近邻。使用SNN相似度定义,计算每对点之间的SNN相似度。
(多选题)
如下哪些不是基于规则分类器的特点,()。