（多选题）

对样本进行聚类，通常采用的相似性统计量（）

A绝对距离

B欧式距离

C夹角余弦

D相关系数

E切比雪夫距离

略

相似试题

（多选题）
以下哪个聚类分析的方法是利用统计学定义的距离进行度量（）
答案解析
（判断题）
在聚类分析当中，簇内的相似性越大，簇间的差别越大，聚类的效果就越差。
答案解析
（单选题）
某市有各类书店500家，其中大型50家，中型150家，小型300家。为了调查该市图书销售情况，拟抽取30家书店进行调查。如果采用分层等比例抽样法，下列在大型、中型、小型书店中样本的正确分配量为（）
答案解析
（单选题）
以下是哪一个聚类算法的算法流程（） ①构造k－最近邻图。 ②使用多层图划分算法划分图。 ③repeat：合并关于相对互连性和相对接近性而言，最好地保持簇的自相似性的簇。 ④until：不再有可以合并的簇。
答案解析
（单选题）
分类变量使用以下哪个统计量进行缺失值填补较合适（）
答案解析
（判断题）
DBSCAN算法对异常值敏感，因此要在聚类前进行异常值分析。
答案解析
（多选题）
天猫分析人员希望通过聚类方法定位代商家刷信用级别的违规者，以下那种操作不应该进行（）
答案解析
（单选题）
当样本容量充分大时，样本估计量充分地靠近总体指标的可能性趋于1，称为抽样估计的（）
答案解析
（多选题）
层次聚类的聚类方式有（）
答案解析