(多选题)
对样本进行聚类,通常采用的相似性统计量()
A绝对距离
B欧式距离
C夹角余弦
D相关系数
E切比雪夫距离
正确答案
答案解析
略
相似试题
(多选题)
以下哪个聚类分析的方法是利用统计学定义的距离进行度量()
(判断题)
在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。
(单选题)
某市有各类书店500家,其中大型50家,中型150家,小型300家。为了调查该市图书销售情况,拟抽取30家书店进行调查。如果采用分层等比例抽样法,下列在大型、中型、小型书店中样本的正确分配量为()
(单选题)
以下是哪一个聚类算法的算法流程() ①构造k-最近邻图。 ②使用多层图划分算法划分图。 ③repeat:合并关于相对互连性和相对接近性而言,最好地保持簇的自相似性的簇。 ④until:不再有可以合并的簇。
(单选题)
分类变量使用以下哪个统计量进行缺失值填补较合适()
(判断题)
DBSCAN算法对异常值敏感,因此要在聚类前进行异常值分析。
(多选题)
天猫分析人员希望通过聚类方法定位代商家刷信用级别的违规者,以下那种操作不应该进行()
(单选题)
当样本容量充分大时,样本估计量充分地靠近总体指标的可能性趋于1,称为抽样估计的()
(多选题)
层次聚类的聚类方式有()