（单选题）

在基本K均值算法里，当邻近度函数采用（）的时候，合适的质心是簇中各点的中位数。

A曼哈顿距离

B平方欧几里德距离

C余弦距离

DBregman散度

正确答案

答案解析

略

相似试题

（判断题）
K均值是一种产生划分聚类的基于密度的聚类算法，簇的个数由算法自动地确定。
答案解析
（单选题）
关于K均值和DBSCAN的比较，以下说法不正确的是（）
答案解析
（判断题）
基于邻近度的离群点检测方法不能处理具有不同密度区域的数据集。
答案解析
（判断题）
异常值在数理统计里一般是指一组观测值中与平均值的偏差超过三倍标准差的测定值
答案解析
（单选题）
（）将两个簇的邻近度定义为不同簇的所有点对的平均逐对邻近度，它是一种凝聚层次聚类技术。
答案解析
（判断题）
给定由两次运行K均值产生的两个不同的簇集，误差的平方和最大的那个应该被视为较优。
答案解析
（单选题）
（）将两个簇的邻近度定义为两个簇合并时导致的平方误差的增量，它是一种凝聚层次聚类技术。
答案解析
（单选题）
以下是哪一个聚类算法的算法流程（） ①构造k－最近邻图。 ②使用多层图划分算法划分图。 ③repeat：合并关于相对互连性和相对接近性而言，最好地保持簇的自相似性的簇。 ④until：不再有可以合并的簇。
答案解析
（多选题）
利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在以下的购物篮中产生支持度不小于3的候选3-项集，在候选2-项集中需要剪枝的是（） ID 项集 1 面包、牛奶 2 面包、尿布、啤酒、鸡蛋 3 牛奶、尿布、啤酒、可乐 4 面包、牛奶、尿布、啤酒 5 面包、牛奶、尿布、可乐
答案解析