今天,腾飞邀请一堆朋友来我们所食堂吃饭,大家吃的非常愉快!
今天,总结一下层次聚类的评价问题。层次聚类根据结果计算其对应的共表性相关系数(Cophenetic Correlation Coefficient)进行评价。共表相关系数越大,表明效果越好。
下面是计算共表相关系数的API
Y = scipy.spatial.distance.pdist((X,'cityblock'); #计算距离列表
Z = hierarchy.linkage(Y,'average'); #进行层次聚类
cluster.hierarchy.cophenet(Z,Y) #计算共表相关系数
Z的方式如下:
如下的距离矩阵:
变为如下方式的距离列表,即Y
参考:这里)