文章目录

一、K均值
二、Q型聚类
三、R型聚类

聚类三种方法：【说明】 1、三种方式输入矩阵行为个案，列为变量量纲不同需要预处理，一般使用zscore() zscore()标准化为对每一列操作减去均值除以标准差
2、k均值需要自己确定k取值。Q、R型聚类需要运行完以后再确定选择

一、K均值

matlab实现

%% 数据预处理%如果量纲不同，需要进行预处理,数据的列为属性，行为个案clear;clc;close all;data_mean=xlsread('data.xlsx','mean','B3:L16'); %读入数据data_mean=zscore(data_mean);%% 判断kmeans的k值%第二个参数 可以自定义，'linkage'，'gmdistribution'，'kmeans'% eva = evalclusters(data_mean,'kmeans','CalinskiHarabasz','KList',[1:10])    %判断聚类k值 越大越好% hold on;% eva = evalclusters(data_mean,'kmeans','DaviesBouldin','KList',[1:10])    %判断聚类k值 越小越好% hold on;%eva = evalclusters(data_mean,'kmeans','gap','KList',[1:10])    %判断聚类k值% hold on;eva = evalclusters(data_mean,'kmeans','silhouette','KList',[1:10])    %判断聚类k值 越大越好% hold on;plot(eva)%% 根据第一步确定分类[idx,C,sumd,d]=kmeans(data_mean,3)%idx表示分类的组别，C表示簇质心的距离，其中第 j 行是簇 j 的质心。%sumd簇内的点到质心距离的总和，以数值列向量形式返回，d表示从每个点到每个质心的距离，以数值矩阵形式返回%% 若维度为2维可以画散点图%catter plot by group,This MATLAB function creates a scatter plot of x and y, grouped by g.%gscatter(x,y,g)%由于这个例子数据维数太高没法可视化，提取数据的前两个维度，方便演示figuregscatter(data_mean(:,1),data_mean(:,2),idx,'bgm')%画散点hold onplot(C(:,1),C(:,2),'kx')%画质心legend('Cluster 1','Cluster 2','Cluster 3','Cluster Centroid')%添加标签%3维数据figurescatter3(data_mean(:,1),data_mean(:,2),data_mean(:,3),50,idx,'.')% plot(C(:,1),C(:,2),'kx')%画质心% legend('Cluster 1','Cluster 2','Cluster 3','Cluster Centroid')%添加标签