广告合作
  • 今日头条

    今日头条

  • 百度一下

    百度一下,你就知道

  • 新浪网

    新浪网 - 提供新闻线索,重大新闻爆料

  • 搜狐

    搜狐

  • 豆瓣

    豆瓣

  • 百度贴吧

    百度贴吧——全球领先的中文社区

  • 首页 尚未审核订阅工具 订阅

    R语言K-中心点聚类分析

    来源:网络收集  点击:  时间:2024-03-09
    【导读】:
    K-中心点算法与K-means算法在原理上相近,不同的是,K-中心点算法在选择中心点时不取样本均值点,而是在类别内选取到其余样本距离之和最小的样本为中心点。K-中心点算法主要是用cluster软件包中的pam()函数来实现的。该函数的基本格式为:pam(x, k, diss = inherits(x, dist), metric = c(euclidean, manhattan), medoids = NULL, stand = FALSE, cluster.only = FALSE, do.swap = TRUE, keep.diss = !diss !cluster.only n 100, keep.data = !diss !cluster.only, pamonce = FALSE, trace.lev = 0)其中x表示待处理数据集,k表示类别数;metric用于选择样本点间距离测算的方式,包括euclidean,和manhattan;medoids默认为NULL时,表示由软件选择初始中心点样本,也可手动设定k维向量来指定初始点;stand表示聚类前是否需要标准化;cluster.only默认为FALSE,为TRUE表示仅获取样本类别。工具/原料moreR软件数据集方法/步骤1/4分步阅读

    读取数据集。

    Tourism_shares=read.csv(Tourism_shares.csv,head=T,encoding=utf-8)

    head(Tourism_shares)

    dim(Tourism_shares)

    2/4

    进行聚类分析。

    library(cluster)#加载软件包

    fit_pam1=pam(na.omit(Tourism_shares),k=3)#采用k中心点算法将数据集分为k=3类

    print(fit_pam1) #输出聚类结果

    结果中的Medoids指明了具体第几个样本为各类别的中心点。

    3/4

    保存每个样本的所属类别。

    Tourism_shares=fit_pam1$cluster

    head(Tourism_shares)#查看数据

    和前面的K-means聚类结果对比,可以发现不同样本点在两种算法的聚类结果是有差别的。

    4/4

    绘制散点图。

    plot(Tourism_shares,pch=fit_pam1$cluster-1)

    K-中心点聚类R聚类分析
    本文关键词:

    版权声明:

    1、本文系转载,版权归原作者所有,旨在传递信息,不代表看本站的观点和立场。

    2、本站仅提供信息发布平台,不承担相关法律责任。

    3、若侵犯您的版权或隐私,请联系本站管理员删除。

    4、文章链接:http://www.1haoku.cn/art_295054.html

    相关资讯

    ©2019-2020 http://www.1haoku.cn/ 国ICP备20009186号05-06 12:03:02  耗时:0.028
    0.0285s