广告合作
  • 今日头条

    今日头条

  • 百度一下

    百度一下,你就知道

  • 新浪网

    新浪网 - 提供新闻线索,重大新闻爆料

  • 搜狐

    搜狐

  • 豆瓣

    豆瓣

  • 百度贴吧

    百度贴吧——全球领先的中文社区

  • 首页 尚未审核订阅工具 订阅

    R语言如何进行朴素贝叶斯分类?

    来源:网络收集  点击:  时间:2024-06-25
    【导读】:
    朴素贝叶斯判别的前提条件要求各个条件之间是相互独立的。理论上,朴素贝叶斯判别分析是在已知的先验概率P(A|B)的前提下,利用贝叶斯公式P(B|A)=(PA|B)*P(B)/P(A)求出后验概率P(B|A),判别分析时,将样本判定为后验概率最大的那一类。简单地讲,朴素贝叶斯算法就是对于给出的待分类样本,求出在该样本出现的情况下各个类别出现的概率,哪个概率最大,就判定该样本属于那个类别。在R语言中,实现朴素贝叶斯判别的函数为NaiveBayes()。工具/原料moreR软件数据集方法/步骤1/5分步阅读

    读取数据集。

    sz_data=read.csv(sz_data.csv,head=T,encoding=utf-8)

    head(sz_data);dim(sz_data) #查看数据的前几行和数据维度

    2/5

    进行数据预处理。在实际应用中,如果数据有缺失值,需要先按照一定的方法先对缺失值进行处理。这里我们直接划分训练集和测试集,并且随机抽取70%的样本作为训练集。

    n=0.7*nrow(sz_data) #作为训练集的样本量

    sub_train=sample(nrow(sz_data),n)#随机抽取n个样本

    data_train=sz_data#训练集

    data_test=sz_data#测试集

    head(data_train);dim(data_train)

    head(data_test);dim(data_test)

    3/5

    进行朴素贝叶斯判别分析,该判别假设变量间是相互独立的。

    library(klaR)#加载软件包

    data_train$is_rise=as.factor(data_train$is_rise) #数据格式转换为分类数据

    fit_Bayes1=NaiveBayes(is_rise~.,data_train) #建立判别公式

    names(fit_Bayes1)

    fit_Bayes1$apriori #先验概率

    fit_Bayes1$tables #所有变量条件概率

    plot(fit_Bayes1)#各类别下变量密度可视化

    从图中可以看出很多信息,比如对于0和1这两个类别,Minimum变量的分布差异并不明显。

    4/5

    对测试集所属类别进行预测。

    pre_Bayes1=predict(fit_Bayes1,data_test)

    data_test$Bayes_pre_rise=pre_Bayes1$class #输出类别预测结果

    head(data_test) #查看含有预测结果的数据

    5/5

    验证模型准确性。

    table(data_test$is_rise,pre_Bayes1$class) #生成is_rise的预测值和实际值的混淆矩阵

    error_Bayes1=sum(pre_Bayes1$class!=data_test$is_rise)/nrow(data_test);error_Bayes1#计算错误率

    混淆矩阵中,对角线上的数据是被准确判别了的。计算出的错误率超过了50%,效果不理想,可能是变量间并不相互独立造成的。实际应用中,可以先对数据集进行相关性检验,如果变量间相互独立,再采取朴素贝叶斯判别方法。

    注意事项

    建立模型之前,需要先安装klaR软件包

    R朴素贝叶斯
    本文关键词:

    版权声明:

    1、本文系转载,版权归原作者所有,旨在传递信息,不代表看本站的观点和立场。

    2、本站仅提供信息发布平台,不承担相关法律责任。

    3、若侵犯您的版权或隐私,请联系本站管理员删除。

    4、文章链接:http://www.1haoku.cn/art_916380.html

    相关资讯

    ©2019-2020 http://www.1haoku.cn/ 国ICP备20009186号05-30 14:32:00  耗时:0.685