R语言如何进行朴素贝叶斯分类？

来源：网络收集点击：时间：2024-06-25

【导读】：

朴素贝叶斯判别的前提条件要求各个条件之间是相互独立的。理论上，朴素贝叶斯判别分析是在已知的先验概率P(A|B)的前提下，利用贝叶斯公式P(B|A)=(PA|B)*P(B)/P(A)求出后验概率P(B|A)，判别分析时，将样本判定为后验概率最大的那一类。简单地讲，朴素贝叶斯算法就是对于给出的待分类样本，求出在该样本出现的情况下各个类别出现的概率，哪个概率最大，就判定该样本属于那个类别。在R语言中，实现朴素贝叶斯判别的函数为NaiveBayes()。工具/原料moreR软件数据集方法/步骤1/5分步阅读

读取数据集。

sz_data=read.csv(sz_data.csv,head=T,encoding=utf-8)

head(sz_data);dim(sz_data) #查看数据的前几行和数据维度

2/5

进行数据预处理。在实际应用中，如果数据有缺失值，需要先按照一定的方法先对缺失值进行处理。这里我们直接划分训练集和测试集，并且随机抽取70%的样本作为训练集。

n=0.7*nrow(sz_data) #作为训练集的样本量

sub_train=sample(nrow(sz_data),n)#随机抽取n个样本

data_train=sz_data#训练集

data_test=sz_data#测试集

head(data_train);dim(data_train)

head(data_test);dim(data_test)

3/5

进行朴素贝叶斯判别分析，该判别假设变量间是相互独立的。

library(klaR)#加载软件包

data_train$is_rise=as.factor(data_train$is_rise) #数据格式转换为分类数据

fit_Bayes1=NaiveBayes(is_rise~.,data_train) #建立判别公式

names(fit_Bayes1)

fit_Bayes1$apriori #先验概率

fit_Bayes1$tables #所有变量条件概率

plot(fit_Bayes1)#各类别下变量密度可视化

从图中可以看出很多信息，比如对于0和1这两个类别，Minimum变量的分布差异并不明显。

4/5

对测试集所属类别进行预测。

pre_Bayes1=predict(fit_Bayes1,data_test)

data_test$Bayes_pre_rise=pre_Bayes1$class #输出类别预测结果

head(data_test) #查看含有预测结果的数据

5/5

验证模型准确性。

table(data_test$is_rise,pre_Bayes1$class) #生成is_rise的预测值和实际值的混淆矩阵

error_Bayes1=sum(pre_Bayes1$class!=data_test$is_rise)/nrow(data_test);error_Bayes1#计算错误率

混淆矩阵中，对角线上的数据是被准确判别了的。计算出的错误率超过了50%，效果不理想，可能是变量间并不相互独立造成的。实际应用中，可以先对数据集进行相关性检验，如果变量间相互独立，再采取朴素贝叶斯判别方法。

注意事项

建立模型之前，需要先安装klaR软件包

R朴素贝叶斯

阅读全文

好评( 0 )

差评( 0 )

本文关键词：

1、本文系转载，版权归原作者所有，旨在传递信息，不代表看本站的观点和立场。

2、本站仅提供信息发布平台，不承担相关法律责任。

3、若侵犯您的版权或隐私，请联系本站管理员删除。

4、文章链接：http://www.1haoku.cn/art_916380.html

上一篇：如何绘制魔童哪吒下一篇：oppo手机隐藏桌面图标怎么找出来

一酷知识大全

今日头条

百度一下

新浪网

搜狐

豆瓣

百度贴吧

R语言如何进行朴素贝叶斯分类？

尚未审核相关分类

尚未审核随机资讯

相关资讯

一酷知识大全

今日头条

百度一下

新浪网

搜狐

豆瓣

百度贴吧

R语言如何进行朴素贝叶斯分类？

尚未审核相关分类

尚未审核最新

尚未审核随机资讯

相关资讯