机器学习——fetch_20newsgroups离线下载
来源:网络收集 点击: 时间:2024-05-31下载fetch_20newsgroups数据集。

按‘windows’加‘E’快捷键打开资源管理界面。

打开C盘。

选择用户文件夹。

选择Administrator文件夹。

选择scikit_learn_data文件夹。

首次打开后是个空白文件夹。

打开此文件夹后,回到Jupyter下,导入相应模块。

运行 fetch_20newsgroups(subset=all)语句,会自动在上面打开的文件夹中创建一个文件夹。

自动创建的创建文件夹。

打开创建的文件夹。

将下载好的数据集,复制到此文件夹中。

根据自己安装Anaconda时选择的路径,打开安装文件夹目录。

选择Lib文件夹。

选择site-packages文件夹。

选择sklearn文件夹。

选择datasets文件夹。

打开spyder软件。

将datasets文件夹下的twenty_newsgroups.py拖动到spyder中。

找到‘download_20newsgroups’函数。

下载语句部分如图示。

解压语句部分如图示。

由于已经自己下载好数据集,因此需要注释掉下载数据集的代码。

将刚刚存放的数据集的文件目录存入archive_path变量。

修改完毕后并保存。
14/21再次运行 fetch_20newsgroups(subset=all)语句,解压下载的数据集文件。

执行过程中,会新建两个文件。

解压完成后,会自动删除压缩文件。

接着会自动删除刚刚生成的两个文件夹。

最终只剩下一个后缀名为pkz的文件。

到此为止fetch_20newsgroups数据集添加完成。
20/21获取训练集和测试集数据。

调用数据效果如下。

版权声明:
1、本文系转载,版权归原作者所有,旨在传递信息,不代表看本站的观点和立场。
2、本站仅提供信息发布平台,不承担相关法律责任。
3、若侵犯您的版权或隐私,请联系本站管理员删除。
4、文章链接:http://www.1haoku.cn/art_865252.html