python-根据时间戳将数据分为训练集和测试集
来源:网络收集 点击: 时间:2024-04-17【导读】:
在很多python任务中,我们需要将原始数据进行处理,分成训练集和测试集,以便更深层次的运用这些数据。工具/原料morepycharmpython3.7win10/7方法/步骤1/6分步阅读
2/6
3/6
4/6
5/6
6/6
注意事项
首先需要指定编码方式为【utf8】格式,再导入处理数据的包-pandas

然后利用pandas读取原始数据,【sep】参数表明原始数据每列数据之间的分隔方式,【names】参数表明给原始数据每一列取一个名字,若是你的数据列名本来就存在,这项可以舍去。

利用sort_values函数对原数据进行排序,【by】参数表明根据哪一列进行排序,这里选择的是时间戳列。【ascending=False】表明按倒序排序。

分别指定所需训练集和测试集的大小,这里取的是90%和10%。

利用Dataframe的iloc函数,可取出日期最新的10%作为测试集

将【ascending】参数设为True,将原始数据进行正序排列,表明时间从前往后排,取前90%作为训练集。

熟练掌握pandas这个工具包很有用的哦!
有问题欢迎交流!
版权声明:
1、本文系转载,版权归原作者所有,旨在传递信息,不代表看本站的观点和立场。
2、本站仅提供信息发布平台,不承担相关法律责任。
3、若侵犯您的版权或隐私,请联系本站管理员删除。
4、文章链接:http://www.1haoku.cn/art_528955.html
上一篇:怎样掌握滑雪的各种平衡技术
下一篇:iphone开热点电脑搜索不到