Stata 处理异常数据(可批量,缩尾或直接删除)
来源:网络收集 点击: 时间:2024-05-11【导读】:
大家在写论文时可能经常会遇到大数据样本中异常数据批量剔除的问题,本文在于向大家推荐在Stata中运用winsorize方法,来对数据进行处理(缩尾使数据平滑,或直接删除),经试验有效,希望有所帮助。另,此方法借鉴于人大经济论坛的相关技术贴,在此向这些无私奉献的老师和大牛们致以崇高的敬意!工具/原料moreStata(网上有面安装款,解压能直接运行),实验数据方法/步骤1/5分步阅读
2/5
3/5
4/5
5/5
打开stata,在命令行输入ssc install winsor2, replace,自动安装winsor2

准备数据(注意输入格式)

导入数据File-Inport

输入命令winsor2变量名 变量名, replace cuts(1 99),此条命令是先找到各个变量的1%,99%所对应的分位数,比如对于变量ac1,其分位数分别为a、b,那么将数据中小于a的数替换成a,将大于b的数替换成b,原始数据直接变为新数据,这样就是缩尾,使数据平滑(口径为1%)。若输入命令winsor2变量名 变量名, replace cuts(1 99) trim,则不替换,将小于a和大于b的直接删除

最后一张图显示的是命令winsor2ac1 ac2, replace cuts(1 99) trim命令的执行结果,大家看到数据表中的“.”,即是删除完异常值后的结果,批量处理后可以File-Export将数据导出,在Excel上排序后即可将其删除(或在STATA上用其他命令也可)

版权声明:
1、本文系转载,版权归原作者所有,旨在传递信息,不代表看本站的观点和立场。
2、本站仅提供信息发布平台,不承担相关法律责任。
3、若侵犯您的版权或隐私,请联系本站管理员删除。
4、文章链接:http://www.1haoku.cn/art_738435.html
上一篇:吹笛子的小男孩怎么做
下一篇:老酒焖黄鱼的做法