使用kettle工具去除重复记录Excel为例
来源:网络收集 点击: 时间:2024-07-06【导读】:
kettle是一个免费且开源的大数据预处理软件,本篇讲述如果使用kettle工具来的去除Excel文件的重复记录。工具/原料moreKettle工具Excel文件方法/步骤1/11分步阅读
2/11
3/11
4/11
5/11
6/11


7/11




8/11


9/11
10/11
11/11
注意事项
打开kettle工具,并新建转换

准备一个需要去重的Excel文件,文件的内容如图,标红的区域为我们需要去重的区域。
注意:Excel文件去重之前必须先排序

创建Excel 输入:
1. 选择输入
2. 选择Excel 输入

创建Excel 输出:
1. 选择输出
2. 选择Excel 输出

创建去除重复记录:
1.选择转换
2.选择去除重复记录

将创建好的的三个组件连接起来,操作如图所示




配置Excel 输人,具体配置如图






配置去除重复记录,具体配置如图




配置Excel输出 具体的配置如图


开始转换


查看转换结果

Excel文件必须事先排好序
大数据数据处理数据清洗KETTLEEXCEL版权声明:
1、本文系转载,版权归原作者所有,旨在传递信息,不代表看本站的观点和立场。
2、本站仅提供信息发布平台,不承担相关法律责任。
3、若侵犯您的版权或隐私,请联系本站管理员删除。
4、文章链接:http://www.1haoku.cn/art_936134.html
上一篇:除了金银花还有一种金什么花
下一篇:信捷PLC如何通过人机界面进行I/O点替换