Java 读取PDF中的表格
来源:网络收集 点击: 时间:2024-03-06将jar包下载到本地,解压。然后执行如下步骤来手动导入:

找到本地路径下的jar文件,点击OK,添加到列表,

添加后,勾选选项,点击Apply完成jar导入。

import com.spire.pdf.*;import com.spire.pdf.utilities.PdfTable;import com.spire.pdf.utilities.PdfTableExtractor;import java.io.FileWriter;import java.io.IOException;public class ExtractTable { public static void main(String args)throws IOException { //加载PDF文档 PdfDocument pdf = new PdfDocument(); pdf.loadFromFile(test.pdf); //创建StringBuilder类的实例 StringBuilder builder = new StringBuilder(); //抽取表格 PdfTableExtractor extractor = new PdfTableExtractor(pdf); PdfTable tableLists ; for (int page = 0; page pdf.getPages().getCount(); page++) { tableLists = extractor.extractTable(page); if (tableLists != null tableLists.length 0) { for (PdfTable table : tableLists) { int row = table.getRowCount(); int column = table.getColumnCount(); for (int i = 0; i row; i++) { for (int j = 0; j column; j++) { String text = table.getText(i, j); builder.append(text+ ); } builder.append(\r\n); } } } } //将提取的表格内容写入txt文档 FileWriter fileWriter = new FileWriter(ExtractedTable.txt); fileWriter.write(builder.toString()); fileWriter.flush(); fileWriter.close(); }}
2/2执行代码,生成txt文档。如图表格读取结果:

版权声明:
1、本文系转载,版权归原作者所有,旨在传递信息,不代表看本站的观点和立场。
2、本站仅提供信息发布平台,不承担相关法律责任。
3、若侵犯您的版权或隐私,请联系本站管理员删除。
4、文章链接:http://www.1haoku.cn/art_256070.html