C# 读取PDF文件
来源:网络收集 点击: 时间:2024-02-17首先需要下载并安装该类库,安装后引用Spire.Pdf.dll到项目,dll文件直接在安装路径下 的Bin文件夹获取。

原测试文档:

读取PDF全部文本内容:
C#
using Spire.Pdf;
using System;
using System.IO;
using System.Text;
namespace ExtractText_PDF
{
class Program
{
static void Main(string args)
{
//实例化PdfDocument类对象,并加载PDF文档
PdfDocument doc = new PdfDocument();
doc.LoadFromFile(sample.pdf);
//实例化一个StringBuilder 对象
StringBuilder content = new StringBuilder();
//遍历文档所有PDF页面,提取文本
foreach (PdfPageBase page in doc.Pages)
{
content.Append(page.ExtractText());
}
//将提取到的文本写为.txt格式并保存到本地路径
String fileName = 获取文本.txt;
File.WriteAllText(fileName, content.ToString());
System.Diagnostics.Process.Start(获取文本.txt);
}
}
}

读取PDF指定范围内的文本内容:
C#
using Spire.Pdf;
using System.IO;
using System.Text;
using System.Drawing;
namespace ExtractText1_PDF
{
class Program
{
static void Main(string args)
{
//创建PdfDocument类实例,并加载PDF文档
PdfDocument pdf = new PdfDocument();
pdf.LoadFromFile(sample.pdf);
//获取PDF第一页
PdfPageBase page = pdf.Pages;
//从第一页的指定矩形区域内提取文本
string text = page.ExtractText(new RectangleF(50, 50, 500, 170));
//保存文本到.txt文件,并打开文档
StringBuilder sb = new StringBuilder();
sb.AppendLine(text);
File.WriteAllText(Extract.txt, sb.ToString());
System.Diagnostics.Process.Start(Extract.txt);
}
}
}

读取图片:
C#
using Spire.Pdf;
using System.Collections.Generic;
using System.Drawing;
namespace ExtractImages_PDF
{
class Program
{
static void Main(string args)
{
//创建一个PdfDocument类对象,加载PDF测试文档
PdfDocument doc = new PdfDocument();
doc.LoadFromFile(sample.pdf);
//声明List类对象
ListImage ListImage = new ListImage();
//遍历PDF文档所有页面
for (int i = 0; i doc.Pages.Count; i++)
{
//获取文档所有页,并提取页面中的所有图片
PdfPageBase page = doc.Pages;
Image images = page.ExtractImages();
if (images != null images.Length 0)
{
ListImage.AddRange(images);
}
}
//将获取到的图片保存到本地路径
if (ListImage.Count 0)
{
for (int i = 0; i ListImage.Count; i++)
{
Image image = ListImage;
image.Save(image + (i + 1).ToString() + .png, System.Drawing.Imaging.ImageFormat.Png);
}
//打开获取到的图片
System.Diagnostics.Process.Start(image1.png);
}
}
}
}

版权声明:
1、本文系转载,版权归原作者所有,旨在传递信息,不代表看本站的观点和立场。
2、本站仅提供信息发布平台,不承担相关法律责任。
3、若侵犯您的版权或隐私,请联系本站管理员删除。
4、文章链接:http://www.1haoku.cn/art_59546.html