广告合作
  • 今日头条

    今日头条

  • 百度一下

    百度一下,你就知道

  • 新浪网

    新浪网 - 提供新闻线索,重大新闻爆料

  • 搜狐

    搜狐

  • 豆瓣

    豆瓣

  • 百度贴吧

    百度贴吧——全球领先的中文社区

  • 首页 尚未审核订阅工具 订阅

    C# 读取PDF文件

    来源:网络收集  点击:  时间:2024-02-17
    【导读】:
    此经验旨在分享C#如何读取PDF文件,示例内容包含了读取PDF全部文本、读取PDF指定区域的内容、读取PDF图片等。工具/原料moreFree Spire.PDF for .NET(社区版)方法/步骤1/5分步阅读

    首先需要下载并安装该类库,安装后引用Spire.Pdf.dll到项目,dll文件直接在安装路径下 的Bin文件夹获取。

    2/5

    原测试文档:

    3/5

    读取PDF全部文本内容:

    C#

    using Spire.Pdf;

    using System;

    using System.IO;

    using System.Text;

    namespace ExtractText_PDF

    {

    class Program

    {

    static void Main(string args)

    {

    //实例化PdfDocument类对象,并加载PDF文档

    PdfDocument doc = new PdfDocument();

    doc.LoadFromFile(sample.pdf);

    //实例化一个StringBuilder 对象

    StringBuilder content = new StringBuilder();

    //遍历文档所有PDF页面,提取文本

    foreach (PdfPageBase page in doc.Pages)

    {

    content.Append(page.ExtractText());

    }

    //将提取到的文本写为.txt格式并保存到本地路径

    String fileName = 获取文本.txt;

    File.WriteAllText(fileName, content.ToString());

    System.Diagnostics.Process.Start(获取文本.txt);

    }

    }

    }

    4/5

    读取PDF指定范围内的文本内容:

    C#

    using Spire.Pdf;

    using System.IO;

    using System.Text;

    using System.Drawing;

    namespace ExtractText1_PDF

    {

    class Program

    {

    static void Main(string args)

    {

    //创建PdfDocument类实例,并加载PDF文档

    PdfDocument pdf = new PdfDocument();

    pdf.LoadFromFile(sample.pdf);

    //获取PDF第一页

    PdfPageBase page = pdf.Pages;

    //从第一页的指定矩形区域内提取文本

    string text = page.ExtractText(new RectangleF(50, 50, 500, 170));

    //保存文本到.txt文件,并打开文档

    StringBuilder sb = new StringBuilder();

    sb.AppendLine(text);

    File.WriteAllText(Extract.txt, sb.ToString());

    System.Diagnostics.Process.Start(Extract.txt);

    }

    }

    }

    5/5

    读取图片:

    C#

    using Spire.Pdf;

    using System.Collections.Generic;

    using System.Drawing;

    namespace ExtractImages_PDF

    {

    class Program

    {

    static void Main(string args)

    {

    //创建一个PdfDocument类对象,加载PDF测试文档

    PdfDocument doc = new PdfDocument();

    doc.LoadFromFile(sample.pdf);

    //声明List类对象

    ListImage ListImage = new ListImage();

    //遍历PDF文档所有页面

    for (int i = 0; i doc.Pages.Count; i++)

    {

    //获取文档所有页,并提取页面中的所有图片

    PdfPageBase page = doc.Pages;

    Image images = page.ExtractImages();

    if (images != null images.Length 0)

    {

    ListImage.AddRange(images);

    }

    }

    //将获取到的图片保存到本地路径

    if (ListImage.Count 0)

    {

    for (int i = 0; i ListImage.Count; i++)

    {

    Image image = ListImage;

    image.Save(image + (i + 1).ToString() + .png, System.Drawing.Imaging.ImageFormat.Png);

    }

    //打开获取到的图片

    System.Diagnostics.Process.Start(image1.png);

    }

    }

    }

    }

    PDF读取PDF文本读取PDF图片免费控件
    本文关键词:

    版权声明:

    1、本文系转载,版权归原作者所有,旨在传递信息,不代表看本站的观点和立场。

    2、本站仅提供信息发布平台,不承担相关法律责任。

    3、若侵犯您的版权或隐私,请联系本站管理员删除。

    4、文章链接:http://www.1haoku.cn/art_59546.html

    相关资讯

    ©2019-2020 http://www.1haoku.cn/ 国ICP备20009186号05-05 09:26:08  耗时:0.030
    0.0302s