C# 如何读取和显示PDF？

 我来答

2个回答

#合辑# 机票是越早买越便宜吗？

匿名用户
2022-12-23

展开全部

读取显示PDF需要借助PDF库，国内Spire.PDF可以读取PDF内容，包括文本，图片以及表格，你可以通过NuGet搜索安装

读取文本内容：

using Spire.Pdf;

using Spire.Pdf.Texts;

using System.IO;

using System.Text;

namespace ExtractText

{

internal class Program

{

static void Main(string[] args)

{

//创建一个 PdfDocument 对象

PdfDocument doc = new PdfDocument();

//加载PDF文件

doc.LoadFromFile("AI数字人.pdf");

StringBuilder sb = new StringBuilder();

foreach (PdfPageBase page in doc.Pages)

{

//创建一个PdfTextExtractot 对象

PdfTextExtractor textExtractor = new PdfTextExtractor(page);

//创建一个 PdfTextExtractOptions 对象

PdfTextExtractOptions extractOptions = new PdfTextExtractOptions();

//将 isExtractAllText 设置为true

extractOptions.IsExtractAllText = true;

//从页面中提取文本

sb.AppendLine(textExtractor.ExtractText(extractOptions));

}

//将提取的文本写入 TXT 文件

File.WriteAllText("提取指定页面文本.txt", sb.ToString());

}

读取表格内容：

using Spire.Pdf;

using Spire.Pdf.Utilities;

using System.IO;

using System.Text;

namespace ExtractTable{
class Program
{
static void Main(string[] args)
{
//实例化PdfDocument类的对象
PdfDocument pdf = new PdfDocument();

//加载PDF文档
pdf.LoadFromFile("sample.pdf");

//创建StringBuilder类的对象
StringBuilder builder = new StringBuilder();

//实例化PdfTableExtractor类的对象
PdfTableExtractor extractor = new PdfTableExtractor(pdf);

//声明PdfTable类的表格数组
PdfTable[] tableLists;

//遍历PDF页面
for (int pageIndex = 0; pageIndex < pdf.Pages.Count; pageIndex++)
{
//从页面提取表格
tableLists = extractor.ExtractTable(pageIndex);

//判断表格列表是否为空
if (tableLists != null && tableLists.Length > 0)
{
//遍历表格
foreach (PdfTable table in tableLists)
{
//获取表格中的行和列数
int row = table.GetRowCount();
int column = table.GetColumnCount();

//遍历表格行和列
for (int i = 0; i < row; i++)
{
for (int j = 0; j < column; j++)
{
//获取行和列中的文本
string text = table.GetText(i, j);

//写入文本到StringBuilder容器
builder.Append(text + " ");
}
builder.Append("\r\n");
}
}
}
}

//保存提取的表格内容为.txt文档
File.WriteAllText("ExtractedTable.txt", builder.ToString());
}
}

}

已赞过 已踩过<

评论收起

惠企百科
2022-12-14 · 百度认证:北京惠企网络技术有限公司官方账号

惠企百科

惠企百科网是一家科普类综合网站，关注热门中文知识,集聚互联网精华中文知识,本着自由开放、分享价值的基本原则,向广大网友提供专业的中文知识平台。

向TA提问

关注

展开全部

先安装AcrobatReader，工具箱上选择项，添加一个AdobePDFReader\x0d\x0a\x0d\x0a在Form上放置一个AdobePDFReader控件，代码:\x0d\x0aprivatevoidForm1_Load(objectsender,EventArgse)\x0d\x0a{\x0d\x0aaxAcroPDF1.LoadFile(@"D:\美国国家地理.pdf");\x0d\x0aaxAcroPDF1.setShowToolbar(false);\x0d\x0aaxAcroPDF1.setShowScrollbars(false);\x0d\x0aaxAcroPDF1.setPageMode("pagesonly");\x0d\x0a}\x0d\x0a效果：

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

C# 如何读取和显示PDF？

为你推荐：