如何用c#读取pdf内容
2个回答
展开全部
public static string ReadPdfContent(string filepath)
{
try
{
string pdffilename = filepath;
PdfReader pdfReader = new PdfReader(pdffilename);
int numberOfPages = pdfReader.NumberOfPages;
StringBuilder text = new StringBuilder();
for (int i = 1; i <= numberOfPages; ++i)
{
text.Append(iTextSharp.text.pdf.parser.PdfTextExtractor.GetTextFromPage(pdfReader, i));
}
pdfReader.Close();
return text.ToString();
}
catch (Exception ex)
{
return "原因:" + ex.ToString();
}
}
此方法需要引用iTextSharp
也可以使用PDFBox
PDDocument doc = PDDocument.load("lopreacamasa.pdf");
PDFTextStripper pdfStripper = new PDFTextStripper();
Console.Write(pdfStripper.getText(doc));
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询
广告 您可能关注的内容 |