1个回答
展开全部
C# 怎么读取PDF文件内容?
怎么能读取到PDF文件里的内容信息,PDF为全英文文本格式 无图片类的东西..
我怎么才能读取到所有信息 然后保存到字符串里面..?
------解决方案--------------------
下载 PDFBox-0.7.3.zip
PDFBox-0.7.3.dll
lucene-demos-2.0.0.dll
lucene-core-2.0.0.dll
bcmail-jdk14-132.dll
bcprov-jdk14-132.dll
FontBox-0.1.0-dev.dll
ICSharpCode.SharpZipLib.dll
IKVM.AWT.WinForms.dll
IKVM.GNU.Classpath.dll
IKVM.Runtime.dll
ikvm-native.dll
放入Bin中
C# code<%@ Page Language="C#" %>
<%@ Import Namespace="System" %>
<%@ Import Namespace="org.pdfbox.pdmodel" %>
<%@ Import Namespace="org.pdfbox.util" %>
<script language="C#" runat="server">
protected void Page_Load(object sender, System.EventArgs e)
{
string pdfPath = Server.MapPath("index.pdf");
PDDocument doc = PDDocument.load(pdfPath);
PDFTextStripper stripper = new PDFTextStripper();
string txt = stripper.getText(doc);
Response.Write(txt);
}
</script>
注:网上搜的不知道管不管用。楼主试试吧能读出来再处理就好办多了
怎么能读取到PDF文件里的内容信息,PDF为全英文文本格式 无图片类的东西..
我怎么才能读取到所有信息 然后保存到字符串里面..?
------解决方案--------------------
下载 PDFBox-0.7.3.zip
PDFBox-0.7.3.dll
lucene-demos-2.0.0.dll
lucene-core-2.0.0.dll
bcmail-jdk14-132.dll
bcprov-jdk14-132.dll
FontBox-0.1.0-dev.dll
ICSharpCode.SharpZipLib.dll
IKVM.AWT.WinForms.dll
IKVM.GNU.Classpath.dll
IKVM.Runtime.dll
ikvm-native.dll
放入Bin中
C# code<%@ Page Language="C#" %>
<%@ Import Namespace="System" %>
<%@ Import Namespace="org.pdfbox.pdmodel" %>
<%@ Import Namespace="org.pdfbox.util" %>
<script language="C#" runat="server">
protected void Page_Load(object sender, System.EventArgs e)
{
string pdfPath = Server.MapPath("index.pdf");
PDDocument doc = PDDocument.load(pdfPath);
PDFTextStripper stripper = new PDFTextStripper();
string txt = stripper.getText(doc);
Response.Write(txt);
}
</script>
注:网上搜的不知道管不管用。楼主试试吧能读出来再处理就好办多了
追问
这个我都写过了 是在指定的位置上添加字符串, 就像photoshop那样直接剪贴到上面 不过那也谢谢你了
追答
你看看pdf的有相关接口没有。我也没弄过,貌似不好弄
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询
广告 您可能关注的内容 |