求助:java读取pdf文件问题.我用下面代码读取本地的pdf文件没问题但是读取远程的pdf文件就报异常
具体代码:读取本地pdf文件:publicstaticvoidmain(String[]args)throwsException{FileInputStreamfis=n...
具体代码:
读取本地pdf文件:
public static void main(String[] args) throws Exception{
FileInputStream fis = new FileInputStream("d://myPDF1.pdf");
PDFParser p = new PDFParser(fis);
p.parse();
PDFTextStripper ts = new PDFTextStripper();
String s = ts.getText(p.getPDDocument());
System.out.println("一共读取了"+s.length()+"个字符");
fis.close();
}
控制台输出内容:
一共读取了67个字符
读取远程文件:
public static void main(String[] args) throws Exception{
FileInputStream fis = new FileInputStream("http://www.dt158.com/pdf/8928991747799539758.pdf");
PDFParser p = new PDFParser(fis);
p.parse();
PDFTextStripper ts = new PDFTextStripper();
String s = ts.getText(p.getPDDocument());
System.out.println("一共读取了"+s.length()+"个字符");
fis.close();
}
控制台输出:
Exception in thread "main" java.io.FileNotFoundException: http:\www.dt158.com\pdf\8928991747799539758.pdf (文件名、目录名或卷标语法不正确。)
at java.io.FileInputStream.open(Native Method)
at java.io.FileInputStream.<init>(Unknown Source)
at java.io.FileInputStream.<init>(Unknown Source)
at jsoupTest.pdfReadTest.main(pdfReadTest.java:20)
貌似是远程的文件路径出问题了,但是远程的路径该怎么写呢????求助..... 展开
读取本地pdf文件:
public static void main(String[] args) throws Exception{
FileInputStream fis = new FileInputStream("d://myPDF1.pdf");
PDFParser p = new PDFParser(fis);
p.parse();
PDFTextStripper ts = new PDFTextStripper();
String s = ts.getText(p.getPDDocument());
System.out.println("一共读取了"+s.length()+"个字符");
fis.close();
}
控制台输出内容:
一共读取了67个字符
读取远程文件:
public static void main(String[] args) throws Exception{
FileInputStream fis = new FileInputStream("http://www.dt158.com/pdf/8928991747799539758.pdf");
PDFParser p = new PDFParser(fis);
p.parse();
PDFTextStripper ts = new PDFTextStripper();
String s = ts.getText(p.getPDDocument());
System.out.println("一共读取了"+s.length()+"个字符");
fis.close();
}
控制台输出:
Exception in thread "main" java.io.FileNotFoundException: http:\www.dt158.com\pdf\8928991747799539758.pdf (文件名、目录名或卷标语法不正确。)
at java.io.FileInputStream.open(Native Method)
at java.io.FileInputStream.<init>(Unknown Source)
at java.io.FileInputStream.<init>(Unknown Source)
at jsoupTest.pdfReadTest.main(pdfReadTest.java:20)
貌似是远程的文件路径出问题了,但是远程的路径该怎么写呢????求助..... 展开
2个回答
展开全部
用UrlConnetion类, 读取http:\www.dt158.com\pdf\8928991747799539758.pdf ,
UrlConnection 的 openStream() 方法获得一个读取流,就可以读取了
UrlConnection 的 openStream() 方法获得一个读取流,就可以读取了
追问
可以给个例子么
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
FileInputStream 只能使用本地文件作为输入。
更多追问追答
追问
那如果我想读取远程的pdf文件该怎么做呢?
追答
URL url = null;
InputStream is =null;
url = new URL(path);
//利用HttpURLConnection对象,我们可以从网络中获取网页数据.
HttpURLConnection conn = (HttpURLConnection) url.openConnection();
conn.setDoInput(true);
conn.connect();
is = conn.getInputStream(); //得到网络返回的输入流
代码如上所示,is就是你需要的输入流。
本回答被提问者采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询