怎么用JAVA实现读取PDF中的表格,输出成XLS表格 200
我知道能下载到的转换软件有很多,只是想自己用JAVA写一个,思路还不是很懂。当初想法是:用PDFbox读PDF。用Tokenizer识别表格符号分割。再用JXL包输出成X...
我知道能下载到的转换软件有很多,只是想自己用JAVA写一个,思路还不是很懂。
当初想法是:用PDFbox读PDF。用Tokenizer识别表格符号分割。再用JXL包输出成XLS。
但PDFbox读出来,文字之间只有空格。这样就会把一个单元格中有空格的一段话也分割开来。
谁能给点思路。最好附上代码。
100分悬赏,感谢!
读取XML转XLS的方法也可以。最好能识别到<Table></Table>之间,把其中的表格输出来。用什么方法能设定<TD><TR>作为分隔符? 展开
当初想法是:用PDFbox读PDF。用Tokenizer识别表格符号分割。再用JXL包输出成XLS。
但PDFbox读出来,文字之间只有空格。这样就会把一个单元格中有空格的一段话也分割开来。
谁能给点思路。最好附上代码。
100分悬赏,感谢!
读取XML转XLS的方法也可以。最好能识别到<Table></Table>之间,把其中的表格输出来。用什么方法能设定<TD><TR>作为分隔符? 展开
展开全部
Scanner类
用useDelimiter(Pattern pattern)设定分隔符,每次next()调用取得一段
用useDelimiter(Pattern pattern)设定分隔符,每次next()调用取得一段
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
pdfbox和POI的联用
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
可以使用正则表达式配置表格<Table>(.*?)</Table>
<TD>(.*?)</TD> 这样就可以配置到TD中的値了
<TD>(.*?)</TD> 这样就可以配置到TD中的値了
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
keyword="营口路";
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
jxl和itext
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询