怎么用JAVA实现读取PDF中的表格,输出成XLS表格 200
我知道能下载到的转换软件有很多,只是想自己用JAVA写一个,思路还不是很懂。当初想法是:用PDFbox读PDF。用Tokenizer识别表格符号分割。再用JXL包输出成X...
我知道能下载到的转换软件有很多,只是想自己用JAVA写一个,思路还不是很懂。
当初想法是:用PDFbox读PDF。用Tokenizer识别表格符号分割。再用JXL包输出成XLS。
但PDFbox读出来,文字之间只有空格。这样就会把一个单元格中有空格的一段话也分割开来。
谁能给点思路。最好附上代码。
100分悬赏,感谢!
读取XML转XLS的方法也可以。最好能识别到<Table></Table>之间,把其中的表格输出来。用什么方法能设定<TD><TR>作为分隔符? 展开
当初想法是:用PDFbox读PDF。用Tokenizer识别表格符号分割。再用JXL包输出成XLS。
但PDFbox读出来,文字之间只有空格。这样就会把一个单元格中有空格的一段话也分割开来。
谁能给点思路。最好附上代码。
100分悬赏,感谢!
读取XML转XLS的方法也可以。最好能识别到<Table></Table>之间,把其中的表格输出来。用什么方法能设定<TD><TR>作为分隔符? 展开
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询
广告 您可能关注的内容 |