怎么用JAVA实现读取PDF中的表格,输出成XLS表格 200

我知道能下载到的转换软件有很多,只是想自己用JAVA写一个,思路还不是很懂。当初想法是:用PDFbox读PDF。用Tokenizer识别表格符号分割。再用JXL包输出成X... 我知道能下载到的转换软件有很多,只是想自己用JAVA写一个,思路还不是很懂。

当初想法是:用PDFbox读PDF。用Tokenizer识别表格符号分割。再用JXL包输出成XLS。

但PDFbox读出来,文字之间只有空格。这样就会把一个单元格中有空格的一段话也分割开来。

谁能给点思路。最好附上代码。

100分悬赏,感谢!
读取XML转XLS的方法也可以。最好能识别到<Table></Table>之间,把其中的表格输出来。用什么方法能设定<TD><TR>作为分隔符?
展开
 我来答
haopyan
2009-09-25
知道答主
回答量:30
采纳率:0%
帮助的人:0
展开全部
你的问题还真难类!
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式