怎么用JAVA实现读取PDF中的表格,输出成XLS表格 200

我知道能下载到的转换软件有很多,只是想自己用JAVA写一个,思路还不是很懂。当初想法是:用PDFbox读PDF。用Tokenizer识别表格符号分割。再用JXL包输出成X... 我知道能下载到的转换软件有很多,只是想自己用JAVA写一个,思路还不是很懂。

当初想法是:用PDFbox读PDF。用Tokenizer识别表格符号分割。再用JXL包输出成XLS。

但PDFbox读出来,文字之间只有空格。这样就会把一个单元格中有空格的一段话也分割开来。

谁能给点思路。最好附上代码。

100分悬赏,感谢!
读取XML转XLS的方法也可以。最好能识别到<Table></Table>之间,把其中的表格输出来。用什么方法能设定<TD><TR>作为分隔符?
展开
 我来答
asherlay
2009-09-29 · 超过16用户采纳过TA的回答
知道答主
回答量:81
采纳率:0%
帮助的人:0
展开全部
如果仅仅是读取XML转XLS,不需要设别分隔符。
用dom4j读取XML,用JXL写XLS。

应该会用吧,不会用的话可以PM QQ。

PDF不是很了解。
西门蛤蟆
2009-09-25 · TA获得超过1021个赞
知道小有建树答主
回答量:597
采纳率:0%
帮助的人:0
展开全部
Scanner类
用useDelimiter(Pattern pattern)设定分隔符,每次next()调用取得一段
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
祚胤17
2009-10-04 · TA获得超过786个赞
知道大有可为答主
回答量:1148
采纳率:82%
帮助的人:593万
展开全部
pdfbox和POI的联用
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
mayu117
2009-09-25
知道答主
回答量:28
采纳率:0%
帮助的人:15.2万
展开全部
可以使用正则表达式配置表格<Table>(.*?)</Table>

<TD>(.*?)</TD> 这样就可以配置到TD中的値了
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
光清晖77
2009-09-25 · TA获得超过1350个赞
知道小有建树答主
回答量:1689
采纳率:0%
帮助的人:604万
展开全部
keyword="营口路";
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
xhc2009
2009-09-29 · 超过20用户采纳过TA的回答
知道答主
回答量:131
采纳率:0%
帮助的人:0
展开全部
jxl和itext
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 2条折叠回答
收起 更多回答(5)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式