java中使用jacob怎么读取word里的部分内容,以字符串形式返回 70
比如word里有AA123456BB,我想把AA和BB之间的内容,即123456取出来,以字符串形式返回,怎么做呀...
比如word里有AA123456BB,我想把AA和BB之间的内容,即123456取出来,以字符串形式返回,怎么做呀
展开
2个回答
展开全部
FileInputStream in = new FileInputStream("D://22.doc ");
WordExtractor extractor = new WordExtractor();
String str = extractor.extractText(in);
int start = str.indexOf("AA");
int end = str.indexOf("BB");
System.out.println(str.substring(start, end));
记得导入tm-extractors-0.4.jar 包
WordExtractor extractor = new WordExtractor();
String str = extractor.extractText(in);
int start = str.indexOf("AA");
int end = str.indexOf("BB");
System.out.println(str.substring(start, end));
记得导入tm-extractors-0.4.jar 包
追问
是
org.apache.poi.hwpf.extractor.WordExtractor
里的吧
我这不能new WordExtractor() 里面要带参数
FileInputStream in = new FileInputStream(inputFile);
WordExtractor extractor = new WordExtractor(in);
这样吧,它又会报错
java.io.IOException: Invalid header signature; read 0x00740068003CFEFF, expected 0xE11AB1A1E011CFD0
追答
org.textmining.text.extraction.WordExtractor;
包错了。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询