您好,请问如何用C#语言读取pdf指定的文字呢?
就像这张图,想读取卖方后的公司名称,赋值个某个变量stringstr1;买方后的公司名称赋值给变量stringstr2;其它所需要的文字,也可以指定的读取,赋值给某个变量...
就像这张图,
想读取卖方后的公司名称,赋值个某个变量string str1;
买方后的公司名称赋值给变量 string str2;
其它所需要的文字,也可以指定的读取,赋值给某个变量,请问您可以实现吗?
谢谢! 展开
想读取卖方后的公司名称,赋值个某个变量string str1;
买方后的公司名称赋值给变量 string str2;
其它所需要的文字,也可以指定的读取,赋值给某个变量,请问您可以实现吗?
谢谢! 展开
展开全部
我也想知道这问题的答案。
参考一下 http://www.doc88.com/p-690590394394.html
pdf 转为文本,正常情况下是按行读取的。这样肯定能取到 公司名称。
但有些pdf 转换后,会出现错行的情况,这样就可能读不到了。
参考一下 http://www.doc88.com/p-690590394394.html
pdf 转为文本,正常情况下是按行读取的。这样肯定能取到 公司名称。
但有些pdf 转换后,会出现错行的情况,这样就可能读不到了。
追问
我试过很多方法,但是读取的都是字母、数字,遇到汉字就变成乱码了,真不知道是什么情况,那个编码gb2312、utf-8都试过,不行,不好怎么办了都。
追答
汉子乱码,以前也有同学遇到过,你可以看一下
http://zhidao.baidu.com/question/872650455679782692.html?oldq=1
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询