您好,请问如何用C#语言读取pdf指定的文字呢?

就像这张图,想读取卖方后的公司名称,赋值个某个变量stringstr1;买方后的公司名称赋值给变量stringstr2;其它所需要的文字,也可以指定的读取,赋值给某个变量... 就像这张图,
想读取卖方后的公司名称,赋值个某个变量string str1;
买方后的公司名称赋值给变量 string str2;
其它所需要的文字,也可以指定的读取,赋值给某个变量,请问您可以实现吗?
谢谢!
展开
 我来答
lichxi1002
2014-07-23 · 超过13用户采纳过TA的回答
知道答主
回答量:36
采纳率:0%
帮助的人:33.9万
展开全部
我也想知道这问题的答案。

参考一下 http://www.doc88.com/p-690590394394.html
pdf 转为文本,正常情况下是按行读取的。这样肯定能取到 公司名称。
但有些pdf 转换后,会出现错行的情况,这样就可能读不到了。
追问
我试过很多方法,但是读取的都是字母、数字,遇到汉字就变成乱码了,真不知道是什么情况,那个编码gb2312、utf-8都试过,不行,不好怎么办了都。
追答
汉子乱码,以前也有同学遇到过,你可以看一下
http://zhidao.baidu.com/question/872650455679782692.html?oldq=1
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式