python怎样读取文本文件里的中文

想写一段python代码，能每次只读取文本文件中的下一个中文字符，跳过所有英文数字、符号和换行符，而且还不知道文件的编码是GBK还是Unicode，应该怎样写呢？... 想写一段python代码，能每次只读取文本文件中的下一个中文字符，跳过所有英文数字、符号和换行符，而且还不知道文件的编码是GBK还是Unicode，应该怎样写呢？展开

 我来答

3个回答

#热议# 网上掀起『练心眼子』风潮，真的能提高情商吗？

我心我在
2015-02-26 · TA获得超过2157个赞

知道小有建树答主

回答量：784

采纳率：77%

帮助的人：634万

我也去答题访问个人页

关注

展开全部

#在Windows 环境下
import sys
reload(sys)
sys.setdefaultencoding("utf-8")
import re
fin = open('in.txt', 'r') #以读的方式打开输入文件
for eachLine in fin: #按行读入文件内容
line = eachLine.strip().decode('gbk', 'utf-8') #处理前进行相关的处理，包括转换成Unicode等
print line #打印原始字符
p2 = re.compile(ur'[^\u4e00-\u9fa5]') #中文的编码范围是：\u4e00到\u9fa5
zh = "".join(p2.split(line)).strip()
#zh = ",".join(zh.split())
print zh ##打印中文字符

追问

想每次只提取一个字，可以吗？

追答

print zh ##打印中文字符
这整个字符都得到了  改成一个一个的提取 应该不难把

已赞过 已踩过<

评论收起

北京月之暗面科技有限公司

广告2025-01-18

写作_选Kimi_一键生成海量文章_编程、翻译、聊天、语音样样全能_产出效率惊人的免费AI智能尽在Kimi~

kimi.moonshot.cn

百度网友0d7347e
推荐于2016-11-14 · TA获得超过165个赞

知道小有建树答主

回答量：233

采纳率：0%

帮助的人：107万

我也去答题访问个人页

关注

展开全部

file = open('filename.txt','r')
text = file.read() #读取所有文字
text = file.readline() #读取一行文字
text = file.readlinse() #把每一行变成list的一个元素
如果需要里面中文的话，用正则匹配

已赞过 已踩过<

评论收起

未央夜幽灵
2015-08-07 · 超过48用户采纳过TA的回答

知道小有建树答主

回答量：176

采纳率：100%

帮助的人：134万

我也去答题访问个人页

关注

展开全部

读没有问题，主要是输出的问题吧？

已赞过 已踩过<

评论收起

1条折叠回答

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

资料下载标准版-资料文档库-全文阅读下载

资料下载专题资料下载，不用四处查资料，360文库海量精选资料下载全行业资料覆盖，千万文档即刻下载，享专属优惠!

wenku.so.com广告

模板与范例模板与范例AI解析，高效又专业

kimi智能助手AI解析模板与范例，帮助快速掌握知识点，效率更高!

kimi.moonshot.cn广告

写作_Kimi-爆款文案生成器-AI智能写作

写作_选Kimi_一键生成海量文章_编程、翻译、聊天、语音样样全能_产出效率惊人的免费AI智能尽在Kimi~

kimi.moonshot.cn广告

python怎样读取文本文件里的中文

您可能关注的内容

其他类似问题

为你推荐：