利用Python列出最频繁的单词和它们的出现次数
读入文本文件《爱丽斯漫游仙境》英文版,可以从http://www.umich.edu/~umfandsf/other/ebooks/alice30.txt这个地址获取,列...
读入文本文件《爱丽斯漫游仙境》英文版,可以从http://www.umich.edu/~umfandsf/other/ebooks/alice30.txt这个地址获取,列出其中使用最频繁的10个单词,并给出它们的出现次数
展开
2个回答
展开全部
Python2.7上测试通过
import urllib2
import re
from collections import Counter
def get_data(url):
resp = urllib2.urlopen(url).read().lower()
return resp
def analyse(text, n=1):
''' show the n most common words in text '''
res = Counter(re.split(r'\W+', text, flags=re.M)).most_common(n)
print('words\ttimes')
print('\n'.join([k+'\t'+str(v) for k,v in res]))
def main():
data = get_data('http://www.umich.edu/~umfandsf/other/ebooks/alice30.txt')
analyse(data, 10)
main()
结果是
words times
the 1642
and 872
to 729
a 632
it 595
she 553
i 543
of 514
said 462
you 411
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询