python里如何快速统计 词频? 现在有个文件 data.txt 里面有1万多行 每行都

python里如何快速统计词频?现在有个文件data.txt里面有1万多行每行都有数量不一的数字:2768111656369.....我现在统计的方法是对于每个数都遍历一... python里如何快速统计 词频?

现在有个文件 data.txt
里面有1万多行 每行都有数量不一的 数字:
2 76 8
111 65 6 36 9
.....

我现在统计的方法是 对于每个数 都遍历一遍所有数字,如果相等, count+1

这样太慢了 是N^2 时间

有快速的方法吗?
展开
 我来答
WM_THU
2015-10-21 · TA获得超过7164个赞
知道大有可为答主
回答量:4285
采纳率:80%
帮助的人:3922万
展开全部
1. N^2时间复杂度是怎么算出来的?N指什么?
2. 对于多位数,比如 76,我们把它当做两个数字 7 和 6 这样来统计词频?
追问
  1. 数字通过   空格  来区分。  76连在一起,那就是一个词

  2.  因为我对于没个  词(数字),  都把它和整个数据库的所有词 作对比,所以共N个词 * N词共N^2


优化方法我已经查出来了:

建立个dictionary , Key是词   Data是词频    那样只用扫描数据库1次  就可以统计出所有词的词频

追答
恩,用dict是标准的解决方案。
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式