python里如何快速统计 词频? 现在有个文件 data.txt 里面有1万多行 每行都
python里如何快速统计词频?现在有个文件data.txt里面有1万多行每行都有数量不一的数字:2768111656369.....我现在统计的方法是对于每个数都遍历一...
python里如何快速统计 词频?
现在有个文件 data.txt
里面有1万多行 每行都有数量不一的 数字:
2 76 8
111 65 6 36 9
.....
我现在统计的方法是 对于每个数 都遍历一遍所有数字,如果相等, count+1
这样太慢了 是N^2 时间
有快速的方法吗? 展开
现在有个文件 data.txt
里面有1万多行 每行都有数量不一的 数字:
2 76 8
111 65 6 36 9
.....
我现在统计的方法是 对于每个数 都遍历一遍所有数字,如果相等, count+1
这样太慢了 是N^2 时间
有快速的方法吗? 展开
展开全部
1. N^2时间复杂度是怎么算出来的?N指什么?
2. 对于多位数,比如 76,我们把它当做两个数字 7 和 6 这样来统计词频?
2. 对于多位数,比如 76,我们把它当做两个数字 7 和 6 这样来统计词频?
追问
数字通过 空格 来区分。 76连在一起,那就是一个词
因为我对于没个 词(数字), 都把它和整个数据库的所有词 作对比,所以共N个词 * N词共N^2
优化方法我已经查出来了:
建立个dictionary , Key是词 Data是词频 那样只用扫描数据库1次 就可以统计出所有词的词频
追答
恩,用dict是标准的解决方案。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询