Python编程实现csv文件某一列的词频统计 10

我有一个csv文件，第三列是一些评论，想请教您该如何实现对该列的词频统计，谢谢！... 我有一个csv文件，第三列是一些评论，想请教您该如何实现对该列的词频统计，谢谢！展开

 我来答

2个回答

#热议# 发烧为什么不能用酒精擦身体来退烧？

有用测评
2017-06-22

知道答主

回答量：15

采纳率：0%

帮助的人：1.9万

我也去答题访问个人页

关注

展开全部

import re
import collections
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer, CountVectorizer
#为避免出问题，文件名使用全路径
data = pd.read_csv('XXX.csv')
trainheadlines = []
for row in range(0, len(data.index)):
trainheadlines.append(' '.join(str(x) for x in data.iloc[row, m:n]))
#上面的m:n代表取那一列，或者那几列。

advancedvectorizer = TfidfVectorizer(
min_df=0, max_df=1, max_features=20000, ngram_range=(1, 1))
advancedtrain = advancedvectorizer.fit_transform(trainheadlines)
print(advancedtrain.shape)

已赞过 已踩过<

评论收起

Y歌Y歌Y
2014-04-11

知道答主

回答量：23

采纳率：0%

帮助的人：7.8万

我也去答题访问个人页

关注

展开全部

如果是用户输入关键词，计算关键词的词频。这个好做，如果是要程序自己分析词来做词频统计，这个非常难。

追问

要的就是第二个啊

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

python教案完整版范本-直接使用

www.gzoffice.cn

商汤科技日日新·CoRaccoon-AI代码辅助生成

基于商汤大模型，让AI帮你写代码，支持100+语言与主流IDE，提升编程效率超50%。涵盖多场景，已助数万用户提升效率。点击立即体验!

www.sensetime.com广告

Python编程实现csv文件某一列的词频统计 10

您可能关注的内容

其他类似问题

为你推荐：