结巴分词获取关键词时怎么过滤掉一些停用词
1个回答
2017-09-20
展开全部
是使用extract_tags函数,这个函数会根据TF-IDF算法将特征词提取出来,在提取之前会去掉停用词,可以人工指定停用词字典,代码如下:jieba.analyse.set_stop_words('D:\\Python27\\stopword.txt')tags=jieba.analyse.extract_tags(text,20)
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询