python 中文切词使用停用词表问题 10
求助!使用Jieba进行分词,加载了停用词,为什么生成的语料库里面仍然存在“停用词”表中的词语?比如下图,分词之后的语料库里面,仍然存在“似乎”这个词语,而这个词语我确定...
求助!使用Jieba进行分词,加载了停用词,为什么生成的语料库里面仍然存在 “停用词”表中的词语?比如下图,分词之后的语料库里面,仍然存在“似乎”这个词语,而这个词语我确定在停用词里面。
展开
1个回答
展开全部
python中最好不要在list遍历中使用list.remove方法:
remove 仅仅 删除一个值的首次出现。
如果在 list 中没有找到值,程序会抛出一个异常
- 最后,你遍历自己时候对自己的内容进行删除操作,效率显然不高,还容易出现各种难debug的问题
建议使用新的list存储要保留的内容,然后返回这个新list。比如
a_list = [1,2,3,4,5]
needs_to_be_removed = [3,4,5]
result = []
for v in a_list:
if v not in needs_to_be_removed:
result.append(v)
print result
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询