python 中文切词使用停用词表问题 10

求助!使用Jieba进行分词,加载了停用词,为什么生成的语料库里面仍然存在“停用词”表中的词语?比如下图,分词之后的语料库里面,仍然存在“似乎”这个词语,而这个词语我确定... 求助!使用Jieba进行分词,加载了停用词,为什么生成的语料库里面仍然存在 “停用词”表中的词语?比如下图,分词之后的语料库里面,仍然存在“似乎”这个词语,而这个词语我确定在停用词里面。 展开
 我来答
油盐多味人生E
2019-06-02 · TA获得超过8048个赞
知道大有可为答主
回答量:1.2万
采纳率:80%
帮助的人:503万
展开全部


python中最好不要在list遍历中使用list.remove方法:

  • remove 仅仅 删除一个值的首次出现。 

  • 如果在 list 中没有找到值,程序会抛出一个异常

  • 最后,你遍历自己时候对自己的内容进行删除操作,效率显然不高,还容易出现各种难debug的问题

建议使用新的list存储要保留的内容,然后返回这个新list。比如

a_list = [1,2,3,4,5]
needs_to_be_removed = [3,4,5]
result = []
for v in a_list:
    if v not in needs_to_be_removed:
        result.append(v)
print result



推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式