python jieba停用词该如何设置?
比如如下语句:“河北西南部累计降水量达100~160毫米。河北等地部分地区昨日的最高气温已突破15℃“停用词如果设置了河北,河北西南部,去停用词之后的语句会得到“西南部累...
比如如下语句:
“河北西南部累计降水量达100~160毫米。河北等地部分地区昨日的最高气温已突破15℃“
停用词如果设置了河北,河北西南部,去停用词之后的语句会得到
“西南部累计降水量达100~160毫米。等地部分地区昨日的最高气温已突破15℃“
河北会去掉,但是西南部没有去除成功。
请问如何设置才能同时去掉河北,河北西南部两个词呢?
望指教,谢谢。 展开
“河北西南部累计降水量达100~160毫米。河北等地部分地区昨日的最高气温已突破15℃“
停用词如果设置了河北,河北西南部,去停用词之后的语句会得到
“西南部累计降水量达100~160毫米。等地部分地区昨日的最高气温已突破15℃“
河北会去掉,但是西南部没有去除成功。
请问如何设置才能同时去掉河北,河北西南部两个词呢?
望指教,谢谢。 展开
1个回答
2020-02-19
展开全部
你把你的停用词排一下序,然后再给结巴看看。
或者加两个停用词,一个河北、一个西南部。
停用词通常是很短的高频出现的词语,真实情况你这样的不多。
如果你这种情况,不妨先分词,也不去停用词。
然后自己再来后续处理。
或者加两个停用词,一个河北、一个西南部。
停用词通常是很短的高频出现的词语,真实情况你这样的不多。
如果你这种情况,不妨先分词,也不去停用词。
然后自己再来后续处理。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询