python中怎样处理汉语的同义词

用结巴分词以后,生成的list中好多词是同义词想知道怎么处理对于英文有提取主干对于汉语举例来说像妈妈和母亲这两个词明显一样的意思但是却是两个词求问怎样处理同义词... 用结巴分词以后,生成的list中 好多词是同义词 想知道怎么处理 对于英文有提取主干 对于汉语 举例来说
像妈妈和母亲这两个词 明显一样的意思 但是却是两个词 求问怎样处理同义词
展开
 我来答
何人我知己
推荐于2016-09-26 · TA获得超过379个赞
知道小有建树答主
回答量:258
采纳率:50%
帮助的人:189万
展开全部
一个字典d
d["妈妈"]="母亲"
d["母亲"]="母亲"

把同义词处理成相同的词

怎么样?
追问
呃,这样那么多同义词怎么办  
这个字典得多长
d={}
d["妈妈"]="母亲"
d["母亲"]="母亲"
text=['母亲','妈妈']
text1=[]
for w in text:
if w in d.keys():
text1.append(d[w])
我刚刚试了下这个倒也可以,
但是这个如果手写下来也挺麻烦的 这么多词
另外还想问问有木有汉语的stopwords的list
追答
字典d可以从 dict.cn使用爬虫收集
如妈妈:http://hanyu.dict.cn/%E5%A6%88%E5%A6%88 就含有母亲

stopwords网上有很多吧
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式