python中怎样处理汉语的同义词
用结巴分词以后,生成的list中好多词是同义词想知道怎么处理对于英文有提取主干对于汉语举例来说像妈妈和母亲这两个词明显一样的意思但是却是两个词求问怎样处理同义词...
用结巴分词以后,生成的list中 好多词是同义词 想知道怎么处理 对于英文有提取主干 对于汉语 举例来说
像妈妈和母亲这两个词 明显一样的意思 但是却是两个词 求问怎样处理同义词 展开
像妈妈和母亲这两个词 明显一样的意思 但是却是两个词 求问怎样处理同义词 展开
1个回答
展开全部
一个字典d
d["妈妈"]="母亲"
d["母亲"]="母亲"
把同义词处理成相同的词
怎么样?
d["妈妈"]="母亲"
d["母亲"]="母亲"
把同义词处理成相同的词
怎么样?
追问
呃,这样那么多同义词怎么办
这个字典得多长
d={}
d["妈妈"]="母亲"
d["母亲"]="母亲"
text=['母亲','妈妈']
text1=[]
for w in text:
if w in d.keys():
text1.append(d[w])
我刚刚试了下这个倒也可以,
但是这个如果手写下来也挺麻烦的 这么多词
另外还想问问有木有汉语的stopwords的list
追答
字典d可以从 dict.cn使用爬虫收集
如妈妈:http://hanyu.dict.cn/%E5%A6%88%E5%A6%88 就含有母亲
stopwords网上有很多吧
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询