sqlserver 全文索引 多个or条件 获取匹配次数的问题! 100
我不知道可不可以一个字段可以直接显示匹配次数。比如CONTAINS(Cnstring,'"计算机"or"系统"or“是”or"新东西")有一条记录他的Cnstring字段...
我不知道可不可以一个字段可以直接显示匹配次数。比如 CONTAINS(Cnstring, '"计算机" or "系统" or “是” or "新东西")有一条记录他的Cnstring字段值是“我的电脑用的是计算机系统” 实际包含了 "计算机",“系统”,“是”,这条记录的匹配次数是3,另外一条记录cnstring字段是“我们都在用计算机系统”这个实际匹配的是2.我需要这个通过这匹配次数来排序结果。
我测试了执行多次查询然后计算次数或者union all执行速度太慢了。 展开
我测试了执行多次查询然后计算次数或者union all执行速度太慢了。 展开
2个回答
展开全部
有两个全文索引是非常重要的,一个是如何字的文字,一个索引数据结构。分割方法基本上是一个二元分词法,最大匹配方法和统计方法。索引数据结构基本上是倒排索引结构。
字查询生成的索引大小的质量和准确性。在中文分词的发展,及早并经常使用的方法是一个二进制字的词汇,这种方法的基本原理是开展句子包含中国二元,没有一个字的意思,只是一个字的二进制索引。因此,该方法的分离的较大数目的话,在一个巨大的索引数,该查询将是无用的检索数据时,好处是简单的算法,将不会错过检索到的数据。后来发展的最大匹配的分割方法,其中分为子字的最大正向和反向的最大字。的原理和字典,生成公共字的字典,所分析句子的最大匹配字典中的字词的过程,因此,分割成有意义的词的句子链。正向最大匹配分词官员容易出错的部分决议字,如“珠宝和服装,”将要“和服”字分离。达梦数据库是用来改善逆向最大的分割方法,该方法是更积极的词的准确性提高。是最复杂的统计方法分割方法。使用隐马尔可夫链,这是一个字后,取决于前一个字的概率发生的概率的方法,最后一个单词出现所有的最大字的基础上的统计概率。这种新的名词和地名的识别方法是远高于最大匹配方法,文本的准确性随着样品的数量增加,分别。 /> />两个元的分割方法和统计方法不依赖于词典中,最大匹配的图像分割方法是依赖于词典,字典的内容所决定的结构的词语是好还是坏。
全文索引被称为倒排索引,倒排索引,因为每个单词的索引条目,根据索引项查找包含单词文本。因此,索引的话,唯一的唱片公司是文本到很多的关系。的索引词排序,根据包含分类文本的字的字定位。
步骤1)阅读整个句子的变量str,请转到步骤2
步骤2)句末可变字读一个字,去第3步
步骤3)查找单词在字典中保存的话。如果有保存的字,则转到步骤4,否则转到步骤5)
步骤4)如果它是最大的字典中的字,或超过的最大数目字(确定为新词),除去尾部条款的话,返回到步骤2
步骤5)读字一个字前,形式新词,请转至步骤3)
>词库和单词记忆的数据结构库字匹配算法
不停地使用这个词的内存层次结构
承担以下字典中的字:中国全国人民民主共和国
在存储器方式如下,其中每个方块代表一个字符,箭头指向的第一个字被安排在层中的
字查询生成的索引大小的质量和准确性。在中文分词的发展,及早并经常使用的方法是一个二进制字的词汇,这种方法的基本原理是开展句子包含中国二元,没有一个字的意思,只是一个字的二进制索引。因此,该方法的分离的较大数目的话,在一个巨大的索引数,该查询将是无用的检索数据时,好处是简单的算法,将不会错过检索到的数据。后来发展的最大匹配的分割方法,其中分为子字的最大正向和反向的最大字。的原理和字典,生成公共字的字典,所分析句子的最大匹配字典中的字词的过程,因此,分割成有意义的词的句子链。正向最大匹配分词官员容易出错的部分决议字,如“珠宝和服装,”将要“和服”字分离。达梦数据库是用来改善逆向最大的分割方法,该方法是更积极的词的准确性提高。是最复杂的统计方法分割方法。使用隐马尔可夫链,这是一个字后,取决于前一个字的概率发生的概率的方法,最后一个单词出现所有的最大字的基础上的统计概率。这种新的名词和地名的识别方法是远高于最大匹配方法,文本的准确性随着样品的数量增加,分别。 /> />两个元的分割方法和统计方法不依赖于词典中,最大匹配的图像分割方法是依赖于词典,字典的内容所决定的结构的词语是好还是坏。
全文索引被称为倒排索引,倒排索引,因为每个单词的索引条目,根据索引项查找包含单词文本。因此,索引的话,唯一的唱片公司是文本到很多的关系。的索引词排序,根据包含分类文本的字的字定位。
步骤1)阅读整个句子的变量str,请转到步骤2
步骤2)句末可变字读一个字,去第3步
步骤3)查找单词在字典中保存的话。如果有保存的字,则转到步骤4,否则转到步骤5)
步骤4)如果它是最大的字典中的字,或超过的最大数目字(确定为新词),除去尾部条款的话,返回到步骤2
步骤5)读字一个字前,形式新词,请转至步骤3)
>词库和单词记忆的数据结构库字匹配算法
不停地使用这个词的内存层次结构
承担以下字典中的字:中国全国人民民主共和国
在存储器方式如下,其中每个方块代表一个字符,箭头指向的第一个字被安排在层中的
展开全部
(len(cnstring)-len(replace(cnstring,'计算机','')))/3
+(len(cnstring)-len(replace(cnstring,'系统','')))/2
+(len(cnstring)-len(replace(cnstring,'是','')))
+(len(cnstring)-len(replace(cnstring,'新东西')))/3
另外可以使用CREATE ASSEMBLY和CREATE FUNCTION创建CLR(托管公共语言运行库)函数来做这个,不过我没用过,所以只能提供一下信息
追问
学习了思路不不错,不过表达式好像有点问题,如果一个记录里面的cnstring里面有多个计算机 那么这个就算了多次,另外速度有点慢,主要是要速度快
追答
一个cnstring里有多个计算机,啥算了多次?
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询