怎样提高文献检索的查全率
展开全部
文献检索是科研的基本功, 阅读文献是科研人员获取科研信息的重要途径。评价文献检索质量的两个最重要的指标是查全率和查准率。
查全率指的是检出的相关文献量与系统文献库中相关文献 总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。查全率 = 检出相关文献量 / 文献库内相关文献总量× 100% 。查准率指的是是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统检出文献准确度的尺度。查准率 = 检出的相关文献篇数/检出的全部文献篇数× 100%。
1 检索词的转换。常见的转换是同义词、近义词、相关词、单复数及缩写形式,如果是动词还有可能有不同的时态。每 一个检索词都有可能有多种表达形式,如果是由英文翻译过来的还有可能有多种翻译方法,所以应该尽可能找全检索词的所有同义词、近义词。相关词指的是与检索 词不是同一个意思但是有关联的词。
如,META分析的同义词包括元分析、荟萃分析、meta-analysis,近义词包括系统综述,相关词为循证医学。 前列腺癌的缩写可能是Pca等等。值得注意的是,在检索中文文献的时候,有必要把英文的全称和缩写也作为检索词,因为有些中文文章中是直接用英文词汇表示 的。
2 使用截词符。虽然从理论上来说我们找到所有的同义词和近义词可以扩大检索结果,但是要想做到这一点是相当困难的。这时可以利用截词符来帮忙。一般用的截词符是“?”和“*”,在不同的数据库中表示的意思有所不同,常见的意思是“?”表示0-1个字符,而“*”表示多个字符。
3 使用上位词,即指代范围更广的词。有些检索系统有主题词途径,则可以选用上位主题词。例如水果是苹果的上位词,prostatic neoplasm的上位主题词是prostatic disease。
4 改变布尔运算符,即将连接两个或多个检索词的AND改为OR,即可提高检出数量。
5 改变检索项。如要求检索词位于标题中或为关键词或主题,检出记录数太少,则可改为要求位于摘要或全文中,检出记录数即可增加。
6 减少限制条件,增加副主题词。如果前面的检索中有限制条件,放宽或去掉限制条件;如果采用的是主题词和副主题词搭配的形式,看是否漏掉可能的副主题词。
以上说的是在同一个数据库 中进行检索。但是,每一个数据库所收录的文献都是有限的,而不同的数据库可能存在一定的互补关系。所以为了提高查全率,应该多检索几个数据库,将结果综合 起来。
当然前提条件是要了解每一个数据库收录期刊的范围、起止年代等,因为不排除有些小的数据库完全是另外一个大数据库的子集的情况,这时当然完全没有必 要再检索那个小的数据库了。
即使是将目前所有的数据库 加起来,也不能囊括所有的文献。例如,有一些年代比较久远的,或者是期刊知名度不高的。
一般我们检索文献不是英文的就是中文的,对于其它语种的则不做要求。如果是要求查全率很高,则可以检索一些不常用的语种的文献,如日文、法文、德文等等。当然如果自己不会那门语言,即使查到了,阅读也是一个问题。如果真是非常重要,不妨请人翻译过来。
PUBMED的查全率问题
PUBMED有自动转换功能,在检索框输入一个检索词,它会自动将其转化为对应的主题词,同时进行主题词 检索和自由词检索,并把二者的检索结果用“OR”连接起来。
所以,在PUBMED中,要提高查准率首选主题词加副主题词的形式,而要提高查全率则首选默认 的检索形式,即打开PUBMED主页后直接在检索框输入检索词。如果采用主题词加副主题词的形式,由于最新的部分文献还没有进行主题标引,因此不能检索到 最新的文献。
PUBMED的查全率问题 与上面所说的大同小异。值得注意的是,如果使用截词符,其自动转换功能即停止。可以采取的办法是第一次用默认检索,第二次用截词符,再把两次检索的结果合 并起来。
例如,检索词的所有同义词近义词缩写相关词等分别为A、B、C、D、E,则第一次以默认的检索方式检索,检索式为 A OR B OR C OR D OR E,第二次用截词符检索,如A? OR B* OR C? OR D OR E*, 再把两次检索的结果合并,检索式为#1 OR #2。
此外,PUBMED还可以提供related articles, 点击这里即可以看到与你检索到的文献相关的文献,也许这其中就有需要而自己没有查到的。
META分析的检索问题
META分析是对文献的查 全率要求最高的一种研究。严格的说,要求获得“所有发表的和未发表的所有形式的信息”,也就是说,包括各国语言的期刊论文、会议论文、学位论文、书籍、 Cochrone图书馆的文献及正在研究尚未发表的资料。
查全率指的是检出的相关文献量与系统文献库中相关文献 总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。查全率 = 检出相关文献量 / 文献库内相关文献总量× 100% 。查准率指的是是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统检出文献准确度的尺度。查准率 = 检出的相关文献篇数/检出的全部文献篇数× 100%。
1 检索词的转换。常见的转换是同义词、近义词、相关词、单复数及缩写形式,如果是动词还有可能有不同的时态。每 一个检索词都有可能有多种表达形式,如果是由英文翻译过来的还有可能有多种翻译方法,所以应该尽可能找全检索词的所有同义词、近义词。相关词指的是与检索 词不是同一个意思但是有关联的词。
如,META分析的同义词包括元分析、荟萃分析、meta-analysis,近义词包括系统综述,相关词为循证医学。 前列腺癌的缩写可能是Pca等等。值得注意的是,在检索中文文献的时候,有必要把英文的全称和缩写也作为检索词,因为有些中文文章中是直接用英文词汇表示 的。
2 使用截词符。虽然从理论上来说我们找到所有的同义词和近义词可以扩大检索结果,但是要想做到这一点是相当困难的。这时可以利用截词符来帮忙。一般用的截词符是“?”和“*”,在不同的数据库中表示的意思有所不同,常见的意思是“?”表示0-1个字符,而“*”表示多个字符。
3 使用上位词,即指代范围更广的词。有些检索系统有主题词途径,则可以选用上位主题词。例如水果是苹果的上位词,prostatic neoplasm的上位主题词是prostatic disease。
4 改变布尔运算符,即将连接两个或多个检索词的AND改为OR,即可提高检出数量。
5 改变检索项。如要求检索词位于标题中或为关键词或主题,检出记录数太少,则可改为要求位于摘要或全文中,检出记录数即可增加。
6 减少限制条件,增加副主题词。如果前面的检索中有限制条件,放宽或去掉限制条件;如果采用的是主题词和副主题词搭配的形式,看是否漏掉可能的副主题词。
以上说的是在同一个数据库 中进行检索。但是,每一个数据库所收录的文献都是有限的,而不同的数据库可能存在一定的互补关系。所以为了提高查全率,应该多检索几个数据库,将结果综合 起来。
当然前提条件是要了解每一个数据库收录期刊的范围、起止年代等,因为不排除有些小的数据库完全是另外一个大数据库的子集的情况,这时当然完全没有必 要再检索那个小的数据库了。
即使是将目前所有的数据库 加起来,也不能囊括所有的文献。例如,有一些年代比较久远的,或者是期刊知名度不高的。
一般我们检索文献不是英文的就是中文的,对于其它语种的则不做要求。如果是要求查全率很高,则可以检索一些不常用的语种的文献,如日文、法文、德文等等。当然如果自己不会那门语言,即使查到了,阅读也是一个问题。如果真是非常重要,不妨请人翻译过来。
PUBMED的查全率问题
PUBMED有自动转换功能,在检索框输入一个检索词,它会自动将其转化为对应的主题词,同时进行主题词 检索和自由词检索,并把二者的检索结果用“OR”连接起来。
所以,在PUBMED中,要提高查准率首选主题词加副主题词的形式,而要提高查全率则首选默认 的检索形式,即打开PUBMED主页后直接在检索框输入检索词。如果采用主题词加副主题词的形式,由于最新的部分文献还没有进行主题标引,因此不能检索到 最新的文献。
PUBMED的查全率问题 与上面所说的大同小异。值得注意的是,如果使用截词符,其自动转换功能即停止。可以采取的办法是第一次用默认检索,第二次用截词符,再把两次检索的结果合 并起来。
例如,检索词的所有同义词近义词缩写相关词等分别为A、B、C、D、E,则第一次以默认的检索方式检索,检索式为 A OR B OR C OR D OR E,第二次用截词符检索,如A? OR B* OR C? OR D OR E*, 再把两次检索的结果合并,检索式为#1 OR #2。
此外,PUBMED还可以提供related articles, 点击这里即可以看到与你检索到的文献相关的文献,也许这其中就有需要而自己没有查到的。
META分析的检索问题
META分析是对文献的查 全率要求最高的一种研究。严格的说,要求获得“所有发表的和未发表的所有形式的信息”,也就是说,包括各国语言的期刊论文、会议论文、学位论文、书籍、 Cochrone图书馆的文献及正在研究尚未发表的资料。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询