信息检索术入门介绍——21世界高效法宝
来源:网络收集 点击: 时间:2024-02-23信息检索方法:
2/111.布尔逻辑检索:
AND或*、OR或+、NOT或ANDNOT或-(排除后面一个,要 A不要B),注意:布尔运算符有运算优先顺序的,如果多个连接词出现,则按照 优先级的顺序运算,但是可以用括号来达到先运算的目的,顺序是:NOT_AND_OR(用NOT排除,用AND添加一些)

2.邻近搜索:(又被称为位置限制检索,不同的数据库的检索连接词不同,
4/11要求:
第一种用法:1.PRE/0或者P/0顺序不可颠倒;2.这两个单词之间不可 插入其他的单词例如WuhanP/0 University(但是可以插入 符号,例如查找之后的结果有WuhanUniversity(中间有空格的 );Wuhan-University(中间有-的)
5/11第二种用法:PRE/#或P/#,要求:1.与第一个一样;2.允许两个单词中间 插入一定数量的单词,就是‘#’这个地方的数子有几个,就可以插入几个单词, 不能超过#所指的上限,也可以少于或一个也不插入。例如:Wuhan P/1 University(允许插入一个单词)
6/11第三种:NEAR/0或N/0,在这里不要求顺序
7/11第四种:NEAR/#或N/#,顺序可以颠倒,第二,它们中间最多可以插入‘#’号个单词
8/113.短语检索:(精确检索:就是检索出来的,必须和我输入的一模一样,不能有任何 的差别)方法就是在输入的关键词两边加双引号,否则默认单词之间的连接运算符 为AND
以下几种情况需要:机构的名称、地名、专有名称等。
9/114.截词检索:截词符:*和?代替不同的部分,类似变量的感觉,(宽容检索:允许检 索出来的有一定的不同),用处:例如:找都以‘-ology’结尾的单词
方法:*加相同的部分,位置不定,要到在线词典去检索,例如:One-Look中
分为三种情况:
前截词:*ology
中间截词:一般中间截词用得更多的是问号,一个问号代表一个字 符,而*,通常代表0到无数个字符 ,例:wom?n
后截词:econom*
截词符也可以在单词的前后出现:*toxic* ;有时候,有的数据库和我们的表达刚好相反,*代表一个字符,?代表无数个字符
,所以我们在使用之前需要了解一下每一个符号代表的意义
10/115.
字段限制检索:
网址构成规律:例:
http://www.sim.whu.edu.cn/的数量越多,说明网页的层次越深,对网址的理解,要从右往
左去理解,也就是说右边的级别是最高的。第一个部分:cn代表国家和地区,这个
指的是中国大陆,中国香港用hk等;第二个部分:edu代表机构的类型,这里指的是
教育机构,.org指非盈利机构,gov指政府机构,.com指的是商业型机构;再往前面
:whu指机构名称;sim指的是武大学的一个子机构;整个来说就是:中国的教育
机构武汉大学的下面的信息管理学院。
网址学名:统一资源定位符
检索式:url:gov.cn(检索有多少个政府网站,gov表政府)
限制后面的检索词必须出现在题名字段当中:
title(ti):Wuhan University
py=2010(找2010以来,出版的著作或者发表的论文)
la=english(指限定找英文的语种)
link:whitehouse.gov(用来查找链接到某一个网站的所有的网页)
11/11还可以把字段检索和关键词进行逻辑‘与’组配:
admission AND site:www.harvard.edu(检索结果要限制在后面的这个网
址当中,也就是说,只能从这个网站去找资料,把前面的关键字和后面的结合在一起
,就是要求在哈佛大学的官网中找入学资料)
还可以吧多个字段进行组配,例如:把机构字段和人名字段组合在一起:
au=Wang li AND (CS=auhan Univ.)
前面就是au=xx,把它限定在作者字段当中,后面CS表机构来源
版权声明:
1、本文系转载,版权归原作者所有,旨在传递信息,不代表看本站的观点和立场。
2、本站仅提供信息发布平台,不承担相关法律责任。
3、若侵犯您的版权或隐私,请联系本站管理员删除。
4、文章链接:http://www.1haoku.cn/art_121205.html