第10课时 网上获取信息的策略(2) |
2004年12月14日 『99100IT园地』 浏览选项:
出处:IT NCOL |
|
|
|
|
| |
|
高一 信息技术 设计与执教教师:沙立 兴宁市济平中学
2004年10月发布 2004年10月更新  --------------------------------------------------------------- 任务 (1)掌握信息获取的途径和方法 (2)掌握网络信息检索的策略与技巧      (3)了解搜索引擎的相关知识(简单原理、工作原理)
---------------------------------------------------------------- 过程 在课堂上,根据分组建好学习团队(标准上4人为一组),各团队的学习任务如下: 一、阅读课本P42-46及下列文章,然后在相应课时的论坛回答问题。 二、组员之间互相交流,掌握好各项技术支持中介绍的技术。 ------------------------------------------------------------------- GOOGLE搜索秘籍 
 一,GOOGLE简介 
Google(www.google.com)是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明,Google Inc. 于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。98年至今,GOOGLE已经获得30多项业界大奖。 
二,GOOGLE特色 
GOOGLE支持多达132种语言,包括简体中文和繁体中文;  GOOGLE网站只提供搜索引擎功能,没有花里胡哨的累赘;  GOOGLE速度极快,据说有8000多台服务器,200多条T3级宽带; 
GOOGLE的专利网页级别技术PageRank能够提供高命中率的搜索结果;  GOOGLE的搜索结果摘录查询网页的部分具体内容,而不仅仅是网站简介;  GOOGLE智能化的"手气不错"功能,提供可能最符合要求的网站;  GOOGLE的"网页快照"功能,能从GOOGLE服务器里直接取出缓存的网页。 
三,基本搜索:+,-,OR 
GOOGLE无需用明文的"+"来表示逻辑"与"操作,只要空格就可以了。 
示例:搜索所有包含关键词"易筋经"和"吸星大法"的中文网页  搜索:"易筋经 吸星大法"  结果:已搜索有关易筋经 吸星大法的中文(简体)网页。共约有726项查询结果,这是第1-10项。搜索用时0.13秒。 
注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。 
GOOGLE用减号"-"表示逻辑"非"操作。 
示例:搜索所有包含"易筋经"而不含"吸星大法"的中文网页  搜索:"易筋经 -吸星大法"  结果:已搜索有关易筋经 -吸星大法的中文(简体)网页。共约有5,440项查询结果,这是第1-10项。搜索用时0.13秒。 
注意:这里的"+"和"-"号,是英文字符,而不是中文字符的"+"和"-"。此外,操作符与作用的关键字之间,不能有空格。比如"易筋经 - 吸星大法",搜索引擎将视为逻辑"与"操作,中间的"-"被忽略。 
GOOGLE用大写的"OR"表示逻辑"或"操作。但是,关键字为中文的或查询似乎还有BUG,无法得到正确的查询结果。 
示例:搜索包含布兰妮"Britney"或者披头士"Beatles"、或者两者均有的中文网页。  搜索:"britney OR beatles"  结果:已搜索有关britney OR beatles的中文(简体)网页。共约有14,600项查询结果,这是第1-10项。搜索用时0.08秒。  搜索:"布兰妮 OR 披头士"  结果:找不到和您的查询-布兰妮 OR 披头士-相符的网页。 
注意:小写的"or",在查询的时候将被忽略;这样上述的操作实际上变成了一次"与"查询。 
"+"和"-"的作用有的时候是相同的,都是为了缩小搜索结果的范围,提高查询结果命中率。 
例:查阅天龙八部具体是哪八部。 
分析:如果光用"天龙八部"做关键字,搜索结果有26,500项,而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的资讯。可以用两个方法减少无关结果。 
1,如果你知道八部中的某一部,比如阿修罗,增加"阿修罗"关键字,搜索结果就只有995项,可以直接找到全部八部,"天龙八部 阿修罗"。 
2,如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录,查询结果为1,010项,可以迅速找到需要的资料,"天龙八部 佛教 -金庸"。 
四,辅助搜索:通配符、大小写、句子、忽略字符以及强制搜索 
GOOGLE不支持通配符,如"*"、"?"等,只能做精确查询,关键字后面的"*"或者"?"会被忽略掉。 
GOOGLE对英文字符大小写不敏感,"GOD"和"god"搜索的结果是一样的。 
GOOGLE的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。 
示例:搜索包含"long, long ago"字串的页面。  搜索:""long, long ago""  结果:已向英特网搜索"long, long ago". 共约有28,300项查询结果,这是第1-10项。搜索用时0.28秒。 
注意:和搜索英文关键字串不同的是,GOOGLE对中文字串的处理并不十分完善。比如,搜索""啊,我的太阳"",我们希望结果中含有这个句子,事实并非如此。查询的很多结果,"啊"、"我的"、"太阳"等词语是完全分开的,但又不是"啊 我的 太阳"这样的与查询。显然,GOOGLE对中文的支持尚有欠缺之处。 
GOOGLE对一些网路上出现频率极高的词(主要是英文单词),如"i"、"com",以及一些符号如"*"、"."等,作忽略处理,如果用户必须要求关键字中包含这些常用词,就要用强制语法"+"。 
示例:搜索包含"Who am I ?"的网页。如果用""who am i ?"","Who"、"I"、"?"会被省略掉,搜索将只用"am"作关键字,所以应该用强制搜索。  搜索:""+who +am +i""  结果:已向英特网搜索"+who +am +i". 共约有362,000项查询结果,这是第1-10项。搜索用时0.30秒。 
注意:英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。 
五,高级搜索:site,link,inurl,allinurl,intitle,allintitle 
"site"表示搜索结果局限于某个具体网站或者网站频道,如"sina.com.cn"、"edu.sina.com.cn",或者是某个域名,如"com.cn"、"com"等等。如果是要排除某网站或者域名范围内的页面,只需用"-网站/域名"。 
示例:搜索中文教育科研网站(edu.cn)上所有包含"金庸"的页面。  搜索:"金庸 site:edu.cn"  结果:已搜索有关金庸 site:edu.cn的中文(简体)网页。共约有2,680项查询结果,这是第1-10项 。搜索用时0.31秒。 
示例:搜索包含"金庸"和"古龙"的中文新浪网站页面,  搜索:"金庸 古龙 site:sina.com.cn"  结果:已在sina.com.cn搜索有关金庸 古龙的中文(简体)网页。共约有869项查询结果,这是第1-10项。搜索用时0.34秒。 
注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,"site:"将被作为一个搜索的关键字。此外,网站域名不能有"http"以及"www"前缀,也不能有任何"/"的目录后缀;网站频道则只局限于"频道名.域名"方式,而不能是"域名/频道名"方式。诸如"金庸 site:edu.sina.com.cn/1/"的语法是错误的。 
"link"语法返回所有链接到某个URL地址的网页。 
示例:搜索所有含指向华军软件园"www.newhua.com"链接的网页。  搜索:"link:www.newhua.com"  结果:搜索有链接到www.newhua.com的网页。共约有695项查询结果,这是第1-10项。搜索用时0.23秒。 
注意:"link"不能与其他语法相混合操作,所以"link:"后面即使有空格,也将被GOOGLE忽略。 
inurl语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如"MP3"、"GALLARY"等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。 
示例:查找MIDI曲"沧海一声笑"。  搜索:"inurl:midi 沧海一声笑"  结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。共约有14项查询结果,这是第1-10项。搜索用时0.01秒。 
示例:查找微软网站上关于windows2000的安全课题资料。  搜索:"inurl:security windows2000 site:microsoft.com"  结果:已在microsoft.com内搜索有关 inurl:security windows2000的网页。共约有198项查询结果,这是第1-10项。搜索用时0.37秒。 
注意:"inurl:"后面不能有空格,GOOGLE也不对URL符号如"/"进行搜索。GOOGLE对"cgi-bin/phf"中的"/"当成空格处理。 
allinurl语法返回的网页的链接中包含所有查询关键字。这个查询的对象只集中于网页的链接字符串。 
示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGI-BIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是"域名/cgi-bin/phf"。  语法:"allinurl:"cgi-bin" phf +com"  搜索:已向英特网搜索allinurl:"cgi-bin" phf +com. 共约有40项查询结果,这是第1-10项。搜索用时0.06秒。 
allintitle和intitle的用法类似于上面的allinurl和inurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。 
示例:查找日本明星藤原纪香的照片集。  搜索:"intitle:藤原纪香 写真"  结果:已搜索有关intitle:藤原纪香 写真的中文(简体)网页。共约有284项查询结果,这是第1-10项。搜索用时0.03秒。 
GOOGLE的罕用高级搜索语法:related,cache,info 
related用来搜索结构内容方面相似的网页。例:搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等),"related:www.sina.com.cn/index.shtml"。 
cache用来搜索GOOGLE服务器上某页面的缓存,这个功能同"网页快照",通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的"网页快照"功能。 
info用来显示与某链接相关的一系列搜索,提供cache、link、related和完全包含该链接的网页的功能。 
示例:查找和新浪首页相关的一些资讯。  搜索:"info:www.sina.com.cn"  结果:有关www.sina.com.cn的网页信息。  新浪首页  北京站 上海站 广东站. ... 游戏世界, |, 影音娱乐, |, Club缘, |, 男  人女人, |, 论坛聊天, |, 时尚潮流, |, 文教育儿, |, 车行天下, |,  软件下载. ... Google 提供这个网址的信息:  查看Google网页快照里www.sina.com.cn的存档  寻找和www.sina.com.cn类似的网页  寻找网页有链接到www.sina.com.cn  寻找网页包含有'www.sina.com.cn' 
六,其他重要功能 
目录服务 
如果不想搜索网页,而是想寻找某些专题网站,可以访问GOOGLE的分类目录"http://directory.google.com/",中文目录是"http://directory.google.com/Top/World/Chinese_Simplified/"。不过由于GOOGLE的目录由志愿者服务,而GOOGLE在国内名气相对比较小,因此中文目录下收录站点很少。 
工具条 
为了方便搜索者,GOOGLE提供了工具条,集成于浏览器中,用户无需打开GOOGLE主页就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其他许多功能,如显示页面PageRank等。最方便的一点在于用户可以快捷的在GOOGLE主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。欲安装GOOGLE的工具条,可以访问"http://toolbar.google.com/",按页面提示可以自动下载并安装。 
新闻组(USENET)搜索 
新闻组中有大量的有价值信息,DEJA一直是新闻组搜索引擎中的佼佼者。2001年2月份,GOOGLE将DEJA收购并提供了所有DEJA的功能。现在,除了搜索之外,GOOGLE还支持新闻组的WEB方式浏览和张贴功能。 
输入"http://groups.google.com/"后,便进入GOOGLE新闻组界面。可惜现在还没有中文界面。因为新闻组中的帖子实在是多,所以我点击"Advaced Groups Search"进入高级搜索界面http://groups.google.com/advanced_group_search。新闻组高级搜索界面提供对关键字、新闻组、主题、作者、帖子序号、语言和发布日期的条件搜索。其中作者项指作者发帖所用的唯一识别号电子信箱。比如要在alt.chinese.text内搜索著名老牌网络写手图雅的帖子,可以用下列指令"group:alt.chinese.text author:tuya@ccmail.uoregon.edu"。不过一般而言,我更推荐使用图形搜索界面,方便而且直观。 
搜索结果翻译 
曾经为那些你不懂的法文、西班牙文页面烦恼么?现在,GOOGLE支持一项搜索结果翻译功能,可以把非英文的搜索结果翻译成英文!!虽然目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文,但是我不得不承认,这是个伟大的改进。 
不过,目前只能在英文状态GOOGLE下实现这个功能。进入GOOGLE的设置页面,http://www.google.com/preferences,有一个"BETA: Enable translation of search results into your interface language. "的选项,把它选中,就OK了。  ------------------------------------------------------------------- 在论坛上回答问题:
1、网上获取信息时应注意哪些步骤?(5分)
2、你认识或使用过的搜索引擎有哪些?(5分)
3、阅读完《GOOGLE搜索秘籍》,如果你要了解一下你多年没见过的同学,想通过google搜索引擎来找到他,你会想到用什么信息做关键字进行查询?(20分) --------------------------------------------------------------------  【本站技术支持】
1、如何用IE下载压缩软件并快速解压?
2、微软拼音手写快速输入大揭秘
3、怎样上传、下载及查看作品
4、怎样下载、保存、打开网络文件、上传自己的文件
5、如何申请电子信箱及收信、发信?
6、如何下载图片?
7、如何复制和粘贴?     (本文已被浏览 2467 次) |
|
| |
|
|
|
|
|
|
|
|
|
|