Thunder Bird
Communication & Improvement
posts - 47,  comments - 155,  trackbacks - 0
一,概述
  搜索已经成为网络生活的一部分。工作需要搜索技术文档、客户信息;购物需要搜索商品信息和指南;娱乐需要搜索相关背景资料和图片。搜索已经变得无处不在,而Google则相应的成了工作和生活中的一个必备工具。
  Internet对我们的影响至深的还是在于学习方式的变迁。从“预学式”到“即学式”。 “即学式”的前提是海量的信息库和超强的信息检索工具。Internet和以Google为强的搜索引擎正是这两个工具。

二,Google搜索基本语法
  1,与:“ ”(英文半角的空格)
  2,非:“-”(英文半角的减号)
  3,或:“OR”(英文大写的OR)
  有效缩小搜索范围,迅速找到目的资讯的一般方法:目标信息一定含有的关键字用“ ”连起来,目标信息不能含有的关键字用“-”去掉,目标信息可能含有的关键字用“OR”连起来。
  4,通配符:Google目前只可以用“*”来替代单个字符,而且包含“*”的全部关键字必须用英文引号括起来。如“"不卑不*"”
  5,Google对英文字符大小写不区别
  6,如要搜索整个短语或者句子(原本包含空格的),把全部关键字用英文引号括起来。
  7,Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。
  如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。
  搜索:“+www +的历史 internet”
  另一个强制搜索的方法是把上述的关键字用英文双引号引起来。在上例“”world war I””中,“I”其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语。
  注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。

三,Google高级搜索语法
  1,site:对搜索的网站进行限制
  .... site:sitename OR sitename2
  注意:site后的冒号(英文半角字符)后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http://”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”的多级域名方式,而不能是“域名/频道名”方式。
  2,filetype:对搜索的文件类型进行限制
  .... filetype:doc OR filetype:xls OR filetype:ppt
  目前,Google已经能检索微软的Office文档(小心其中可能有的宏病毒)如.xls、.ppt、.doc,.rtf,WordPerfect文档,Lotus1-2-3文档,Adobe的.pdf文档(最实用的电子化出版标准),ShockWave的.swf文档(Flash动画)等。
  3,inurl:搜索的第一个关键字包含在URL链接中,后面的关键字则出现在URL链接链接中或者网页文档中
  inurl:midi 沧海一声笑
  注意:“inurl:”后面不能有空格,Google也不对URL符号如“/”进行搜索。例如,Google会把“cgi-bin/phf”中的“/”当成空格处理。
  allinurl:搜索的全部关键字包含在URL链接中。
  示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGI-BIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。
  搜索:allinurl:"cgi-bin" phf +com
  4,intitle:搜索的第一个关键字包含在网页标题中,第二个在标题或者正文中
  allintitle搜索的全部关键字包含在网页标题中
  5,inanchor”和“allincnchor”搜索的关键字包含在网页的“锚”(anchor)链点内

四,Google特定搜索语法:
  1,link:www.xxxx.com搜索所有链接到某个URL地址的网页
  注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被Google忽略。另外还要说明的是,link只列出Google索引链接很小一部分,而非全部,所以如果你用Google没有搜到链到你的主页的链接,也不必灰心丧气。除了上述功能,link语法还有其它妙用。一般说来,做友情链接的网站都有相似地方。这样,你可以通过这些友情链接,找到一大批具有相似内容的网站。比如说,你是个天文爱好者,你发现某网站非常不错,那么,可以用link语法查一下与之做链接的网站,也许可以找到更多符合你兴趣的内容。
  2,related: www.sina.com.cn/index.shtml查找与某个页面结构内容相似的页面
  3,cache从Google服务器上缓存页面中查询信息,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。
  4,其它罕用语法如info、stock等

五,Google的图片搜索:images.Google.com
  AltaVista的检索图片数量比和匹配度比Google好些。但AltaVista国内用户无法正常访问,因此对中国用户而言,Google的图片搜索引擎已经是最好的了。
  Google图像搜索目前支持的语法包括基本的搜索语法如“ ”、“-”、“OR”、“site”和 “filetype:”。其中“filetype:”的后缀只能是几种限定的图片类似,如JPG,GIF等。
  如果要搜索的图片是分散于网络中的,则用google图片搜索;如果要搜索的图片通常是处于某个图片集合(如相册)中的,则不适合用google图片搜索,可直接用普通搜索。

六,Google的目录搜索:directory.Google.com
  如果不想搜索广泛的网页,而是想寻找某些专题网站,可以访问Google的分类目录“http://directory.Google.com/”,中文目录是“http://directory.Google.com/Top/World/Chinese_Simplified/”。分类的网站目录一般由专人负责,分类明确,信息集中。因此读者应该养成这样的习惯:首先考虑所需要的信息能否在一个专门主题的网站上找到。不过需要说明的是,用目录检索,往往需要用户对查询的领域很熟悉。否则,连查询的内容属于哪个类目都不知道,目录浏览也就无从谈及了。
  目前Google使用的分类目录采用了ODP的内容。“Open Directory Project”是网景公司所主持的一项大型公共网页目录。由全世界各地的义务编辑人员来审核挑选网页,并依照网页的性质及内容来分门别类。因此,在某一目录门类中进行搜索往往能有更高的命中率。另外,Google根据其专业的“网页级别”(PageRank)技术对目录中登录的网站进行了排序,可以让一般的检索更具高效率。
  示例:查找一下介绍搜索引擎方面的中文网站
搜索:先进入中文简体分类目录,再进入“计算机”目录,再进入“互联网络”子目录,再进入“搜寻”子目录。我们看到在“World > Chinese Simplified > 计算机 > 互联网络 > 搜寻”下,还有两个子目录“分类目录 (33) 搜索引擎 (10)”,以及6个相关网站。显然,这些都是我们所需要的信息。
  除了用鼠标层层点入,也可以在目录中检索。比如,在上例的“互联网络”目录下,选中“只在互联网络中搜索”选项,在搜索栏内填入“搜索引擎”进行搜索。
结果:在分类Google 网页目录项中搜索搜索引擎。 共约有387项查询结果,这是第11-20项 。 搜索用时0.09秒。
  可以看到,上述查询结果比普通的检索更有效,因为在分类“互联网络”下进行搜索剔除了很多不相关的诸如新闻之类的无效信息。不过,对于中文用户而言,现在最大的问题是志愿的中文目录编辑太少,导致收录站点太少,因此搜索结果范围显得过于狭隘。但愿这个问题能随着Google以及ODP项目在国内名声的响亮而能得到改观。

七,Google的新闻组搜索:groups.Google.com
  2001年2月份,Google将新闻组搜索引擎中的佼佼者DEJA收购并提供了所有DEJA的功能。现在,除了搜索之外,Google还支持新闻组的WEB方式浏览和张贴功能。
  因为新闻组中的帖子实在是多,而且又涉及一些普通搜索所没有的语法,所以建议使用“高级群组搜寻”进入高级搜索界面。新闻组高级搜索提供留言内容、分类主题、标题、留言者、留言代码、语言和发布日期作为条件进行搜索。其中作者项指作者发帖所用的唯一识别号电子信箱。
posted on 2006-04-17 15:16 Thunder 阅读(583) 评论(0)  编辑 收藏 引用
只有注册用户登录后才能发表评论。

<2010年1月>
272829303112
3456789
10111213141516
17181920212223
24252627282930
31123456

常用链接

留言簿(8)

随笔档案

相册

搜索

  •  

最新评论

阅读排行榜

评论排行榜