alvalong

  IT博客 :: 首页 :: 新随笔 :: 联系 :: 聚合  :: 管理 ::
  9 随笔 :: 1 文章 :: 4 评论 :: 0 Trackbacks

2008年7月15日 #

今年5月,谷歌工程副总裁尤迪·曼博(Udi Manber)对搜索质量事业部进行了介绍,该事业部主要负责对搜索结果进行排名,旗下包含多个团队.其中,曼博谈到了核心排名团队、国际搜索团队、用户界面团队和评估等其他一系列团队.在这里,我重点谈一下核心排名团队.

谷歌搜索算法首席工程师:反对人工干预搜索
谷歌搜索算法首席工程师阿米特·辛格

  首先自我介绍一下,我叫阿米特.辛格,在谷歌负责搜索排名团队,在谷歌从事搜索业务已有8年.在学术界,搜索被称为信息检索.1990年我在读研究生时就开始接触搜索,做了10年信息搜索研究员后,我于2000年加盟谷歌,一直从事搜索排名工作至今.

  谷歌搜素排名是一套算法,用来查找与用户查询内容相关度最高的文档.我们每天要对海量的网页进行数亿次的查询,而每一次查询都需要使用这套算法.网页搜索是访问量最高的搜索服务,但其他搜索业务也使用这套算法,如图片搜索、新闻搜索、地图搜索、产品搜索和书籍搜索等.

  关于搜索排名,人们问我最多的问题是:“你们是如何做这件事情的?”当然,首先要建立一套先进的排名系统,这点我在以后会详细介绍.今天,我先简单介绍一下谷歌搜索排名:

  1、全球相关性最高的搜索引擎

  2、简单易用

  3、无需人工干预

  第一点很明显,鉴于我们对搜索业务的激情,我们绝对要确保每位用户获得相关度最高的搜索结果,我们将其称之为“不落后”原则.对于来自任何国家、任何语言的搜索,如果提供的搜索结果关联度不高,就会激励我们进行改进.

第二点也很明显,每个系统架构师不都希望自己的系统简单易用吗?搜索系统同样如此,但我们需要处理来自全世界多种语言的搜索,因此很容易使系统变得很复 杂.在这方面,在保证搜索质量的前提下,我们尽量保持系统的简易性.这是一件需要持续改进的工作,也是值得做的事情.每周,我们要对排名系统进行 10次改进,每一次都要确保简单性.这套简单易用的系统同时还有利于创新,事实也证明了这一点.因此,简单易用很重要.

  谈到搜索排名,如果不谈“是否进行人工干预”那将是不完整的讨论.谷歌搜索算法本身就是人类智慧的结晶,但最终对搜索结果进行排名的是搜索算法,而无需人工干预.我们认为,任何个人的主观判断都具有个人主观性,因此,通过搜索算法自动排名比人工干预更适合.

此外,我们反对人工干预的第二个原因是,一次失败的查询结果就意味着我们需要对搜索算法进行改进.改进搜索算法不只是提高一次搜索查询结果,而是整个查 询结果,且针对全部语言.这里还要补充一点,我们对所推荐的网站有明文规定,对于一小部分违反政策的网站我们将采取行动,如违法、具有儿童色情内容、存在 病毒和恶意软件的网站等.
posted @ 2008-07-15 10:59 alvalong 阅读(248) | 评论 (0)编辑 收藏

2008年5月24日 #

前天的传闻所说,Google于今天正式发布了Friend Connect。简而言之,Friend Connect可以允许任意第三方网站具备社会化特性,从而吸引新用户。网站站长只需要给网站增加一小段Friend Connect代码,即可马上让网站拥有社会化特性,而无需复杂的编程。网站可以选择Friend Connect提供的集成功能比如用户注册、邀请、相册、信息发送、评论等,也可以选择由Google OpenSocial成员所开发的第三方应用特性。而普通用户访问了采用Friend Connect技术的网站时,即可马上浏览、邀请及与新好友及之前在其它社会化网站上的旧好友进行互动。

  可见Friend Connect是Google试图成为社会化网络中心平台的一个最新尝试。越多网站采用Friend Connect,Google的社会化网络也就越庞大,它根本不需要单独壮大Orkut去与MySpace或Facebook竞争。

Friend Connect原理示意图:
friend_connect_illustration.jpg


Friend Connect网站截图:
friend_connect_home.jpg


采用Friend Connect技术的网站实例:
friend_connect_example.jpg


  欲查看与Friend Connect有关的官方文档及详细使用办法,请于几小时后访问其官方网站(当前暂未生效):

  http://www.google.com/friendconnect/

  值得注意的是,当前Friend Connect还未完全开放,Google暂时只选定一小部分网站进行试验,普通个人网站可能还要等待一段时间才能使用。
posted @ 2008-05-24 00:46 alvalong 阅读(270) | 评论 (0)编辑 收藏

2008年4月13日 #

1.搜索在线摄像头监视站点

      在Google中输入"inurl: "ViewerFrame?Mode=""或者"inurl:"MultiCameraFrame?Mode=""、"inurl: "view/index.shtml""(输入时不带外面的双引号,在英文状态下输入),你会获得无数个未经加密的网络摄像机监视到的画面。无聊的时候玩 玩,可以满足一下我们的好奇心。此外,打开这个站点:www.opentopia.com/hiddencam.php,在"from"中选择"China",你还可以看到国内的某处网络摄像机画面。

2.让Google搜索结果在新窗口中打开

      默认情况下Google的搜索结果跟百度等搜索引擎不一样,它是直接在当前网页中打开搜索结果,这对我们的使用会感到不方便,其实我们可以通过设置来达到 目的。打开Google后,选择"使用偏好"链接,在打开页面的"结果视窗"中勾选"开启新视窗以显示查询结果。"一项,单击"存储偏好设置"按钮即可如 图所示。


3.比较两个关键词在Google中搜索结果数量

      想知道克里和布什谁更火?那就比较一下Google的搜索结果数量就知道了。打开www.googlefight.com/,在"Keyword #1"和"Keyword #2"中分别输入"克里"和"布什",单击"Make a fight!"按钮即可看到他们各自的结果。笔者试过,克里有741000个搜索结果,布什有4020000个搜索结果,布什获胜!

4.让Google来告诉去哪儿旅游

      想好去哪儿旅游了吗?问问Google吧。打开douweosinga.com/projects/besttimetovisit站点,在"Enter the name of destination"栏中输入你想要去的城市名字,比如"北京",点击"Go"即可获得结果。

5.有趣的关键字

      在Google中输入"_*_"这个关键字,不管你是"搜索所有网页"还是"仅搜索中文网页",你都只能搜索到一大堆中文页面。想明白这是为什么吗?到 blog.outer-court.com/forum/5066.html去看看就知道了,原来这是ASCII字符和Google之间的矛盾。

6.中英文字典

 

      这项中(英)文单词翻译服务是由DrEye译典通网站所提供的,其查询格式为:"fy+中(英)文单词"(实际操作时,请勿输入+号和""号)。例如在 Google搜索框中输入fy innocent后,Google就会在搜索结果页面的最上方显示出"innocent的中文翻译"链接,点击它,你就能查到该单词的中文意思了。另外, 假如我们要翻译"无辜"这个词语的话,那只要输入fy 无辜 这样的格式就行了,Google会直接显示其所对应的英文单词,点下方的"Dr.eye线上字典"链接,保证你还能查到更多的内容。

      如果手边没有翻译软件,Google提供的单词翻译服务就显得很便利。

7.天气查询

      其查询格式为:"tq+城市名称",例如输入 tq 北京,再点击搜索结果页面上方的"北京天气预报"链接后,你就能在t7online网站上查询到北京今后3天内的天气状况了。

8.查询邮编或长途区号

      虽然现在网络已非常发达,但偶尔也难免要写封信,打个电话,这时此项功能就能帮上忙了。查询格式为:"yb+城市名称"或"qh+城市名称",借助此命 令,我们还可以输入相应的邮编或长途区号,反向查询到城市名称。不过,经过笔者的试用,发现Google所收录的邮编和长途区号的信息还十分不完整,有待 于补充改进。

9.股票查询

      其查询格式为:"gp+股票名称或代码",如:gp 宝钢股份 或gp 600019,其数据是由新浪财经提供的。

10.查询手机号码归属地

      直接输入移动或联通的手机号码后,通过相应链接,你就能知道该号码的所属省份、所属城市和手机卡类型等信息,十分方便。

posted @ 2008-04-13 10:08 alvalong 阅读(703) | 评论 (8)编辑 收藏

2008年3月24日 #

在近日Google总部(Googleplex)进行的一次搜索技术会谈上,Google对整个搜索用户界面的改进进行了回顾和展望,并首次公开了其新“整合型”通用搜索服务的一些重要元素,下面,我们将详细为您介绍Google新一代搜索服务的诸多细节。

Universal Search(通用搜索)

从Onebox开始,Google就一直努力将更多搜索服务整合到一个搜索页面中,然而,想要在不破坏页面简洁、高效风格的情况下整合新搜索结果并不容易。


“Google通用搜索将成为信息交叉式检索的终极模式,将新闻、图片、视频、书籍以及本地搜索服务有机整合,在一个搜索页面上呈现给用户。”

如图所示:(上图为未来的新搜索页面,下图为目前的Google搜索结果页面)我们可以看到,新搜索页面将嵌入一个可以在线播放Google Video的小窗口,大大降低用户在查找视频时的点击次数。

图文:Google“新一代”搜索体验揭密

图文:Google“新一代”搜索体验揭密

 

新界面设计

我们曾经为您介绍过的新导航页面也已正式启用,Google在导航条中添加新下拉式菜单,大大增加了搜索页面可选服务的数量——现在你就可以试试这个新导航条,根据你的Google帐号服务不同,可选的“More”也会有所差别。

不过,目前只有Google.com开始使用这个新导航条,Google.cn依然没有改变。

图文:Google“新一代”搜索体验揭密

 

搜索实验室

Google此次公布的新特性中,最让人兴奋的莫过于Google Experimental(Google实验室)了,在这个页面中,Google会展示所有正在进行测试的新功能以及试用方式。

1.时间轴搜索:针对特定关键词,可以展示维基百科等科研/文献网站中的历史资料与频率分部。

例如:在google.com输入搜索:nanotechnology view:timeline,如图所示,不仅出现纳米技术的内容分部,同时还按照时间轴详细展示不同年份的搜索结果

 

图文:Google“新一代”搜索体验揭密

 

2.键盘快捷键

Google新搜索页面将添加快捷键功能,大大提高信息检索的效率。

演示链接:http://www.google.com/search?q=rattlesnake&esrch=BetaShortcuts

快捷键一览:

J:选择下一搜索结果;K:选择上一搜索结果;O/回车:打开所选则搜索结果;/:回到搜索输入框;ESC:进入搜索结果导航

图文:Google“新一代”搜索体验揭密


3.左右新导航条

左右新导航条将大大提高搜索效率。两侧的新导航条将提供相关搜索以及更多分类搜索(产品、新闻、学术等)——对于越来越多的宽屏用户来说,这一新特性不仅有效利用了屏幕显示面积,还大大提高搜索效率——再也不用到搜索页底部寻找“相关搜索”了。

尝试一下?

左导航条:http://www.google.com/search?esrch=RefinementBarLhsGradientPreview&q=ipod

右导航条:http://www.google.com/search?esrch=RefinementBarRhsPreview&q=python


在所有Google实验室的试验搜索页面,Google还设置了反馈链接,你可以与Google开发人员分享对新功能的意见和看法。

图文:Google“新一代”搜索体验揭密

 

更“善解人意”

Google将在短期内对用户搜索词组进行更智能化的识别,即便你输入的词语毫不通顺,Google也会善解人意地为你理清头绪

例如:如果你搜索“unchanged lyrics van halen”,Google会将其变为更符合常规语法的“lyrics to unchained by van halen”——不过,Google并未透露是否会在中文搜索中加入这一智能“理解”功能。

除此之外,Google还将为搜索结果提供11种语言机器翻译,方便用户查阅国外资料。

图文:Google“新一代”搜索体验揭密

总结:

如果用两个词来概括Google未来搜索服务的发展趋势,“人性化”与“垂直化”最为合适。新搜索用户界面、更强大的关键词识别引擎以及快捷键等特性将大大提高用户搜索的方便性,而书籍、新闻、学术、产品、专利等行业的垂直搜索技术亦更加成熟与完善。

Google还有很多服务依然“默默无闻”,就如同谷歌北京研究院附院长刘骏老师所说,Google开发人员现在所完成的不过很小的一部分,当Gmail、Doc、GTalk等产品更为成熟,Google网络平台化战略的潜力将更为可观。

图文:Google“新一代”搜索体验揭密

posted @ 2008-03-24 04:27 alvalong 阅读(241) | 评论 (0)编辑 收藏

2008年3月15日 #

在过去的2007年中,Google针对SEO技术的一些变化确实有点多,应该引起大家的一些注意。
  • 去除搜索结果中的补充材料标记,查看补充材料命令也相继失效。评:显形变隐形,不过Google处理原创的能力确实厉害。
  • 对二级域名等同目录看待,并在同一域名下不会超过两个以上的搜索结果。评:阿里巴巴当年的盛世不可再现了。
  • 互惠链接成为历史,对大量采用互惠链接的站点有可能降低30位的排名惩罚,侧重单向链接,又极力反对垃圾群发。评:外链建设工作变的越来越有“技术”含量了:)
  • 降低目录网站的PR,特别是对付费目录及质量低且只为站长而建的目录结构的网站进行打击。评:古老的目录网站看样子真的要退休了。
  • 大量惩罚买卖链接的PR,有些加入过买卖链接网站或博客的PR直接被清零。评:有得就有失,PR即使作用不是那么大,确实有很多人还是追求的。
  • 复数形式的英文关键词排名好,单数形式并不一定有排名的优势
  • 核心关键词排名好并不一定能带动长尾组合关键词的排名
  • 链接文本的多样性至关重要
  • 单靠大量链接确实能提供一些关键词的排名
posted @ 2008-03-15 00:03 alvalong 阅读(197) | 评论 (1)编辑 收藏

2008年3月14日 #

实用功能一

Google最新推出“短信搜索”功能。用户利用手机向Google发送了一条带有搜索关键字的信息后,Google会判断要查找的特定信息,并自动将所查询的结果以文字形式返回到手机中。

不过它与传统的搜索引擎不同,在结果中仅有文字而无具体的链接、网页,这样可方便使用普通手机的用户直接得到自己想到的信息。随着元旦、春节的到 来,许多朋友往往会踏上旅程奔赴各方。当身处异地时,了解诸如当地天气、城市周边环境、火车车次甚至股市行情等重要信息就非常方便了。

既然Google的短信搜索有着如此有用,那么现在我们还是以几个小事例看看它强大的实用功能吧!

一、雨雪阴晴早知道

利用假期去驴行,自然是一个非常不错的想法,但前提要知道当地的天气状况。否则不是被淋一身雨,便是因衣着过多而导致行动不便。

打开自己的手机,进入手机的短信编辑页面。在打算查询当地天气时,可在手机上输入“城市名称 天气”或“tq 城市名称”;然后发送短信至1069999333。稍待片刻,便会将当地未来三天的天气情况返回到手机上,非常实用(图1)。

图1

二、快速获悉车票信息

实际上,驴行一族并不占大多数。利用常规的交通工具-火车出行,则是大多数朋友的选项。坐火车出行,最重要的法则便是要选择正确的车次,否则南辕北辙,后果不可想象。

现在通过Google的短信搜索功能,可让你在任何地点、任何时间快速得到具体的车次情况,让手机变成“列车时刻表”。

在手机的短信编辑页面中,键入火车的车次编号,如T771,或者键入“火车 出发站到目标站”,如“火车 北京到重庆”这个搜索关键词,将它们发送到1069999333,即可得到相应的结果。

三、寻觅温馨小屋

车马劳顿,到达目的地后,自然要找寻一处宜居的宾馆,以洗去旅途中的疲惫。不过,人处异地,对于陌生城市宾馆所在的位置肯定不会熟悉。为此,还是让手机当成一位向导,让它引领我们到达正确的目的地。

例如打算在北京找到“假日酒店”的所在地,可在手机中输入“北京 假日酒店”这个关键词。在返回的搜索结果中,便能够看到有关“假日酒店”的相关信息,比如具体的地址、电话等,非常方便(图2)。

posted @ 2008-03-14 23:57 alvalong 阅读(143) | 评论 (0)编辑 收藏

2008年3月5日 #

+   addition   45 + 39
-   subtraction   45 – 39
*   multiplication   45 * 39
/   division   45 / 39
% of   percentage of   45% of 39
^   raise to a power   2^5
google还能做计算,直接在搜索框里面输入右边的例子,就能做相应的工作。
posted @ 2008-03-05 18:40 alvalong 阅读(228) | 评论 (0)编辑 收藏

新站如何让搜索引擎快速收录?
原理:找到Google,Yahoo认为比较重要并且派蜘蛛天天爬的网站,在上面做个链接引蜘蛛过来。
如果有比较好的资源,收录当然不是什么问题。买几个PR比较高的站的链接,很容易就被收录。
在没有资源前提下,
Google:建议去www.digg.com,把自己的网站首页digg一下。我有个站,第一天digg,第二天收录,第三天有排名,整天过程不到两天。
Yahoo:建议去answers.yahoo.com,自问自答也好,热心回答别人的问题也好,把网址顺带上,一个星期到半个月,站点应该就会被收录了。
posted @ 2008-03-05 18:31 alvalong 阅读(232) | 评论 (0)编辑 收藏

 ■本报记者 祝慧

  网络实名大战和域名抢注运动并不是件新鲜事,其中蕴涵的商机让很多人趋之若骛。在这个热潮尚未散尽的时候,一个新的热潮又来临了。

  记者从中国总机了解到,在其推出电话实名服务两年来,电话实名注册量已经突破了十万。

  蕴藏巨大商机

  互

联网自兴起以来,成为很多人的掘金地。受益于这块宝地,无数人的发财梦想得以实现。也正是因为其所蕴涵的巨大商机和投机,抢注网络实名和域名掀起了令世人关注的狂潮。

  在抢注网络实名和域名之战进行得如火如荼的时候,有人从中寻找到了灵感,电话实名应运而生。所谓电话实名,就是指打电话的人只要打入一 个固定号码,向接线员报出想要的企业名称或者是个人名称,则接线员会直接将电话转到这个企业或个人,简而言之,就是“让需要最快找到你”。

  与互联网不同,电话早在一百多年前就发明出来了,其在人们生活中扮演着平凡而重要的角色,对使用人群也没有任何特殊的要求。这样说来,按理电话应该埋藏更大商机。然而,在互联网高度发展的今天,电话中的商机似乎被忽略了。

  “一方面太多的数字让人很难清晰记住谁是谁,另一方面,使用800、400等容易记住的号段又需要大额通讯费。”中国总机副总裁褚朝晖告诉记者,如果解决了这两点,电话带来的商机不会比互联网少。

  褚朝晖向记者介绍,中国总机自2005年8月在全国首创了“打电话直呼其名”的电话实名服务以来,今年11月已经突破了十万大关。

  中国总机首创的“打电话直呼其名”的电话实名服务是以企业的“公司名称”、“品牌”、“商标”、“产品名称”、“行业名称”等作为标识 的一种现代化的中文通信方式。它主要致力于“改变沟通,改变生活”。用户只需记住企业的“电话实名”,拨打4008-100-100,转接企业的“电话实 名”,即可与已注册的企业通话,而无需再记一连串的数字。更重要的是这个号码可以实现全国联通,而且只收主叫方的本地市话费用。

  “记得住,找得到。我们的电话实名自投入市场后,不但受到广大消费者的关注,更受到大批知名品牌和企业的欢迎,特别是对一些中小企业的发展起到了积极的推动作用。”褚朝晖说。

  此外,与火爆的网络搜索竞价排名相比,电话实名的惟一性,使得其游戏规则只限于“先到先得”,后来者即便愿意付出更多的代价,但只要是排在后面,结局都无可逆转,惟一可行的办法就是与先前抢注到的用户私下协商。

  据资料显示,互联网方面,仅在2006年初,全球就已经有16个域名交易超过了10万美元,Macau.com卖了55万美元,On.com售价则高达65万美元。从中不难看出电话实名所暗藏着的商机。

  更重要的是,与网络不同,电话实名还受到中文语音语调的限制,一旦一个名称被注册后,与其同音不同字或不同调的名称,将无法进行注册。这使得电话实名资源显得更为稀缺。

  也正因为此,2005年中国总机进入电话实名转接服务领域时,市场上仅此一家。但两个月后便开始出现跟风抄袭者,而今这块市场上已出现 不下十五家类似企业。“跟风企业模仿的只是我们的产品,但他们模仿不了我们的方向。”尽管出现众多跟风者,但褚朝晖对自己的产品还是很有信心。

  褚朝晖透露,目前,中国总机已有注册企业3.8万家,平均注册电话实名2.7个。此外,据数据统计,已有千万人次使用了该项服务,有些实名一周被叫率高达1000余次。

  习惯培养成瓶颈

  虽然电话实名蕴涵巨大商机,抢注也非常火爆,精确转接的方式可以使人们快速找到自己想要找的信息,但不可忽视的一点是,如今的人们似乎更习惯于在google、百度之类的网站上去寻找自己想要的信息。

  “不可否认,在现阶段,电话实名对很多人来说还很陌生,它的知名度还不够高,我们还处于培养人们习惯的时期。”对于培养人们习惯,褚朝 晖坦承不是件容易的事情。不过他认为,虽然让人们培养这一习惯并不容易,但是一旦培养起来,将给人们的生活带来极大的便利。“这就仿佛以前人们上网查找某 一个公司,需要输入复杂的域名。但是Google、百度等搜索引擎的出现改变了人们以往的习惯,现在人们只要在搜索引擎中输入关键词,就可以在网上找到成 千上万与之相关的链接。中国总机也是这样,我们希望以后每一个人都知道中国总机,知道4008-100-100,知道在寻找某些信息的时候拨打这个电 话。”

  此外,褚朝晖还表示,对于未来,仍是希望语音搜索的发展与融合。“互联网与电信网络的结合是服务的必然方向。”

  据记者了解,今年十月底中国总机就在网上推出了“物流搜索”。“这是向语音搜索发展的一个小小的尝试。物流和票务是我们现在最热门的实 名注册领域,也是数据量最大的两个分支,我们现在提供物流行业的检索、转接、回呼服务。随着数据量的继续扩大,这样的行业搜索我们也会逐步展开,直至覆盖 到所有行业类别。”褚朝晖表示。

posted @ 2008-03-05 17:36 alvalong 阅读(153) | 评论 (0)编辑 收藏

仅列出标题