财智伟业策划专家
品牌策划管理专家
闽南企业管理网
闽南企业管理网
 品牌总网 >> 互联网 >> 观点经纬 >> [专题]电子商务

搜索引擎成第四桶金


[  人民邮电报    更新时间:2005/4/18  ]    ★★★

    技术发展空间很大

    尽管目前网络搜索技术与过去几年相比,有了很大发展,但是要完全满足用户的需求仍有很长的路要走。

    微软公司MSN网络分部搜索副总裁ChristopherPayne在最近一次技术会议上表示,“该行业仍然处于早期阶段”。

    三大搜索巨头一直没有间断对搜索服务的前进步伐。最近微软公司刚刚推出了自己的搜索引擎,而雅虎公司对其搜索广告服务进行了修补和改善;Google公司则有条不紊地陆续为其网络搜索引擎增加了各种新的功能,其中包括目前热门的视频搜索等功能。

    随着Google壮大成为网上最受欢迎的搜索引擎,以及占据最具可观利润的文本搜索广告市场,微软和雅虎公司双双作出反应,努力改进自己的技术,意图进入并分享搜索服务市场。雅虎正在从其他网络服务中集合内容,加进搜索结果中,并计划开放其搜索引擎技术接口,允许其他程序师开发可兼容搜索信息的软件应用程序。

    尽管微软公司认为搜索引擎还处于早期发展阶段,但Payne同时表示新的参与者将很难进入该领域获得一席之地,并像Google在1998年进入搜索市场后挑战其他现存参与者一样经受住竞争的考验。“现在进入该领域的代价是非常巨大的。”Payne说微软公司将最终让搜索成为Windows系统的统一组成部分,并且将从代号为Longhorn的下一代操作系统开始。据悉Longhorn将在2006年发布。

    为了进一步改进搜索相关的服务,三大公司已经相继推出了测试版的搜索软件,允许搜索用户搜索本地硬盘上的文件及其他存储信息。搜索引擎发展的下一步将是跟踪搜索结果,为用户提供适合特殊兴趣及需要的结果。如果能够把搜索功能与手机相联系,实现互通将是扩大搜索服务的机遇。Payne|表示无线搜索服务是一个潜

    在的发展领域,但搜索提供商如何利用该领域服务取得利益还不能明确。

    未来,搜索引擎技术的发展方向主要包括以下方面

    ——自然语言理解技术。自然语言理解是计算机科学中的一个引人入胜的、富有挑战性的课题。从计算机科学特别是从人工智能的观点看,自然语言理解的任务是建立一种计算机模型,这种计算机模型能够给出像人那样理解、分析并回答自然语言。以自然语言理解技术为基础的新一代搜索引擎,我们称之为智能搜索引擎。由于它将信息检索从目前基于关键词层面提高到基于知识(或概念)层面,对知识有一定的理解与处理能力,能够实现分词技术、同义词技术、概念搜索、短语识别以及机器翻译技术等。因而这种搜索引擎具有信息服务的智能化、人性化特征,允许网民采用自然语言进行信息的检索,为他们提供更方便、更确切的搜索服务。

    ——P2P对等网络。P2P是peer-to-peer的缩写,意为对等网络。其在加强网络上人的交流、文件交换、分布计算等方面大有前途。长久以来,人们习惯的互联网是以服务器为中心,人们向服务器发送请求,然后浏览服务器回应的信息。而P2P所包含的技术就是使联网电脑能够进行数据交换,但数据是存储在每台电脑里,而不是存储在既昂贵又容易受到攻击的服务器里。网络成员可以在网络数据库里自由搜索、更新、回答和传送数据。所有人都共享了他们认为最有价值的东西,这将使互联网上信息的价值得到极大地提升。

    ——多媒体搜索引擎。随着宽带技术的发展,未来的互联网是多媒体数据的时代。开发出可查寻图像、声音、图片和电影的搜索引擎是一个新的方向。

    搜索引擎技术的原理

    搜索引擎技术的原理实际上很简单:一般分为三个部分,首先是进行全网搜索,自动抓取网页;其次是将抓取的网页按照关键词进行索引,同时也会记录与检索有关的属性,中文搜索引擎中还需要首先对中文进行分词;最后通过检索生成的索引文件并按照各种参数进行复杂的计算,产生结果并返回给用户。也有人认为,搜索引擎的界面设计可以算做新的部分。这样可以逐渐提升用户的使用体验。除此之外,搜索引擎的附属功能中还包括分布式计算模块,以及一套后台监控体系。在这些部分中,最核心的是搜索结果的排序,如何把最合适的结果排到前面。因此,可以说其他的所有环节都是为最后的计算作准备的。

    但实际的检索效果受多方面因素的影响。抓取网页工具的稳定性和抓全率非常重要,最早的搜索引擎只抓取静态网页,现在的搜索引擎就要求抓取更多的动态网站,因此需要对含有Script语句的网页进行解析,同时Flash的广泛应用也要求搜索引擎能够解析其中的文字和超级链接。

    接下来的格式转换和创建索引则需要深厚的技术功底。索引的难点在于让存储数据结构尽可能的优化以适合搜索的需要。这方面,各家搜索引擎厂商的技术都不太一样。但如何尽可能减少内存、CPU占用以及读盘次数则是共同的目标。尽管有些人有很好的想法,但不一定用现在的技术都容易实现。由于搜索引擎所需要处理的数据量极其庞大,不加限制的位置、属性的增加可能导致系统的过度膨胀和检索速度的下降。多线程并发检索系统的构建也是一个难点。

 

中国品牌总网

上一页  1 2 

上一篇 上一篇文章: 中国万网总裁张向东在舵手论坛上的...
下一篇 下一篇文章: 关注第八届电子商务大会
发表评论】【打印此文】【关闭窗口
品牌总网版权与免责声明:
        本网站(www.ppzw.com)刊载的所有内容,包括文字、图片、音频、视频、软件、程序、以及网页版式设计等均在网上搜集。 访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。 本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
※ 联系方式:品牌总网管理客户服务部 电话:0595-22501825
 图片资讯
1 2 3
财智品牌营销全攻略 品牌系统化与营销落地化
 社会动态
 视频推荐
 商机在线
 分类信息
 图片新闻频道
 招商加盟
 

版权所有: 品牌总网   闽ICP备16034782号-1 本网站法律顾问:郑明汉 律师

Copyright © PPZW.COM 2002-2025 All Rights Reserved. 在线客服: 在线咨询QQ:383485670 加盟商在线QQ:

Email:qy@PPzw.com

闽公网安备 35052102000246号