互联网的基础与应用简答题 简述搜索引擎的基本工作方式:
来源:网络收集 点击: 时间:2024-03-06【导读】:
搜索引擎的基本工作原理包括如下三个过程:
1、抓取网页,每个独立的搜索引擎都有自己的网页抓取程序爬虫(spider)。通过超链接分析连续访问抓取更多网页。
2、处理网页,搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索引。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。
3、提供检索服务,用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页,为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。
百度为全球最大的中文搜索引擎、最大的中文网站,2000年1月,李彦宏从美国硅谷回到祖国创建了百度。经过十多年的发展,李彦宏领导下的百度已经发展成为全球第二大独立搜索引擎和最大的中文搜索引擎。
从2009年推出的框计算技术理念,到此后“数据开放平台”、“应用开放平台”的陆续推出,至2011年发布“百度新首页”,李彦宏进一步完善了中国互联网科学的理论体系,并带动整个IT产业技术面向未来、不断进步。
百度的成功,也使中国成为美国、俄罗斯和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。
参考资料来源:百度百科-搜索引擎基本工作原理
参考资料来源:百度百科-百度 (百度公司)
版权声明:
1、本文系转载,版权归原作者所有,旨在传递信息,不代表看本站的观点和立场。
2、本站仅提供信息发布平台,不承担相关法律责任。
3、若侵犯您的版权或隐私,请联系本站管理员删除。
4、文章链接:http://www.1haoku.cn/art_256620.html