国内顶级SEO优化公司

    顺时SEO优化

当前位置: 首页 > 服务培训 >

SEO培训:搜索引擎的架构和工作原理图

时间:2017-03-22 17:05来源:未知 作者:shunshiseo 点击:
SEO培训:搜索引擎的架构和工作原理图,搜索引擎发展史:分类目录(网址导航)是史前时代、文本检索是第一代、链接分析是第二代、以用户中心是第三代,搜索引擎的3个目标:更全、更快、更

  SEO培训:搜索引擎的架构和工作原理图,搜索引擎发展史:分类目录(网址导航)是史前时代、文本检索是第一代、链接分析是第二代、以用户中心是第三代,

  搜索引擎的3个目标:更全、更快、更准。

  搜索引擎的3个核心问题:1.用户真正的需求是什么,2.哪些信息是和用户需求是真正相关的,3.哪些信息是用户可以信赖的。

  搜索引擎的架构,一张图可以说明情况:

  搜索引擎的整体架构示意图:

SEO培训:搜索引擎的架构和工作原理图

  我们来看一下搜索引擎的架构(上图):

  网络爬虫爬行互联网连接;

  网页计算去重;

  添加索引;

  内容,链接计算;

  网页排序;

  形成对应词典,存入cache系统;

  用户检索;

  分析内容,调出词典内容

  这基本上是一个网页从产生到呈现的过程,当然这个过程很复杂,这里只是简单的比拟出来。不过我们可以看到,网络的爬虫对我们网站是何等的重要,这也是很多卖蜘蛛池的原因吧。其次是网页的去重,因为现在百度自身服务器内部很多的网页缓存,蜘蛛爬去过得内容百度会经过一系列的计算后去除重复网页,这里面有一个比较复杂的算法,这个以后可以详细来讲。`

  我们看网页的排序有两个方面因素的影响:内容的相似性&链接分析,大概这就是我们常说的SEO“内容为王,外链为皇”理论依据吧。其实网页排序的影响因素有很多,但是内容和链接是基础的比较重要的影响因素。

  网页排序之后就是生成关键词的词典存入搜索引擎的Cache系统,一方面可以快速的提供用户查询信息,另一方面就是减轻搜索引擎的计算压力。

  除了上述的子功能模块,“反作弊”模块也日益重要。

  互联网页面划分为五个部分:1.已下载网页集合、2.已过期网页集合、3.待下载网页集合、4.可知网页集合、5.不可知网页集合。

  网络爬虫分为:批量性爬虫、增量型爬虫、垂直型爬虫。

  爬虫抓取的策略:1.宽度优先遍历、2.非完全PageRank、3.OPIC(Online Page Importantance Computation)、4.大站优先。

  网页更新策略:1.历史参考策略、2.用户体验策略、3.聚类抽样策略。相关SEO培训阅读《新手应该如何选择SEO培训机构》。

 

  本文由顺时SEO军哥整编收集于网络不代表本站观点,如果您还想了解更多关于SEO优化的文章,请点击查看百度快速排名网络营销推广的其它文章,请关注顺时SEO优化公司官网(seo.baidutop123.com).

顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
猜你喜欢的内容

客户QQ服务热线:

    QQ:1251192082

    QQ:2922517368

  QQ:1733080874

在线客服