您好,  欢迎光临媒介星发稿平台!

注册 登录
天 津 北 京 广 州
18979480970
当前位置:媒介星发稿 > SEO推广

南昌网站优化平台|爬行抓取之蜘蛛

时间: 2020-02-03 12:09:20 作者: 媒介星软文平台

南昌网站优化平台|爬行抓取之蜘蛛

所谓的爬行和抓取,是搜索引擎工作的第一步。搜索引擎要向用户提供信息,自己的数据库里面就必须有庞大的数据量。所以,在网络上搜寻有一定质量的内容放入自己数据库是很重要的事情。

搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider)。

1

robots协议

蜘蛛访问网站页面时,类似用户访问。不同的是,蜘蛛在访问一个网站的时候,都会先访问网站根目录下的robots.txt文件。这个文件是网站和搜索引擎的一个协议,蜘蛛会遵守协议,不抓取被禁止的网址。

2

各搜索引擎蜘蛛

从访问日志当中,可以看到各搜索引擎的蜘蛛命名方式不一样:

Baiduspider百度蜘蛛

360spider 360蜘蛛

熟悉各家蜘蛛的名称,对后期优化中,分析爬行日志有很大作用。

3

爬行原则

蜘蛛爬行有两种原则:广度原则和深度原则。如下图:

深度原则的爬行方式:A-B-D-C-E-F

广度原则的爬行方式:A-B-C-D-E-F

两种方式各有优劣势,分别影响的是爬行网站数量多少和内页内容深度。

从理论上说,不管是深度优先还是广度优先,只要时间够,蜘蛛都能爬整个网络。但是在实际情况下,由于资源、时间的限制,搜索引擎需要一个科学的爬行规则。

所以搜索引擎往往是深度、广度通常是混合使用的,这样既客户照顾尽量多的网站,也能增加网站内页收录。

PS思考:蜘蛛爬行的时候,怎么判断某个网站深度深一点?

                     做网站,做推广,找网络营销产品代理加盟。

南昌网站优化平台|爬行抓取之蜘蛛  品牌营销加推广,精准获客推广媒介星软文平台


联系我们

扫一扫,添加好友!

免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表本站的观点和立场和对其真实性负责,如因作品内容,版权和其他问题需要同本网站联系的,请邮件联系2290/781984@qq.com


上一篇: 媒介星网络推广仅有三种方式,看懂了就是钱!
下一篇: 网络营销必备:早睡早起

海量网站直线发稿、24小时自助发稿平台、助您提升营销效率!

注册会员 尽享全网海量网站发稿对接!

18979480970 工作日:9:00-18:00
周 末:请联系客服
资源多 价格低 速度快