周三网络科技有限公司

        周三网络科技有限公司14年老品牌技术开发服务公司,专注于网站建设_APP小程序制作_软件开发_公司定制设计。
        经营范围电子商务经营;网络技术开发;计算机周边设备、电子产品的销售;国内贸易;进出口业务;计算机软硬件技术研发及技术推广;计算机系统服务;网络技术服务,互联网软、硬件研发、设计、制作、代理、推广;广告设计、制作、代理,用自有媒体发布户外广告;网络设备安装。
        为全国及上海、广州、北京、深圳、合肥等提供网站建设,小程序开发,APP开发,系统开发,及高端网站定制服务,专注于企业网站建设,对建筑,机械,教育,家装,外贸等多个行业拥有丰富的开发经验!

联系我们

联系我们

公司:周三网络科技有限公司

QQ:3043239330

网站的默认首页(网站的默认首页怎么设置)

网站建设admin5小时前阅读:4

网站的默认首页(网站的默认首页怎么设置)

  robots文件有什么用呢?

  1、屏蔽网站内的死链接。

  2、屏蔽搜索引擎蜘蛛抓取站点内重复内容和页面。

  3、阻止搜索引擎索引网站隐私性的内容。

  4、可以屏蔽一些网站中比较大的文件,如:图片,音乐,视频等,节省服务器资源。

  5、设置网站地图连接,方便引导蜘蛛爬取页面。

  想要学习网站搭建以及SEO的伙伴可以来这个群:215--113--587 在这里,大神带你进入互联网的世界,在这里,你可以学习到你想要学习到的东西,在这里,绝对不会让你失望!

  一个网站写有robots文件是很有必要的,如果网站中重复的页面、内容或者404信息过多,那么搜索引擎蜘蛛抓取时候就会认为该网站价值较低,从而降低对该网站的权重,这样网站的排名就不好了。

  robots怎么写呢?

  User-agent: * 这里的*代表的所有的搜索引擎种类,*是一个通配符

  Disallow: /admin/ 这里定义是禁止爬寻admin目录下面的目录

  Disallow: /require/ 这里定义是禁止爬寻require目录下面的目录

  Disallow: /ABC/ 这里定义是禁止爬寻ABC目录下面的目录

  Disallow: /cgi-bin/*.htm 禁止访问/cgi-bin/目录下的所有以”.htm”为后缀的URL(包含子目录)。

  Disallow: /*?* 禁止访问网站中所有包含问号 (?) 的网址

  Disallow: /.jpg$ 禁止抓取网页所有的.jpg格式的图片

  Disallow:/ab/adc.html 禁止爬取ab文件夹下面的adc.html文件。

  Allow: /cgi-bin/ 这里定义是允许爬寻cgi-bin目录下面的目录

  Allow: /tmp 这里定义是允许爬寻tmp的整个目录

  Allow: .htm$ 仅允许访问以”.htm”为后缀的URL。

  Allow: .gif$ 允许抓取网页和gif格式图片

  Sitemap: 网站地图 告诉爬虫这个页面是网站地图

  下面,小编将列举一些robots.txt的具体用法:

  允许所有的搜索引擎访问网站所有的部分的robot写法:

  User-agent: *

  Disallow:

  或者也可以建一个空文件 robots.txt 文件,功能同上。

  禁止所有搜索引擎访问网站的任何部分的robots写法:

  User-agent: *

  Disallow: /

  禁止所有搜索引擎访问网站的某几个部分(下例中的01、02、03目录)的robots写法:

  User-agent: *

  Disallow: /01/

  Disallow: /02/

  Disallow: /03/

  禁止某个搜索引擎的访问(如下例中禁止百度引擎抓取)的robots写法:

  User-agent: Baiduspider

  Disallow: /

  注意:以上写法只禁止了百度搜索引擎的抓取,其他搜索引擎还是可以来抓取的。

  只允许某个搜索引擎的访问(如下例中只允许谷歌搜索引擎抓取站点内容)的robots写法:

  User-agent: Googlebot

  Disallow:

  User-agent: *

  Disallow: /

  禁止搜索引擎抓取自己网站图片(禁止图片抓取)的robots写法:

  User-agent: *

  Disallow: .jpg$

  Disallow: .jpeg$

  Disallow: .gif$

  Disallow: .png$

  Disallow: .bmp$

  如果你的网站有动态和静态两种形式的网页,你只允许抓取静态页面(禁止动态页面)的robots写法:

  User-agent: *

  Disallow: /*?*

  下面顺便将各大搜索引擎的蜘蛛的名字分享一下(这里仅列举中国国内比较常用的一些搜索引擎):

  google蜘蛛:Googlebot

  百度蜘蛛:Baiduspider

  搜狗蜘蛛:sogou spider

  360蜘蛛:360Spider

  yahoo蜘蛛:Yahoo!slurp

  alexa蜘蛛:ia_archiver

  bing蜘蛛:MSNbot

  Soso蜘蛛:Sosospider

  Google Adsense蜘蛛:Mediapartners-Google

  有道蜘蛛:YoudaoBot

  未经本人允许,转发前请联系本人QQ:482500554

  谢谢合作

上一篇:易恢复软件(易恢复软件 破解)

下一篇:信息网络安全培训信息(网络信息安全培训ujiuye)

猜你喜欢

网友评论