蜗牛789
主机测评与优惠

WordPress SEO优化 如何设置WordPress站点的robots协议

文章目录

robots是搜索蜘蛛访问你站点时首先检测并访问的文件,我们可以通过这个文件来告诉搜索引擎那些内容可以被抓取收录,那些是不可以被收录。当然并不是所有网站的robots设置是一摸一样的,它根据不同的网站程序的不同设置的内容也会有所不同,但是如果采用的是同一建站程序那基本都是一致的。在这里主要介绍下WordPress robots协议如何设置。

robots协议的创建也很简单,你只需在本地新建一个记事本“.txt”文件,然后重命名为“robots.txt”,把robots协议保存到里面,最后把“robots.txt”上传到站点根目录即可。在此文章中介绍三个等级的WordPress robots协议,分别是简单、适中、严格。请根据自己需要进行选择即可。

一、最简单的配置方法:

User-agent: *
Disallow: /wp-
Disallow: /?s=
Sitemap: http://www.wn789.com/sitemap.xml

解释:“User-agent: *”指的是允许所以的搜索引擎访问;“Disallow: /wp-”是搜索引擎收录“wp-”开头的目录。“Sitemap:http://www.wn789.com/sitemap.xml”指的是你的网站地图。

二、相对适中的配置方法:

 User-agent: *
 Disallow: /wp-admin
 Disallow: /wp-content/plugins
 Disallow: /wp-content/themes
 Disallow: /wp-includes
 Disallow: /?s=
 Sitemap: http://www.wn789.com/sitemap.xml

这种写法同样允许所以搜索引擎访问抓取,而且只限制搜索引擎抓取“/wp-admin”、“/wp-content/plugins”、“/wp-content/themes”、“/wp-includes”目录,并非第一种方法直接限制“wp-”开头的目录。

三、最为严格的配置方法:

 User-agent: *
 Disallow: /wp-*
 Disallow: /*.php$
 Disallow: /*.inc$
 Disallow: /*.js$
 Disallow: /*.css$
 Disallow: /?s=
 Sitemap: http://shandian.biz/sitemap.xml

这种方法最为严格,在禁止搜索引擎抓取“wp-”开头的目录外,还禁止抓取.php、.inc、.js、.css文件。

以上三种写法适用于所以WordPress站点,可以在上面任选一段代码保存到“robots.txt”上传到站点根目录即可。下面另外再介绍一种仅适合设置了全站伪静态的方法:

 User-agent: *
 Disallow: /wp-admin
 Disallow: /wp-content/plugins
 Disallow: /wp-content/themes
 Disallow: /wp-includes
 Disallow: /?s=
 Disallow: /page/
 Disallow: /category/*/page/*
 Disallow: /tag/
 Disallow: */trackback/
 Disallow: /category/*
 Sitemap: http://www.wn789.com/sitemap.xml

解释:“Disallow: /page/”限制抓取Wordpress分页;“Disallow: /category/*/page/*”限制抓取分类的分页;“Disallow: /tag/”限制抓取标签页;“Disallow: */trackback/”限制抓取Trackback內容;“Disallow: /category/*”限制抓取所有分类清单。

About 蜗牛

【声明】:本博客不参与任何交易,也非中介,仅记录个人感兴趣的主机测评结果和优惠活动,内容均不作直接、间接、法定、约定的保证。访问本博客请务必遵守有关互联网的相关法律、规定与规则。一旦您访问本博客,即表示您已经知晓并接受了此声明通告。





评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址