网站robots文件制作。

2017年12月1日23:53:28 发表评论

在让搜索引擎发现我们网站页面前,其实我们还需要考虑为网站创建一个robots.txt文件,这本质上是一个说明手册,告诉搜索引擎爬虫在您的网站上什么文件可以抓取,什么文件不能抓取。

该文件写法很简单,在这简单介绍下:

User-agent: * 这里的*代表的所有的搜索引擎种类,*是一个通配符

Disallow: /admin/ 这里定义是禁止爬寻admin目录下面的目录

Disallow: /require/ 这里定义是禁止爬寻require目录下面的目录

Disallow: /ABC/ 这里定义是禁止爬寻ABC目录下面的目录

Disallow: /cgi-bin/*.htm 禁止访问/cgi-bin/目录下的所有以".htm"为后缀的URL(包含子目录)。

Disallow: /*?* 禁止访问网站中所有包含问号 (?) 的网址

Disallow: /.jpg$ 禁止抓取网页所有的.jpg格式的图片

Disallow:/ab/adc.html 禁止爬取ab文件夹下面的adc.html文件。

Allow: /cgi-bin/ 这里定义是允许爬寻cgi-bin目录下面的目录

Allow: /tmp 这里定义是允许爬寻tmp的整个目录

Allow: .htm$ 仅允许访问以".htm"为后缀的URL。

Allow: .gif$ 允许抓取网页和gif格式图片。

例如:

网站robots文件制作。

如果您的robots.txt文件准备就绪,则可以像其他任何文件一样将其上传到网站的根目录。

weinxin
柴叔的微信号
扫一扫添加柴叔微信,免费获取SEO诊断服务
成都seo

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: