html Meta 标签屏蔽蜘蛛抓取的方法教程

今天有人说可以利用 html 页面的中 meta 标签来屏蔽搜索引擎蜘蛛的抓取或不让蜘蛛抓取网页中的其它链接， <meta name='robots' content='noindex,nofollow' /> 这样的HTML代码，可以告诉来网页爬取的蜘蛛本页内容是否可以抓取，是否可以抓取网页上的其它链接。

html meta标签的代码如下：

<metaname='robots'content='noindex,nofollow'/>

解释：

name ：是指的所有的搜索引擎.它的值有多个，下面列出几个。

robots：表示所有的搜索引擎
Baiduspide：百度
Googlebot：谷歌

content：表示对搜索引擎蜘蛛的行为做出指示，它有下面的几值来表示。

index：允许本页被抓取
noindex：禁止许本页被抓取
follow：允许本页的上其它链接可以被跟踪抓取
nofollow：禁止本页上的其它链接被跟踪抓取
noarchive：禁止搜索引擎对网站建立快照

根据上面 content 属性的四个值，我们可以列出以下几个组合的用法：

<metaname='robots'content='index,follow'/>：可以抓取本页，也可以顺着本页继续索引别的链接
<metaname='robots'content='noindex,follow'/>：禁止抓取本页，但可以抓取跟踪本页的其它链接
<metaname='robots'content='index,nofollow'/>：可以抓取本页，禁止抓取和跟踪本页的其它链接
<metaname='robots'content='noindex,nofollow'/>：禁止抓取本页，禁止抓取和跟踪本页的其它链接
<metaname='robots'content='noarchive'/>：禁止搜索引擎建立快照

需要注意的是：

1、index 与 follow 的组合可以简化为 all

<metaname='robots'content='index,follow'/>

可以写成

<metaname='robots'content='all'/>

2、noindex 与 nofollow 组合可以简化为 none

<metaname='robots'content='noindex,nofollow'/>

可以写成

<metaname='robots'content='none'/>

3、相反的属性值是不能写在一样的，比如 index 与 noindex 不能写到一起，follow 与 nofollow 不能写到一起

下面的两个示例是错误的

<metaname='robots'content='index,onindex'/>
<metaname='robots'content='follow,onfollow'/>

1.《html Meta 标签屏蔽蜘蛛抓取的方法教程》援引自互联网，旨在传递更多网络信息知识，仅代表作者本人观点，与本网站无关，侵删请联系页脚下方联系方式。

2.《html Meta 标签屏蔽蜘蛛抓取的方法教程》仅供读者参考，本网站未对该内容进行证实，对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址，https://www.lu-xu.com/jiaoyu/2372151.html

html Meta 标签屏蔽蜘蛛抓取的方法教程

大学英语四六级考试注意事项

2023年考研政治综合备考毛中特复习考点概述