nofollow 是HTML页面中a标签的属性值。这个标签的意义是告诉搜索引擎”不要追踪此网页上的链接或不要追踪此特定链接”。
nofollow是HTML页面中a标签的属性值。它的出现为网站管理员提供了一种方式,即告诉搜索引擎”不要追踪此网页上的链接”或”不要追踪此特定链接”。这个标签的意义是告诉搜索引擎这个链接不是经过作者信任的,所以这个链接不是一个信任票。
nofollow标签是由谷歌领头创新的一个“反垃圾链接”的标签,并被百度、yahoo等各大搜索引擎广泛支持,引用nofollow标签的目的是:用于指示搜索引擎不要追踪(即抓取)网页上的带有nofollow属性的任何出站链接,以减少垃圾链接的分散网站权重!
简单的说就是,如果A网页上有一个链接指向B网页,但A网页给这个链接加上了 rel=”nofollow” 标注,则搜索引擎不把A网页计算入B网页的反向链接。搜索引擎看到这个标签就可能减少或完全取消链接的投票权重。
nofollow可以用于阻止在PR值高的网站上以留言等方式添加链接从而提高自身网站排名的行为,以改善搜索结果的质量,防止垃圾链接的蔓延。网站站长也可对其网页中的付费链接使用nofollow来防止该链接降低搜索排名。对一些重要度低的网页内容使用nofollow,还可以使搜索引擎以不同的优先级别来抓取网页内容。
发展
最初,”Nofollow”属性出现在网页级元标记中,用于指示搜索引擎不要追踪(即抓取)网页上的任何出站链接。例如:<meta name=”robots” content=”nofollow” />。
而后,在将”Nofollow”用于各个链接前,我们需要完成大量的工作(例如,将链接重定向至robots.txt中拦截的网址),以阻止蜘蛛追踪某网页上的各个链接。
因此,我们创建了rel属性的”Nofollow”属性值。这可让网站管理员更精确地进行控制:无需指示搜索引擎和漫游器不要追踪该网页的所有链接,只需轻松地指示蜘蛛不要抓取某特定链接即可。例如:
<a href="signin.php" rel="nofollow">signin</a>。
原因作用
我们都知道,反向链接即外链是搜索引擎给网站排名的一个重要因素。为了添加反向链接,SEO作弊者会在论坛和博客等大量发布带无关链接的内容。这些垃圾链接的存在给搜索引擎对网页质量的评估造成一定程度的麻烦,可以说nofollow是一个非常好的“垃圾链接防火墙”。
正是百度、谷歌、Yahoo、MSN 为了应对垃圾链接(Spam)引入的一个属性,此属性应该被广泛采用。Nofollow标签的作用有两方面,简单的说,一是不给链接投票,降低此链接的权重,二是使添加nofollow的部分内容不参与网站排名,便于集中网站权重,减少权重的分散。
使用方法
nofollow标签通常有两种使用方法:
1、将”nofollow”写在网页上的meta标签上。
Meta robots标签必须放在HTML网页的head标签之间,格式:
< meta name="Robots" content="指令">
用来告诉搜索引擎不要抓取网页上的所有外部和包括内部链接:
<!--用来告诉搜索引擎不要抓取网页上的所有外部和包括内部链接-->
<meta name="robots"content="nofollow" />
nofollow还有另外的一些写法:
content中的值决定允许抓取的类型,必须同时包含两个值:是否允许索引(index)和是否跟踪链接(follow,也可以理解为是否允许沿着网页中的超级链接继续抓取)。
content部分有四个命令:index、noindex、follow、nofollow,命令间以英文的“,”分隔。
- INDEX命令:告诉搜索引擎抓取这个页面
- FOLLOW命令:告诉搜索引擎可以从这个页面上找到链接,然后继续访问抓取下去。
- NOINDEX命令:告诉搜索引擎不允许抓取这个页面
- NOFOLLOW命令:告诉搜索引擎不允许从此页找到链接、拒绝其继续访问。
根据以上的命令,我们就有了一下的四种组合:
<!--可以抓取本页,而且可以顺着本页继续索引别的链接-->
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">
<!--不许抓取本页,但是可以顺着本页抓取索引别的链接-->
<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">
<!--可以抓取本页,但是不许顺着本页抓取索引别的链接-->
<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">
<!--不许抓取本页,也不许顺着本页抓取索引别的链接-->
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">
这里需要注意的是,不要把两个对立的反义词写到一起,例如:
<META NAME="ROBOTS" CONTENT="INDEX,NOINDEX">
此外对于多命令,这里有一个简便的写法,如果是:
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">
的形式的话,可以写成:
<META NAME="ROBOTS" CONTENT="ALL">
如果是:
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">
的形式的话,可以写成:
<META NAME="ROBOTS" CONTENT="NONE">
如果是对于单独的某个搜索引擎不允许建立快照,例如谷歌,我们就可以写成:
<META NAME="Googlebot" CONTENT="INDEX,FOLLOW,noarchive">
如果在元标记中不写关于蜘蛛的命令,那么默认的命令即为如下:
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW, archive">
因此,如果我们对于这一部分把握不准的话,可以直接写上上面的这一行命令,或者是直接留空。
禁止搜索引擎建立快照:
<meta name="robots" content="noarchive">
以上的一段代码限制了所有的搜索引擎建立你的网页快照。
如果我们需要仅仅限制一个搜索引擎建立快照的话,就可以像如下这样去写:
<!--禁止Google搜索引擎对网页建立快照-->
<meta name="Googlebot" content="noarchive">
2、将”nofollow”放在超链接中。
<!--告诉搜索引擎不要抓取特定的链接。-->
<a rel="external nofollow" href="url"><span>内容</span></a>
或者更为正规的rel=”external nofollow”亦可以,即:
<a href="#" target="_blank" rel="nofollow">###</a> 。
使用示例
如某博客上有垃圾评论:
<a href="URL">顶顶</a>以下操作,即进行了 nofollow:<a href="URL" rel="nofollow" >灌水</a>
在网页的 <HEAD> 部分添加适当的 <META> 标签。
拦截所有搜索引擎把网页收录:
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
只是拦截百度蜘蛛爬取网页,而允许其他搜索引擎收录:
<META NAME="baiduspider" CONTENT="NOINDEX, NOFOLLOW">
允许搜索引擎收录你的网页,但禁止其追踪外部链接:
<META NAME="ROBOTS" CONTENT="NOFOLLOW">
允许搜索引擎收录你的网页,但禁止其收录网页上的图片:
<META NAME="ROBOTS" CONTENT="NOIMAGEINDEX">
更多内容请查看这里:Robots Meta标签
拓展应用
你可以为站点的内部链接添加nofollow。比如:联系我们、关于我们、隐私保护、公司简介、网站后台等的链接可以把它们nofollow掉。
理论上来说:
这样做,首页的PR值就不会传输给他们。因为,他们有太多的PR值显然没用;另外网站上的一些广告,因为这些广告只是让其带来IP和流量,而不是让其加重搜索引擎的权重,所以也可以加上这个nofollow标签,这样不会影响其本来意愿。
实际上博主个人的经验而言,这样做并不会给站点集中到权重从而提升排名(尤其是小网站,大型网站我并没有这样的实际经验),搜索引擎发展至今,已经是非常智能的了,我想并不会因为你没有给:联系我们、关于我们、这样的页面链接没有加上nofollow而降低你页面“权重”。
搜索引擎漫游器无法作为成员登录或注册您的论坛,因此没有理由邀请 Googlebot 追踪“在此注册”或“登录”链接。对这些链接使用 nofollow,可让 Googlebot 抓取您希望编入 Google 索引的其他网页。
不过,与主要依靠包含 nofollow 的链接区分抓取优先级相比,稳固的信息架构(直观的导航界面、用户友好和搜索引擎友好的网址等等)可能是更高效的资源。
所以不要想着通过nofollow去提升多大的蜘蛛抓取量,nofollow只是一种辅助手段,站点自身结构做好才是可靠有效的。
搜索支持
以前谷歌、和必应Bing支持,百度通过百度站长俱乐部向外宣布百度也支持nofollow标签。youdao,soso也支持该标签,不支持的有Yahoo和sogou!
友链和检查
看了以上关于nofollow标签的说明,相信各位网站建设者对于nofollow标签都已经有了一定的了解,这里要说的是,站长在交换友情链接的时候应当留意下与你交换链接的站点有没有在其所添加的友情链接上写上nofollow标签,如果在友链中写上了nofollow标签,它会阻止蜘蛛进行跟踪,同时也阻止了权重的传递。
查询的方法也很简单,我们只要直接打开对方站点页面的源文件,查看其中nofollow的事情情况。当然也并不是一定不换,如果是一些流量大的站点可以换,虽然有该标签,但是这也可以为我们的站点带来一定的流量。
就如同我们知道百度经验的外链有nofollow标签,但是百度经验的外链可以很好的为我们带来流量,我们也是可以适当的建设的。
用站长工具或者其他查询工具,查询友情链接、或者是查询域名反链。可以看到外链是否被nofollow,如果是友链被nofollow了,一定把自己网站对它的友链删掉,因为这会影响了网站的优化,是一次不公平的交换。
所以换了友情链接后要定期的去查询,发外链也要发高质量的链接。
站长之家友链查询工具地址:https://link.chinaz.com/
进入后输入网址,即可查询站点上所有的友情链接反链情况(关键词、是否nofollow等),还可以选择查询爬虫的请求头。
部分站长会在交换友链时候进行作弊,通过判断ua等信息进行返回不同的页面,如果是蜘蛛爬取,则返回带nofollow版本的页面,如果是正常用户访问,则返回不带nofollow的页面。现在随着SEO的没落,这样操作的人已经很少了,如果你要确认对方是否这样操作。
可以通过在搜索引擎搜索对方交换友链的页面,然后查看快照,是否有nofollow确定。
支持深度
google对nofollow支持的深度已经相当完美,百度对nofollow的优先级作用已经得到了证实。百度站长俱乐部里网友也就这一问题向百度提出疑问,经过官方的回答,也证实了这一点。
什么是external nofollow
external nofollow是比nofollow更专业的写法,即明确指出链接为外部链接,爬虫可以略过。
和nofollow的区别
external nofollow其实这个属性就是告诉搜索引擎不要跟踪这个链接,也就是这个链接很可能被视为一个垃圾链接,这也主要是应对 Spam而增设的一种属性。
rel=”nofollow”属性是谷歌为了应对垃圾链接而引入的一个属性值,被各大搜索引擎引用!
rel=”external nofollow”只是更相对于rel=”nofollow”参数更加规范一些而已!
rel=”external nofollow”与rel=”nofollow”其功能就中文译文”外部链接不要读取”及”不要读取”的意思!
参考内容: