SEO优化-通过 301 和 canonical 整合重复网址


原文链接: SEO优化-通过 301 和 canonical 整合重复网址

整合重复网址

使用 rel="canonical" link 元素标记所有重复的网页

rel canonical 属性值 -- rel="canonical"属性让搜索引擎知道当前网站中的重复或相似网页中,哪一个页面才是站长想让其抓取与收录的

canonical属性值通常在,rel属性中出现
引用网址:http://www.dreamdu.com/xhtml/rel_canonical/
canonical从功能上来讲,可理解为301永久重定向的辅助功能
canonical可以与相对链接或绝对链接一起使用,但是建议使用绝对链接
Google对canonical的定义是:规范网页是一组内容高度相似的网页的首选版本
canonical:中文"典范"的意思

示例

<link rel="canonical" href="http://dreamdu.com/" />

指定网页http://www.dreamdu.com/为搜索引擎应收录的链接(规范链接)。可以将上述代码复制到所有非规范网址的head部分,例如网址www.dreamdu.com、www.dreamdu.com/default.html、www.dreamdu.com/index.html等
参考

Google关于rel="canonical" - 网站站长工具帮助

Google 元标记 索引跟踪

这些元标记可以控制搜索引擎的抓取和索引编制行为。robots 元标记适用于所有搜索引擎,而“googlebot”元标记专用于 Google。默认值是“index, follow”(相当于“all”),不需要进行指定。我们可以识别以下值(指定多个值时,请使用英文逗号进行分隔):

noindex:防止网页被编入索引。 https://support.google.com/webmasters/answer/61050
nofollow:防止 Googlebot 跟踪此页面中的所有链接。https://support.google.com/webmasters/answer/96569
nosnippet:防止文本摘要或视频预览显示在搜索结果中。对于视频,将改为显示一张静态图片(如果可以的话)。
noarchive:防止 Google 显示网页的缓存链接。
unavailable_after:[date]:可让您指定要停止抓取此网页及将其编入索引的确切日期和时间
noimageindex:可让您指定您不希望自己的网页显示为 Google 搜索结果中所显示图片的引荐来源网页。
none:相当于 noindex, nofollow。

现在,您还可以使用“X-Robots-Tag”HTTP 标头指令在网页的标头中指定此信息。如果您要限制将非 HTML 文件(如图形或其他类型的文档)编入索引,这种方法尤其实用。详细了解漫游器元标记

至於follow這個值是指,若你希望搜尋引擎在抓取此頁面時,不進一步的去抓取該頁面所連出去的連結,你就填上nofollow的值。這個功能通常會用在社群論壇或是網站討論版,是為了防止有人在你的頁面上亂貼連結來意圖增加他的SEO 反向連結及排名,使用nofollow的話搜尋引擎的抓取會在該頁面停止,不繼續往其他連結前進,固可以防止亂貼連結的事情發生。

兩個值的功用完全不同,我來舉幾個範例讓你完全清楚如何使用。

  1. < meta name=”robots” content=”noindex , nofollow”>

這個做法便是告訴搜尋引擎,不要索引我的網站,並且在抓取資料時該頁面的相關連結也不要去抓取。

  1. < meta name=”robots” content=”index , nofollow”>

抓取資料時該頁面的相關連結不要抓取。

3.< meta name=”robots” content=”noindex , follow”>

不要索引我的頁面,但頁面上所有的連結請正常抓取(最常用之使用方式)

4.< meta name=”robots” content=”index , follow”>

這個做法就沒有任何意義,加上這段標籤跟沒加的道理是一樣的,等於搜尋引擎將正常索引及抓取。

`