规范标签

内容

URL 规范化是决定 URL 的最终版本,并在所有链接回最终页面的页面上添加规范标签的过程。

什么是 Canonical 标签?

canonical标签,也称为"rel canonical",是一个HTML标签,告诉搜索引擎封闭的URL是页面的原始、最终版本。规范化的URL。

标签放在页面的<head>部分,看起来像这样:

<link rel="canonical" href="https://www.example.com">

从实际角度来看,canonical标签告诉谷歌你希望在搜索结果中显示哪个页面。

为什么规范标签很重要?

人类倾向于认为外观相同、内容相同的页面都是同一个页面。比如主页就是主页就是主页。然而,搜索引擎并不是这样工作的。它们将不同的 URL 视为不同的页面,即使它们提供相同的内容。

所以对于谷歌来说,所有这些 URL 都是独立的页面:

  • https://www.example.com
  • www.example.com/
  • https://www.example.com/index.php
  • example.com

对于 Google 来说,即使所有人只能看到一个页面,你的主页可能有 5 个独特的副本。这种情况可能会导致你遭受与重复内容相关的一些问题。

当谷歌遇到这三个网址时会发生什么

Copied pages without canonicals confused bots

向链接到您的规范URL的4个副本添加规范标签,告诉谷歌忽略这些副本并转向原始内容:

image alt text

现代内容管理系统和网站在根据用户动态显示内容时可能会导致这个问题。电子商务平台也可能是罪魁祸首,因为它们会显示同一产品的多个版本(颜色、尺寸、型号等)。

重复内容也可能是有意为之,比如当你创建只有微小差异的着陆页面时。这在 PPC 和电子邮件营销活动中是相对常见的做法。

这如何帮助您的网站?

虽然谷歌没有"重复内容惩罚",但托管复制页面可能会对您的搜索引擎优化造成严重问题:

  • 稀释链接建设:有时候人们并不总是链接到正确的URL版本。他们经常省略https部分或添加尾随斜杠。如果没有规范标签,这些链接传递的链接权重将不会分配给正确的页面。
  • 阻止爬虫:托管重复内容会让Google的爬虫“浪费”时间查看他们已经看过的内容的副本。如果他们认为网站主要是重复内容,Google就不太可能查看网站上的更多页面。

使用 canonical 标签来防止重复内容问题有助于预防这些问题。

为您的页面添加规范标签

如上所述,规范标签的代码如下所示:

<link rel="canonical" href="https://www.example.com">

它放在页面的<head>部分。页面的<head>是页面HTML代码中出现在<head></head>标签之间的所有代码。

如何添加页面的 canonical 标签完全取决于您的网站类型。如果您有 WordPress 网站,可以使用以下其中一个 SEO 插件来添加 canonical 标签:

规范标签最佳实践

canonical 标签是一个相对简单的代码片段,但在使用时遵循最佳实践绝对至关重要。由于 canonical 告诉 Google 基本上忽略当前页面并转到 canonical URL,你很容易搞砸你的网站的 SEO。

自引用规范

页面不一定要使用自引用的规范标签,但这样做也无妨。自引用的规范标签是指页面包含一个指向自身的规范标签。例如,https://www.example.com/page1 包含了这样的规范标签:

<link rel="canonical" href="https://www.example.com/page1">

再次强调,你不一定要这样做,但这样做也没有坏处。乍一看这似乎很明显,但在SEO领域这是一个常见的问题。

确保您的规范URL可访问

再次,这可能是显而易见的。为什么你会说一个页面是权威版本,然后将谷歌重定向到另一个URL?或者重定向到一个返回404的URL?或者重定向到被robots.txt阻止的URL?但这确实会发生。

只规范化返回200状态码并在robots.txt文件中允许的URL。确保您的规范化URL也在您网站的XML站点地图中列出。检查规范化URL是否存在noindex标签

如果您使用的是动态生成 canonical 标签的程序,请仔细检查您的 canonical 标签。一些插件和 CMS 平台会为您网站上发布的每个 URL 写入一个唯一的自引用 canonical 标签,这完全违背了 URL 规范化的初衷。

使用绝对 URL

在为 canonical 标签添加 URL 时,始终包括完整的 URL。这意味着 URL 必须包括以下部分:

  • https://的部分
  • www(如果它是您首选域的一部分)
  • 您的域名
  • .com部分。

这些被称为“绝对URL”。仅包括“.com”后面部分的URL被称为“相对URL”,当Google读取您的规范标签时不会被识别。

如果您不使用绝对 URL,Google 将会忽略该标签。

你可以在不同域之间进行规范化

如果你拥有网站A(websitea.com)和网站B(websiteb.com),你可以将网站A指向网站B的 canonical 标签。这对于发布相同内容在多个网站上的媒体公司来说是有意义的,但他们只想让一个网站排名。

不要创建“规范链”

我们只是编造了“规范链”,但可以将其视为给页面A添加指向页面B的标签。然后添加指向页面C的页面B的规范标签。这会向谷歌发送模棱两可的信号,因为你在告诉它两个不同的URL是页面的最终版本。

这种模棱两可的规范情况很可能会导致谷歌忽略你的规范标签。

相反,决定一个规范版本(页面C),然后将所有版本指向该版本。因此,在页面A和页面B上都放置指向页面C的规范标签。

常见的规范标签错误

没有人是完美的。所以偶尔你可能会在你的规范标签中犯错。以下是人们在URL规范化中常犯的错误。

规范链接和分页

您可以在分页内容中使用规范标签。这不是错误。然而,当人们意外地将规范标签添加到每个指向第一页的页面时,错误经常发生。因此,例如,https://www.example.com/content_page1 应该有这个规范标签:

<link rel="canonical" href="https://www.example.com/content_page1">

链条中的下一页,https://www.example.com/content_page2,应该有这个标签:

<link rel="canonical" href="https://www.example.com/content_page2">

人们遇到麻烦的地方是当他们将这个标签添加到https://www.example.com/content_page2时:

<link rel="canonical" href="https://www.example.com/content_page1">

这将阻止谷歌索引内容的第二页。

规范链接和hreflang

再次,使用规范标签和hreflang标签是完全可以的。但是,很容易出错,比如意外地将一个语言的页面规范化到另一种语言的相同页面。这就是hreflang标签的作用。

如果您同时使用了canonicals hreflangs,请仔细检查英语页面的canonicals是否指向英语URL,西班牙语页面的canonicals是否指向西班牙语URL。

例如,如果 https://www.example.com 是规范的 URL,同时也有西班牙语版本,那么规范标签和 hreflang 应该如下所示:

<link rel="canonical" href="https://www.example.com"> <link rel="alternate" hreflang="en" href="https://www.example.com"> <link rel="alternate" hreflang="es" href="https://www.example.com/es">

简单易懂,但如果你不够注意,很容易出错。

在不相似的页面上使用规范标签

许多网站都会有多个页面涵盖相同的主题。在 WooRank,我们有多篇关于关键词研究、内容营销、高级 SEO 以及许多其他主题的博客文章。电子商务网站可能会有两种非常相似的产品,其描述和规格也相似。

然而,这些页面有两个非常不同的目的,即使它们非常相似,也不应该包含彼此的规范链接。

如果你过于激进地使用规范标签,谷歌可能会决定完全不信任你网站上的规范标签。这意味着它将不会在 任何 页面上尊重规范标签,从而导致上述潜在的重复内容问题。

接下来呢?

一旦你理解了规范标签,这就不是一个那么复杂的主题。如果你遵循最佳实践,你可以轻松地使用规范标签来保持你的网站对谷歌的爬虫进行优化。

如果您已经在使用规范标签,请考虑使用WooRank的网站抓取或其他网站抓取软件对您的网站进行审计,以确保您遵循规范的最佳实践。

如果您已经设置好了规范标签,请考虑转向与 Google 爬取和理解您的网站相关的这些主题:

总结
URL规范化是决定URL的最终版本并在所有链接回最终页面的页面上添加规范标签的过程。规范标签告诉搜索引擎封闭的URL是页面的原始、最终版本。它有助于解决重复内容问题,防止链接建设稀释和搜索引擎爬行受阻。添加规范标签的最佳实践包括自引用规范、确保规范URL可访问、使用绝对URL和避免创建规范链。常见的规范标签错误包括在分页内容和hreflang标签中错误使用规范标签,以及在不相似的页面上使用规范标签。