然后继续内部链接到非规范版

令人惊讶的是,我经常看到有人在页面的一个版本上设置 301 或规范,本并使用非规范 URL 填充其 XML 站点地图。内部链接是强烈的信号,发送混合信号只会给你带来麻烦。 (13)什么也不做。 最后,你可以让搜索引擎来整理。这就是谷歌多年来建议你做的事情。不幸的是,根据我的经验,这几乎总是一个坏主意,特别是对于大型网站。

然而值得注意的是

并非所有重复内容都是灾难,谷歌当然可以过滤掉其中的一些内容,而不会 电话号码数据 造成重大后果。如果您只有几个孤立的重复项,那么将它们单独保留是一个完全有效的选择。 (14) 相对=“备用”hreflang=“x” (添加于 2012 年 4 月 2 日 – 向@YuriKolovsky 致敬)。

自这篇文章发布以来

Google 引入了一种新方法来处理翻译内容和同语言内容的区域差异(例如 如何提高客户响应时间 | 美国英语与英国英语)。这些标记的实现非常复杂且高度情境化,但这里是对 hreflang=”x” 属性的完整描述。 V. 重复内容的示例。 那么,既然我们已经向后工作并配置了工具来修复重复的内容,那么它实际上是什么样子的呢?我将介绍各种各样的示例,这些示例代表了您在真实网站上可能遇到的问题。

在本节中

我将参考第 IV 节中列出的解决方案 – 例如,参考 301 重定向 (IV-2)。 (1) “www”与非 www 对于整个网站 消費者數據  上的重复内容,这可能是最大的罪魁祸首。无论您的门户是坏的还是您吸引了错误 URL 的链接和社交提及,您的 URL 都会同时拥有“www”和非 www(根域)版本: www 与非 www 示例 大多数时候,301 重定向 (IV-2) 是您的最佳选择。

这是一个常见问题

Google 很擅长在此类情况下尊重重定向。 您可能还想在 Google 网站管理员工具中设置您的首选地址。在“站点配置”>“设置”下,您应该看到一个名为“首选域”的部分: GWT 首选域屏幕 GWT 有一个怪癖,为了设置首选域,您可能必须为站点的“www”和非 www 版本创建 GWT 配置文件。

虽然很烦人,但不会造成伤害。如果您有重大的规范化问题,我会推荐它。如果您不这样做,您几乎可以不理会它,让 Google 确定首选域。 (2) 临时服务器 尽管比(1)少见得多,但这个问题也经常是由子域引起的。在典型情况下,您正在重新设计网站以重新启动,您的开发团队为新网站设置了一个子域,并且他们不小心将其开放给爬虫。

您最终会得到两组索引 URL,如下所示: 暂存 URL 示例 最好的办法是通过使用 Robots.txt (IV-3) 阻止暂存站点来防止此问题发生。但是,如果您发现临时站点已被索引,则可能需要对这些页面进行 301 重定向 (IV-2) 或对它们进行 Meta Noindex (IV-4)。

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部