百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 文章教程 > 正文

什么是 XML 站点地图?为什么要有它?

xsobi 2025-01-08 18:17 1 浏览

一份好的 XML 站点地图可以作为您网站的路线图,引导 Google 找到您所有的重要页面。XML 站点地图对 SEO 非常有利,即使您的内部链接不完美,Google 也能快速找到您的重要页面。这篇文章解释了它们是什么以及它们如何帮助您获得更好的排名。

什么是 XML 站点地图?

XML 站点地图是一个列出网站重要页面的文件,确保 Google 能够找到并抓取所有页面。它还可以帮助搜索引擎了解您的网站结构。您希望 Google 抓取您网站的每个重要页面。但有时,页面最终没有内部链接,很难找到。站点地图可以帮助加快内容发现速度。

想要扩展您对技术 SEO 的了解?我们在 Yoast SEO 学院开设了一门课程,重点介绍可抓取性和可索引性。我们讨论的主题之一是如何正确使用 XML 站点地图。

XML 站点地图是什么样的?

XML 站点地图提供了一种列出帖子和页面的标准化方式,使搜索引擎可以发现它们。这是一个非常简单的示例:具有单个 URL 的站点地图:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.yoast.com/wordpress-seo/</loc>
<lastmod>2024-01-01</lastmod>
</url>
</urlset>

它由以下几个部分组成:

  • XML 版本声明:搜索引擎爬虫使用哪个版本声明来确定读取的文件类型。
  • URL 集告诉搜索引擎有关协议的信息。
  • URL:列出页面的URL。
  • Lastmod:描述页面最后修改时间的日期格式。

每个站点地图都需要遵循此标准才有效。其他属性(如<priority>和)<changefreq>不会影响站点地图的运作或性能。

lastmod 的重要性

Google 和 Bing 已经认识到该功能的实用性lastmod。Microsoft Bing的 Fabrice Canel表示,将<lastmod>标签包含在站点地图中至关重要。Google 的 Gary Illyes表示:

“<lastmod>站点地图中的元素是一种信号,可以帮助爬?虫程序确定抓取网页的频率。”

在其XML 站点地图文档中,Google 表示:

<lastmod> “如果该值始终如一且可验证(例如通过与页面的最后修改时间进行比较)准确,Google 就会使用该 值。”

Google 还解释了如何查看lastmod页面更新日期:

“该值应反映页面最后一次重大更新的日期和时间。例如,对页面主要内容、结构化数据或链接的更新通常被认为是重要的,但对版权日期的更新则不重要。”

XML 站点地图示例

让我们看一个例子。下面,您将看到yoast.com 的基本 XML 站点地图的屏幕截图。您可以看到 yoast.com 上的所有不同站点地图。您会注意到每行末尾都有一个日期。这会告诉 Google 每篇文章的最后更新时间,并有助于 SEO,因为您希望 Google 尽快抓取您更新的内容。当站点地图中的日期发生变化时,Google 就知道有新内容可以抓取和索引。

Yoast.com 的 XML 站点地图

如您所见,Yoast.com XML 站点地图显示了几个“索引”站点地图:post-sitemap.xml、page-sitemap.xml、video-sitemap.xml 等。这种分类使站点的结构尽可能简单明了。因此,如果您点击其中一个索引站点地图,您将看到该特定站点地图中的所有 URL。例如,如果您点击,post-sitemap.xml您将看到 Yoast.com 的所有帖子 URL。

Yoast.com 的帖子 XML 站点地图

有时,如果您的网站规模很大,则需要拆分索引站点地图。单个 XML 站点地图最多可容纳 50,000 个 URL,文件大小最多为 50 MB。如果您的网站有超过 50,000 个帖子,则需要为帖子 URL 制作两个单独的站点地图,从而有效地添加第二个索引站点地图。Yoast SEO 插件将限制设置得更低(1,000 个 URL),以使您的站点地图尽可能快地加载。

哪些网站需要 XML 站点地图?

Google 的文档称,站点地图对“非常大的网站”、 “拥有大量档案的网站”、 “只有少量外部链接的新网站”“使用富媒体内容的网站”非常有用。据 Google 称,适当的内部链接应该可以让它轻松找到所有内容。不幸的是,许多网站没有在逻辑上正确地链接其内容。

虽然我们同意这些网站从拥有 XML 站点地图中获益最多,但在 Yoast,我们认为 XML 站点地图对每个网站都有好处。随着网络的发展,正确地索引网站变得越来越困难。这就是为什么你应该为搜索引擎提供所有可用的选项来找到它。此外,XML 站点地图使搜索引擎的抓取过程更高效、更环保。

每个网站都需要 Google 来轻松找到重要页面并了解它们上次更新的时间。这就是 Yoast SEO 插件中包含此功能的原因。

您的 XML 站点地图中应该包含哪些页面?

如何决定将哪些页面包含在 XML 站点地图中?首先要考虑 URL 的相关性:当访问者访问某个 URL 时,结果是否良好?您是否希望访问者访问该 URL?如果不希望,则可能不应将其包含在内。但是,如果您不希望该 URL 出现在搜索结果中,则必须 添加“noindex”标签。将其从站点地图中删除并不意味着 Google 不会为该 URL 编制索引。如果 Google 可以通过跟踪链接找到它,则 Google 可以为其编制索引。

例如:一个新博客

例如,您正在创建一个新博客。当然,您希望确保目标受众能够在搜索结果中找到您的博客文章。因此,最好立即将您的文章包含在 XML 站点地图中。可以肯定的是,您的大多数页面也会成为访问者的相关结果。但是,人们在订阅您的时事通讯后会看到的感谢页面并不是您希望出现在搜索结果中的内容。在这种情况下,您不想从站点地图中排除所有页面,而只想排除这个页面。

让我们继续以新博客为例。除了博客文章之外,您还创建了一些类别和标签。这些类别和标签将具有存档页面,其中列出了该特定类别或标签中的所有帖子。但是,最初可能没有足够的内容来填充这些存档页面,从而使它们成为“内容单薄”的页面。例如,仅显示一篇帖子的标签存档对访问者来说还不那么有价值。您可以在开始博客时将它们从站点地图中排除,并在拥有足够多的帖子后将它们包括在内。您甚至可以使用 Yoast SEO 同时排除所有标签页面或类别页面。

但是,这种页面也可能是极好的排名材料。因此,如果您认为:好吧,是的,这个标签页面现在有点“单薄”,但它可能是一个很棒的着陆页,那么请用额外的信息和图片来丰富它。在这种情况下,不要将其从站点地图中排除。

如何让 Google 找到您的站点地图

如果您希望 Google 更快地找到您的 XML 站点地图,则需要将其添加到您的 Google Search Console 帐户。您可以在“站点地图”部分找到您的站点地图。如果没有,您可以在页面顶部添加您的站点地图。

添加站点地图有助于检查 Google 是否已将其中的所有页面编入索引。如果某个站点地图上的“已提交”和“已编入索引”数字相差很大,我们建议您进一步调查。也许存在导致 某些页面无法编入索引的错误 ?另一种选择是添加更多指向尚未编入索引的内容的链接。

Google 正确处理了帖子站点地图中的所有 URL

如何使用 Yoast SEO 将 XML 站点地图添加到您的网站

由于其 SEO 价值,我们在 Yoast SEO 插件中添加了创建 XML 站点地图的功能。它们在插件的免费版和高级版中均可用。我们会自动为您制作,并将它们放置在正确的位置。您不必担心 XML 站点地图应放在哪里,也不必担心针对搜索引擎对其进行优化。

尽管我们与 Google 合作将 XML 站点地图原生引入 WordPress,但我们在 Yoast SEO 中提供了站点地图的高级版本。WordPress 版本是基础版本,远不如 Yoast SEO 中的版本精细,但功能齐全。如果您安装 Yoast SEO,我们会自动为您禁用 WordPress 站点地图。

Yoast SEO 会自动为您的网站创建 XML 站点地图。单击 WordPress 安装侧栏中的“SEO”,然后选择常规下方的“站点功能”选项卡。向下滚动到 API 部分:

您可以在 Yoast SEO 的“常规”>“站点功能”设置中找到 XML 站点地图

在此屏幕中,您可以使用功能下方的滑动按钮为您的网站启用或禁用不同的 XML 站点地图。此外,您可以点击“了解更多”来详细了解 XML 站点地图是什么以及为什么您需要它。点击“查看 XML 站点地图”以查看您网站的 XML 站点地图。

如何从 XML 站点地图中排除内容类型

您可以在 Yoast SEO 设置“内容类型”部分中从 XML 站点地图中排除内容类型。点击要排除的内容类型(例如,帖子),然后使用“在搜索结果中显示帖子”旁边的滑块按钮将其禁用。如果这样做,此内容将不会包含在您的 XML 站点地图中。

确定您想要在 XML 站点地图中看到的内容

这并不意味着我们建议将您的帖子和页面从 XML 站点地图中排除。但您可以控制在 XML 站点地图中显示哪些内容类型。您也可以对单个帖子和页面执行此操作,方法是转到 Yoast SEO 元框或侧边栏中的高级设置,然后选择“允许搜索引擎在搜索结果中显示此帖子/页面?”中的选项。想了解更多关于何时以及为什么应该从 XML 站点地图中排除某些内容的信息吗?阅读我们关于在 Yoast SEO 中编制索引的帖子:在 Google 的搜索结果中显示哪些页面。

有关 XML 站点地图的常见问题解答

关于 XML 站点地图有很多问题,因此我们在下面的常见问题解答中回答了几个。

当 Google Search Console 显示 XML 站点地图有错误时会发生什么?

如果 XML 站点地图无效或搜索引擎无法正确读取,您必须找出列出的错误类型。如果搜索引擎无法读取 XML 站点地图,请确保将其提交给搜索引擎网站管理员工具。如果它无效,请检查错误并找到问题的具体解决方案。

如何检查网站是否有 XML 站点地图?

在大多数情况下,您可以通过将 sitemap.xml 添加到根域来查明网站是否具有 XML 站点地图。因此,这将是 example.com/sitemap.xml。如果网站安装了 Yoast SEO,您会注意到它被重定向到 example.com/sitemap_index.xml。Sitemap_index.xml 是基础站点地图,它将您网站上的所有站点地图收集在一个页面上。

如何更新 XML 站点地图?

有几种方法可以手动制作和更新站点地图,但您不应该这样做。此外,还有静态生成器可以帮助您随时制作站点地图。但是,同样,每次添加或更新内容时都需要重复此过程。最好的方法是使用 Yoast SEO。在 Yoast SEO 中打开 XML 站点地图并返回站点 - 所有更新都将自动进行。

我可以在我的 XML 站点地图中使用 <priority> 吗?

过去,人们确信<priority>在站点地图中添加此属性会向 Google 发出信号,表明 Google 需要优先处理特定的 URL。不幸的是,它没有任何作用,因为 Google 经常提到他们不会使用此属性来读取和优先处理站点地图中找到的内容。

检查您自己的 XML 站点地图!

现在,您知道拥有 XML 站点地图有多重要:拥有一个站点地图可以帮助您网站的 SEO。如果您添加正确的 URL,Google 可以轻松访问您最重要的页面和帖子。Google 还可以轻松找到更新的内容,因此他们知道何时需要再次抓取 URL。最后,将您的 XML 站点地图添加到 Google Search Console 可帮助 Google 快速找到您的站点地图,并允许您检查站点地图错误。

因此,请检查您的 XML 站点地图并确定您是否做得正确!

相关推荐

什么是 XML 站点地图?为什么要有它?

一份好的XML站点地图可以作为您网站的路线图,引导Google找到您所有的重要页面。XML站点地图对SEO非常有利,即使您的内部链接不完美,Google也能快速找到您的重要页面。这篇文...

springboot整合mybatis使用xml实现sql语句的查询配置

首先肯定还是引入mybatis依赖<!--https://mvnrepository.com/artifact/org.mybatis.spring.boot/mybatis-spring-b...

IDEA 这么设置 Maven,再也不用担心依赖下载失败了

Hello,大家好,我是楼下小黑哥。B站视频版本...

WordPress网站被利用xmlrpc.php攻击解决办法

最近看了百度云加速后台的数据报表,发现有很多针对WordPress的攻击,其实就是利用xmlrpc.php文件来攻击。虽然目前站点一切安好,但是据说如果不采取相应措施解决的话,很有可能会被这些攻击导致...

看大佬对Maven讲解有多深,Maven setting.xml文件 了解一下

通常我们安装了Maven之后会对Mavensetting.xml(Maven的配置文件做一些自定义),本章我们将详细地学习一下Mavensetting.xml文件。文件位置一般存在与Maven安装...

XML文档篇(二):认识 xsd 文档

前面介绍了基于XML的DTD,详见:XML文档篇:认识DTD(一)。今天再来分享一个它的替代者,...

Mybatis 中xml和注解映射,分分钟搞定

MyBatis提供了XML配置和注解配置两种方式。今天就来搞搞这两种方式是如何实现的。...

您的网站需要XML站点地图吗?

昨天有人咨询我们:“向百度提交网站地图有多重要?”首先,让我们了解一下“XML网站地图有多重要?”您是否需要XML网站地图?...

详细解释Xml中的Schema约束(保姆级)

我本人总是爱忘记这个约束,说实话不是太难,因此想写这篇文章详细记录下,希望对有同样需要的小伙伴能够提供帮助。Xml约束主要有两种:dtd约束(比较简单)schema约束(常用、复杂)dtd约束比较简单...

HTML和xml有哪些区别?

HTML和XML都是用于描述和组织数据的标记语言,但它们之间有着许多区别。本文将详细介绍HTML和XML的区别,包括语法、标记、应用场景等方面。一、语法差异...

开源XML数据库 BaseX

BaseX是一个开源的XML数据库系统,包括一个前端用户操作管理界面XQueryEditor。提供高效的XPath和XQuery处理,包含了对W3CUpdate和FullText扩展的全...

一篇文章让你弄清楚XML文件的规范与使用

可扩展标记语言(ExtensibleMarkupLanguage,简称XML)是一种标记语言。所谓的标记是指计算机所能理解的信息符号,通过标记可以实现软件开发者与计算机之间的信息沟通。我们常见的H...

Python 3 实现在线xml sitemap索引文件提取URL到指定文件

毫无疑问,在SEO分析网站结构和开放搜索引擎端抓取页面数时,对sitemap文件的分析是最好的入手点。通常规模不是太小的网站URL数量都会超过5万条,而搜索引擎要求单个sitemap文件的数量不能超过...

从零开始学Java之带你学会解析XML文件

一.XML简介1.概念XML(ExtensibleMarkupLanguage,可扩展的标记语言),作为一种标记语言,它是标准通用标记语言的子集。XML给我们提供了可扩展性和自定义标签的特性...

解除 网课失去焦点/离开页面 就自动暂停 的限制

用代码解决实际生活中的问题h5如果视频是video元素,可以写个定时器,每秒钟设置一下播放状态...