建站SEO优化之站点地图sitemap

文章目录

    • 编写规范
    • 小型网站站点地图
      • 小型网站规范示例
      • 站点地图说明
    • 大型网站站点地图
      • 大型网站规范示例
      • 以豆瓣站点地图为例

近期文章

  • 个人建站做SEO网站外链这一点需要注意,做错了可能受到Google惩罚
  • 一文搞懂SEO优化之站点robots.txt
  • 网页常见水印实现方式
  • Node.js中那些常用的进程通信方式
  • 浅谈微前端沙箱机制
  • 实现篇:手把手打造一个番茄时钟
  • 实现篇:二叉树遍历收藏版
  • 实现篇:LRU算法的几种实现
  • 从底层视角看requestAnimationFrame的性能增强
  • Nginx Upstream了解一下
  • 实现篇:一文搞懂Promise是如何实现的
  • 一文搞懂 Markdown 文档规则

很早以前一直觉得站点地图可有可无,反正搜索引擎爬虫都会自己去爬站内各种连接。但是对于一个新站或经常更新的站点来说,站点地图很重要性,是快速告诉搜索引擎站内有哪些内容或更新了哪些内容。并且还能针对不同以页面配置优先级等。

原文地址:建站SEO优化之站点地图sitemap

站点地图通常在 robots.txt 文件中声明,具体可看之前的文章(一文搞懂SEO优化之站点robots.txt)

编写规范

比较常见是 xml类型站点地图,还有RSS、mRSS 、Atom 1.0(与xml类型类似)以及文本类型站点地图。本篇主要说一说xml格式中如何实现。

因为站点地图是描述网站中都有哪些页面,不同体量的网站网页数差别很多,大型网站可能上万或几十万个网页,小型网站可能就几十个网页。如果都放到站点地图文件里会使文件太大读取困难,并且搜索引擎爬虫通常也会对站点地图大小有要求,比如谷歌就要求站点地图不能大于50M,且不超过5万个站点,那其余网站怎么办?

小型网站站点地图

小型网站规范示例

例如:https://ai-bar.com/sitemap.xml

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"><url><loc>https://ai-bar.cn/tools</loc></url><url><loc>https://ai-bar.cn/tools/wechat-editor</loc><lastmod>2025-06-04</lastmod><changefreq>weekly</changefreq><priority>0.8</priority></url><url><loc>https://ai-bar.cn/news</loc><lastmod>2025-06-04</lastmod></url>
</urlset>

站点地图说明

整个站点地图信息都是通过 urlset 标签包裹,内部每一个网站链接都是通过 url 标签定义,其中 loc 是必须要有的,lastmodchangefreqpriority 为非必须的。

  • urlset 站点地图外层容器标签,照抄即可。
  • url 定义站点链接信息的父标签
  • loc 必须有,定义具体链接,必须包含域名的绝对地址,如 https://ai-bar.cn/tools,不能是相对地址如 /tools
  • lastmod 可选,最新修改时间,可是 2025-06-06,也可以是 2025-06-06T18:00:12+00:00
  • changefreq 可选,定义页面更新频率,可选值有 alwayshourlydailyweeklymonthlyyearlynever,其中 always 为每次访问网页都会变化,never 存档不更新。尽管这么规定了,实际上搜索引擎爬虫并不完全根据这里的规定来抓取。
  • priority 可选,定义页面优先级,从 0.01.0,这个标签的定义不会影响页面在搜索中的排名,只会影响在本站中的重要性。

注意
这里设置的值是相对的,如果所有页面都设置的很高,实际上搜索引擎会认为没有重要性或重要性一样,所以应根据实际情况定义。我自己在生成站点地图的时候会根据网页的目录层级来动态生成优先级,每多一个层级就减少0.2,一般来说页面的目录层级不超过3层最好。

详细规范可以看这里https://www.sitemaps.org/protocol.html

大型网站站点地图

前面介绍的是页面较少的小型网站的站点地图,对于页面较多的大型网站有所不同。

大型网站规范示例

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"><sitemap><loc>https://test.com/sitemap1.xml</loc><lastmod>2025-06-05</lastmod></sitemap><sitemap><loc>https://test.com/sitemap2.xml</loc></sitemap>
</sitemapindex>

这个站点地图其实是管理子站点的索引文件,普通站点的 urlset 标签被替换为了 sitemapindexurl 标签被替换为了 sitemap,其余的没有什么变化。不过仔细观察可以发现,loc 中定义的不是单个网址,而是xml 的普通站点地图。

以豆瓣站点地图为例

站点地图为:https://www.douban.com/sitemap_index.xml,可以发现大约定义了 1万<sitemap>,每一个 <sitemap> 定义了 gzip 压缩的xml普通站点地图。

<?xml version="1.0" encoding="utf-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"><sitemap><loc>https://www.douban.com/sitemap.xml.gz</loc><lastmod>2025-05-31T20:22:12Z</lastmod></sitemap><!-- 其他... --><sitemap><loc>https://www.douban.com/sitemap9985.xml.gz</loc><lastmod>2025-05-31T20:22:12Z</lastmod></sitemap>
</sitemapindex>

随机下载一个发现就是前面介绍的普通网站的站点地图。

<?xml version="1.0" encoding="utf-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"><url><loc>https://movie.douban.com/celebrity/1524905/movies</loc><priority>0.7</priority><changefreq>weekly</changefreq></url><!-- 其他行... -->
</urlset>

不看不知道,一看真是惊呆了,每一个站点地图也包含了巨量的网页,随机下载了几个测试,每个几乎都有 7万个 左右的链接定义,当然也有少一些的。这么粗算下来:1万个站点地图 * 7万个链接 ,豆瓣岂不是有7亿个页面!!

好了今天就研究这么多。由此可见,大型网站(尤其C端)并不是这么容易维护,就站点地图的生成、不同子站或模块如何维护更新频率,还有更新时间等就需要统一平台来管理。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/pingmian/84602.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java分层开发必知:PO、BO、DTO、VO、POJO概念详解

目录 引言一、核心概念与定义1、PO&#xff08;Persistent Object&#xff0c;持久化对象&#xff09;2、BO&#xff08;Business Object&#xff0c;业务对象&#xff09;3、DTO&#xff08;Data Transfer Object&#xff0c;数据传输对象&#xff09;4、VO&#xff08;View O…

Linux下OLLAMA安装卡住怎么办?

网络环境不理想&#xff0c;经常在官方的linux安装脚本执行时卡住&#xff0c;其实主要是下载文件卡住&#xff0c;于是我想到了是否可以把其中下载的过程显化、分步&#xff0c;这样更可控&#xff0c;于是修改了官方的install.sh #!/bin/sh # This script installs Ollama o…

C++面试(5)-----删除链表中指定值的节点

操作系统&#xff1a;ubuntu22.04 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 给定一个单向链表的头节点 head 和一个特定值 val&#xff0c;要求编写一个函数来删除链表中所有值等于 val 的节点&#xff0c;并返回修改后的链表头节点。 示例&#xff1a; 输…

如何用AI赋能学习

由于博主是大学生&#xff0c;今天花费了大量的时间去进行期末的复习&#xff0c;不过从复习中得到了一些学习的灵感&#xff0c;即&#xff1a;如何用AI赋能学习 当我们需要掌握一门新的技能的时候&#xff0c;我们很容易的想到三种办法&#xff1a;买书自己学&#xff0c;报…

【threejs】每天一个小案例讲解:常见材质

代码仓 GitHub - TiffanyHoo/three_practices: Learning three.js together! 可自行clone&#xff0c;无需安装依赖&#xff0c;直接liver-server运行/直接打开chapter01中的html文件 运行效果图 知识要点 1. MeshBasicMaterial&#xff08;基础网格材质&#xff09; • 特…

springboot后端与鸿蒙的结合

软件&#xff1a;鸿蒙devceo3.1&#xff0c;springboot项目采用IDEA 目的&#xff1a; 1、结合springboot后端与鸿蒙的结合运用。 2、Log日志查看console语句的信息。 3、引入 import http from ohos.net.http。 4、调用springboot后端提供的链接发送post 5、TextInput的…

minio集群通过mc mirror命令进行定时备份,支持X86和arm两种架构

文章目录 前言一、思路二、使用步骤1.下载mc二进制文件2.手动测试备份命令3.配置定时任务4.成功截图 总结 前言 通过mc mirror命令对minio集群进行定时备份。 一、思路 通过mc mirror命令配合crond定时任务进行周期性的备份 二、使用步骤 1.下载mc二进制文件 wget https:…

三大能力升级,为老项目重构开辟新路径

在软件技术飞速迭代的今天&#xff0c;老项目重构是开发者们绕不开的难题。接口实现缺失、业务逻辑矛盾、架构规划偏离等问题如同拦路虎&#xff0c;让重构工作举步维艰。而传统的 AI 辅助方式&#xff0c;因未充分关联项目实际情况&#xff0c;犹如 “空中造楼”&#xff0c;难…

AES加密

AES加密算法详解 AES&#xff08;Advanced Encryption Standard&#xff09;是一种对称密钥分组加密算法&#xff0c;用于保护电子数据的安全性。其核心特点是通过相同的密钥进行加密和解密&#xff0c;属于对称加密体系。。以下从核心特性、加密流程及安全性三方面展开说明&a…

关于联咏(Novatek )自动曝光中Lv值的计算方式实现猜想

目录 一、常见Lv对应的实际场景 二、常见光圈值 三、最小二乘法计算SV中的系数K

[docker]镜像操作:关于docker pull、save、load一些疑惑解答

在使用 Docker 的过程中&#xff0c;镜像管理是极其重要的一环。无论是拉取、保存还是加载镜像&#xff0c;每一个步骤都可能遇到一些疑问或者误区。 本文将结合实际案例&#xff0c;对常见的 Docker 镜像操作问题进行系统性总结&#xff0c;帮你更好地理解 Docker 镜像的工作机…

SFTrack:面向警务无人机的自适应多目标跟踪算法——突破小尺度高速运动目标的追踪瓶颈

【导读】 本文针对无人机&#xff08;UAV&#xff09;视频中目标尺寸小、运动快导致的多目标跟踪难题&#xff0c;提出一种更简单高效的方法。核心创新在于从低置信度检测启动跟踪&#xff08;贴合无人机场景特性&#xff09;&#xff0c;并改进传统外观匹配算法以关联此类检测…

什么是渗透测试,对网站安全有哪些帮助?

在网络安全的战场中&#xff0c;网站如同暴露在数字世界的堡垒&#xff0c;时刻面临着黑客攻击的威胁。而渗透测试&#xff0c;就像是为网站进行一场 “模拟攻防演练”&#xff0c;它以黑客的思维和手段&#xff0c;主动出击&#xff0c;探寻网站潜在的安全漏洞。究竟什么是渗透…

KU115LPE-V10型FPGA加速卡

KU115LPE-V10是一款基于PCI Express总线通信的FPGA加速类产品。 该产品基于Xilinx公司的的高性能Kintex Ultra-Scale FPGA设计&#xff0c;配置最大两组DDR4缓存单元&#xff0c;每组最大支持4GB容量&#xff0c;72bit&#xff08;包含ECC&#xff0c;8bit&#xff09;&#x…

【笔记】Blockchain

区块链Blockchain是一种分布式数据库技术&#xff0c;其核心特点在于去中心化、不可篡改和透明性。它通过一系列按照时间顺序排列的数据块&#xff08;即“区块”&#xff09;组成&#xff0c;每个数据块都包含了一定时间内的一系列信息交易&#xff0c;并通过密码学方法确保这…

GitHub Desktop Failure when receiving data from the peer

目录 安装Github Desktop简易省流助手 解决 Git 克隆时出现的 "Failure when receiving data from the peer" 错误1. 网络连接问题原因&#xff1a;解决办法&#xff1a; 2. Git 配置问题原因&#xff1a;解决办法&#xff1a; 3. GitHub 服务故障原因&#xff1a;解…

疏锦行Python打卡 DAY 27 函数专题2:装饰器

def logger(func):def wrapper(*args, **kwargs):print(f"开始执行函数 {func.__name__}&#xff0c;参数: {args}, {kwargs}")result func(*args, **kwargs)print(f"函数 {func.__name__} 执行完毕&#xff0c;返回值: {result}")return resultreturn wr…

大模型布署如何选择GPU资源?

当前主流GPU型号及其显存大小&#xff08;显存“大小”&#xff09;的详细分类汇总&#xff0c;结合消费级、专业工作站级及数据中心级三大应用场景&#xff0c;数据综合自行业常用型号及最新产品信息&#xff08;截至2025年6月&#xff09;&#xff1a; &#x1f3ae; 一、消费…

目标检测——YOLOv12算法解读

论文&#xff1a;YOLOv12: Attention-Centric Real-Time Object Detectors (2025.2.18) 作者&#xff1a;Yunjie Tian, Qixiang Ye, David Doermann 链接&#xff1a;https://arxiv.org/abs/2502.12524 代码&#xff1a;https://github.com/sunsmarterjie/yolov12 YOLO系列算法…

JavaEE-Maven

maven Maven是⼀个项⽬管理⼯具, 通过pom.xml⽂件的配置获取jar包&#xff0c;⽽不⽤⼿动去添加jar包。 maven简单, ⽅便, 提⾼我们的开发效率, 减少我们的开发Bug。 IDEA本⾝已经集成了Maven, 我们可以直接使⽤, ⽆需安装。 创建maven项目 name是项目名 location是项目路径 …