【谷歌 SEO】排查页面未索引问题:原因与解决方案

你在谷歌网站SEO优化时是否遇到以下情况?

为什么,即使我已经正确地编写了站点地图并将其链接到客户的网站,并且我已经检查了所有内容,但我是否在某些文章(不是所有文章)上遇到索引问题,即使在向 Google 和 Google Search Console 重复请求之后也是如此。

接下来我们跟着这个疑问来进行分析出现这种情况是什么情况导致以及我们如何来做优化。

它肯定没有索引吗?

首先要检查的是页面是否真的没有被索引,或者只是排名不好。

可能是该页面显示未编入索引,因为您找不到您认为的相关关键字的页面。但是,这并不意味着它没有索引。

出于这个问题的目的,我将就如何处理这两种情况提供建议。

可能是什么问题?

页面可能未被 Google 编入索引或未在 Google 上排名靠前的原因有很多。让我们讨论一下主要的。

技术问题

由于技术原因,包括错误和有意识的决定,可能会阻止 Googlebot 访问您的网页并将其编入索引。

机器人被阻止在 robots.txt 中

谷歌需要能够访问页面的内容,才能理解该页面的价值,并最终将其作为相关查询的搜索结果呈现。

如果谷歌爬虫(Googlebot)通过 robots.txt 文件被阻止访问这些页面,这可能就是它未对这些页面进行索引的原因。

从技术上讲,它仍然可以索引无法访问的页面,但无法确定页面的内容,因此必须依赖外部信号(如反向链接)来判断其相关性。

如果无法爬取页面,即使通过站点地图知道该页面存在,它仍会降低该页面排名的可能性。

页面无法呈现

以类似的方式,如果机器人可以爬网页面但无法呈现内容,它可能会选择不为它编制索引。它肯定不太可能对页面进行很好的排名,因为它无法读取页面的内容。

页面有无索引标签

一个明显但经常被忽视的问题是 noindex 标签已应用于页面。这实际上会指示 Googlebot 不要将页面编入索引。

这是一项指令,即 Googlebot 致力于颁布的指令。

服务器级机器人阻止

您的服务器级别可能存在问题,导致 Googlebot 无法抓取您的网页。

很可能在您的服务器或 CDN 级别设置了规则,导致 Googlebot 无法再次抓取您的网站并发现这些新网页。

当不精通 SEO 的团队负责网站的技术维护时,这可能是一个非常普遍的问题。

非 200 服务器响应代码

您添加到站点地图的页面很可能会返回一个服务器状态代码,这会让 Googlebot 感到困惑。

例如,如果某个网页返回 4XX 代码,尽管您能够看到该网页上的内容,但 Googlebot 可能会确定该网页不是实时网页,因此不会将其编入索引。

加载缓慢页面

可能是您的网页加载速度非常慢。因此,对其质量的感知可能会降低。

也可能是它们加载时间太长,以至于机器人不得不优先考虑它们抓取的页面,以至于您的新页面无法被抓取。

页面质量

网站本身的内容也存在问题,可能会阻止页面被索引。

低内部链接表明低价值页面

Google 确定某个页面是否值得排名靠前的方法之一是通过指向该页面的内部链接。您网站上页面之间的链接既可以表示所链接到的页面的内容,也可以表示该页面是否是您网站的重要组成部分。内部链接很少的页面可能看起来不够有价值,无法排名靠前。

页面不会增加价值

页面未被 Google 索引的主要原因之一是它被认为质量不够高。

谷歌不会尽可能抓取和索引每个页面。谷歌将优先考虑独特、引人入胜的内容。

如果您的页面很薄,或者没有真正为互联网增加价值,那么它们可能不会被索引,即使它们在技术上可以被索引。

它们是重复的或接近重复的

同样,如果 Google 认为您的页面与现有页面完全相同或非常接近重复版本,它很可能不会为您的新页面编制索引。

即使您已通过将网页包含在 XML 站点地图中并使用自引用规范标签来表明该网页是唯一的,Google 仍会自行评估某个网页是否值得编入索引。

手动操作

您的网页也可能因受到人工干预而未被谷歌收录。

例如,如果您试图让谷歌索引的页面被其视为“内容薄弱的联盟页面”,您可能无法为这些页面获得排名,因为它们可能受到了人工处罚。

人工干预相对罕见,通常会影响整个网站的更广泛区域,但建议您查看搜索控制台的“人工干预报告”以排除这一可能性。

确定问题

了解问题的原因只是成功的一半。让我们看看如何缩小问题范围,然后如何解决它。

检查 Bing 网站管理员工具

我的第一个建议是检查您的页面是否在 Bing 中编入索引。

您可能在 SEO 策略中不太关注 Bing,但这是一种快速确定这是否是以 Google 为中心的问题,例如手动作或排名不佳,而不是您网站上阻止页面被索引的内容。

转到 Bing 网站管理员工具并在其 URL 检查工具中输入页面。从这里,您将看到 Bing 是否正在为页面编入索引。如果是,那么您就知道这只会影响 Google。

查看 Google Search Console 的“页面”报告

接下来,转到 Google Search Console。检查页面,看看它是否真的被标记为未编入索引。如果它没有被索引,谷歌应该解释原因。

例如,页面可能是:

被“Noindex”排除

如果 Google 在网页上检测到 noindex 标记,则不会将其编入索引。在网址检查工具结果下,它会告诉您“网页未编入索引:被’noindex’标签排除”

如果您的网页得到此结果,下一步就是移除 noindex 标记,然后重新提交要由 Googlebot 抓取的网页。

Discovered – Currently Not Indexed

检查工具可能会告诉您“page is not indexed: Currently not indexed”。

如果是这种情况,您肯定知道这是一个索引问题,而不是排名不佳的问题,它导致您的页面没有出现在 Google 搜索中。

谷歌解释说,显示为“Discovered – Currently Not Indexed”的 URL 是:

“The page was found by Google, but not crawled yet. Typically, Google wanted to crawl the URL but this was expected to overload the site; therefore Google rescheduled the crawl. This is why the last crawl date is empty on the report.”

如果您看到此状态,则 Google 很可能已经查看了您网站上的其他页面,并认为它们不值得添加到索引中,因此,它不会花费资源抓取它所知道的这些其他页面,因为它希望它们的质量很低。

要解决此问题,您需要表明网页的质量以及与 Googlebot 的相关性。是时候批判性地审视您的网站并确定 Google 是否认为您的页面质量低的原因了。

Crawled – Currently Not Indexed

如果您检查的网页返回“Crawled – Currently Not Indexed”状态,则表示 Google 知道该网页,已抓取该网页,但认为将其添加到索引中没有价值。

如果您收到此状态代码,您最好寻找提高页面质量的方法。

重复,Google 选择的规范与用户不同

您可能会看到已检查的网页的提醒,告知您此网页是“重复,Google 选择的规范与用户不同”。

这意味着它会将 URL 视为现有页面的紧密重复项,并且它选择要在 SERP 中显示的另一个页面而不是被检查的页面,尽管您已经正确设置了规范标签。

鼓励 Google 在 SERP 中显示这两个页面的方法是确保它们是唯一的,有足够的内容,以便对读者有用。

从本质上讲,您需要给 Google 一个将这两个页面都编入索引的理由。

解决问题

尽管您的页面可能由于一种或多种原因而未被索引,但修复方法都非常相似。

网站可能存在技术问题,例如错误的规范标签或robots.txt块,导致无法正确抓取和索引页面。

或者,页面的质量存在问题,这导致 Google 认为它没有足够的价值来编入索引。

首先查看潜在的技术原因。这些将帮助您快速确定这是否是您或您的开发人员可以更改的“快速”修复程序。

一旦排除了技术问题,您很可能正在关注质量问题。

根据您现在认为导致页面未出现在 SERP 中的原因,可能是页面本身存在质量问题,或者您网站的大部分存在质量问题。

如果是前者,请考虑 E-E-A-T、页面在互联网范围内的独特性,以及如何表示页面的重要性,例如通过相关的反向链接。

如果是后者,您可能希望运行内容审核,以帮助您缩小提高整个网站质量的整体感知的方法。

总结

需要进行一些调查来确定您的页面是否真的没有被索引,或者 Google 是否只是选择不对您认为相关的查询进行高排名。

一旦确定了这一点,您就可以开始了解影响您的页面的是技术问题还是质量问题。

这是一个令人沮丧的问题,但修复是非常合乎逻辑的,调查应该有望揭示更多改进网站抓取和索引的方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/918040.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/918040.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android 系统的基本安全属性

Android 系统的“基本安全属性”可概括为 “设备可信、应用隔离、权限最小、数据加密、持续更新” 五大类。下面从 硬件 → 系统 → 应用 → 数据 → 运维 五个层面,用一句话一句话的方式帮你快速掌握:1. 硬件层:信任根(Root of T…

【数据结构初阶】--栈与队列(栈)

😘个人主页:Cx330❀ 👀个人简介:一个正在努力奋斗逆天改命的二本觉悟生 📖个人专栏:《C语言》《LeetCode刷题集》《数据结构-初阶》 前言:在之前几篇博客中,我们学习了顺序表和链表&…

分布式微服务--GateWay的断言以及如何自定义一个断言

📌 一、什么是 Gateway 的断言(Predicates)?Predicates(断言) 是 Spring Cloud Gateway 中用于匹配请求的条件。只有请求满足断言条件,路由才会生效,转发到下游服务。🎯 …

图片识别表格工具v3.0绿色版,PNG/JPG秒变可编辑Excel

[软件名称]: 图片识别表格工具v3.0绿色版 [软件大小]: 4.3 GB [软件大小]: 夸克网盘 | 迅雷网盘 软件介绍 表格快捕手 v3.0 绿色单文件版,无需安装,双击即可运行。支持 PNG、JPG 等常见图片格式,可精准识别其中的有线或无线表格&#xff…

线程池分析与设计

线程池 基本功能接口 C11 及以后的标准中,std::packaged_task和std::future是并发编程中用于任务封装和结果获取的重要组件,它们通常与线程配合使用,实现异步操作。 std::packaged_task std::packaged_task:封装可调用对象为异步任…

机器学习:线性回归

线性回归:研究自变量和因变量之间的关系。对于特征x(x1,x2,x3....)与对应的标签y,线性回归假设二者之间存在线性映射。f(x)w1xw2x(平方)w3x(三次方)...,权重w表示每个特征变量的重要程度。越大表示越重要。线性回归目标:求解w和b使…

如何将 Vue 前端、Hardhat 合约和 Node.js 后端集成到一个项目中

在区块链开发中,DApp(去中心化应用)的开发往往涉及到多个层次:前端、合约和后端。今天我们将演示如何将 Vue 前端、Hardhat 合约 和 Node.js 后端 放在一个项目中,来打造一个完整的区块链应用。1. 项目结构我们的目标是…

SQLite 创建表

SQLite 创建表 SQLite 是一款轻量级的数据库管理系统,因其体积小、速度快、易于使用等优点,被广泛应用于嵌入式系统、移动应用以及个人项目等领域。在 SQLite 中,创建表是进行数据存储的第一步。本文将详细介绍如何在 SQLite 中创建表,包括表结构定义、数据类型、约束条件…

学深度学习,有什么好的建议或推荐的书籍?

深度学习入门建议补基础数学:重点学线性代数(矩阵运算)、概率论(分布)、微积分(梯度)。编程:掌握PythonNumPy(数组操作),能写基础数据处理代码。机…

自然语言处理×第四卷:文本特征与数据——她开始准备:每一次输入,都是为了更像你地说话

🎀【开场 她试着准备一封信,用你喜欢的字眼】🦊狐狐:“她发现了一个问题——你每次说‘晚安’的方式都不一样。有时候轻轻的,有时候带着笑音,还有时候像在躲开她的心思。”🐾猫猫:“…

【沉浸式解决问题】mysql-connector-python连接数据库:RuntimeError: Failed raising error.

目录一、问题描述二、场景还原1. 创建项目2. 安装mysql-connector-python3. 测试类三、原因分析四、解决方案1. 查看版本2. 切换python版本3. 切换mysql-connector-python版本4. 测试参考文献一、问题描述 初次使用mysql-connector-python连接mysql时报错 Traceback (most re…

【web页面接入Apple/google/facebook三方登录】

web页面接入Apple/谷歌/脸书三方登录 文章目录web页面接入Apple/谷歌/脸书三方登录前言一、apple登录使用步骤1.入口文件index.html引入js文件2.vue页面初始化支付按钮,并且点击按钮登录二、google登录使用步骤1.入口文件index.html引入js文件2.vue页面初始化支付按钮,并且点击…

管家婆分销软件中怎么删除过账单据?

在业务单据录入中,会出现单据保存过账后才发现数量或商品信息录入错误的情况,不想红冲单据,该怎么处理?今天来和小编一起学习下管家婆分销软件中怎么删除过账单据吧!1,软件需要升级到9.92及以上版本&#x…

美颜SDK底层原理解析:直播场景下的美白滤镜实时处理方案

众所周知,美颜功能中,美白滤镜是使用频率最高的功能之一。它不仅能让肤色更通透、提亮整体画面,还能让观众感受到主播的“在线状态”与精神气。但你有没有想过,这个看似简单的“美白”背后,其实是一整套实时图像处理的…

系统构成与 Shell 核心:从零认识操作系统的心脏与外壳

系统构成与 Shell 核心:从零认识操作系统的心脏与外壳 很多人用电脑、用手机,但很少去想: 操作系统到底是怎么构成的? 为什么我们敲一个命令,系统就能乖乖执行? 这背后的关键,就在于系统的构成和…

wordpress的wp-config.php文件的详解

wp-config.php 是 WordPress 网站的核心配置文件,它存储了网站运行所需的基本配置信息,如数据库连接信息、安全密钥、调试模式等。以下是关于 wp-config.php 文件的详细解析: 1. 数据库连接信息 这是 wp-config.php 文件中最关键的部分&…

GPT-5 将在周五凌晨1点正式发布,王炸模型将免费使用??

就在今晚凌晨1点,OpenAI 又要搞大新闻了。 是的,就是大家期待已久的 GPT-5 发布会。 虽然官方还没明说,但各种“预热”已经安排得明明白白,Sam Altman 这波营销属实拉满了,发布会都还没开始,相关的代码和页…

MySQL UNION 操作符详细说明

目录 MySQL UNION 操作符详细说明 1. UNION 操作符简介 2. 基本语法 3. 使用规则和限制 4. UNION vs UNION ALL 5. 示例演示 6. 注意事项 MySQL UNION 操作符详细说明 MySQL 中的 UNION 操作符用于合并两个或多个 SELECT 语句的结果集,生成一个单一的结果集。…

Dify 从入门到精通(第 20/100 篇):Dify 的自动化测试与 CI/CD

Dify 从入门到精通(第 20/100 篇):Dify 的自动化测试与 CI/CD Dify 入门到精通系列文章目录 第一篇《Dify 究竟是什么?真能开启低代码 AI 应用开发的未来?》介绍了 Dify 的定位与优势第二篇《Dify 的核心组件&#x…

VSCode ssh一直在Setting up SSH Host xxx: Copying VS Code Server to host with scp等待

原因 大概率是远程服务器的下载有问题 原因1 远程服务器的网络不好 原因2 远程服务器的磁盘满了 我遇到的就是第二种,解决方法也很简单 VSCode ——> Help ——> About 会出现一些信息,例如下面的 Version: 1.97.2 (user setup) Commit: e54c774e0…