搜索引擎是如何工作的?初学者指南

内容

目录

让我们首先探讨搜索引擎是什么,它们为什么存在以及它们如何赚钱。

什么是搜索引擎?

搜索引擎是可搜索的网络内容数据库。它们由两个主要部分组成:

  1. **搜索索引。**关于网页信息的数字图书馆。 2. **搜索算法。**负责从搜索索引中匹配结果的计算机程序。

搜索引擎的目标是什么?

每个搜索引擎都旨在为用户提供最好、最相关的结果。这在一定程度上是它们获得市场份额的方式。

搜索引擎如何赚钱?

搜索引擎有两种类型的搜索结果:

  1. 搜索索引中的自然搜索结果。 这里不接受付费排名。 2. 广告商的付费搜索结果。 你可以付费在这里显示。

每当有人点击付费搜索结果时,广告主就需要向搜索引擎支付费用。这就是所谓的按点击付费(PPC)广告,也是市场份额至关重要的原因。用户越多意味着广告点击量和收入都会增加。

How search engines make money

每个搜索引擎都有自己建立搜索索引的过程。以下是谷歌使用的流程的简化版本。[1]

How Google builds its search index

让我们来分解一下。

网址

一切都始于已知的 URL 列表。Google 以多种方式发现这些 URL,但最常见的三种方式是:

  • 从反向链接中。 谷歌拥有数百亿网页的索引。2 如果有人从已知页面链接到新页面,谷歌可以从那里找到它。
  • 从站点地图中。 站点地图告诉谷歌你认为哪些页面和文件在你的网站上很重要。3
  • 从URL提交中。 谷歌允许网站所有者在Google Search Console中请求对单个URL的抓取。

爬取

爬取是指计算机机器人(称为蜘蛛)访问并下载已知的 URL。谷歌的爬虫是 Googlebot [4]

处理和渲染

处理是谷歌从抓取的页面中理解和提取关键信息的地方。为了做到这一点,它必须渲染页面,这就是它运行页面代码以理解用户看到的页面外观的地方。

谷歌之外的人不知道这个过程的每一个细节。但这并不重要。我们真正需要知道的是,它涉及提取链接并存储内容以进行索引。

索引

索引是指从抓取的页面中处理的信息被添加到搜索索引的过程。

搜索索引是你使用搜索引擎进行搜索时所搜索的内容。这就是为什么被主要搜索引擎如Google和Bing索引是如此重要的原因。除非你在索引中,否则用户无法找到你。

你知道吗?

Google拥有91.43%的搜索引擎市场份额。它可以为您带来比其他搜索引擎更多的流量,因为大多数人使用它。[5]

发现、抓取和索引内容只是谜题的第一部分。当用户执行搜索时,搜索引擎还需要一种方法来对匹配结果进行排名。这就是搜索算法的工作。

什么是搜索算法?

搜索算法是从索引中匹配和排名相关结果的公式。谷歌在其算法中使用了许多因素。

关键的谷歌排名因素

没有人知道所有的谷歌排名因素,因为谷歌没有披露它们。但我们确实知道一些关键因素。让我们来看看其中的一些。

反向链接

反向链接是指从一个网站页面链接到另一个网站页面的链接。它们是谷歌排名因素中最重要的之一。6 这可能是我们在对超过十亿个页面进行研究时看到链接域和有机流量之间存在强烈相关性的原因。7

The correlation between referring domains and search traffic

不仅仅是数量的问题。质量也很重要。拥有少量高质量的反向链接的页面通常会超越那些拥有大量低质量反向链接的页面。

你知道吗?

你可以免费在Ahrefs上检查你网站的反向链接。

注册免费的Ahrefs网站管理员工具账户,进入网站浏览器,然后转到反向链接报告。

Backlinks report in Ahrefs' Site Explorer

我们的网络爬虫是第五活跃的,8所以您将在这里看到一个相当完整的反向链接视图。

相关性

相关性是搜索结果对搜索者的有用性。谷歌有许多确定相关性的方法。在最基本的层面上,它会寻找包含与搜索查询相同关键词的页面。它还会查看互动数据,以确定其他人是否发现该结果有用。9

新鲜度

新鲜度是一个与查询相关的排名因素。对于需要新鲜结果的搜索来说,这一因素更为重要。9这就是为什么你会在“新的 Netflix 系列”搜索结果中看到最近发布的顶部结果,但在“如何解决魔方”搜索结果中却看不到。

Freshness is a query-dependant Google ranking factor

页面速度

页面速度 是桌面和移动设备的排名因素。[10]11 但它更多地是一个负面排名因素,而不是一个正面排名因素。这是因为它对最慢的页面产生负面影响,而不是对速度极快的页面产生正面影响。

你知道吗?

你可以免费在Ahrefs上检查你的页面速度。

注册免费Ahrefs网站管理员工具账户,使用Ahrefs的网站审核工具对您的网站进行爬行,然后转到性能报告。一般来说,您看到的红色越少,越好。

Performance report in Ahrefs' Site Audit

移动友好性

自2019年谷歌切换至移动优先索引以来,移动友好性一直是移动和桌面排名的因素。[12]

Google为每个用户量身定制搜索结果。它使用诸如您的位置、语言和搜索历史等信息来实现这一点。9让我们更仔细地看看这些内容。

位置

Google 使用您的位置来个性化定位搜索结果。这就是为什么“意大利餐厅”的所有结果都来自或关于当地餐厅。Google 知道您不太可能为了午餐而飞到世界的另一端。

语言

Google 知道向西班牙用户显示英文结果没有意义。这就是为什么它会为使用不同语言的用户排名本地化版本的内容(如果有的话)。

Google ranks different versions of pages for different languages

搜索历史

Google 保存您的活动和您所去的地方,以便为您提供更个性化的搜索体验。13 您可以选择退出,但大多数人可能不会。

主要收获

  • 搜索引擎由两个主要部分组成:索引和算法。
  • 为了构建索引,它会爬取已知页面并跟踪链接以找到新页面。
  • 搜索算法的目标是返回最佳、最相关的结果。
  • 搜索结果的质量对于建立市场份额非常重要。
  • 没有人知道所有影响谷歌有机搜索结果排名的因素。
  • 关键的排名因素包括反向链接、相关性和新鲜度。
  • 谷歌根据您的位置、语言和搜索历史个性化其搜索结果。

参考资料

  1. “了解 JavaScript SEO 基础”. Google. 检索于 2022 年 8 月 16 日。 2. “组织信息 — Google 搜索工作原理”. Google. 检索于 2022 年 8 月 16 日。 3. “了解网站地图”. Google. 检索于 2022 年 8 月 16 日。 4. “Googlebot”. Google. 检索于 2022 年 8 月 16 日。 5. “全球搜索引擎市场份额”. Statcounter. 检索于 2022 年 8 月 16 日。 6. “Google Q&A+ #March”. YouTube. 检索于 2022 年 8 月 16 日。 7. “90.63% 的内容未从 Google 获得流量。以及如何成为另外的 9.37%”. Ahrefs. 2020 年 1 月 31 日。 检索于 2022 年 8 月 16 日。 8. “CloudFlare Radar”. CloudFlare. 检索于 2022 年 8 月 16 日。 9. “排名搜索结果 — Google 搜索工作原理”. Google. 检索于 2022 年 8 月 16 日。 10. “在网页搜索排名中使用网站速度”. Google. 检索于 2022 年 8 月 16 日。 11. “在移动搜索排名中使用页面速度”. Google. 检索于 2022 年 8 月 16 日。 12. “移动优先索引最佳实践”. Google. 检索于 2022 年 8 月 16 日。 13. “查找和控制您的网络和应用活动”. Google. 检索于 2022 年 8 月 16 日
总结
搜索引擎是可搜索的网络内容数据库,由搜索索引和搜索算法组成。它们的目标是为用户提供最佳、最相关的结果,并通过有机结果和付费结果赚取广告费。搜索引擎通过发现、抓取和索引网页来构建搜索索引,然后使用搜索算法匹配和排名相关结果。谷歌的搜索索引构建过程包括发现URL、抓取、处理和渲染、索引等步骤。搜索算法使用多种因素进行排名,包括反向链接、相关性、新鲜度、页面速度和移动友好性。此外,搜索引擎还根据用户的位置、语言和搜索历史个性化结果。