A white robot holding a magnifying glass next to a white box.

搜索引擎是如何工作的?

一些年长的读者可能还记得,当时搜索引擎还在为谁能称王而争斗不休。那些日子已经一去不复返了,现在谷歌因其垄断地位经常成为法律焦点。虽然许多人对这一讨论并不陌生,但对于全球使用的搜索索引总数有限的问题,人们却知之甚少。

搜索引擎的工作原理是,首先用网络爬虫搜索公众可以访问的互联网,并跟踪和映射网页之间的链接。然后将这些网页添加到搜索索引中。当你在自己喜欢的搜索引擎中输入搜索时,该查询会与现有的搜索索引数据库进行核对。你可以把搜索索引想象成一个大型数字图书馆,在这里你可以寻找问题的答案。如果索引中没有你要找的页面,那么它就不会显示在你的搜索结果中,甚至不会出现在谷歌搜索结果的第 2 页。

How web crawlers work to build search indexes.

网络爬虫如何建立搜索索引。

现在你可以看到,对这些索引所包含内容的控制会对信息的自由传播产生重大影响,并可能导致审查。例如,谷歌遵守中国政府的审查准则,以便继续在中国提供搜索引擎。这导致中国境内的谷歌用户无法获得大量信息。

谁控制着全球最大的搜索索引?

The major providers of web search.

截至 2024 年 7 月,谷歌在全球搜索中占据 91% 的份额。图表和数据由 StatCounter 提供。

目前,主流搜索引擎使用的主要搜索索引屈指可数。其中包括谷歌、必应、雅虎、百度和 Yandex。这使得全球大部分搜索结果掌握在美国、中国和俄罗斯这三个国家的法律管辖之下。

虽然这五家公司之外也有搜索引擎,但其中许多都在使用大科技公司的搜索索引,而不是建立自己的独立索引。例如,DuckDuckGo 和 Ecosia 等搜索引擎都使用雅虎和必应的搜索索引来呈现搜索结果。

搜索引擎集中化会带来哪些威胁?

互联网的集中化,无论是通过政府干预还是大科技公司的垄断行为,都会使互联网基础设施的其他部分对其产生依赖,从而带来巨大的安全风险。早在2013年,《纽约客》就写道:“有惊人比例的通信流经一小部分公司,因此受到这些公司和其他机构的深刻影响。

一旦发生安全事件、网络中断或政治剧变,缺乏开放的网络索引将对任何没有运行自己索引的国家构成国家安全威胁。将这一关键技术交到永远将利润放在首位的科技公司手中,我们就等于将危险的信任交到了他们手中。这些索引是维持互联网功能现状的重要基础设施。

为什么欧洲需要自己的独立网络索引?

出于谨慎考虑,欧盟必须开发自己的网络索引,以保证互联网搜索访问的稳定性,而不必依赖其他国家。开放网络索引(OWI)就是这样一个竞争者。OWI 于 2022 年推出,由欧洲的研究型大学和非营利组织共同开发,这些组织正努力在整个互联网上建立一个替代大科技公司把关的系统。

The Open Search Foundation goals.

开放搜索基金会的目标。

该项目由政府资助,为期三年,旨在 “将信息视为公共产品,提供自由、公正和透明的访问…”。如果搜索结果受制于少数利益竞争的科技公司,我们就无法相信它们会提供诚实、公平的信息获取途径。谷歌和雅虎都被指控偏袒自己的网站和产品,导致诉讼,声称大科技公司的做法具有高度垄断性

德国本地搜索引擎 MetaGer 推动开发开放式网络索引

与汉诺威大学合作建立MetaGer 的非营利组织 Suma.ev 是开发欧洲开放网络索引的合作伙伴之一。MetaGer 项目旨在为用户提供私人搜索服务,以替代大型科技公司的搜索服务。用户可以选择要查询的搜索引擎和索引,所有结果只能通过完全加密的连接返回。甚至还可以选择匿名打开搜索结果。由于完全支持 Tor 和洋葱网站,用户可以搜索所有主要索引,而不必担心数据会被侵入性追踪。

与 Tuta 一样,MetaGer 也位于德国,因此受益于欧盟和德国政府严格的数据保护法。

Tuta 通过加密提供隐私保护,为大型科技公司提供了另一种选择。

在 Tuta,我们正在积极努力创造一种安全、私密的电子邮件服务,以替代GmailOutlook 等大型科技公司的电子邮件服务。通过使用世界上首个后量子加密技术来保护电子邮件,我们能够向全球用户提供免费和付费账户,目的是让公民能够夺回自己的隐私。

放弃谷歌就像打开开关一样简单。今天就注册 Tuta 账户,开启隐私保护