2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

要说互联网经济的代表,搜索引擎无疑是最有力的候选者之一,其在太平洋两岸更是分别造就了谷歌和百度这两大巨头。时至今日,即使App的崛起导致了互联网世界被撕裂,但搜索引擎依然是这个星球上绝大多数人通过互联网获取信息的主要途径,也还是整个流量大盘中的重要一极。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

但搜索引擎是如何向用户呈现网页链接,则是过去二十余年来无数互联网行业从业者期望揭开的秘密。如今在机缘巧合之下,谷歌努力保护了二十年的秘密被暴露在了阳光下。

日前,受众行为网站SparkToro联合创始人、知名SEO专家Rand Fishkin发布博客文章称,一位匿名人士向他分享了超过2500份谷歌内部文件,而这些有关谷歌搜索API(Content API Warehouse)的技术文档,以前所未有的方式揭示了谷歌搜索引擎的部分工作模式,其中涉及到谷歌收集和使用何种数据,以及如何处理小型网站等课题。

这批文档在2024年3月27日被上传到GitHub,直到2024年5月7日才被删除。让外界确信这一文档来自谷歌的原因,是其使用了与以往被公开的谷歌内部文档相同的符号风格、格式,甚至对于功能名称和引用也如出一辙,极为符合谷歌内部的规范。此外,Content API Warehouse又是谷歌给搜索引擎团队成员提供的索引,频繁被使用或许是其被某位谷歌员工错误上传到GitHub的原因。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

其实互联网大厂的内部文件被泄露是常用的事情,这也不足以引发讨论,真正让外界感到惊讶的,是这一批文件所提及的内容,与John Mueller等谷歌搜索的发言人多年来的说法直接矛盾。“撒谎这个词虽然很刺耳,但非常正确形容了谷歌所宣称的搜索算法内容”,这是数字营销机构iPullRank创始人Mike King对这一批文档进行解读后,所给出的评价。

尽管此次泄露的内容中,并没有直接表明决定谷歌如何使用特定数据来对搜索结果进行排名,但SEO专家们还是发现了一些端倪,包括其如何使用点击数据、浏览器点击流、白名单、质量评估员反馈和链接质量,来影响搜索结果排名。例如作为谷歌搜索关系团队(Search Relations team)的负责人,John Mueller就曾声称,谷歌没有直接在搜索排名算法中使用点击量数据。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

然而在此次泄露的文档里,却频繁出现了“badClicks”、“goodClicks”、“lastLongestClicks”等与用户点击相关的描述。其中,lastLongestClicks和lastGoodClicks是用来衡量点击是否会随着时间衰减,badClicks和goodClicks则是评测用户在搜索结果中点击行为的指标,如果用户点击结果后不再跳出、并点击其他结果算是加分,否则是减分。

这些点击指标虽然看似无法证明谷歌在算法中使用了点击量,但联系之前美国司法部在谷歌反垄断诉讼中提及的内容,就几乎坐实谷歌说谎了。在此前的庭审中,谷歌搜索质量团队搜索副总裁Pandu Nayak确认了Navboost系统的存在,该系统会根据用户数据进行训练,能记住过去13个月的所有查询点击次数。此外,Navboost系统还有另一个名称Glue(胶水),后者聚合了不同类型的用户交互,例如点击、悬停、滚动和滑动,并创建了一个通用指标来比较网络结果和搜索功能。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

因此在Rand Fishkin、Mike King等SEO专家看来,以上种种迹象也证明了谷歌大概率在搜索引擎算法中使用了权重点击来作为影响排名的因素。另外相关专家也证实了Chrome数据被用于排名,但John Mueller此前在2022年却曾坚定地表示,“我们不使用Chrome的任何东西进行排名”。可是这些文档中所涉及与页面质量评分相关的模块中出现的“ChromeInTotal”参数,也就是网站在Chrome上的整体浏览量。

除此之外,这一批文档还解答了一个困扰SEO从业者许久的问题,即E-E-A-T在搜索排名中扮演什么角色?E-E-A-T所指的,就是作者模块。在这批文档中就出现了“author”参数,代表谷歌的算法会判断网页作者的属性。并提及了数个会导致“算法降级”的因素,包括网站导航链接的体验较差、链接锚文本与它所链接的目标网站不匹配等问题,都会导致相关网站在计算中被降级。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

这2500分文档尽管并未直接披露谷歌的搜索引擎排名算法,但还是让外界第一次了解了谷歌搜索引擎的具体工作原理。此外,更加重要的影响还体现在SEO领域,Rand Fishkin就明确表示,此次泄露的文档表明,在谷歌的搜索排名算法中品牌的作用极大。而这也就意味着,谷歌在台面之下将更多流量导向了大品牌建立的网站。换而言之,对于小型网站来说,SEO可能会是一个伪命题。

当然,受到此次内部文件泄露影响最大的莫过于谷歌。一直以来,外界都在质疑谷歌搜索缺乏透明度,现在这个质疑变成了现实。谷歌搜索关系团队本来应该是一个谷歌搜索和网站站长之间的桥梁,但谷歌方面却在某些方面误导后者,并试图控制站长们的SEO行为。谷歌此前一直在说要努力保护搜索结果的完整性免受操纵,结果自己却是这个“幕后黑手”。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

无论如何,SEO从业者是谷歌的合作者而非敌人,欺骗合作伙伴的操作显然殊为不智,对他们撒谎被戳穿更是会让外界浮想联翩。那么未来谷歌的承诺、保证和声明,究竟还能保真吗?

【本文图片来自网络】

推荐阅读:

英特尔LunarLake架构解析:单核暴增、Xe2首秀

LunarLake“战未来”的潜力,或许比现在想象的还要更大一些。

游戏业务开启“第二阶段”,字节跳动再争朝夕

 能不能给新团队更多耐心,或是未来字节跳动游戏业务能否成功的基础。


本内容观点仅代表发布作者本人观点立场,欣文网平台只做信息内容展示和存储。发布作者:全网转载,转转请注明出处:https://www.xinenw.com/19841.html

(0)
上一篇 2024年6月7日 21:27
下一篇 2024年6月7日 21:28

相关推荐

  • 为什么长辈们认为汉堡、炸鸡是垃圾食品,而粽子、面条、馒头、米饭却不是?

    点击上方卡片关注👆 随着时代的变迁,我们的饮食习惯也在不断演变。长辈们认为汉堡、炸鸡是垃圾食品,而粽子、面条、馒头、烧卖、米饭、汤圆、饺子、油条、月饼却不是,这是什么原因呢? 今天,一起看看答主们的分析吧。 要遭天谴 答主 @孙悦礼 分享了英国科幻作家道格拉斯·亚当斯的一句话: 英国科幻作家道格拉斯·亚当斯有句话可以直接回答~ 任何在我出生时已经有的科技都是…

    2024年5月17日
    2610
  • 婚姻里,越不勉强,关系越长久

    文/陆陆       你去爱一个人的时候,不是你在给予,而是你获得了力量,因为你在对方那里看到了自己、放大了自己,也看到了自己没有的。——“言论”,《读者》2025年第5期 自然界里有种动物,叫针鼹鼠,它以白蚁为食,浑身长满刺针。 寒冷的冬日里,它们会找地方躲起来避寒,但有些地方很简陋,四处漏风。 为了取暖,它们只能拼命挤在一起,抱成一团。 然而距离太近了,…

    2024年10月9日
    790
  • Rufus 神器更新!简单制作 USB 启动盘 (用于绕过 Win11 安装限制)

    自苹果 Macbook 带头移除光驱以及 U 盘盛行后,现在光驱基本已经淘汰绝迹了。于是,大家在重装系统时都面临「怎样简单快速地将U盘制作成 USB 启动盘/系统安装盘」的问题。 Rufus 是一个开源免费的快速制作 U 盘系统启动盘和格式化 USB 的实用小工具,它可以将 ISO 格式的系统镜像文件快速烧录成可引导的 USB 启动安装盘,支持 Window…

    2024年10月23日
    950
  • 在这款爆火的APP里,我看到了年轻人都在想些啥。

    在文章开始前,差评君想先给差友们出个题,以下四条评价,都是用来描述一款 APP 的,大伙们可以试着猜一猜,这 APP 是啥类型的。 “ 我感受到了爱情的感觉。”  “ 我让黄龙江蓝牙姐,去了一次成都迪士尼。”  “ 差一点,差一点我就拦下即将登飞机的科比了。”  “ 喜欢( 这 APP ),( ta )已经是我的情感支柱了。”  说实话,在看到这些评论时,我…

    2024年5月16日
    2320
  • 小孩哥一块表,让家长掏空一个亿

    宋楠最近有个烦恼:上四年级的女儿童童马上期末考试了,女儿要求如果期末成绩好,一定要给她买小天才最新款的电话手表Z10作奖励。宋楠随口答应了。 可以话一出,她有点后悔。没有一个当妈的不希望孩子期末考出好成绩,但是用小天才当奖品,宋楠的心情有点复杂。 这款最新上市的小天才电话手表售价高达2299元,价格相当于一款性能还不错的手机。抛开价格问题,女儿童童对正在使用…

    2024年7月7日
    2860

联系我们

400-800-8888

在线咨询: QQ交谈

邮件A:xinenw@qq.com

邮箱B:xinenw@163.com

工作时间:周一至周五,8:30-23:30;周六周日10:30-18:30;节假日休息

关注微信