2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

要说互联网经济的代表,搜索引擎无疑是最有力的候选者之一,其在太平洋两岸更是分别造就了谷歌和百度这两大巨头。时至今日,即使App的崛起导致了互联网世界被撕裂,但搜索引擎依然是这个星球上绝大多数人通过互联网获取信息的主要途径,也还是整个流量大盘中的重要一极。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

但搜索引擎是如何向用户呈现网页链接,则是过去二十余年来无数互联网行业从业者期望揭开的秘密。如今在机缘巧合之下,谷歌努力保护了二十年的秘密被暴露在了阳光下。

日前,受众行为网站SparkToro联合创始人、知名SEO专家Rand Fishkin发布博客文章称,一位匿名人士向他分享了超过2500份谷歌内部文件,而这些有关谷歌搜索API(Content API Warehouse)的技术文档,以前所未有的方式揭示了谷歌搜索引擎的部分工作模式,其中涉及到谷歌收集和使用何种数据,以及如何处理小型网站等课题。

这批文档在2024年3月27日被上传到GitHub,直到2024年5月7日才被删除。让外界确信这一文档来自谷歌的原因,是其使用了与以往被公开的谷歌内部文档相同的符号风格、格式,甚至对于功能名称和引用也如出一辙,极为符合谷歌内部的规范。此外,Content API Warehouse又是谷歌给搜索引擎团队成员提供的索引,频繁被使用或许是其被某位谷歌员工错误上传到GitHub的原因。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

其实互联网大厂的内部文件被泄露是常用的事情,这也不足以引发讨论,真正让外界感到惊讶的,是这一批文件所提及的内容,与John Mueller等谷歌搜索的发言人多年来的说法直接矛盾。“撒谎这个词虽然很刺耳,但非常正确形容了谷歌所宣称的搜索算法内容”,这是数字营销机构iPullRank创始人Mike King对这一批文档进行解读后,所给出的评价。

尽管此次泄露的内容中,并没有直接表明决定谷歌如何使用特定数据来对搜索结果进行排名,但SEO专家们还是发现了一些端倪,包括其如何使用点击数据、浏览器点击流、白名单、质量评估员反馈和链接质量,来影响搜索结果排名。例如作为谷歌搜索关系团队(Search Relations team)的负责人,John Mueller就曾声称,谷歌没有直接在搜索排名算法中使用点击量数据。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

然而在此次泄露的文档里,却频繁出现了“badClicks”、“goodClicks”、“lastLongestClicks”等与用户点击相关的描述。其中,lastLongestClicks和lastGoodClicks是用来衡量点击是否会随着时间衰减,badClicks和goodClicks则是评测用户在搜索结果中点击行为的指标,如果用户点击结果后不再跳出、并点击其他结果算是加分,否则是减分。

这些点击指标虽然看似无法证明谷歌在算法中使用了点击量,但联系之前美国司法部在谷歌反垄断诉讼中提及的内容,就几乎坐实谷歌说谎了。在此前的庭审中,谷歌搜索质量团队搜索副总裁Pandu Nayak确认了Navboost系统的存在,该系统会根据用户数据进行训练,能记住过去13个月的所有查询点击次数。此外,Navboost系统还有另一个名称Glue(胶水),后者聚合了不同类型的用户交互,例如点击、悬停、滚动和滑动,并创建了一个通用指标来比较网络结果和搜索功能。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

因此在Rand Fishkin、Mike King等SEO专家看来,以上种种迹象也证明了谷歌大概率在搜索引擎算法中使用了权重点击来作为影响排名的因素。另外相关专家也证实了Chrome数据被用于排名,但John Mueller此前在2022年却曾坚定地表示,“我们不使用Chrome的任何东西进行排名”。可是这些文档中所涉及与页面质量评分相关的模块中出现的“ChromeInTotal”参数,也就是网站在Chrome上的整体浏览量。

除此之外,这一批文档还解答了一个困扰SEO从业者许久的问题,即E-E-A-T在搜索排名中扮演什么角色?E-E-A-T所指的,就是作者模块。在这批文档中就出现了“author”参数,代表谷歌的算法会判断网页作者的属性。并提及了数个会导致“算法降级”的因素,包括网站导航链接的体验较差、链接锚文本与它所链接的目标网站不匹配等问题,都会导致相关网站在计算中被降级。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

这2500分文档尽管并未直接披露谷歌的搜索引擎排名算法,但还是让外界第一次了解了谷歌搜索引擎的具体工作原理。此外,更加重要的影响还体现在SEO领域,Rand Fishkin就明确表示,此次泄露的文档表明,在谷歌的搜索排名算法中品牌的作用极大。而这也就意味着,谷歌在台面之下将更多流量导向了大品牌建立的网站。换而言之,对于小型网站来说,SEO可能会是一个伪命题。

当然,受到此次内部文件泄露影响最大的莫过于谷歌。一直以来,外界都在质疑谷歌搜索缺乏透明度,现在这个质疑变成了现实。谷歌搜索关系团队本来应该是一个谷歌搜索和网站站长之间的桥梁,但谷歌方面却在某些方面误导后者,并试图控制站长们的SEO行为。谷歌此前一直在说要努力保护搜索结果的完整性免受操纵,结果自己却是这个“幕后黑手”。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

无论如何,SEO从业者是谷歌的合作者而非敌人,欺骗合作伙伴的操作显然殊为不智,对他们撒谎被戳穿更是会让外界浮想联翩。那么未来谷歌的承诺、保证和声明,究竟还能保真吗?

【本文图片来自网络】

推荐阅读:

英特尔LunarLake架构解析:单核暴增、Xe2首秀

LunarLake“战未来”的潜力,或许比现在想象的还要更大一些。

游戏业务开启“第二阶段”,字节跳动再争朝夕

 能不能给新团队更多耐心,或是未来字节跳动游戏业务能否成功的基础。


本内容观点仅代表发布作者本人观点立场,欣文网平台只做信息内容展示和存储。发布作者:全网转载,转转请注明出处:https://www.xinenw.com/19841.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2024年6月7日 21:27
下一篇 2024年6月7日 21:28

相关推荐

  • 699起?之前硬刚红米的国产神机,杀回来了

    可以说是毫无征兆,魅族今天杀出一款新机—— 魅蓝 20 AI 手机。 你没有看错,就是魅蓝。 魅蓝上一款手机要追溯到 2022 年 1 月,这一波确实是让大家久等了。 大家应该也很感兴趣,这款连两年磨一剑的产品长啥样。 魅蓝 20 刚看到这名字的时候,智慧如我也是满头问号。 今年不是魅族 21 周年吗?怎么又开始用 20 这个代号了。 看了魅蓝两年前的那款「…

    2024年7月17日
    16100
  • 敢吞卡皮巴拉,动物界的“瑜伽裤”有多能装

    本文经授权转载自 壹读 (ID:yiduiread) 作者:敏敏 杜雨芯 问:什么东西最能装? 答案:瑜伽裤。 不知道从什么时候开始,互联网上掀起了一股“瑜伽裤装万物”的野性营销,为了展示瑜伽裤的弹性,带货主播们把油桶、西瓜甚至行李箱都统统塞了进去。以至于有网友戏称“以后搬家都不用叫搬家公司了,带条瑜伽裤就行”。 而在动物界,也有一种动物的嘴和瑜伽裤一样,在…

    2024年6月10日
    14400
  • ​《命运方舟》全新版本今日上线!全新大陆职业福利一览

    9月25日《命运方舟》全新版本于今日正式上线,以高超的战斗技巧,将短剑技能、阴影技能与突袭技能相结合的暗影正式与冒险家们见面!此外,还有全新大陆普雷切、地狱难度梦幻军团长等全新玩法内容开放,更有摩可可互助活动、飞跃成长快车等多种福利活动等待冒险家们体验参与,快来一起看看吧! 全新大陆普雷切 位于克雷多斯大洋的自由与艺术共存的国度普雷切,这里是艾伦幼时的故乡,…

    2024年10月8日
    3600
  • 华为终于掏出了享界S9,40万的行政级轿车开起来啥样?

    噔噔噔,今天下午华为又发了一堆新品,有手机,有电脑,有耳机等一堆东西,最重要的还有享界 S9 。 因为东西实在太多了,所以这次我邀请脖子哥和我一起给大家梳理下发布会的重点吧。  # 鸿蒙智行 我们先从最重要的车讲起。 一上来,余总就说了第四个 “ 界 ” 的名字。之前咱还以为叫 “ 傲界 ” 来着,这次正式公布了,尊界。 紧接着,本次的主角享界 S9 登场。…

    2024年8月14日
    15100
  • 实测苹果AI beta版:太难用了,真的。

    昨天一醒来,世超就看到各路媒体发来消息: iOS 18.1 beta 来了,还带来了重磅的通话录音和 Apple Intelligence 苹果 AI 。。。 正当我想升级的时候,发现写了一串话: Apple Intelligence is available on iPhone 15 Pro and iPhone 15 Pro Max.Apple Inte…

    2024年8月1日
    14200

发表回复

登录后才能评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件A:xinenw@qq.com

邮箱B:xinenw@163.com

工作时间:周一至周五,8:30-23:30;周六周日10:30-18:30;节假日休息

关注微信