2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

要说互联网经济的代表,搜索引擎无疑是最有力的候选者之一,其在太平洋两岸更是分别造就了谷歌和百度这两大巨头。时至今日,即使App的崛起导致了互联网世界被撕裂,但搜索引擎依然是这个星球上绝大多数人通过互联网获取信息的主要途径,也还是整个流量大盘中的重要一极。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

但搜索引擎是如何向用户呈现网页链接,则是过去二十余年来无数互联网行业从业者期望揭开的秘密。如今在机缘巧合之下,谷歌努力保护了二十年的秘密被暴露在了阳光下。

日前,受众行为网站SparkToro联合创始人、知名SEO专家Rand Fishkin发布博客文章称,一位匿名人士向他分享了超过2500份谷歌内部文件,而这些有关谷歌搜索API(Content API Warehouse)的技术文档,以前所未有的方式揭示了谷歌搜索引擎的部分工作模式,其中涉及到谷歌收集和使用何种数据,以及如何处理小型网站等课题。

这批文档在2024年3月27日被上传到GitHub,直到2024年5月7日才被删除。让外界确信这一文档来自谷歌的原因,是其使用了与以往被公开的谷歌内部文档相同的符号风格、格式,甚至对于功能名称和引用也如出一辙,极为符合谷歌内部的规范。此外,Content API Warehouse又是谷歌给搜索引擎团队成员提供的索引,频繁被使用或许是其被某位谷歌员工错误上传到GitHub的原因。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

其实互联网大厂的内部文件被泄露是常用的事情,这也不足以引发讨论,真正让外界感到惊讶的,是这一批文件所提及的内容,与John Mueller等谷歌搜索的发言人多年来的说法直接矛盾。“撒谎这个词虽然很刺耳,但非常正确形容了谷歌所宣称的搜索算法内容”,这是数字营销机构iPullRank创始人Mike King对这一批文档进行解读后,所给出的评价。

尽管此次泄露的内容中,并没有直接表明决定谷歌如何使用特定数据来对搜索结果进行排名,但SEO专家们还是发现了一些端倪,包括其如何使用点击数据、浏览器点击流、白名单、质量评估员反馈和链接质量,来影响搜索结果排名。例如作为谷歌搜索关系团队(Search Relations team)的负责人,John Mueller就曾声称,谷歌没有直接在搜索排名算法中使用点击量数据。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

然而在此次泄露的文档里,却频繁出现了“badClicks”、“goodClicks”、“lastLongestClicks”等与用户点击相关的描述。其中,lastLongestClicks和lastGoodClicks是用来衡量点击是否会随着时间衰减,badClicks和goodClicks则是评测用户在搜索结果中点击行为的指标,如果用户点击结果后不再跳出、并点击其他结果算是加分,否则是减分。

这些点击指标虽然看似无法证明谷歌在算法中使用了点击量,但联系之前美国司法部在谷歌反垄断诉讼中提及的内容,就几乎坐实谷歌说谎了。在此前的庭审中,谷歌搜索质量团队搜索副总裁Pandu Nayak确认了Navboost系统的存在,该系统会根据用户数据进行训练,能记住过去13个月的所有查询点击次数。此外,Navboost系统还有另一个名称Glue(胶水),后者聚合了不同类型的用户交互,例如点击、悬停、滚动和滑动,并创建了一个通用指标来比较网络结果和搜索功能。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

因此在Rand Fishkin、Mike King等SEO专家看来,以上种种迹象也证明了谷歌大概率在搜索引擎算法中使用了权重点击来作为影响排名的因素。另外相关专家也证实了Chrome数据被用于排名,但John Mueller此前在2022年却曾坚定地表示,“我们不使用Chrome的任何东西进行排名”。可是这些文档中所涉及与页面质量评分相关的模块中出现的“ChromeInTotal”参数,也就是网站在Chrome上的整体浏览量。

除此之外,这一批文档还解答了一个困扰SEO从业者许久的问题,即E-E-A-T在搜索排名中扮演什么角色?E-E-A-T所指的,就是作者模块。在这批文档中就出现了“author”参数,代表谷歌的算法会判断网页作者的属性。并提及了数个会导致“算法降级”的因素,包括网站导航链接的体验较差、链接锚文本与它所链接的目标网站不匹配等问题,都会导致相关网站在计算中被降级。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

这2500分文档尽管并未直接披露谷歌的搜索引擎排名算法,但还是让外界第一次了解了谷歌搜索引擎的具体工作原理。此外,更加重要的影响还体现在SEO领域,Rand Fishkin就明确表示,此次泄露的文档表明,在谷歌的搜索排名算法中品牌的作用极大。而这也就意味着,谷歌在台面之下将更多流量导向了大品牌建立的网站。换而言之,对于小型网站来说,SEO可能会是一个伪命题。

当然,受到此次内部文件泄露影响最大的莫过于谷歌。一直以来,外界都在质疑谷歌搜索缺乏透明度,现在这个质疑变成了现实。谷歌搜索关系团队本来应该是一个谷歌搜索和网站站长之间的桥梁,但谷歌方面却在某些方面误导后者,并试图控制站长们的SEO行为。谷歌此前一直在说要努力保护搜索结果的完整性免受操纵,结果自己却是这个“幕后黑手”。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

无论如何,SEO从业者是谷歌的合作者而非敌人,欺骗合作伙伴的操作显然殊为不智,对他们撒谎被戳穿更是会让外界浮想联翩。那么未来谷歌的承诺、保证和声明,究竟还能保真吗?

【本文图片来自网络】

推荐阅读:

英特尔LunarLake架构解析:单核暴增、Xe2首秀

LunarLake“战未来”的潜力,或许比现在想象的还要更大一些。

游戏业务开启“第二阶段”,字节跳动再争朝夕

 能不能给新团队更多耐心,或是未来字节跳动游戏业务能否成功的基础。


本内容观点仅代表发布作者本人观点立场,欣文网平台只做信息内容展示和存储。发布作者:全网转载,转转请注明出处:https://www.xinenw.com/19841

(0)
上一篇 2024年6月7日 21:27
下一篇 2024年6月7日 21:28

相关推荐

  • 教填志愿收费 2 万元,3000 万粉顶流网红又被骂了!

    顶流网红讲师张雪峰,商味儿越来越浓了。 这两天正是高考时间,加上一条有关 “ 张雪峰一门课卖近两万元 ” 的话题,将张雪峰又一次推到公众面前。 跟以往一样,上热搜、引发网友热议。 这一次,是因为张雪峰公司旗下的峰学蔚来 App ,上架了系列 2024 高考志愿填报课程。 这系列课程,根据服务不同,上市定价在 599-17999 元不等。 到底是什么样的志愿课…

    2024年6月12日
    11300
  • 联发科天玑9400 芯片依旧“全大核”,性能、成本均上涨,十月见

    日前联发科官方宣布,新一代天玑9400旗舰芯片目前已经进入流片阶段,将于今年十月正式发布。 据了解,天玑 9400将采用台积电3nm制程工艺、Cortex-X5、Cortex-X4 和 Cortex-A7xx 全大核设计,和前代天玑 9300芯片的架构相似。 有业内人士透露,天玑 9400 的NPU 算力相较于天玑 9300(48 TOPS)提升40%,LP…

    2024年8月4日
    7300
  • 这一轮的AI大模型价格战,初创企业选择不跟

    转眼间,今年的618大促已经启动,又到了各大电商平台表演的时候。可谁都没能想到,如今价格战打得最猛的却并非是快消品,而是大众认知里高大上的AI厂商,大模型每百万Tokens的输入价格在短短一周时间里可谓是飞流直下三千尺,降价80%只是开胃菜、直降97%都很正常,甚至还有免费使用的。在此前经历了团购大战、外卖大战、千播大战、网约车大战的网民,仿佛又一次看到了历…

    2024年5月30日
    10200
  • 钟薛高濒死,13亿是怎么消失的?

    曾经的林盛,善于施展“魔法”、改变局面。他用一套行业内人士看不懂的营销手法,造出了钟薛高,收割了一票投资人和消费者,享受了令人眩晕的高增长。 如今,“魔法”失灵,失去了重重光环的钟薛高被打回原形。我们找到数位钟薛高的中高层员工和熟悉消费赛道的投资人,试图还原:融到的十几亿都花去哪儿了?以及这个新消费领域的第一网红,究竟是如何倒下的? 文 | 常芳菲 编辑 |…

    2024年4月26日
    15700
  • 我去美国试了特斯拉的FSD,好像真有点遥遥领先。。。

    问大伙一个问题哈,就说第一印象,你们觉着现在哪家智能驾驶的键盘值最高? 绝大部份兄弟的答案,肯定是华为。也确实啊,都不说网上流传了数不清的小视频了,我实际体验下来,华为的 ADS 2.0 在国内这一票厂商里头,还真就是最能打的那个。 可如果把视野放的大一点,把海外市场也拉来对比的话,大伙的答案可能就会不一样了。 为啥?因为在北美有那么一家车企的智驾,虽说国内…

    2024年6月16日
    7400

发表回复

登录后才能评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件A:xinenw@qq.com

邮箱B:xinenw@163.com

工作时间:周一至周五,8:30-23:30;周六周日10:30-18:30;节假日休息

关注微信
欣文网内容建设升级中,欢迎您参与意见征集进行评论,只为打造更好的内容平台!