泰晤士报:英国计划对英伟达收购ARM进行第二轮审查
06-08
文章内容语音播放由深声科技提供。
您的浏览器不支持音频元素。
谷歌目前正在对其核心搜索算法进行更改,这可能会影响多达十分之一的搜索结果的排名。
谷歌是如何修改其搜索算法的?对于谷歌的算法修改技术,雷锋网引用了相关文章并在不改变原理的情况下进行了整理。
【图片来源:THE VERGE 所有者:THE VERGE】 据悉,这一修改基于谷歌研究人员开发的尖端自然语言处理技术(NLP),该技术十个月前已应用于其搜索产品。
谷歌声称,它通过更好地理解句子中单词之间的关系来提高结果。
此前,谷歌在新闻发布会上讨论了一个例子,他们的搜索算法能够解析短语的含义——“你能为某人药房买药吗?”谷歌研究员兼搜索副总裁潘杜·纳亚克(Pandu Nayak)表示,旧的谷歌搜索算法将这句话视为“词袋”。
因此,它会查看那些重要的单词,即“medicine”和“pharmacy”,然后简单地返回本地结果。
新算法可以理解“为某人”一词的上下文,意识到这是一个关于您是否可以从其他人那里获得处方的问题,并返回正确的结果。
据了解,调整后的算法基于BERT(Bi Direction Encoder Representations from Transformers),即“Bi Direction Encoder Representations from Transformers”。
重要的是,BERT 并没有将句子视为“词袋”,而是将句子中的所有单词视为一个整体。
这样做可以让它认识到“为了某人”对于句子的意义至关重要。
不能省略。
值得一提的是,BERT 通过自学习注意到这些单词。
谷歌收集了一个英语句子语料库,随机删除了15%的单词,然后设置BERT来找出删除的单词是什么。
对此,高级研究员兼研究高级副总裁 Jeff Dean 表示,随着时间的推移,这种训练将使 NLP 模型在理解上下文方面更加有效。
此外,谷歌还举了另一个例子——“在没有路缘的山上停车”。
其中,“否”字对于句子的查询至关重要;但Google算法在实现BRET算法之前忽略了这一点。
【图片来源:THE VERGE 所有者:THE VERGE】谷歌表示,在过去的几天里,他们推出了一种新算法,该算法应该会影响美国 10% 的英语搜索查询(其他语言和国家尚未影响)可用)讨论)。
雷锋网了解到,为了确保改进的结果,所有对搜索的改变都必须经过一系列的测试。
这些测试包括使用谷歌的人工审核团队来评估搜索结果的质量,以训练公司的算法。
不仅如此,谷歌还进行live A/live B测试。

请记住,并不是每个查询都会受到 BERT 的影响,它只是 Google 用于对搜索结果进行排名的许多不同工具中的最新工具。
他们如何合作是一个谜。
事实上,谷歌故意对其中一些进程保持神秘,以防止人们利用其系统发送垃圾邮件。
另一个重要原因是:当计算机使用机器学习来做出决策时,很难知道它为什么会做出这样的选择。
这就涉及到机器学习的“黑匣子”问题。
如果结果在某种程度上是错误的,则很难诊断原因。
谷歌表示,它一直在努力确保在算法中添加 BERT 不会增加偏差——这是机器学习中的一个常见问题,模型被训练成有偏差。
此外,由于 BERT 是在庞大的英语句子语料库上训练的,而这个语料库存在固有的偏差,这也是一个值得关注的问题。
谷歌还表示,预计其算法不会导致流量发生任何重大变化,至少在大型出版商中是这样。
事实上,每当谷歌的搜索算法发生变化时,整个网络都会关注。
此外,值得一提的是,由于谷歌搜索排名的变化,一些公司也变得不确定。
其实,每个通过网络流量赚钱的人都应该注意这一点。
当谈到搜索结果的质量时,Payak 表示:这是最大的一个……这是我们在过去 5 年中经历的最积极的变化,也可能是自一开始以来最大的变化之一。
。
雷锋网注:本文整理自 Dieter Bohn 在 The Verge 发表的文章。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-18
06-18
最新文章
三只松鼠:门店扩张已全面暂停
Nvidia 已准备好“统治”AI
【创业24小时】2023年11月16日
【创业24小时】2022年10月20日
倒计时一天,浙江这座小镇要火了!
沃图网络获数千万A轮投资,加大投入海外网红营销SaaS平台建设
泰山天使基金部分退出拉手半年回报180倍
西格数据完成1000万元A+轮融资,国发创投领投