首页 > 科技未来 > 内容

让用户吃石头,给披萨涂胶水,Google AI 搜索疯了吗

发布于:2024-06-21 编辑:匿名 来源:网络

让用户吃石头并在披萨上涂胶水。

谷歌人工智能搜索疯了吗? 2020年2月,追逐ChatGPT的巴德公开犯了事实错误; 2018年12月,双子座像贾维斯一样说话,但视频经过后期处理; 2018年2月,双子座生成了多种肤色的历史人物,并被批评歧视白人。

这一次,厄运降临到了谷歌的专业——搜索上。

海外网友并没有太认真地看热闹,甚至上演了一波图战狂欢。

被众人嘲笑的谷歌AI搜索,有明显的愚蠢感。

不久前的Google I/O大会上推出的功能之一就是AI Overview。

顾名思义,AI Overview 会在网页顶部生成多个来源的摘要以及链接。

当时,谷歌对AI Overview非常有信心,并宣布将立即向所有美国用户推出,并很快将推广到更多国家。

预计到年底将覆盖超过10亿人。

然而没过几天,《AI Overview》就在美国用户中掀翻了。

自制披萨上的奶酪容易脱落怎么办?亲爱的,Google 建议您只需在酱汁中添加约 1/8 杯胶水即可。

特别强调的是无毒,背后的理由很暖心。

谷歌现在没有编译它,而是从11年前Reddit上一位用户的评论中复制了答案。

不幸的是,它无法解读人类的幽默。

一个人一天应该吃多少颗石头才能补充营养呢?谷歌并没有反驳问题本身的不合理性,而是严肃地表示,根据加州大学伯克利分校地质学家的说法,你每天至少应该吃一小块石头才能获取维生素和矿物质。

答案的来源是《洋葱新闻》的一篇“报道”,该新闻社以假新闻和讽刺文章而闻名。

AI Overview也对美国历史不甚了解,陷入了奥巴马是第一位穆斯林总统的阴谋论陷阱。

一时间,X等社交媒体掀起了一股抽象热潮:发布截图,竞相看谁的谷歌答案最可笑。

在人工智能的世界里,竞争非常激烈,前总统曾 21 次从威斯康星大学毕业,一只狗曾在 NBA、NFL 和 NHL 打过球,蝙蝠侠是一名警察。

人们聚集嬉戏的地方,浑水摸鱼、颠倒是非的人也不少。

谷歌回应称,《AI Overview》中的大部分信息质量很高,并提供了有用的链接供用户了解更多信息。

在许多“翻转”的情况下,问题并不常见,结果无法重现,甚至被篡改。

例如,一张广为流传的截图显示,治疗抑郁症的方法是从金门大桥跳下去。

这是人命关天的问题,谷歌竭尽全力解释说这个结果是假的。

▲ 被谷歌反驳的截图 与此同时,谷歌并没有反驳其他例子,而是将它们作为改进AI的养料。

为什么不考虑带有人类反馈的强化学习(RLHF)?眼尖的网友还发现,谷歌I/O上精心挑选的演示其实存在事实错误,但更为微妙。

当被问及如何修复卡住的胶片相机时,谷歌建议打开后门并轻轻取出胶片,但这样做可能会毁掉你的照片。

这并不是谷歌第一次在高调的公共场所犯错。

谷歌巴德在二月份的一次演示中表示,詹姆斯·韦伯太空望远镜是第一个对太阳系外行星进行成像的望远镜。

事实上,第一张系外行星图像是在 。

一个错误就让市值损失1亿美元。

这次,除了AI Overview本身的错误之外,还有一个缺陷:这个功能不容易关闭。

一些热情的开发人员争先恐后地创建扩展程序,强制只显示传统的搜索结果。

没有方便的退出机制是谷歌的错。

AI概览基于传统搜索页面,拥有海量用户。

如果不熟悉AI的用户盲目相信其结果而被误导,后果很难说。

“谷歌怎么可能错了 30%?”事实上,AI Overview所暴露的问题并不新鲜。

人工智能会犯错误早已是一个公开的秘密。

就像在建模中发挥作用的“吸烟有害健康”一样,AI Overview的底部标注着:“Generative AI is Experimental”。

ChatGPT还用小字提醒:“可能会出现错误,请检查重要信息。

”大语言模型的基本原理然而,通过预测生成下一个单词或短语的概率最高的文本,有时可能会选择不正确但看似合理的单词,从而导致错误信息或“错觉”。

AI概览的胡说八道也是幻觉的表现。

让用户吃石头,给披萨涂胶水,Google AI 搜索疯了吗

它结合了大型语言模型生成的句子和来自互联网的链接。

可以引用来源,但不保证来源的准确性。

即使采用RAG(Retrieval Augmentation Generation)等技术,将检索系统与生成模型结合起来,限制回答问题的范围,也只能抑制错觉,而不能治愈错觉。

此外,消息来源本身的可信度也值得怀疑。

“美国版贴吧”Reddit,内容由网友而非权威媒体贡献。

今年 2 月,谷歌与 Reddit 达成协议,利用其内容来训练人工智能模型。

当时有人怀疑,是否会导致“垃圾进,垃圾出”的尴尬局面。

谷歌并不是唯一一家受到“幻想”困扰的公司。

去年5月,当有网友询问微软的New Bing时,答案显然是错误的。

当他点击参考链接时,他发现作为参考来源的知乎答案实际上是由人工智能生成的。

够不着。

人工智能搜索者如何引用来源也是一个令人困惑的问题。

当我用中文搜索“如何给柴犬洗澡”时,Perplexity的来源是搜狐、YouTube、豆瓣日记和哔哩哔哩,而天工的来源是知乎和百度文库。

我一时不知道哪一个更权威,我简直不敢相信。

既然AI搜索都是幻觉,为什么谷歌总是被火烤呢?成立于 ,谷歌已成为搜索的代名词。

谷歌作为AI巨头,引发了外界的期待,也必须承担错误的后果。

相反,Perplexity CEO Aravind Srinivas 表示,轻装上阵是他们的优势,言语中还带着几分自豪。

如果你使用我们的产品,80%的结果是好的,你可能会印象深刻,但如果你使用谷歌的产品,只有70%的时候是正确的,你可能会感到困惑,谷歌怎??么可能错了30%时间?此外,AI搜索也引发了用户认知的变化。

我们过去常常说“用谷歌搜索”,但在介绍搜索的生成式人工智能功能时,谷歌自己将博客命名为“让谷歌搜索你”,这是一个微妙的优先顺序逆转。

过去,Google 会显示哪些链接回答了您的问题。

现在,谷歌本身使用人工智能来回答你的问题。

传播错误信息的责任已经从消息来源本身转移到了谷歌引用消息来源的头上。

谷歌必须承担责任。

除了提供事实,AI搜索还有哪些可能性?既然幻觉已经是前提,我们就应该换个角度来看待人工智能搜索,问自己一个问题:我们的预期是不是错了?事实上,在《AI Overview》受到批评之前,谷歌首席执行官皮查伊在最近接受 The Verge 采访时提到,“错觉”问题尚未得到解决,甚至可以说是大型语言模型的固有特征。

他认为,大语言模型不一定是理解事实的最佳渠道,但这并不意味着大语言模型没有用,非黑即白的思维不可取。

例如,它可以创作诗歌并引入搜索。

无论是CEO在接受采访还是在I/O大会上,他们都在向用户传递一个理念:不要仅仅把AI搜索当作现有网页的简单总结。

人工智能可以发挥作用的地方有很多。

然而,《AI Overview》未能让人们满意,这不能怪用户。

与演示相比,目前的AI概览还不是很完整,很多功能还没有推出。

Google 搜索总监 Liz Reid 在 I/O 上演示了“多步推理”的示例。

输入“查找波士顿最好的瑜伽馆,显示折扣信息,以及从灯塔山出发的步行时间”。

我找了三遍,现在一次就够了。

同时,AI Overview未来还将具备“规划”能力。

比如让AI规划三天的晚餐,用户可以直接拿到菜谱,中途细化,添加“素食”等要求,然后导出到文档。

谷歌的想法和其他人工智能搜索产品一样——让搜索更加可视化、交互性和个性化,用人类的文字而不是关键词进行交流,节省寻找信息的时间,回答更复杂和具体的问题。

Secret Tower提供简单、深入、研究等不同的搜索模式。

研究模式甚至可以给出大纲和思维导图来生成演示文稿。

Perplexity可以控制搜索范围,可以覆盖整个互联网,也可以根据搜索需求将范围缩小到学术论文、YouTube、Reddit。

天工以AI搜索为入口,搭载更多生产力工具,并提供AI速读、音乐创作等智能代理。

相当于在AI搜索之上搭建了一个AIGC内容创作平台。

大多数常见问题,例如天气怎么样、汇率是多少、跳转到官方网站,实际上都可以通过简单的传统搜索来回答。

但在相对复杂的场景下,AI搜索却被寄予厚望。

毕竟它比ChatGPT拥有更多的信息来源,也更方便验证。

与传统搜索相比,它可以进行更多的研究、创作、策划、头脑风暴。

它并没有成为比传统搜索更好的百科全书,而是更像是代理型的。

当然,无论蛋糕画了多少,AI搜索的假象仍然令人不安。

为此,有人建议,为了安全起见,使用生成式人工智能,不要只看摘要,用传统的谷歌搜索来检查。

俗话说,风云变幻,大哥依然是大哥。

让用户吃石头,给披萨涂胶水,Google AI 搜索疯了吗

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 更近了一步!美的精选小额IPO申请获证监会受理

    更近了一步!美的精选小额IPO申请获证监会受理

    美的(65.NQ)于2018年5月14日收到《中国证监会行政许可申请受理单》,证监会于2019年5月13日受理 公司公开发行核准向不特定合格投资者提供申请材料。

    06-18

  • 马可- “银河航天”完成新一轮融资,源代码是Pre-A轮投资者

    马可- “银河航天”完成新一轮融资,源代码是Pre-A轮投资者

    近日,中国商业航天企业银河航天完成最新一轮融资,投后估值约1亿元人民币。 老股东源码资本自Pre-A轮起就投资了银河航天,并持续支持后续几轮融资。 本轮融资由建银国际领投,安徽三众宜创基金、合肥产业投资、振威基金跟投。 老股东君联资本、混沌投资继续跟风。 据了解,银

    06-18

  • 2021年除夕夜银联线上交易笔数同比增长10.4%

    2021年除夕夜银联线上交易笔数同比增长10.4%

    中国银联最新数据显示,除夕夜(2月11日0:00至24:00),银联网上交易金额增加1亿元,较去年除夕同比增长7.1%。 去年除夕夜,银联网上交易笔数同比增长10.4%。

    06-18

  • 新玩法?高德地图携手郭德纲首次推出公交导航

    新玩法?高德地图携手郭德纲首次推出公交导航

    12月18日,高德地图在北京正式发布高德地图公交导航版,成为国内首家推出专业公交导航产品的互联网地图厂商旅行用户。 此外,高德还宣布与国内著名相声艺术家郭德纲合作,为高德地图用户提供郭德纲专属语音导航。 公交导航打造无缝出行体验 作为专注地图导航领域12年的专业厂

    06-18

  • 专注光量子集成芯片设计,“硅量子”获新一轮融资1500万,国芯科技投资

    专注光量子集成芯片设计,“硅量子”获新一轮融资1500万,国芯科技投资

    据投资界(ID:pedaily)4月20日消息,合肥硅芯科技有限公司已获新一轮融资。 硅量子股份有限公司(以下简称“硅量子”)近日获得新一轮1万元融资,本轮由苏州国芯科技有限公司(以下简称“国芯科技”)投资。 是国芯科技继今年5月份之后发起的第二轮投资,两轮投资金额合计

    06-18

  • 广州耀明小江完成3000万元A轮融资

    广州耀明小江完成3000万元A轮融资

    据投资界4月29日消息,广州耀明小江科技有限公司近日完成1万元A轮融资。 投资方为广州金控基金管理有限公司和纳斯科技投资管理有限公司。 据了解,本轮融资将为公司深化业务拓展、加强网络协同和数据智能、推动服务生态融合提供强有力的资本支持。 公司将继续巩固在自助设备、

    06-18

  • 生而纯,RED CHAMBER朱栈开启中国纯妆行业新标准

    生而纯,RED CHAMBER朱栈开启中国纯妆行业新标准

    4月11日,RED CHAMBER朱栈(以下简称:RC)在北京举办“生而纯首届纯妆团”上海世博会创意展示标准及纯化妆品行业白皮书新闻发布会”。 现场,品牌联合上海日用化学品行业协会正式推出中国最纯净化妆品团体标准《纯净彩妆通用要求指南》,并携手凯度咨询、天猫TMIC、行业权威

    06-18

  • 清流资本十周年特别行动:CEO闭门系列“新能源+新材料引领下一个十年”特别活动

    清流资本十周年特别行动:CEO闭门系列“新能源+新材料引领下一个十年”特别活动

    清流资本十周年特别行动:CEO闭门系列“新能源+新材料引领下一个十年”特别活动< titlesplit >专题专场 清流资本十周年 清流资本微信IDCrystalstreamCapital关于特色 清流资本是成功人士创业者创立的风险投资公司,专注于投资TMT领域的初创公司。 团队成员均来自顶尖互联网公

    06-18

  • 用iPad Pro玩了两天游戏,发现了苹果做游戏机的突破点

    用iPad Pro玩了两天游戏,发现了苹果做游戏机的突破点

    苹果在今年春季发布会上发布了新的游戏订阅服务“Apple Arcade”,并于9月份在iPhone上正式推出同年推出的iPad、Apple TV、MacBook设备,采用首月免费、第二个月收费4.99美元/月的商业模式。 几乎与此同时,苹果官方商店中出现了一款意想不到的产品——微软精英控制器II。 此

    06-21

  • 同程旅游:“五一”假期机票预订量同比增长超10倍

    同程旅游:“五一”假期机票预订量同比增长超10倍

    同程旅游大数据显示,截至3月17日,“五一”假期机票预订量同比增长10倍以上< titlesplit > “五一”假期同比增加10倍以上。 主要原因是同期疫情存在不确定性。 目前,清明假期机票价格已基本恢复至去年同期水平,五一假期机票价格已超过去年同期。 据同程旅游平台数据预测,

    06-17

  • 上海证券交易所:科创板上市公司申请发行股票购买资产的交易所审核时间修改为60天

    上海证券交易所:科创板上市公司申请发行股票购买资产的交易所审核时间修改为60天

    上交所拟修改《上海证券交易所科创板上市公司重大资产重组审核规则》。 修改内容包括:增加并购重组委对科创公司发行股份购买资产的审核流程,同时将重组交易项目的审核流程由现有的上市委员会变更为并购重组委的审核收购与重组委员会。 修改审核时间,完善相关计算规则。 根

    06-18

  • 阿里云发布《Create@阿里巴巴诸神之战2023年度新势力榜单》

    阿里云发布《Create@阿里巴巴诸神之战2023年度新势力榜单》

    面对复杂多变的市场环境,这是企业发展充满活力的一年。 大型人工智能模型诞生,新的数字模型和新技术不断涌现,人工智能与各行各业互动。 随着各行业的深度融合,我们看到越来越多的创新型企业利用科技发展的契机,实现从理念到产品到市场创新的创新。 也有越来越多的企业通

    06-17