首页 > 科技未来 > 内容

拥有26亿个参数,接近人类的水平,谷歌的开放领域聊天机器人的意义何在?

发布于:2024-06-18 编辑:匿名 来源:网络

科技巨头时不时宣称自己在AI领域取得了突破性进展,我们对此不再感到惊讶。

当地时间1月28日,谷歌在博客中推出了一款名为Meena的开放式聊天机器人,号称“史上最强大”。

那么这个新的突破是否会让人眼前一亮呢? [图片来源:谷歌博客 所有者:谷歌博客] 在开放领域开发聊天机器人很困难。

事实上,智能聊天机器人就是为了解决信息爆炸时代存在的信息过载问题而设计的。

最初,聊天机器人是作为搜索引擎的最终形式而设计和开发的。

与现有的搜索引擎不同,聊天机器人可以自然流畅地对用户的问题给出准确的答案,节省大量时间,从而带来更好的用户体验。

根据使用场景,聊天机器人主要有两种类型:开放域型和任务型。

其中,面向任务的主要包括问答系统和对话系统聊天机器人,分别是指根据用户的问题给出答案的聊天机器人(常用于智能家居中的智能搜索、家电控制等场景)和聊天机器人与用户进行多轮对话。

(如客服机器人、销售机器人等)。

开放域聊天机器人(又称聊天机器人),顾名思义,针对的是开放域对话场景,对话题和内容没有任何限制,比如微软的小冰和苹果的Siri。

谷歌在上述博客中表示:开放领域聊天机器人的研究不仅具有学术价值,还可以激发许多有趣的应用,例如更深入的人机交互、改进的外语训练以及互动电影和游戏角色的制作。

值得一提的是,开放领域的聊天机器人更符合人们对“人工智能”的定位,开发难度自然也很大。

开放领域的聊天机器人目前面临的一个严重问题是它们表达的内容往往毫无意义且无法理解。

它与用户的问题是连贯的,但由于缺乏基本的常识和认知,无法给出有针对性的答复。

谷歌开发的Meena是一个开放领域的聊天机器人。

那么与现有的聊天机器人相比有何突破呢? 【Meena与人类对话内容图片来源:谷歌博客】26亿参数端到端神经对话模型。

谷歌在博客中介绍,Meena是一个26亿参数的端到端训练的神经对话模型,它是一个GPT-2模型。

最大版本的1.7倍(15亿个参数)。

据称,谷歌使用一亿字的数据集,通过张量处理单元(TensorProcessingUnit,谷歌专用的AI芯片)训练了30天,得到了最好的版本。

实验表明,相比聊天机器人SOTA,Meena能够更好地完成对话,而且内容更加具体、清晰。

据悉,Meena由1个Evolved Transformer编码器和13个Evolved Transformer解码器组成:编码器用于处理对话上下文,帮助Meena理解对方的话;解码器将使用该信息来生成回复。

在此过程中,谷歌表示:研究人员发现,经过超参数调整后,实现高质量对话的关键在于更强大的解码器。

【图片来源:谷歌博客 所有者:谷歌博客】雷锋网了解到,谷歌从公共领域社交媒体对话中过滤了 GB 的文本,并将文本组织在树状上下文中,用于“多轮对话”训练。

研究人员将每轮对话作为训练样本,每轮之前的7轮对话作为上下文信息,它们共同形成了一组数据。

据悉,选择7轮对话作为上下文,不仅可以保证训练过程获得足够的上下文信息,而且模型也不能超过内存限制。

毕竟,文本越长,占用的内存就越多。

新提出的人类评估指标SSA 根据博客,上述性能是谷歌根据新提出的人类评估指标“敏感性和特异性平均值(SSA)”获得的。

这次提出新指标是因为目前聊天机器人的人类评价指标相当复杂,很难形成一致的评价指标。

谷歌表示,SSA 捕获了基本但对人类对话很重要的属性。

为了计算这一指标,研究人员测试了 Meena、Mitsuku、Cleverbot、DialoGPT 和小冰等常见聊天机器人。

在测试中,对于每个聊天机器人,研究人员收集了对话中的轮流,并由人类评估者对每个聊天机器人的响应进行评分(主要根据对话的流畅性和答案的准确性),以及它们各自的表现如下所示。

【图片来源:谷歌博客 所有者:谷歌博客】不难看出,Meena的 SSA 分数比现有的 SOTA 聊天机器人更高,甚至接近人类的表现。

毫无疑问,困惑与 SSA 密切相关。

人的评价或多或少都存在问题。

拥有26亿个参数,接近人类的水平,谷歌的开放领域聊天机器人的意义何在?

因此,很多研究者希望找到一种可以自动计算的评价指标,而且这个指标必须准确对应人类的评价。

雷锋网了解到,perplexity(perplexity,指任何神经对话模型都可以轻松获得的计算指标)是一个 seq2seq 模型(雷锋网注:循环神经网络的一种变体,包括编码器和解码器是自然语言处理中的重要模型,可以作为机器翻译、对话系统、自动摘要中的通用指标来评估语言模型的不确定性,值得一提的是,谷歌已经证明了混淆度很高。

事实上,Meena接受的训练是为了最大限度地减少预测下一个标记的混乱和不确定性,因为Meena的核心是“进化的 Transformer seq2seq 架构”,这是一种通过进化神经架构搜索发现的 Transformer 架构。

谷歌在博客中表示,研究人员根据层数、注意力数量、训练步骤数、编码器和训练方法等因素测试了总共 8 个不同的模型,发现困惑度越低, SSA 分数越高。

同时,两者的相关系数非常高(R^2 = 0.93)。

【图片来源:谷歌博客 所有者:谷歌博客】同时,谷歌表示,研究人员将继续通过改进算法、架构、数据和计算量来降低这种神经对话模型的复杂性。

Meena意义重大吗?根据博客中显示的数据,我们认为Meena确实有出色的表现,但人们可能会质疑Meena何时发射以及实际发射后的表现如何。

博客提到,研究团队目前正在进一步评估这项研究的风险和收益,并可能在未来几个月内启动,旨在推动该领域的发展。

对此,VentureBeat记者Ronald Ashri在报道中表示:首先,我们必须认识到,即使谷歌开源了所有代码,也很少有人能够训练出类似于Meena的模型。

Meena可能仍在实验室中,太复杂而无法使用,尚未集成到工具中,而且谷歌不太可能很快将其作为服务提供给用户。

因此,Meena短期内恐怕很难推出。

另外,从实用性上来说,Meena作为一个开放式的聊天机器人确实可以实现多轮对话。

然而,Meena无法协助用户完成某项任务、学习一项新技能,或者为陷入困境的用户提供情感或心理支持。

与用户聊天没有明确的目的。

而在我们生活的时代背景下,把时间花在无意义的谈话上似乎并不是一个理想的产品。

与此同时,记者罗纳德·阿什里也对Meena提出了进一步的质疑。

如上所述,谷歌从公共领域社交媒体对话中过滤了数十亿字节的文本,以进行进一步的培训。

那么,数以百万计的公共领域社交媒体对话是否是所谓“有史以来最强大的聊天机器人”的正确数据集?Meena是否会说出不恰当的话或许也是我们应该关注的一点。

近年来,随着越来越多的AI聊天解决方案投入使用,我们需要专注于最有价值的东西——定义类人对话并探索此类对话在聊天机器人世界中的作用。

正如罗纳德·阿什里所说:Meena拉近了我们的距离,但尚未让我们到达那里。

拥有26亿个参数,接近人类的水平,谷歌的开放领域聊天机器人的意义何在?

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 普发真空助力CMS半导体应用

    普发真空助力CMS半导体应用

    ——空气分子污染物控制技术,半导体制造业先进工艺中使用的AMC(空气分子污染物)和微小颗粒的检测和控制技术,例如集成电路的生产工艺,许多关键工艺步骤基于真空技术。 在硅加工过程中使用真空技术有几个原因: 真空可以控制条件,因为它排除了硅晶圆中的环境空气,例如反

    06-06

  • 电商云客服平台如何利用数据驱动精准客服和营销?

    电商云客服平台如何利用数据驱动精准客服和营销?

    .wp-block-column h3{margin-left:0} 在电商行业,数据驱动的精准客户服务和营销策略已成为提高竞争力、提升用户体验的重要手段。 电商云客服平台利用丰富的数据资源和先进的分析技术,实现精准客户服务和个性化营销。 其中,伟峰私域营销是电商云客服平台的重要功能。 它基于

    06-18

  • 奈杜球完成1000万元A轮融资,富辉山资本、旭越科技共同领投

    奈杜球完成1000万元A轮融资,富辉山资本、旭越科技共同领投

    投资圈(ID:pedaily)据4月6日消息,奈杜球球股份有限公司(以下简称奈杜球) (以“奈杜秋”名义,Naildoo Inc.)近日宣布完成1000万元A轮融资。 本轮融资由富辉山资本、旭越科技联合领投。 本轮融资将用于推动快时尚消费品手工美甲供应链的建设和完善,以及美甲连锁品牌NA

    06-17

  • 传闻亚朵酒店计划今年赴美上市,创始人为中国居住在联合创始人

    传闻亚朵酒店计划今年赴美上市,创始人为中国居住在联合创始人

    据媒体报道,获悉人士报道,酒店集团亚朵计划今年赴美IPO,筹集约3亿美元。 美国银行和花旗集团帮助安排了这笔交易。

    06-17

  • 首次发布 -第三方病理诊断机构阿克曼完成数千万元A+轮融资

    首次发布 -第三方病理诊断机构阿克曼完成数千万元A+轮融资

    投资圈(ID:pedaily)4月14日,阿克曼宣布完成数千万元A+轮融资。 投资方为博航资本、青岛科学资管。 本轮融资的完成,进一步释放了资本进入病理学这家蓝海赛道平台龙头企业的信号。 下一步,阿克曼将继续致力于多个地区病理中心建设,实现病理资源、技术和人才向基层医疗机

    06-17

  • 理想VS蔚来:不同客群不同命运

    理想VS蔚来:不同客群不同命运

    2017年中国汽车市场产销量首次突破万辆,新能源汽车销量突破5000辆,渗透率逼近32%。 残酷绞杀和无限卷入下,新能源车企处境各异。 高河和威马跌入冰窖,蔚来仍在亏损巨额,但其理想却获得了巨额利润。 理想在过去的一年里斩获了新能源行业诸多里程碑式的称号:第一家年收入突

    06-17

  • 农村电商汇通达最快二季度赴港上市:阿里巴巴、雷军参与投资

    农村电商汇通达最快二季度赴港上市:阿里巴巴、雷军参与投资

    外媒报道称,阿里巴巴(8)参股的农村电商平台汇通达,正考虑最快第二季度在香港上市。 本季度完成上市,据悉汇通达募资规模高达10亿美元。

    06-17

  • 虎牙发布2018年第四季度及全年财报:月活跃用户突破1.16亿,连续5个季度盈利

    虎牙发布2018年第四季度及全年财报:月活跃用户突破1.16亿,连续5个季度盈利

    投资界消息,3月5日,虎牙直播(NYSE:HUYA)公布第四季度业绩12 月 31 日和全年未经审计的财务报告。 财报显示,虎牙总营收同比增长0.4%至46亿元人民币(约6亿美元),其中第四季度营收15亿元人民币(约2亿美元)。 第四季度和全年营收均超出预期。 根据非美国通用会计准则,

    06-17

  • 镭科技完成数千万A+轮融资,由经纬创投领投,蓝驰创投跟投

    镭科技完成数千万A+轮融资,由经纬创投领投,蓝驰创投跟投

    据投资界(ID:pedaily)12月9日消息,近日,“雨科技”宣布完成数千万人民币1万元A+轮融资。 本轮融资由经纬创投领投,老股东蓝驰创投跟投。 募集资金将主要用于3D打印粉末材料、打印设备核心部件的研发,以及“镭元科技”智能打印服务中心产能的进一步扩大。 “莱鑫科技”

    06-17

  • 360:上半年净利润5.72亿元,同比下降48.87%

    360:上半年净利润5.72亿元,同比下降48.87%

    360发布半年报。 公司实现营业收入56.19亿元,同比增长13.03%;净利润5.72亿元,同比下降48.87%。 报告期内,以政企安保为代表的安保及其他业务收入9.12亿元,同比增长.45%;智能硬件业务收入10.49亿元,同比增长16.16%;互联网相关业务收入36.51亿元。

    06-17

  • 猎豹IPO解读:走出腾讯与360

    猎豹IPO解读:走出腾讯与360

    美国时间4月2日消息,据报道,2020年12月,雷军曾为金山网络设定了三年内上市的目标年。 仅仅三年后,金山网络给雷军一个解释还为时不晚。   4月3日凌晨,金山网络以Cheetah Mobile Inc(为便于理解,以下统称为金山网络或金山)的名义向SEC提交了上市申请。   ,腾讯投资

    06-17

  • DotData获高盛领投2300万美元A轮融资

    DotData获高盛领投2300万美元A轮融资

    据投资界11月5日消息,人工智能开发软件提供商DotData宣布获得2300万美元A轮融资。 本轮融资由高盛领投,日本风险投资公司JAFCO Japan也跟投。 dotData 成立于 ,是一家致力于为企业提供端到端数据科学自动化的公司。 dotData 的全自动数据科学平台通过民主化、可操作化和加速

    06-18