首页 > 科技未来 > 内容

Google开源了最新的NLP模型,可以处理整个《罪与罚》

发布于:2024-06-17 编辑:匿名 来源:网络

Transformer。

可以说是近年来NLP领域备受关注的模型之一。

2017年,谷歌发表了一篇题为《Attention Is All You Need》的论文,提出了一个完全基于注意力机制的名为Transformer的网络框架。

2016年,谷歌开源了基于Transformer的BERT模型,一炮而红NLP领域。

2016 年,机器学习的最大趋势之一是基于 Transformer 的自然语言模型的持续增长和扩散。

2017年,根据自然语言处理领域数据集GLUE的排名,一些表现最好的模型——包括Nvidia的Megatron、Google的XLNet、微软的MT-DNN和Facebook的Roberta——都是基于Transformer的。

近日,Google推出了Transformer的“升级版”——Reformer。

【图片来源:VentureBeat 所有者:VentureBeat】比 Transformer 更高效 序列数据,无论是语言、音乐、语音还是视频,对于人工智能和机器学习模型来说都很难理解——尤其是在广泛的环境中。

例如,如果一个人或物体从视频中消失后又重新出现很长时间,许多算法就会忘记它的样子。

因此,Google开发了机器翻译模型Transformer,希望能够解决这个问题。

Transformer 是一种可扩展到数千个单词的架构,可显着提高合成、图像合成、逐句文本翻译和文档摘要等任务的性能。

与所有深度神经网络一样,Transformer 由连接层中的神经元(数学函数)组成,这些神经元传输来自输入数据的信号并缓慢调整每个连接的突触强度(权重),这是所有人工智能模型提取和学习预测方法的特征,但 Transformer 独特地注意到每个输出元素与每个输入元素相关联,并且它们之间的权重实际上是动态计算的。

然而,Transformer 并不完美 - 将其扩展到更大的环境中会使局限性变得明显。

大窗口应用程序的内存范围从 GB 到 TB,这意味着模型只能吸收几段文本或生成一小段音乐。

基于此,Google 推出了 Reformer,作为 Transformer 的进化版。

Reformer 可以处理多达 10,000 个字的环境,并且可以在仅具有 16GB 内存的单个 AI 加速器芯片上运行。

【图片来源:论文】雷锋网获悉,相关论文《Reformer: The Efficient Transformer》已被将于今年4月在埃塞俄比亚召开的自然语言处理顶级会议ICLR(International Conference on Learning Representations)接收。

目前的模型也已经开源了。

论文称,Reformer主要包括以下技术:第一,可逆层在整个模型中只存储激活函数的单个副本,因此N因子消失;其次,激活函数在前馈层中被分割并分段处理。

Google开源了最新的NLP模型,可以处理整个《罪与罚》

消除dff因子,节省前馈层内存;第三,使用局部敏感哈希(雷锋网注:LSH,一种哈希算法,主要用于高维海量数据的快速近似搜索)。

具体来说,哈希函数是将任意大小的数据映射到与相似向量(即表示机器学习中人类可读数据的代数结构)匹配的固定大小的值的函数,而不是在所有可能的向量中心搜索中。

例如,在翻译任务中,来自网络第一层的每个向量代表一个单词,不同语言对应同一个单词的向量可以获得相同的哈希值。

当哈希赋值时,对序列进行重新排列,然后根据元素的哈希值进行分类,实现并行处理,降低了长序列的复杂度,大大减少了计算量。

Reformer 可以处理整本小说 为了验证 Reformer 确实可以在单个 GPU 上运行并快速训练长序列,研究人员在 enwik8 和 imagenet64 数据集上训练了 20 层 Reformer 模型。

实验表明,Reformer 可以实现与 Transformer 相同的性能,并且内存效率更高,并且在长序列任务上训练速度更快。

[图片来源:论文] 此外,研究团队还尝试了基于 Reformer 的图像和文本模型,用它们生成图像中缺失的细节,还处理了小说《罪与罚》的全文(包含约 91 个单词) 。

研究表明,Reformer 能够逐像素生成全帧图像,并且可以在单轮训练中接受小说长度的文本。

谷歌科学家 ?ukasz Kaiser 和加州大学伯克利分校学生 Nikita Kitaev 都对这项研究做出了贡献。

他们在博客中写道:因为 Reformer 非常高效,所以它可以直接应用于比几乎所有当前最先进技术大得多的上下文窗口。

对于文本域数据,Reformer 处理如此大数据集的能力也可能会刺激社区创建数据集。

据悉,论文作者将进一步将其应用到更广泛的领域(如时间序列预测和音乐、图像、视频生成),并改进位置编码的处理。

?ukasz Kaiser 和 Nikita Kitaev 补充道:我们相信 Reformer 为未来将 Transformer 模型用于长文本和自然语言处理以外的应用奠定了基础。

年末,外媒VentureBeat采访了谷歌高级副总裁杰夫·迪恩。

他在采访中表示:谷歌仍然希望建立更多的情境模型。

就像现在一样,BERT等模型可以处理数百个单词,但无法处理 10,000 个单词。

所以这将是谷歌未来的主要关注点。

改革者似乎是朝这个方向迈出的有希望的第一步。

来自 VentureBeat,雷锋网编译。

Google开源了最新的NLP模型,可以处理整个《罪与罚》

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 勤思科技获数千万元天使轮融资,进一步拓展海事、航道运营综合智能平台发展

    勤思科技获数千万元天使轮融资,进一步拓展海事、航道运营综合智能平台发展

    据投资界(ID:pedaily)5月13日消息,广州勤思网络科技有限公司勤思科技有限公司(简称“勤思科技”)近日完成天使轮融资,融资金额数千万元,本轮领投方为广州南沙中盈明星基金。 据悉,本轮融资本轮融资将用于进一步拓展公司海事航道综合智能平台的发展,加快在长江、环渤

    06-17

  • 中微资本:亚洲VC的成长之路

    中微资本:亚洲VC的成长之路

    2017年的一个周末,中微资本合伙人第一次见到了讯石科技CEO金良。 姚安民印象深刻——这是一家专注于3D打印技术、为牙科提供数字化椅旁解决方案的初创公司。 虽然其总部位于浙江绍兴,但其3D打印设备在北美非常受欢迎,市场份额超过50%。 此前,中维资本在梳理3D打印行业国内

    06-18

  • 光电集成芯片公司“齐芯光电”完成3.5亿元Pre-IPO轮融资,重庆南方基金投资

    光电集成芯片公司“齐芯光电”完成3.5亿元Pre-IPO轮融资,重庆南方基金投资

    投资圈(ID:pedaily)8月8日消息,领先的齐芯光电科技股份有限公司齐芯光电集成芯片公司(以下简称“齐芯光电”)宣布完成3.5亿元Pre-IPO轮融资。 投资方为深圳市投控东海投资管理有限公司(以下简称“深投控”),系深圳市投资控股有限公司(“投控东海”管理的重庆南方基金

    06-18

  • 你在社交平台分享的照片下一秒可能会成为AI成人内容的提要

    你在社交平台分享的照片下一秒可能会成为AI成人内容的提要

    上世纪末的作品中《攻壳机动队》,全身被改造成了假肢的苏子质疑他是否还存在。 身体、记忆、与他人的关系,当这些东西可以被复制时,就不能用来作为物质生活的论据。 当人工智能歌手走红时,孙燕姿在回应中也提出了类似的观点。 你并不特别,你已经是可预测的,不幸的是你也

    06-21

  • zendesk海外客服系统的其他建议

    zendesk海外客服系统的其他建议

    .wp-block-column h3{margin-left:0} 对于需要在海外市场提供客户服务的企业来说,选择合适的海外客服系统至关重要。 除了zendesk客服系统之外,还有其他值得推荐的海外客服系统,同样强大且备受认可。 我们来看看这些建议。 Salesforce Service Cloud:Salesforce是全球领先

    06-17

  • 智能营销SaaS服务商“励销云”获数亿元B+轮融资

    智能营销SaaS服务商“励销云”获数亿元B+轮融资

    投资社区(ID:pedaily)据6月16日消息,全流程智能营销SaaS服务商励销云又获数百万元融资数百万元B+轮融资。 本轮融资由澳洲电信领投,大晨财智、58参奇资本、老股东君联资本跟投。 资金将主要用于产品研发、平台建设和市场推广。 阅微资本担任财务顾问资本独家一轮融资。 此

    06-18

  • 苹果前首席设计官的最新作品来了,一款43万的硬件产品

    苹果前首席设计官的最新作品来了,一款43万的硬件产品

    今年是英国著名音响品牌、高保真先锋Linn成立50周年。 它有一个特别的生日庆祝活动:与苹果前首席设计官 Jony Ive 合作推出限量版黑胶唱片机。 这也意味着Jony Ive在离开苹果并成立一家名为LoveFrom的新公司后终于迎来了自己的第一个硬件项目。 Linn的技术创新和LoveFrom的设

    06-21

  • 梅州产业发展基金注册成功,促进梅州与大湾区区域协调互补

    梅州产业发展基金注册成功,促进梅州与大湾区区域协调互补

    投资界动态(ID:pedaily)梅州产业发展基金(全称:“梅州嘉盈产业发展基金合伙企业》)于2018年2月9日顺利通过中国证券投资基金业协会注册。 该基金是根据《梅州市产业发展基金暨广东省粤东西北产业转移基金梅州子基金组建总体方案》精神,由广东嘉盈控股集团有限公司(简称

    06-18

  • 天合化工上市 天达、摩根士丹利和太盟投资集团获得退出

    天合化工上市 天达、摩根士丹利和太盟投资集团获得退出

    天合化工上市公司天大、摩根士丹利、太盟投资集团获退出。 2019年6月20日,天合化工集团股份有限公司在香港主板上市。 天合化工集团有限公司成立于 。 2019年6月20日,天合化工集团股份有限公司在香港主板上市。 天合化工集团股份有限公司是一家总部位于中国辽宁的特种化学品

    06-18

  • 电池寿命只能靠堆叠电池? OPPO Watch团队让不可能成为可能

    电池寿命只能靠堆叠电池? OPPO Watch团队让不可能成为可能

    智能手表有一个“不可能三角”:智能、续航、轻薄。 大多数产品只能选择其中一种,或者最多选择三种中的两种。 市场上几乎没有产品可以全部选择。 产品。 最典型的例子就是以运动健康为核心的轻智能运动手表。 它的电池寿命很长,但不够智能,而且往往不够轻薄。 在这个“不可

    06-21

  • 平台机器人客服:降低企业成本、提升服务水平的明智选择

    平台机器人客服:降低企业成本、提升服务水平的明智选择

    .wp-block-column h3{margin-left:0} 随着技术的不断发展,平台机器人客服逐渐成为强大的工具为企业提高服务效率助手。 无论您是传统企业还是新兴行业,客服机器人都能给您的业务带来翻天覆地的变化。 在选择合适的客服机器人时,成本成为企业关注的重要因素之一。 在当前激烈

    06-18

  • 如果MacBook使用了这款Cherry蝴蝶键盘,结果可能会大不相同

    如果MacBook使用了这款Cherry蝴蝶键盘,结果可能会大不相同

    不久前,德国键盘制造商Cherry发布了MX Ultra Low Profile机械键盘轴。 最大的亮点是其超薄设计,高度仅为3.5英寸。 mm,该轴最早会安装在Alienware m15 R4/m17 R4系列笔记本电脑上。 这款笔记本电脑仍在预售中。 事实上,将机械键盘装入笔记本电脑并不是什么新鲜事。 甚至可

    06-21