首页 > 科技未来 > 内容

Google开源了最新的NLP模型，可以处理整个《罪与罚》

发布于：2024-06-17 编辑：匿名来源：网络

Transformer。

可以说是近年来NLP领域备受关注的模型之一。

2017年，谷歌发表了一篇题为《Attention Is All You Need》的论文，提出了一个完全基于注意力机制的名为Transformer的网络框架。

2016年，谷歌开源了基于Transformer的BERT模型，一炮而红NLP领域。

2016 年，机器学习的最大趋势之一是基于 Transformer 的自然语言模型的持续增长和扩散。

2017年，根据自然语言处理领域数据集GLUE的排名，一些表现最好的模型——包括Nvidia的Megatron、Google的XLNet、微软的MT-DNN和Facebook的Roberta——都是基于Transformer的。

近日，Google推出了Transformer的“升级版”——Reformer。

【图片来源：VentureBeat 所有者：VentureBeat】比 Transformer 更高效序列数据，无论是语言、音乐、语音还是视频，对于人工智能和机器学习模型来说都很难理解——尤其是在广泛的环境中。

例如，如果一个人或物体从视频中消失后又重新出现很长时间，许多算法就会忘记它的样子。

因此，Google开发了机器翻译模型Transformer，希望能够解决这个问题。

Transformer 是一种可扩展到数千个单词的架构，可显着提高合成、图像合成、逐句文本翻译和文档摘要等任务的性能。

与所有深度神经网络一样，Transformer 由连接层中的神经元（数学函数）组成，这些神经元传输来自输入数据的信号并缓慢调整每个连接的突触强度（权重），这是所有人工智能模型提取和学习预测方法的特征，但 Transformer 独特地注意到每个输出元素与每个输入元素相关联，并且它们之间的权重实际上是动态计算的。

然而，Transformer 并不完美 - 将其扩展到更大的环境中会使局限性变得明显。

大窗口应用程序的内存范围从 GB 到 TB，这意味着模型只能吸收几段文本或生成一小段音乐。

基于此，Google 推出了 Reformer，作为 Transformer 的进化版。

Reformer 可以处理多达 10,000 个字的环境，并且可以在仅具有 16GB 内存的单个 AI 加速器芯片上运行。

【图片来源：论文】雷锋网获悉，相关论文《Reformer: The Efficient Transformer》已被将于今年4月在埃塞俄比亚召开的自然语言处理顶级会议ICLR（International Conference on Learning Representations）接收。

目前的模型也已经开源了。

论文称，Reformer主要包括以下技术：第一，可逆层在整个模型中只存储激活函数的单个副本，因此N因子消失；其次，激活函数在前馈层中被分割并分段处理。

Google开源了最新的NLP模型，可以处理整个《罪与罚》

消除dff因子，节省前馈层内存；第三，使用局部敏感哈希（雷锋网注：LSH，一种哈希算法，主要用于高维海量数据的快速近似搜索）。

具体来说，哈希函数是将任意大小的数据映射到与相似向量（即表示机器学习中人类可读数据的代数结构）匹配的固定大小的值的函数，而不是在所有可能的向量中心搜索中。

例如，在翻译任务中，来自网络第一层的每个向量代表一个单词，不同语言对应同一个单词的向量可以获得相同的哈希值。

当哈希赋值时，对序列进行重新排列，然后根据元素的哈希值进行分类，实现并行处理，降低了长序列的复杂度，大大减少了计算量。

Reformer 可以处理整本小说为了验证 Reformer 确实可以在单个 GPU 上运行并快速训练长序列，研究人员在 enwik8 和 imagenet64 数据集上训练了 20 层 Reformer 模型。

实验表明，Reformer 可以实现与 Transformer 相同的性能，并且内存效率更高，并且在长序列任务上训练速度更快。

[图片来源：论文] 此外，研究团队还尝试了基于 Reformer 的图像和文本模型，用它们生成图像中缺失的细节，还处理了小说《罪与罚》的全文（包含约 91 个单词）。

研究表明，Reformer 能够逐像素生成全帧图像，并且可以在单轮训练中接受小说长度的文本。

谷歌科学家 ?ukasz Kaiser 和加州大学伯克利分校学生 Nikita Kitaev 都对这项研究做出了贡献。

他们在博客中写道：因为 Reformer 非常高效，所以它可以直接应用于比几乎所有当前最先进技术大得多的上下文窗口。

对于文本域数据，Reformer 处理如此大数据集的能力也可能会刺激社区创建数据集。

据悉，论文作者将进一步将其应用到更广泛的领域（如时间序列预测和音乐、图像、视频生成），并改进位置编码的处理。

?ukasz Kaiser 和 Nikita Kitaev 补充道：我们相信 Reformer 为未来将 Transformer 模型用于长文本和自然语言处理以外的应用奠定了基础。

年末，外媒VentureBeat采访了谷歌高级副总裁杰夫·迪恩。

他在采访中表示：谷歌仍然希望建立更多的情境模型。

就像现在一样，BERT等模型可以处理数百个单词，但无法处理 10,000 个单词。

所以这将是谷歌未来的主要关注点。

改革者似乎是朝这个方向迈出的有希望的第一步。

来自 VentureBeat，雷锋网编译。

站长声明

标签：

上一篇：领先的互联网印刷企业世纪开元完成1亿元C轮融资，

下一篇：【创业24小时】2023年4月28日

全球最大生物医药股权投资诞生！高瓴认购百济神州逾10亿美元股份

全球生物医药史上最大股权投资即将进行，缔造者正是高瓴资本。 7月13日，百济神州（纳斯达克代码：BGNE；香港联交所代码：0）宣布以注册直接发行的方式向特定现有投资者发行1,000股每股面值0.0美元的普通股。按照定价，每股普通股的购买价格为 14.00 美元，相当于每股美国存

06-17
数字营销时代的汽车销售：如何利用SCRM工具提升销售业绩和客户满意度

.wp-block-column h3{margin-left:0} 在数字营销时代，汽车销售行业面临着越来越多的挑战竞争激烈，消费者需求多样化。为了提高销售业绩和客户满意度，汽车行业正在转向 SCRM（社交客户关系管理）工具。我峰科技的SCRM伟峰产品以其实现潜在客户私域运营、粉丝会员营销互动、

06-18
对战6亿用户竞技手游：聚焦复杂游戏中的多智能体博弈

在竞技手游中与6亿用户竞争：专注于复杂游戏中的多智能体游戏。 2019年11月，全球首届“AI《球球大作战》：Go-Bigger多智能体决策智能挑战赛”正式拉开帷幕。作为面向全球技术开发者和在校学生的技术大赛，本次大赛旨在促进决策智能相关领域技术人才的培养，打造全球领先、原

06-18
Google Insider揭秘：OpenAI领先的原因比想象的更复杂

他更喜欢渐进式的产品改进而不是剧烈的改变；他容忍员工数量的增加、懒惰的企业文化和低效的组织结构；与此同时，皮查伊在谷歌的声音似乎并没有像一个CEO应有的那么强烈。皮查伊等一些高管无法让 DeepMind 的首席执行官确定项目的优先顺序或与 Google Brain 共享代码。这可

06-21
比亚迪：一季度归属于母公司净利润预计同比增长77.56%-166.34%

比亚迪发布今年一季度业绩预告。报告显示，比亚迪预计今年一季度归属母公司净利润2亿元至3亿元，同比增长77.56%-.34%。

06-17
VC急招招投招聘总监，月薪7万

“今年最火的两个内部职位，法务岗和投招岗位。 ”这堪称一级市场当年最生动的写照：法务岗位对应的是回购、投资招聘岗位，是回报投资。正如近日圈内流传的招聘消息——某知名双币VC基金正在紧急招聘新职位——工投招聘总监，月薪5万-7万。在我的印象中，这样的职位在过去是

06-18
100%自主研发！龙芯中科新一代通用处理器发布

据央视新闻报道，11月28日，新一代国产CPU——龙芯3A在北京发布。据介绍，龙芯3A采用我国自主设计的指令系统和架构，不需要依赖任何国外授权技术。是我国自主研发、自主可控的新一代通用处理器。它可以运行多种跨平台应用程序，满足各种大型复杂桌面应用场景的需求。据悉

06-06
当前传感器芯片供应商“新工微电子”获一村资本数百万投资

据投资界5月10日消息，上海新工微电子（以下简称新工微）近日收购了昆山七村投资中心控股的由一村资本（有限合伙）基金投资1万元。　　森科微电子有限公司于2016年5月在上海成立，是由来自欧美一流半导体公司和著名风险投资基金的高级管理人员和高级技术人员创立的电流传感

06-18
含广厦地产2021财年第一季度净利润为29.2万美元

本财年第一季度，含广厦地产总营收为5000美元，而上年同期为4000美元。增长19.6%。听，中小企业反馈平台。倾听用户需求，倾听创业者声音，解决中小企业痛点。点击立即参与调查并获得礼物。

06-17
五芳斋即将登陆A股市场

6月4日，五芳斋上市前披露文件在证监会网站发布，保荐人为浙商证券。本次公司拟募集资金10.56亿元，用于投资智慧食品车间、数字产业智慧园区、研发中心及信息化建设、成都生产基地改造等项目，并补充流动资金。

06-17
苹果发布 16 英寸 MacBook Pro，售价 18999 元起

据雷锋网报道，2020 年 11 月 13 日，苹果在其官网发布了首款 16 英寸 MacBook Pro，售价 9 元起，高端版售价上涨9元。与之前的 13 英寸和 15 英寸 MacBook Pro 相比，该型号配备了更大的屏幕、更高性能的处理器和更大的存储空间。被业界认为是针对专业群体的新产品。据苹

06-17
第九届清华校友创新创业大赛“一带一路”区域邀请赛暨天使投资峰会圆满落幕 -英诺喜讯

第九届清华校友创新创业大赛“一带一路”区域邀请赛暨天使投资峰会圆满落幕|诺悦新闻天使天使基金天使天使基金天使天使基金微信IDinnoangel99关于特色天使天使基金（设立于航空航天等）、生命科技、下一代信息技术天使阶段和Pre-A阶段投资。 “投资创新，成人实现了自己

06-17