首页 > 科技未来 > 内容

开源 -谷歌发布最新“天马”模型，自动生成超越人类的文本摘要！

发布于：2024-06-18 编辑：匿名来源：网络

我们知道Transfromer在处理长文本序列方面比CNN/RNN表现更好。

因此，最强大的预训练模型，例如BERT和GPT，都使用了Transfromer基础设施。

并且已经证明，在处理机器翻译、文本摘要、语音识别、问答系统等多语言任务时，只需微调即可实现 SOTA 性能。

然而，Transfromer 的自我监督目标（自supervised））更通用，与下游语言任务关系不密切。

也就是说，它不知道下游执行的是机器翻译还是文本摘要。

如果自监督目标能够与下游任务建立紧密的联系，微调性能将会更好。

为此，Google AI 团队开发了 PEGASU（天马）模型。

基于Transfromer编码器/解码器的天马架构的结果是出人意料的。

研究发现，“天马”模型不仅展现了卓越的表现，而且在小样本数据下也能达到同样的效果，大大优化了训练效率，降低了数据成本。

成本。

目前，该研究的论文《PEGASUS：Pre-training with Extracted Gap-sentence for Abstractive Summarization》已发表在预印本论文库arXiv上，并已被ICML国际机器学习会议收录。

从“间隙句”到文本摘要，较小的样本表现更好研究人员假设，预训练目标越接近下游任务，微调的性能越好。

为此，他们将下游语言任务设置为“提取文本摘要”，将预训练目标设置为“间隙句子生成”。

开源 -谷歌发布最新“天马”模型，自动生成超越人类的文本摘要！

研究人员从输入文档中删除了一些完整的句子，天马模型的任务是恢复它们。

如果输出结果中能够出现被删除的句子，则说明已经与下游任务建立了连接，即生成了GSG。

如下图所示：这个过程就像我们做填空题一样。

研究人员表示，这项对人类来说看似不可能完成的任务实际上已经实现了。

他们发现删除的“重要”句子越多，实验效果就越好。

在此基础上，他们在12个下游摘要数据集上对模型进行了微调，结果表明预训练后的输出示例与微调后的摘要非常相似，并且这一结果经过了ROUGE标准的测试。

ROUGE通过N-gram重叠计算两个文本的相似度。

此外，这些数据集非常丰富，包含文章、科学论文、专利、短篇小说、电子邮件、法律文件和使用说明等，这表明天马模型在选择文本主题方面不受限制。

更令人惊讶的是，研究人员发现天马模型还显示了卓越在小样本数据集中的表现。

以下是研究人员选取4个数据集后，ROUGE评分与监督样本数的关系。

（虚线表示Transformer编解码器在完全监督但没有预训练的情况下的性能。

）可以看到，仅通过微调示例，天马模型就已经具有非常好的性能，并且高于未训练的示例（虚线）。

这一结果表明，天马模型在优化性能的同时，可以大大降低数据使用成本，提高训练效率。

超人的表现为了保证实验结果的准确性，除了ROUGE标准测量外，研究人员还采用了手动评估方法。

也就是说，将实验后总结与人工撰写的总结进行比较。

这与图灵测试类似。

研究人员使用了三个不同的数据集，评估者在做出判断时并不知道哪一个是人类。

最终结果表明，评估者并不总是喜欢人类撰写的摘要。

而且，从XSum、CNN/Daily Mail和Reddit TIFU这三个数据集可以看出，仅训练少数样本也达到了超越人类的水平，再次证实了天马模型在小样本中的性能优势。

然而，尽管天马模型的预训练性能可以与人类相媲美，但它仍然存在误差。

例如，研究人员对以下文本进行了预训练。

XSum 数据集中这个例子的全文没有提到数字“4”，但在文本提取中，天马能够抽象出文本摘要“NoproposalhavebelaudedtopreservingfourRoyalNavyfrigatesforreuse,theBBChas学到了。

”，从 2 到 5 都是如此。

但在第六艘护卫舰上，天马犯了一个错误，他的总结显示为“七”。

这表明该模型在重复文本提取方面需要进一步优化。

为此，研究人员还在Github上公开发布了该项目。

站长声明

标签：

上一篇：新三板挂牌公司转入科创板-创业板应具备这些条件

下一篇：达达集团：自618活动启动以来，旗下京东到家平台整体销售额同比增长超140%

成都银行正式递交IPO申请拟发行不超8亿股普通股

成都银行已正式提交IPO申请，拟在上海证券交易所发行不超过8亿股人民币普通股（A股）。），募集资金将用于补充资本金、增强可持续发展能力。　　IPO是成都银行实现建设优秀股份制银行目标的重要战略举措。成都银行上市不仅有利于增强资本实力、提高市场竞争力，也有利于进

06-17
日报优鲜孵化的无人零售“便利购物”获2亿美元融资，腾讯领投A轮，鼎晖领投B轮，

据投资界12月29日消息，生鲜零售平台天天耀明正式宣布，旗下孵化了半年的无人零售项目便利店，近日已分拆为独立运营的子公司并获得2亿美元A+B轮融资。　　其中，腾讯领投A轮投资，总额1万美元，元生资本、时代资本、KTB跟投；鼎晖投资共计1.44亿美元B轮领投，北极光创投、

06-18
工信部：下架艺龙酒店等37款APP

工信部此前已向社会公布了侵犯用户权益的APP企业名单。截至目前，经第三方检测机构核查复检，仍有37款APP未按照我部要求完成整改，包括新版星辰、艺龙酒店、草莓视频、东风出行、相机等APP。工业和信息化部组织下架上述37款App。本通知发布后，相关应用商店应立即组织下架

06-18
货拉拉完成3亿美元D轮融资，2018年业务量增长近200%

据投资界2月21日消息，从相关媒体获悉，同城货运平台货拉拉已完成高瓴资本D1投资。红杉资本中国基金领投D2轮融资。本轮融资总额为3亿美元。钟鼎资本和光伏资本也参与了投资。顺为资本、祥和资本、MindWorks Ventures、零一创投等老牌投资股东也持续跟投，广元资本担任本次

06-17
科技部：重点支持符合国家战略和战略性新兴产业的高新技术企业在创业板上市

科技部、深圳市人民政府关于印发的通知：支持深圳市制定新建研发机构扶持政策的项目申请和分类。推进创业板改革，实行注册制，推进发行、上市、信息披露、交易、退市等基础性制度改革。优化政策环境，重点支持符合国家战略的高新技术产业和战略性新兴产业高新技术企业在创业

06-17
9.1GWh！ Fortescue计划在西澳部署全球最大电池储能项目

据外媒报道，澳大利亚矿商Fortescue金属集团近日表示，已向西澳环保局提交了建设Uaroo可再生能源中心的提案。该项目的公众咨询期将开放一周，直至 2 月 15 日。公众咨询已经开始就一项大型可再生能源项目的计划进行，该项目将包括为 Fortescue 采矿设施提供电力的电网规模电

06-08
element14 社区公布“第六感”设计挑战赛获奖者

社区成员使用意法半导体 SensorTile 和 TE Con??nectivity 组件包设计自动驾驶汽车中国上海，2019 年 4 月 29 日 – 电子元件和开发服务全球分销商 element14 Community，在线社区element14旗下工程师公布了“第六感”设计挑战赛的获奖者。作为element14社区年度五大挑战赛

06-06
君联资本蔡大庆：医疗健康领域投资看重人才，聚焦新模式

近年来，健康医疗成为VC/PE策略师的必争之地。健康医疗行业也因其巨大的市场和不断涌现的创新技术和模式，成为竞争的温床。，及其抗周期性，被誉为“永远的朝阳产业”。君联资本重点关注的TMT、健康医疗、清洁科技、现代服务、先进制造、消费品六大领域中，医疗健康成为其

06-18
阿里云副总裁任庚：打造共生、创造、互惠的创业生态

10月12日上午，阿里巴巴年度创新创业峰会在云栖小镇国际会展中心举行。阿里云副总裁任庚发表主题为《遇见双创预见未来》的主题演讲。任庚认为，大众创业、万众创新不仅是国家竞争力的体现，也是DT时代的历史机遇，更是阿里巴巴经济体的责任和担当。阿里巴巴如何做大众创

06-17
RedBlock获得上市公司The Ninth City战略投资

7月11日消息，近日，区块链金融科技公司RedBlock宣布获得纳斯达克上市公司The Ninth City战略投资。除了获得九城的资金支持外，RedBlock还将依托九城的产业布局，与九城及其关联公司在海外业务和资产数字化方面开展战略合作。 RedBlock源自硅谷，致力于成为资产数字化领域的

06-18
人人网计划今年赴美IPO融资5亿美元

据投资界2月21日消息，据外媒报道，中国社交网站人人网计划今年赴美上市。　　据透露，投行摩根士丹利、德意志银行和瑞士信贷将担任人人网首次公开募股的联席证券承销商。据人士透露，人人网将于今年6月前向美国证监会提交上市申请。　　商业社交网络LinkedIn上个月宣布，

06-18
《广州2000年亿母基金管理办法》正式颁布

日前，广州市政府常务会议审议通过《广州产业投资母基金、广州创新投资母基金管理办法及配套激励约束制度》（以下简称《管理办法》）。 1亿元产业基金中的基金发挥“促投资、促生产”作用，采用“王牌基金+直投”方式开展投资运作；亿元创投基金中的基金发挥“以投促创业”的

06-17