首页 > 科技未来 > 内容

研心树自主研发国内首个非Attention机制大模型,无损速度提升7倍

发布于:2024-06-17 编辑:匿名 来源:网络

1月24日,上海研心树人工智能科技有限公司“新架构,新模型赋能”大模型发布会。

与此同时,研信慧智正式发布了中国首个无Attention机制的大规模通用自然语言模型——Yan模型。

作为业界少有的非Transformer大模型,Yan模型以全新自主研发的“Yan架构”替代Transformer架构,利用百亿参数实现千亿参数大模型的性能- 内存容量增加3倍,速度提高。

同时推理吞吐量提升了5倍7倍。

会上,彦芯数智CEO刘凡平表示:“我们希望Yan架构能够作为人工智能领域的基础设施,并利用它构建AI领域的开发者生态,最终允许任何人在任何设备上使用通用人工智能。

模型,获得更加经济、便捷、安全的人工智能服务,推动构建普惠的人工智能未来。

“Transformer 并不是大型模型的‘唯一解决方案’。

Transformer 是 GPT、LLAMA、PaLM 等流行的大型模型的基础架构,它的崛起无疑是深度学习史上的一个重要里程碑。

凭借其强大的功能,自然语言理解能力方面,Transformer 推出短短几年内就取代了传统的 RNN 网络结构,不仅成为自然语言处理领域的主流模型架构,而且在计算机视觉等多个领域得到了展现。

研心树自主研发国内首个非Attention机制大模型,无损速度提升7倍

那么,在变形金刚已经占据人工智能领域半壁江山的今天,彦科数智为何还要另辟蹊径,在发布会上寻找更多非变形金刚的可能性呢?刘凡平回答了这个问题,他指出,以规模大着称的Transformer,算力高,实际应用中成本高,让很多中小企业望而却步。

其内部架构的复杂性使得决策过程难以解释;长序列处理的难度以及无法控制幻觉的问题也限制了大型模型在某些关键领域和特殊场景的广泛应用。

随着云计算和边缘计算的普及,行业对高性能、低能耗的大规模AI模型的需求日益增长。

刘凡平提到:“在全球范围内,许多优秀的研究人员一直在试图从根本上解决对 Transformer 架构的过度依赖,并寻求更好的方法来替代 Transformer。

就连 Transformer 论文的作者之一 Llion Jones 也在探索“Transformer 之后的可能性”,试图用一种基于进化原理的自然启发的智能方法,从不同角度创建对 AI 框架的重新定义。

” 核心数据也不例外。

在不断研究和改进Transformer模型的过程中,他们意识到重新设计大模型的必要性:一方面,Attention机制下,现有架构的调整几乎达到了瓶颈;另一方面,现有架构的调整几乎已经到了瓶颈;一方面,延信数字希望降低企业使用大模型的门槛,让大模型能够以更少的数据和更低的算力拥有更强的性能,从而能够应用到更广泛的业务中。

经过近多个日日夜夜,数百次以上的设计、修改、优化、比较、重启,言信数字自主研发出不再依赖Transformer的全新架构——“言架构”。

与此同时,基于燕建筑的通用大型模型应运而生。

颜架构:技术与实现的双重努力。

如果说基于Transformer架构的大型车型是一款“又耗油又贵”的燃油车,那么基于Yan架构的大型车型则更像是一辆燃油车。

经济、更节能的新能源汽车。

它去掉了 Transformer 中高成本的注意力机制,代之以计算量少、难度小的线性计算,大大提高了建模效率和训练速度,同时效率提高了一倍。

成本大幅降低。

发布会上,研究团队展示了相同参数尺度下Yan模型与Transformer模型的大量实测对比。

实验数据表明,Yan架构比Transformer架构能够实现更高的训练效率和更强的记忆能力。

能力,较低的幻象表达。

同等资源条件下,Yan架构模型的训练效率和推理吞吐量分别是Transformer架构的7倍和5倍,内存容量提升3倍。

Yan模型在推理过程中的空间复杂度是恒定的,因此Yan模型对于Transformer面临的长序列问题也表现良好。

对比数据显示,在单张24G显卡上,当模型输出token的长度超过Transformer的。

模型会出现显存不足的问题,但Yan模型的显存占用始终稳定在14G左右,理论上可以实现无限长度的推理。

此外,研究团队首创了合理的相关特征函数和记忆算子,结合线性计算方法。

,降低模型内部结构的复杂度。

新架构下的Yan模型将打开过去自然语言处理的“不可解释的黑匣子”,充分挖掘决策过程的透明性和可解释性,从而促进大型模型在高风险领域的广泛使用例如医疗、金融、法律等。

除了技术上的突破和创新,颜模型还具备隐私性、经济性、精准实时性、专业性、通用性六大优秀的商业化能力。

可以说是“为执行而生”。

据行业共识,大型模型竞赛已从“体量参数”时代过渡到“体量应用”阶段。

行业对通用大型车型的需求亟待解决。

因此,很多大型模型都会采用剪枝、压缩等主流技术。

为了实现在设备上运行,Yan模型%支持私有化部署应用,可以无损运行在主流消费级CPU等端侧设备上,无需裁剪和压缩,达到与其他模型在GPU上运行相同的效果。

这一点在本次发布会上也得到了证实。

研究人员在个人电脑上演示了 Yan 模型的运行推理。

下一阶段,预计将无损部署在手机等更多便携设备或终端中。

刘凡平表示:“彦核数字旨在打造全模态实时人机交互系统,全面连接感知、认知、决策和行动,构建通用人工智能的智能循环,并提供方向研究为通用机器人等具身智能的大模型基础库提供“更多选择”,我们希望通过提供低功耗、有限显存下基于Yan架构的专业生产力工具,实现端侧训练与训练推送的一体化。

助力千行百业完成数据智能转型升级“新模式动力、新生态新闻发布会圆桌讨论环节”,中国科学院上海显微研究所研究员、博士生导师、总工程师刘凡平、李汉军。

中国信息通信研究院上海产业创新中心,智子芯源创始人曹阳与微起点技术总监岳野立伟围绕未来人工智能领域生态建设进行了深入交流和探讨主题为“创新与变革”。

李汉军表示:“人工智能发展至今,大型模型的架构升级不断演进,在技术和应用的双重驱动下,生态边界也在不断扩大。

可以说,每一次技术突破都会带来发展。

”从目前的注重多功能性到未来的个性化发展,我们期望行业能够开发出更多新的生产力工具,引发新一轮的技术革命,推动整个人工智能产业向更加高效的方向发展。

和可持续的方向。

“燕模型在实际应用中的表现还需要市场的检验,正如燕信数智董事长陈代前在总结发言中所言:“随着燕模型的进一步落地和应用,我们期待到基于Yan架构的通用大型模型。

,为各类机器人、嵌入式设备、物联网设备提供所需的智能能力,能够为人工智能产业注入新活力、新理念、新可能性,为企业和用户创造更多价值。

我们也将用我们的力量参与推动人工智能领域新一轮技术变革。

》雷锋网(公众号:雷锋网)雷锋网版权文章,未经授权禁止转载。

详情请见转载说明。

0人收藏分享:相关文章颜架构核心数字智能大模型腾讯发布数字技术前沿应用趋势涉及多模态大模型……徐栋梁:短期来看大模型是提高效率的工具,长期来看是超智能……GPT-BI在中国上线一汽、大车型技术融入数字化、智能化转型时代 数字化安全的答案,藏在一本实用指南里。

研心树自主研发国内首个非Attention机制大模型,无损速度提升7倍

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 中饮巴比登陆A股市场,一年卖出价值10亿的两块钱馒头

    中饮巴比登陆A股市场,一年卖出价值10亿的两块钱馒头

    上头条10月12日,中饮巴比食品有限公司(以下简称中饮巴比)登陆A股A股市场暴涨44%,报18.32元,对应总市值45亿元。 这意味着巴比食品成为“中国包子第一股”。 招股书显示,中国饮料股份有限公司专业从事中式糕点、速冻食品的研发、生产和销售。 是一家“以连锁店销售为主,

    06-17

  • 车住邦能源链获5000万元A轮融资,今年6月已完成100个城市部署

    车住邦能源链获5000万元A轮融资,今年6月已完成100个城市部署

    据投资界1月22日消息,车住邦(北京)科技有限公司及其品牌能源链宣布据悉,他们已获得万元A轮融资,投资方包括仲恺集团、赛马资本、蓝焱资本等。 据悉,本轮融资距离车主帮完成万元Pre-A轮融资仅10个月。 这也是今年“互联网+能源”行业的首笔投资。   车主邦表示,本轮融

    06-17

  • 专注MIM智能制造,富驰完成近2亿元融资,源星资本领投

    专注MIM智能制造,富驰完成近2亿元融资,源星资本领投

    据投资界6月1日消息,智能制造公司富驰宣布完成近2亿元融资。 本轮投资由源星资本领投,元和资本跟投。   Fuchi是一家金属注射成型(MIM)技术解决方案提供商。 MIM技术在金属零件的小型化、精密化、复杂化的生产和应用中具有明显的优势。 富驰已经应用于消费电子、医疗、

    06-18

  • 同创永逸近期完成近亿元B轮融资

    同创永逸近期完成近亿元B轮融资

    据投资界9月17日消息,据36氪消息,北京同创永逸科技发展有限公司(以下简称“同创永逸”) )近日宣布完成近亿元B轮融资。 本轮投资方为小喵朗城、前海领航。 此前,同创永益已获得AA投资数千万元A轮融资。 本轮融资后,公司将从以下两个方面进行战略升级:一方面,同创永易

    06-18

  • 维多利亚的秘密 (Victoria's Secret) 破产,美容 (Beauty) 关闭了其门店,为什么Admiral内衣越卖越便宜,为什么要IPO?

    维多利亚的秘密 (Victoria's Secret) 破产,美容 (Beauty) 关闭了其门店,为什么Admiral内衣越卖越便宜,为什么要IPO?

    “性感神话”维密天使宣布破产、内衣第一股都市丽人关闭数千家门店、Emblem年度业绩大幅下滑、汇洁股价陷入滞胀……越来越多的迹象表明,依赖内衣的内衣行业对女人来说,赚钱,正在经历一个寒冷的冬天。 不过,也有一些公司会选择在此时逆势向资本市场发起冲击,比如爱慕股份

    06-18

  • 安徽母基金招募GP拟设立5只子基金

    安徽母基金招募GP拟设立5只子基金

    安徽省新型基础设施建设基金有限责任公司子基金管理机构公开遴选公告(年度第一批) 1、基金定位为规范和建设安徽省新型基础设施建设基金子基金(以下简称“基金中的基金”)的设立和投资运营,将充分发挥国有资本的引领和撬动作用,为吸引优质社会资本聚焦安徽,更好服务安

    06-18

  • 都2023年了,汽车设计还能再好看点吗?

    都2023年了,汽车设计还能再好看点吗?

    前腿还在打情骂俏,后腿却不再打情骂俏,只剩下打骂。 我很着急,甚至可能要上法庭。 您点击了错误的链接,我们没有计划过渡到情感内容。 但这个不恰当的比喻完美地概括了近期吉利银河与长安之间的设计之争。 2月27日,长安汽车向吉利发出律师函,指出吉利的银河之光原型车涉

    06-21

  • 聚焦个性化诊疗赛道,耀明医疗获5000万元B轮融资

    聚焦个性化诊疗赛道,耀明医疗获5000万元B轮融资

    据12月16日消息,武汉佑耀明医疗科技有限公司(简称:耀明医疗)获B轮融资1万元。 本轮融资由海富产业基金和同济现代医疗基金共同投资。 本轮融资将用于拓展公司产品管线,推动公司心脑血管、代谢、神经精神疾病、肿瘤等个性化诊疗产品的临床研究和产业化,进一步完善与慢性

    06-18

  • 微云人工智能完成新一轮亿元融资

    微云人工智能完成新一轮亿元融资

    据投资界(ID:pedaily)3月30日消息,近期专注于提供数字牙科AI定制服务的工业互联网公司“微云人工智能”宣布获得新一轮融资。 融资1亿元,由多家海外家族基金和上市公司投资。 据创始人及CEO刘博士介绍介绍,本轮募集资金将主要用于继续产品的智能化升级以及隐形正畸品牌“

    06-17

  • 唯物主义周刊丨苹果股价大跌,乔波集体认罪……

    唯物主义周刊丨苹果股价大跌,乔波集体认罪……

    近日,CB Insights重新整理了一张医疗领域AI创业图景,统计了全球活跃的92家初创公司。 今年,人工智能医疗保健公司的融资交易只有 10 笔,但到了 2019 年,这一数字达到了 60 笔。 Frost & Sullivan 分析师 Harpreet Singh Buttar 表示,“到 2020 年,无论是人类健康管理还

    06-17

  • 温州科技创新基金投资9个GP

    温州科技创新基金投资9个GP

    投资圈(ID:pedaily)。 据投资界消息,11月20日,温州科技创新创业投资基金二期拟合作设立基金管理机构。 温州科技创新基金拟投资9家管理机构。 以下为公告原文: 《关于共同设立温州市科技创新创业投资基金第二期基金管理机构的公告》已经审议通过,拟与宁波梅山同意保税港

    06-18

  • 奇纳新材获超2亿元C轮融资,航发基金领投

    奇纳新材获超2亿元C轮融资,航发基金领投

    投资圈(ID:pedaily)3月6日消息,据硬氪报道,江苏奇纳新材料科技有限公司奇纳新材股份有限公司(以下简称“奇纳新材”)近日完成超2亿元C轮融资。 本轮融资由航发基金领投,国家电投、深创投、国鼎资本、中信建投、腾业创投、北京创投共同跟投。 泰合资本担任长期独家财务

    06-18