首页 > 科技未来 > 内容

大模型时代的算力和存储产业新机遇

发布于:2024-06-17 编辑:匿名 来源:网络

大模型时代算力和存储行业的新机遇。

2019年2月16日,OpenAI发布了自己的*AI视频生成模型Sora,继ChatGPT之后再次展现了大型模型强大的泛化能力。

大机型的不断迭代升级,创造了对计算基础设施的大量需求,NVIDIA在二级市场的市值也屡创新高。

本文将从大模型的发展趋势出发,分析大模型时代算力和存储行业的新机遇,并提出相应的投资意见。

大模特浪潮席卷各行各业,展现出无限可能。

在多种算力模型的基础上,业界开发了内容生成、智能语音、创意设计、对话引擎、辅助开发等功能,并已应用于办公、医疗、工业、政务、电商、游戏等领域、流媒体等多样化场景。

人工智能大模型的发展经历了萌芽阶段、探索沉淀阶段、快速发展阶段三个阶段。

在萌芽阶段,浅层机器学习转变为深度学习,催生了重要的CNN和RNN模型。

2017年,Transformer的出现为当今主流大模型的算法架构奠定了基础,预训练的大模型开始走上历史舞台。

随着Google发布BERT模型、OpenAI发布GPT模型,大型AI模型彻底进入井喷时代,全球科技公司不断探索大型模型的能力。

近年来,随着各种大型模型的出现,模型计算量的增长速度已经将摩尔定律远远抛在了后面。

目前大型模型正在向多模态、拓宽上下文长度的方向纵深发展,这对模型的参数量和训练数据量提出了更高的要求。

数据量的不断增加对计算能力产生了强烈的需求。

同时,如何高效处理和存储大规模数据是当前算力设施面临的两大挑战。

因此,计算、存储、网络三大板块的核心芯片共同构成了算力生态系统,并将持续受益于未来算力的强劲需求。

其中,算力芯片最为紧缺。

目前,GPU仍是主流,CUDA生态短期内难以突破。

存储日益成为大型模型训练和推广的瓶颈。

HBM、高速PCIe等新技术正在快速渗透和迭代,不断提升计算效率。

在传输方面,高性能网络通信芯片可以提高数据传输效率,减少延迟,有效提升客户集群训练能力。

算力生态市场前景广阔,规模持续增长。

据Gartner预测,到2020年,全球AI算力芯片市场规模预计将达到1亿美元,同比复合增长率达22%。

全球 HBM 市场正在快速增长。

年市场规模预计将达到1亿美元,年复合增长率达37%。

全球企业级SSD市场稳定增长,预计将从2018年的1亿美元增长至2018年的1亿美元。

GPU已成为AI计算芯片的主流架构,国内存在另类投资机会。

从CNN到Transfomer,大型模型仍在升级,对AI芯片的通用性提出了更高的要求。

硬件端能否持续兼容各种大型机型的迭代升级成为重要标准,GPU架构将成为未来的主流架构。

与性能更出色的DSA架构相比,GPU架构在通用性方面的突出优势使其能够快速兼容各种模型和场景,并可以通过大规模量产来平均分散研发成本。

此外,GPU架构在性能方面也有软件优化的空间。

CUDA平台已形成软件生态屏障,助力各类AI场景的硬件加速。

Nvidia 是 GPU 芯片领域唯一的玩家。

高性能硬件+CUDA生态圈强强联手,软硬件结合形成行业壁垒。

2016年,英伟达在全球AI服务器市场的市场份额达到65%,并在全球GPU芯片领域保持领先地位,市场份额超过80%。

2017年,英伟达数据中心部门收入达到1亿美元,同比增长%,最新市值已达2.2万亿美元。

NVIDIA稳固的领先地位来自于软硬件结合形成的生态壁垒。

硬件水平拥有全球最优秀的算力,搭配软件平台CUDA,为客户带来1>2的大型模型训练和推广成果。

今年10月,美国商务部工业与安全局(BIS)宣布禁止销售英伟达高性能H和A芯片。

为应对政策制裁,NVIDIA推出中国最新版H、A芯片,在保持单卡算力不变的情况下,削弱了卡间的互联能力,阻碍了多机多卡算力集群的建设。

2020年10月,美国商务部宣布升级禁令,第一版H、A芯片成为历史。

英伟达无奈,只能再次推出性能较低的A20和L20芯片,计算能力大幅下降。

在英伟达高性能芯片难以获取的背景下,国产高性能GPU芯片预计将长期供不应求。

因此,我们认为国产GPU首先应该解决可用性问题。

国产替代的投资机会预计将集中在硬件性能接近A/H,这是一家软件兼容CUDA生态的GPU芯片初创公司。

存储成为GPU性能的瓶颈,为HBM、PCIe等行业带来新的机遇。

GPU迭代中存在存储与计算之间的权衡,存储性能迭代已经落后于算力迭代。

GPU架构具有计算单元“小”和“多”的特点。

当摩尔定律接近极限时,为了提高计算资源的性价比,业界主要通过增加计算单元的堆叠来提高计算性能;存储方面,片上存储空间受到挤压的同时,SRAM密度无法通过工艺改进来弥补,导致当前迭代的存储性能落后于算力。

与A相比,H的FP16计算能力提升了2.42倍,而SRAM存储容量仅提升了1.22倍。

存储子系统容量和带宽不足已成为GPU发展的瓶颈。

大型模型训练需要海量数据的存储和处理,这对GPU存储系统容量和内存访问带宽提出了更高的要求。

对于GPU架构来说,堆叠计算单元并不困难。

目前的计算任务主要集中在等待数据从存储系统到达计算单元的过程,而不是计算单元进行矩阵计算的过程。

GPU主要采用多级Cache分布式存储子系统。

存储单元距离计算单元越近,容量越小,内存访问带宽越高。

因此,性能提升有三个方向:增加SRAM容量、增加DRAM带宽、增加SSD带宽。

其中,增加片上SRAM的容量成本较高,并不是主流路径。

因此,业界主要采用两种路线来解决存储瓶颈。

一是HBM(高带宽内存)技术。

HBM技术解决了目前DRAM容量不足、带宽低的问题,已成为主流计算芯片的“标配”。

它通过硅穿孔技术垂直连接多个DRAM,缩短互连距离以增加传输带宽和容量。

从第一代HBM技术到最新的HBM3e,垂直堆叠的DRAM芯片数量从4个增加到12个,每个DRAM芯片的密度从2GB增加到24GB、36GB,带宽从GB/s增加,GB/s,0.2GB/s,GB/s升至约1.2TB/s。

二是PCIe技术的不断升级。

目前SSD接口已经逐渐从SATA转向更高速的PCIe接口。

这是一种高速串行总线标准。

数据通过总线直接连接到芯片,省去了内存调用硬盘的过程,传输效率和速度成倍提高。

从PCIe Gen3到PCIe Gen6,传输速率不断提高,逐渐从每Lane 1GB/s发展到每Lane 2GB/s、每Lane 4GB/s、每Lane 8GB/s。

在三大巨头的垄断下,HBM的高成本和紧张的产能为国内先进封装产业链带来了投资机会。

HBM芯片占AI芯片成本近一半,售价是标准DRAM芯片的5-6倍,毛利润高达42%-51%。

同时,受制于SK、三星、美光三大国际巨头垄断格局,HBM产能紧张,预订周期已达6月至12月。

先进封装作为HBM制造中附加值最高的环节,发展潜力巨大,国内产业链存在投资机会。

全球SSD市场保持增长趋势,传输带宽持续增加,PCIe Gen4逐渐转向PCIe Gen5。

全球SSD全年出货量为3.63亿台,在保持增长的同时加速对HDD的替代。

该细分市场的企业级SSD市场仍处于快速增长通道,年出货量5500万台,年复合增长率18%。

消费级SSD市场跟随企业级市场的脚步,保持稳定增长,年出货量达2.97亿台,年复合增长率为5%。

高速串行接口PCIe与SSD的结合不断加深,逐渐取代SATA成为主流接口,并不断向更高速的协议发展。

PCIe Gen4已经取代PCIe Gen 3成为主流接口,PCIe Gen5已经进入市场并成为未来发展趋势。

此外,新创市场将为国内SSD提供亿元的替代需求,PCIe Gen5能力成为重要考虑因素。

金融、电信、教育等8大行业对国产信创服务器有需求,总需求量达到1万台。

按照单台服务器SSD数量3.8块、SSD单价人民币计算,产业信创将带来1亿元的SSD市场规模。

其中,电信行业对服务器的需求量最大,是国内替代进程最快的行业之一。

对SSD大容量、高带宽的要求很高。

目前,PCIe Gen5加速进入企业级SSD市场,年渗透率预计将达到69%。

消费市场也将追随企业市场的步伐,每年PCIe Gen5渗透率预计将达到12%。

全闪存阵列具有突出的性能优势,已成为高性能数据中心的必然趋势。

AI数据中心、云计算等新兴技术领域的不断发展,对高性能存储系统提出了更高的要求。

随着SDD取代HDD,SDD的低延迟和高吞吐量与传统SCSI协议的低吞吐量和高延迟发生冲突。

这就导致了NVMe高速协议的出现。

NVMe高速协议缩短并优化了数据路径,加快服务器内部以及服务器与存储阵列之间的信息传输。

与SSD高速介质一起,凸显了全闪存阵列的性能优势。

2017年,全闪存阵列(AFA)市场份额达到18.9%,增长率为24.0%,高于整体市场平均增长率17.5%。

全闪存阵列解决方案提出了两个核心技术要求:系统管理能力和NVMeoF网络能力。

1)与HDD相比,SSD存在闪存写操作周期有限、磨损均衡、纠错编码、坏数据块等问题,传统SSD控制器已经不能满足全闪存系统的管理需求。

如何管理全闪存存储?组合和优化成为核心技术要求。

国际领先的PureStorage和VAST Data开发了自主开发的软件技术解决方案,以增强全闪存系统管理。

2)主机内本地磁盘存储通信采用NVMe协议作为上层协议,该协议建立在PCIe协议之上,最大化释放SSD介质的能力。

然而,存储系统仍然呼唤更快的网络,以满足主机访问节点外NVMe SSD系统的需求,NVMe-oF(NVMe over Fabrics)应运而生。

大模型时代的算力和存储产业新机遇

NVMe-oF用Fabrics(如RDMA或光纤通道)替代PCle,将NVMe的低延迟、高吞吐量等性能优势从服务器层面扩展到整个数据中心层面。

【本文由投资界合伙人云秀资本授权发表。

本平台仅提供信息存储服务。

】如有任何疑问,请联系投资界()。

#阿里云#创新创业#创业支持#创业资讯我们关注国内外最热门的创新创业动态,提供一站式资讯服务,实时传递行业热点新闻、深度评论和前瞻观点帮助企业家掌握新兴技术。

趋势和行业变化,以及对未来技术趋势的洞察。

大模型时代的算力和存储产业新机遇

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • MIUI 13 Pad稳定版已上线!与苹果相比,您的体验如何?

    MIUI 13 Pad稳定版已上线!与苹果相比,您的体验如何?

    如果把“平板电脑”和“生产力”放在一起,肯定会有很多争议,但如果把“平板电脑”和“效率”放在一起,争论就会安静一些。 分屏、小窗口、平行水平线等功能在大屏幕上确实更高效。 因此,我非常认同MIUI 13 Pad发布时提到的“效率创新”。 但作为小米和苹果双生态的用户,在

    06-21

  • 美光总裁兼首席执行官:全球半导体行业扩张势头不会减弱

    美光总裁兼首席执行官:全球半导体行业扩张势头不会减弱

    近日,美国半导体行业协会轮值主席、美光科技总裁兼首席执行官Sanjay Mehrotra表示,随着智能手机的兴起,计算技术个人电脑、云计算应用等领域不断取得突破,人们在生产生活中使用信息的方式得到深度优化。 特别是在医疗、交通技术和数据访问等领域,半导体技术发挥着不可替

    06-08

  • 构建高效的多语言客户服务体系:满足跨境客户服务需求

    构建高效的多语言客户服务体系:满足跨境客户服务需求

    .wp-block-column h3{margin-left:0} 在全球化日益发展的今天,跨境客户服务已成为许多人不可或缺的一部分企业。 的一个链接。 然而,面对不同语言和文化背景的客户,如何提供高效、准确的客户服务支持成为许多企业面临的问题。 沃丰科技的跨境客户服务系统以其强大的功能和灵

    06-18

  • “成人版捉迷藏”火了,怎么突然成了年轻人的社交新宠?

    “成人版捉迷藏”火了,怎么突然成了年轻人的社交新宠?

    这次年轻人的重点是“兼得又想要”。 他不再愿意像“苦行僧”一样重复枯燥的健身套路,但同时他又渴望通过运动来获得健康的身体。 最近在各个城市流行的“城市捉迷藏”,就是年轻人的最新“答案”。 在技??术的支持下,我们与他人的关系不再局限于“在一起”,而是可以建立在

    06-21

  • 1秒破100!特斯拉最强大的超级跑车与 SpaceX 挂钩,年内将亮相

    1秒破100!特斯拉最强大的超级跑车与 SpaceX 挂钩,年内将亮相

    你不应该打听别人的处方,这是相当私密的。 当被问及“吸毒”问题时,马斯克突然恼怒起来。 他说,开氯胺酮有助于治疗他偶尔发作的抑郁症,是合理的药物,甚至对公司和投资者都有好处。 氯胺酮通常呈白色粉末状,其英文名称的第一个字母是K,所以俗称“K粉”。 今年1月,有媒

    06-21

  • 钉钉生鲜完成近亿元B轮融资

    钉钉生鲜完成近亿元B轮融资

    据投资界4月21日消息,一站式生鲜供应配送服务平台钉钉生鲜近日宣布完成近亿元融资人民币B轮融资。 B1轮由中金文化消费基金领投,甘嘉伟及老股东普洛斯隐山资本、头投石岛投资基金、三生创投跟投; B2轮由平川资本领投。 钉钉生鲜是年初孵化的回家吃饭,专注于3R食品供应链服

    06-18

  • 支持30种方言混合说话,中国电信人工智能研究院发布“星辰”超级多方言语音识别大模型 - IT之家

    支持30种方言混合说话,中国电信人工智能研究院发布“星辰”超级多方言语音识别大模型 - IT之家

    中国电信人工智能研究院(TeleAI)发布“星辰”超级多方言语音识别识别模型模型,取得重大突破。 该模型能够同时识别和理解 30 多种不同的中国方言,这一壮举超越了通常只能识别单一方言的现有模型的能力。 该模式的开发预计将极大惠及老年人和偏远贫困地区的人们,提高他们获

    06-18

  • 掌趣科技何佳:很多公司通过收购手游、转型借壳上市基本饱和

    掌趣科技何佳:很多公司通过收购手游、转型借壳上市基本饱和

    投资界动态 第三届GMGC全球手游大会3月26日在北京国家会议中心召开27、图为掌曲科技副总裁与何佳参加讨论环节。 讨论的主题是“投资的艺术:谁将是我们的下一个目标”。 何佳并不看好资本市场的前景。 他提到,近期国内大量企业通过收购手游公司实现转型。 他认为,很多企业通

    06-18

  • 国雄资本:2021年港股IPO融资规模预计突破4000亿港元

    国雄资本:2021年港股IPO融资规模预计突破4000亿港元

    国雄资本今日发布港股投资策略观点,称基于近期新股发行热潮就香港股市而言,以及2021年香港股市在疫情等外部不确定环境下的表现,从IPO规模来看,香港股市IPO融资规模预计将突破100港元全年达万元。 其中,新港股的高市盈率特征有望延续。

    06-18

  • 登上《自然》杂志封面! 《恐龙猎人》发现史上最奇特化石,刷新人类对鸟类进化的认识

    登上《自然》杂志封面! 《恐龙猎人》发现史上最奇特化石,刷新人类对鸟类进化的认识

    这是我研究过的最奇特的化石。 当地时间3月11日,《自然》杂志发表题为《缅甸白垩纪蜂鸟大小的恐龙》的研究论文。 3月12日,这篇论文出现在本期《自然》杂志的封面上。 《自然新闻》和《科学新闻》也报道了这项研究。 研究小组表示,迄今为止发现的最小的恐龙是在来自缅甸的白

    06-18

  • 今年第一笔订单!美股退市后,康鹏科技科创板IPO失败

    今年第一笔订单!美股退市后,康鹏科技科创板IPO失败

    3月17日获悉,科创板上市委员会第十八次审核会议结果显示,上海康鹏科技股份有限公司(以下简称“康鹏科技”“鹏科技”)科创板IPO被驳回,广东力源恒智能装备股份有限公司(以下简称“力源恒”)通过审查。

    06-18

  • 北恒生物获得德诚资本约亿元A轮融资,德诚资本投资

    北恒生物获得德诚资本约亿元A轮融资,德诚资本投资

    据投资界2月14日消息,北恒生物科技宣布完成约1亿元A轮融资。 此次融资由德诚资本独家提供。 结束。 通过本轮融资,北恒生物与德诚资本达成深度合作,持续完善人才引进和GMP设施建设,同时推动通用型肿瘤免疫产品的开发和临床转化。 据悉,北衡生物是一家专注于通用细胞治疗

    06-18