首页 > 科技未来 > 内容

大模型时代的算力和存储产业新机遇

发布于:2024-06-17 编辑:匿名 来源:网络

大模型时代算力和存储行业的新机遇。

2019年2月16日,OpenAI发布了自己的*AI视频生成模型Sora,继ChatGPT之后再次展现了大型模型强大的泛化能力。

大机型的不断迭代升级,创造了对计算基础设施的大量需求,NVIDIA在二级市场的市值也屡创新高。

本文将从大模型的发展趋势出发,分析大模型时代算力和存储行业的新机遇,并提出相应的投资意见。

大模特浪潮席卷各行各业,展现出无限可能。

在多种算力模型的基础上,业界开发了内容生成、智能语音、创意设计、对话引擎、辅助开发等功能,并已应用于办公、医疗、工业、政务、电商、游戏等领域、流媒体等多样化场景。

人工智能大模型的发展经历了萌芽阶段、探索沉淀阶段、快速发展阶段三个阶段。

在萌芽阶段,浅层机器学习转变为深度学习,催生了重要的CNN和RNN模型。

2017年,Transformer的出现为当今主流大模型的算法架构奠定了基础,预训练的大模型开始走上历史舞台。

随着Google发布BERT模型、OpenAI发布GPT模型,大型AI模型彻底进入井喷时代,全球科技公司不断探索大型模型的能力。

近年来,随着各种大型模型的出现,模型计算量的增长速度已经将摩尔定律远远抛在了后面。

目前大型模型正在向多模态、拓宽上下文长度的方向纵深发展,这对模型的参数量和训练数据量提出了更高的要求。

数据量的不断增加对计算能力产生了强烈的需求。

同时,如何高效处理和存储大规模数据是当前算力设施面临的两大挑战。

因此,计算、存储、网络三大板块的核心芯片共同构成了算力生态系统,并将持续受益于未来算力的强劲需求。

其中,算力芯片最为紧缺。

目前,GPU仍是主流,CUDA生态短期内难以突破。

存储日益成为大型模型训练和推广的瓶颈。

HBM、高速PCIe等新技术正在快速渗透和迭代,不断提升计算效率。

在传输方面,高性能网络通信芯片可以提高数据传输效率,减少延迟,有效提升客户集群训练能力。

算力生态市场前景广阔,规模持续增长。

据Gartner预测,到2020年,全球AI算力芯片市场规模预计将达到1亿美元,同比复合增长率达22%。

全球 HBM 市场正在快速增长。

年市场规模预计将达到1亿美元,年复合增长率达37%。

全球企业级SSD市场稳定增长,预计将从2018年的1亿美元增长至2018年的1亿美元。

GPU已成为AI计算芯片的主流架构,国内存在另类投资机会。

从CNN到Transfomer,大型模型仍在升级,对AI芯片的通用性提出了更高的要求。

硬件端能否持续兼容各种大型机型的迭代升级成为重要标准,GPU架构将成为未来的主流架构。

与性能更出色的DSA架构相比,GPU架构在通用性方面的突出优势使其能够快速兼容各种模型和场景,并可以通过大规模量产来平均分散研发成本。

此外,GPU架构在性能方面也有软件优化的空间。

CUDA平台已形成软件生态屏障,助力各类AI场景的硬件加速。

Nvidia 是 GPU 芯片领域唯一的玩家。

高性能硬件+CUDA生态圈强强联手,软硬件结合形成行业壁垒。

2016年,英伟达在全球AI服务器市场的市场份额达到65%,并在全球GPU芯片领域保持领先地位,市场份额超过80%。

2017年,英伟达数据中心部门收入达到1亿美元,同比增长%,最新市值已达2.2万亿美元。

NVIDIA稳固的领先地位来自于软硬件结合形成的生态壁垒。

硬件水平拥有全球最优秀的算力,搭配软件平台CUDA,为客户带来1>2的大型模型训练和推广成果。

今年10月,美国商务部工业与安全局(BIS)宣布禁止销售英伟达高性能H和A芯片。

为应对政策制裁,NVIDIA推出中国最新版H、A芯片,在保持单卡算力不变的情况下,削弱了卡间的互联能力,阻碍了多机多卡算力集群的建设。

2020年10月,美国商务部宣布升级禁令,第一版H、A芯片成为历史。

英伟达无奈,只能再次推出性能较低的A20和L20芯片,计算能力大幅下降。

在英伟达高性能芯片难以获取的背景下,国产高性能GPU芯片预计将长期供不应求。

因此,我们认为国产GPU首先应该解决可用性问题。

国产替代的投资机会预计将集中在硬件性能接近A/H,这是一家软件兼容CUDA生态的GPU芯片初创公司。

存储成为GPU性能的瓶颈,为HBM、PCIe等行业带来新的机遇。

GPU迭代中存在存储与计算之间的权衡,存储性能迭代已经落后于算力迭代。

GPU架构具有计算单元“小”和“多”的特点。

当摩尔定律接近极限时,为了提高计算资源的性价比,业界主要通过增加计算单元的堆叠来提高计算性能;存储方面,片上存储空间受到挤压的同时,SRAM密度无法通过工艺改进来弥补,导致当前迭代的存储性能落后于算力。

与A相比,H的FP16计算能力提升了2.42倍,而SRAM存储容量仅提升了1.22倍。

存储子系统容量和带宽不足已成为GPU发展的瓶颈。

大型模型训练需要海量数据的存储和处理,这对GPU存储系统容量和内存访问带宽提出了更高的要求。

对于GPU架构来说,堆叠计算单元并不困难。

目前的计算任务主要集中在等待数据从存储系统到达计算单元的过程,而不是计算单元进行矩阵计算的过程。

GPU主要采用多级Cache分布式存储子系统。

存储单元距离计算单元越近,容量越小,内存访问带宽越高。

因此,性能提升有三个方向:增加SRAM容量、增加DRAM带宽、增加SSD带宽。

其中,增加片上SRAM的容量成本较高,并不是主流路径。

因此,业界主要采用两种路线来解决存储瓶颈。

一是HBM(高带宽内存)技术。

HBM技术解决了目前DRAM容量不足、带宽低的问题,已成为主流计算芯片的“标配”。

它通过硅穿孔技术垂直连接多个DRAM,缩短互连距离以增加传输带宽和容量。

从第一代HBM技术到最新的HBM3e,垂直堆叠的DRAM芯片数量从4个增加到12个,每个DRAM芯片的密度从2GB增加到24GB、36GB,带宽从GB/s增加,GB/s,0.2GB/s,GB/s升至约1.2TB/s。

二是PCIe技术的不断升级。

目前SSD接口已经逐渐从SATA转向更高速的PCIe接口。

这是一种高速串行总线标准。

数据通过总线直接连接到芯片,省去了内存调用硬盘的过程,传输效率和速度成倍提高。

从PCIe Gen3到PCIe Gen6,传输速率不断提高,逐渐从每Lane 1GB/s发展到每Lane 2GB/s、每Lane 4GB/s、每Lane 8GB/s。

在三大巨头的垄断下,HBM的高成本和紧张的产能为国内先进封装产业链带来了投资机会。

HBM芯片占AI芯片成本近一半,售价是标准DRAM芯片的5-6倍,毛利润高达42%-51%。

同时,受制于SK、三星、美光三大国际巨头垄断格局,HBM产能紧张,预订周期已达6月至12月。

先进封装作为HBM制造中附加值最高的环节,发展潜力巨大,国内产业链存在投资机会。

全球SSD市场保持增长趋势,传输带宽持续增加,PCIe Gen4逐渐转向PCIe Gen5。

全球SSD全年出货量为3.63亿台,在保持增长的同时加速对HDD的替代。

该细分市场的企业级SSD市场仍处于快速增长通道,年出货量5500万台,年复合增长率18%。

消费级SSD市场跟随企业级市场的脚步,保持稳定增长,年出货量达2.97亿台,年复合增长率为5%。

高速串行接口PCIe与SSD的结合不断加深,逐渐取代SATA成为主流接口,并不断向更高速的协议发展。

PCIe Gen4已经取代PCIe Gen 3成为主流接口,PCIe Gen5已经进入市场并成为未来发展趋势。

此外,新创市场将为国内SSD提供亿元的替代需求,PCIe Gen5能力成为重要考虑因素。

金融、电信、教育等8大行业对国产信创服务器有需求,总需求量达到1万台。

按照单台服务器SSD数量3.8块、SSD单价人民币计算,产业信创将带来1亿元的SSD市场规模。

其中,电信行业对服务器的需求量最大,是国内替代进程最快的行业之一。

对SSD大容量、高带宽的要求很高。

目前,PCIe Gen5加速进入企业级SSD市场,年渗透率预计将达到69%。

消费市场也将追随企业市场的步伐,每年PCIe Gen5渗透率预计将达到12%。

全闪存阵列具有突出的性能优势,已成为高性能数据中心的必然趋势。

AI数据中心、云计算等新兴技术领域的不断发展,对高性能存储系统提出了更高的要求。

随着SDD取代HDD,SDD的低延迟和高吞吐量与传统SCSI协议的低吞吐量和高延迟发生冲突。

这就导致了NVMe高速协议的出现。

NVMe高速协议缩短并优化了数据路径,加快服务器内部以及服务器与存储阵列之间的信息传输。

与SSD高速介质一起,凸显了全闪存阵列的性能优势。

2017年,全闪存阵列(AFA)市场份额达到18.9%,增长率为24.0%,高于整体市场平均增长率17.5%。

全闪存阵列解决方案提出了两个核心技术要求:系统管理能力和NVMeoF网络能力。

1)与HDD相比,SSD存在闪存写操作周期有限、磨损均衡、纠错编码、坏数据块等问题,传统SSD控制器已经不能满足全闪存系统的管理需求。

如何管理全闪存存储?组合和优化成为核心技术要求。

国际领先的PureStorage和VAST Data开发了自主开发的软件技术解决方案,以增强全闪存系统管理。

2)主机内本地磁盘存储通信采用NVMe协议作为上层协议,该协议建立在PCIe协议之上,最大化释放SSD介质的能力。

然而,存储系统仍然呼唤更快的网络,以满足主机访问节点外NVMe SSD系统的需求,NVMe-oF(NVMe over Fabrics)应运而生。

大模型时代的算力和存储产业新机遇

NVMe-oF用Fabrics(如RDMA或光纤通道)替代PCle,将NVMe的低延迟、高吞吐量等性能优势从服务器层面扩展到整个数据中心层面。

【本文由投资界合伙人云秀资本授权发表。

本平台仅提供信息存储服务。

】如有任何疑问,请联系投资界()。

#阿里云#创新创业#创业支持#创业资讯我们关注国内外最热门的创新创业动态,提供一站式资讯服务,实时传递行业热点新闻、深度评论和前瞻观点帮助企业家掌握新兴技术。

趋势和行业变化,以及对未来技术趋势的洞察。

大模型时代的算力和存储产业新机遇

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 「信迪诊断」完成近6亿元B轮融资

    「信迪诊断」完成近6亿元B轮融资

    「信迪诊断」宣布完成近6亿元B轮融资。 本轮融资由中信证券投资、中信医疗基金领投,盈科资本、厚信医疗投资、金浦国条、创瑞投资、仁普医疗基金、宏城投资、金雨茂物和南京创新投资、老股东田洋跟投外汇资金持续支撑。 耀明资本担任本次融资的独家保荐人。 先声诊断致力于为

    06-18

  • 为什么蘑菇街是除了淘宝、豆快之外第一个孵化过亿主播的平台?

    为什么蘑菇街是除了淘宝、豆快之外第一个孵化过亿主播的平台?

    作者 |倪叔双11已经落下帷幕,各平台都争先恐后地秀肌肉。 让倪叔印象深刻的是蘑菇街的直播记录:截至11月10日12点05分,蘑菇街一姐@小甜心_单场破亿,当日最终交易额为2.74亿元。 全网身价过亿的主播有很多,但过去大多集中在淘宝、快手、抖音。 流量不占优势的蘑菇街成为这

    06-18

  • 金鱼嘴机构日·新一代信息技术专场圆满落幕

    金鱼嘴机构日·新一代信息技术专场圆满落幕

    3月29日,由南京市建邺区人民政府指导,建邺高新区管委会、南京金鱼嘴基金区块发展中心、南京金鱼嘴主办由路演文化发展有限公司、清科创新中心、华商资本主办的金鱼嘴机构日华商资本新一代信息技术专场活动成功举办。 当前,世界正在进入以新一代信息产业为主导的新经济发展时

    06-17

  • 中国新冠疫苗启动临床试验;董明珠:格力二月没有收入;北京公交可刷银联卡 -雷锋晨报

    中国新冠疫苗启动临床试验;董明珠:格力二月没有收入;北京公交可刷银联卡 -雷锋晨报

    我国重组新冠疫苗获批启动临床试验。 近日,军事科学院军事医学科学院陈薇院士领导的科研团队研发的重组COVID-19疫苗已获批启动临床试验。 自1月26日抵达武汉以来,陈薇院士团队联合当地优势企业,在埃博拉疫苗研发成功经验的基础上,与时间赛跑,开展重组新冠病毒疫苗的药学

    06-17

  • AR公司亮亮视野获建银国际1亿元B+轮投资,兰驰、经纬持续跟投

    AR公司亮亮视野获建银国际1亿元B+轮投资,兰驰、经纬持续跟投

    据投资界6月5日消息,今日,AR商业化领军企业亮亮视野AR眼镜宣布完成1亿元B+轮融资。 此轮融资由建银国际领投,蓝驰创投和经纬创投跟投。 至此,亮亮视野成为国内首家完成B+轮融资的AR公司。   亮亮视野创始人及CEO吴斐表示,本轮融资后,亮亮视野将进一步强化在安防、工业

    06-17

  • 金富子宣布完成C1轮1亿元融资,春晓领投,红杉资本、京基联合创投

    金富子宣布完成C1轮1亿元融资,春晓领投,红杉资本、京基联合创投

    据投资界3月25日消息,继去年完成C轮数亿融资后,国内领先的互联网财富管理平台金富子中国,斧头近期再次宣布完成C1轮1亿元融资,由春晓资本领投,红杉资本、京基资本共同投资。 资金仍将主要用于继续扩大规模、提升财富管理服务质量。 始终走在金融科技前沿的金斧头连续两年

    06-18

  • 首尔半导体在美国提起16项LED专利侵权诉讼

    首尔半导体在美国提起16项LED专利侵权诉讼

    近日,首尔半导体宣布,已向美国德克萨斯州西区地方法院对全球零售商Ace Hardware提起LED专利侵权诉讼,指控其销售LED产品菲特电气生产的LED灯丝灯泡和其他LED产品。 尽管收到多份侵权通知,Ace Hardware 仍继续销售 Feit Electric 相关产品,因此首尔半导体认为此次侵权行为

    06-08

  • 山东工友即将赴德国上市,计划融资400万欧元

    山东工友即将赴德国上市,计划融资400万欧元

    山东工友集团股份有限公司(以下简称“山东工友”)在法兰克福证券交易所上市已进入倒计时。 该公司是第一家在德国上市的大陆公司。 得益于宽松的融资环境,越来越多的中国企业选择在欧洲上市。     春节前后上市    负责山东工友海外上市融资的陈经理表示:“山东工

    06-18

  • 香蕉游戏再获2亿元B轮融资,经纬创投与竞远资本联合领投

    香蕉游戏再获2亿元B轮融资,经纬创投与竞远资本联合领投

    NewSeed(ID:pelink)据9月29日消息,王思聪创办的电竞内容公司香蕉游戏近日宣布完成2亿元人民币融资B轮融资,由经纬创投和竞远 Investments联合领投。 据萌芽数据库显示,今年6月,香蕉游戏获得IDG资本、文子数字投资基金投资的1.5亿元A轮融资。 Banana Games属于Banana Pr

    06-17

  • 241家企业中有1-4获得融资,年均增长缓慢,然而“国家队”和资本却对这个行业情有独钟

    241家企业中有1-4获得融资,年均增长缓慢,然而“国家队”和资本却对这个行业情有独钟

    当年,自从腾讯领投拿下互联网后,互联网三大巨头BAT相继步入“互联网+法律”领域打开了互联网法律服务创业的大门。 那一年,法律机构不断探索“互联网+法律”之路,希望找到一条正确的道路。   经过近两年的市场耕耘,2020年我们谈论“互联网+法律”不再茫然:有了充足的资

    06-18

  • 新密科技获过亿元A轮投资,由虎山资本、中芯聚源

    新密科技获过亿元A轮投资,由虎山资本、中芯聚源

    投资界领投(ID:pedaily)据12月1日消息,国内领先的半导体全氟密封产品制造商新密科技宣布,完成超亿元A轮融资。 本次投资由虎山资本、中芯聚源领投,青大海峡跟投,老股东中南创投追加投资。 据悉,新密科技是一家专注于高端密封材料及产品解决方案的高新技术企业。 集研发

    06-18

  • 毅镤科技完成Pre-A轮融资,戈壁创投独家投资

    毅镤科技完成Pre-A轮融资,戈壁创投独家投资

    投资界(ID:pedaily)据9月5日消息,上海毅镤新能源科技有限公司(以下简称“毅镤科技”) )宣布完成数千万元Pre-A轮融资,本轮融资由戈壁创投独家投资。 普亭科技CEO罗坚表示,本轮募集资金将用于继续加大研发投入、完善和优化制氢控制系统等业务方面。 毅镤科技成立于今年

    06-17