首页 > 科技未来 > 内容

不可忽视的资源引擎算力层

发布于:2024-06-18 编辑:匿名 来源:网络

AIGC驱动中国计算产业发展机遇概述聚焦“芯片硬件、服务器、应用模型、能源散热”等计算模块全球将大力发展算力基础设施建设算力支撑与模型需求存在差距,AIGC庞大的算力需求进一步给供需结构带来压力。

自2016年Google提出Transformer架构以来,人工智能的发展逐渐进入预训练大型模型时代。

今年6月,OpenAI的GPT模型参数数量已达到1.17亿个。

模型参数数量开始实现数亿碱基的快速发展,平均每3-4个月翻一番。

不可忽视的资源引擎算力层

这就带来了对训练算力的需求。

水涨船高。

”算力正在成为影响国家综合实力和经济发展的关键因素。

浪潮信息发布的相关报告显示,算力指数平均每提升1个点,数字经济和GDP将分别增长3.3个百分点和1.8个百分点。

面对算力层供需结构的矛盾,各国都在积极开展算力层基础设施建设。

在算力指数国家排名中,美国拥有全球超大型数据中心最多,以75分的国家算力指数排名第一,中国以66分排名第二,其次是日本、德国、英国等国家。

算力建设已成为国家高质量发展的战略方针。

年底,OpenAI的GPT模型具备能力后,AI行业迅速进入以大模型为技术支撑的AIGC时代。

大量的培训和算力需求,让本已供需不均的算力产业结构进一步承压。

目前,我国各地正在加快新一批数据中心和智能计算建设,不断优化算力资源,满足未来快速发展的大算力需求。

算力的释放符合AI模型的逻辑:先训练,后推理。

1亿美元的训练算力需求已经奠定,边缘、端侧算力的巨大需求还有待释放。

大模型需要经过训练、调优、二次开发、推理四大核心。

步。

从算力应用角度来看,可以细分为训练算力和推理算力。

**训练算力需求=模型参数量*数据集token个数*系数k。

**由此可以看出,模型训练所需的计算能力与数据集中的参数数量和token数量成正比。

AIGC预训练的承载千亿、万亿参数的大型模型需要海量的算力,给相关厂商设定了很高的算力门槛。

以OpenAI训练GPT模型为参考,1亿参数模型的训练大约需要3.14*10^23次浮点运算,相当于10天的训练耗时约10000个GPU。

国内厂商计算资源匮乏,之前购买的GPU大部分都被常规业务占用。

为了训练自己的国内大型模型,一些厂商采取计算资源分配策略,优先训练大型模型,实现资源聚合。

**推理算力要求=模型参数量*(“输入+输出”代币数量)*系数k。

**对于大型云模型,推理算力需要支持百万级用户的频繁应用。

2019年4月6日,ChatGPT因需求量大而暂停升级服务,并停止销售Plus付费项目。

国内大型模型厂商也因为推理端的算力资源容量限制了AIGC大型模型的公开测试名额。

AIGC早期,市场更多关注模型预训练的大算力层,关注GPU等高算力芯片的资源供给和消耗。

未来,本着AI模型先训练后推理的逻辑,AIGC算力层将逐步迎来推理算力更广阔、更开放的家园,带来更多去中心化的机会。

AIGC时代算力产业模式将进化。

智能算力资源可能更多地承载在云服务产品中,以MaaS模式服务于各行业。

过去,数据中心主要以租赁和自建为主,算力需求方以自身业务为主。

根据规模、财务预算、数据隐私要求等,您可以选择租赁或自建。

在AIGC时代背景下,数据中心将配备更多的AI服务器,以满足日益增长的智能算力需求。

云厂商提出了MaaS(ModelasaService)模型即服务商业模式,融合了云计算、智能算力和模型能力。

与其他资源高度集成,客户可以直接在云端调用、开发和部署模型,更好地适应客户的个性化需求。

未来,更多长尾企业的需求量将拥抱MaaS商业模式。

与云算力的发展相比,客户端大规模模型的发展虽然较慢,但仍然是各终端厂商发展的技术重点。

例如,从苹果的招聘信息中可以看出,其致力于“在客户端实现推理和加速大型语言模型”。

职能型人才需求和产品规划。

未来,随着大模型轻量级开源版本的发布,大模型有望进一步定制和优化,将推理能力部署在设备侧,带动手机、机器人等端侧芯片的发展。

数据中心需要响应高速、海量运营的需求。

大模型时代,数据中心将进一步优化网络带宽、能耗、制冷运维等。

预训练大模型的训练和推理需要海量的数据资源和全天候的高性能访问。

性能计算机。

高速运行对数据中心的网络带宽、能耗、制冷运维能力提出了更高的要求。

首先,网络是数据中心最重要的组成部分。

随着数据量和计算量的增加,数据中心需要优化网络带宽,实现数据在节点内部和节点之间的高吞吐量、低延迟的传输和连接,并进一步优化计算集群的架构和设计,保证高效利用数据中心;其次,能源消耗和碳排放是数据中心迫切需要关注的关键问题。

普通服务器的标准功耗一般为W,但AI模型运行时会消耗更多的能量。

以CPU+AI芯片(配备4卡/8卡)异构服务器为例,系统功耗一般会达到WW。

根据斯坦福大学公布的数据,GPT-3模型训练消耗的电力可供一个美国家庭使用数百年,而二氧化碳排放量相当于一个家庭近百年的排放量。

于是,OpenAI 创始人 Sam Altma 押注于核聚变公司 Helion Energy,并向其投资了 3.75 亿美元。

Helion Energy还与微软签署了购电协议,并承诺在年内将全球首台商用核聚变发电机并入电网。

,交付给微软;另一方面,由于基于大型模型算力需求的高耗能运算,热量释放成倍增加。

为了保证服务器能够长期保持合适的工作温度,数据中心将更加注重系统设计和散热技术的开发和应用。

大型车型的散热需求加速了从风冷到液冷的技术升级,进一步提高经济性、节能性和散热效率。

散热也将更加贴近热源,从机柜级散热、服务器级散热发展到芯片级散热。

目前,我国正在大力推进“东方数据、西方计算”工程,已出台《新型数据中心发展三年行动计划(年)》等政策文件,指导实施新型数据中心集约化、高密度、智能化建设,完成规模化和发展AIGC时代的中国计算产业。

网络带宽、算力利用率、绿色能源利用率等全方位提升,大模型时代数据中心优化的方向。

人工智能芯片是计算能力皇冠上的明珠。

关注其性能和运用,服务于大模型的训练和推广。

AI芯片需要进一步升级内存、带宽、互联等能力。

算力是评价AI芯片的关键。

核心要素。

芯片的性能衡量除了运算次数外,还需要考虑运算精度。

根据运算数据精度的不同,算力可分为双精度算力(FP64)、单精度算力(FP32)、半精度算力(FP16)和整数算力(INT8、INT4) 。

位数越高,运算精度越高,能够支持的运算复杂度也越高,从而适应更广泛的AI应用场景。

另外,AI芯片的性能峰值算力是指芯片能够输出的最大算力。

但由于硬件架构、算法模型特性、工具链、软件框架等因素的限制,AI芯片的算力不会得到100%的充分利用。

使用。

为了适应大型模型的训练和推理,AI芯片需要更大的内存访问带宽和更低的内存访问延迟,这推动了从GDDR到HBM的技术升级。

另一方面,它需要更高的片间互连甚至片内互连能力,以满足AI加速器对内存访问和数据交换的需求。

最后,大型集群并不等于强大的计算能力。

在大规模集群部署中,集群训练会引入额外的通信成本。

节点越多,算力利用率就越低,单点故障会影响全局运行。

因此,逐年增加GPU卡或计算节点数量并不能线性增加算力收入,我国面临的单卡芯片性能差距将更难以通过堆叠等方式解决。

AI芯片巨头英伟达正在从硬件向平台扩张。

NVIDIA 正在宣扬人工智能的“iPhone”时刻。

Allin的“生成式AI”受益于AIGC的爆发。

NVIDIA的股价再次飙升。

现在NVIDIA的估值已经达到1万亿美元。

成功进入苹果、微软、谷歌、亚马逊同属的“万亿俱乐部”,成为美股历史上第一家市值达到万亿美元的芯片公司。

今年3月,NVIDIA召开GTC(GPU技术大会)大会,推出了基于Hopper架构的产品H、为AI生成视频提供硬件支持的L4图形GPU,以及结合Grace架构CPU的GH以及Hopper架构GPU等主要产品。

此外,NVIDIA还将产品布局向上游延伸,推出历时四年的cuLitho光刻库,并与台积电、ASML、Synopsys等上游厂商合作,计算光刻速度提升40倍以上;积极拓展下游模型的应用场景。

,围绕生成AI推出了一系列加速模型训练和推理软硬件产品和服务。

8月,NVIDIA在年度计算机图形大会SIGGRAPH上宣布推出全球首款HBM3e内存,推出下一代GHGraceHopper超级芯片,并宣布与Huggingface合作,协助生成式AI模型的高效开发和部署。

综上所述,NVIDIA早期通过软硬件产品的结合,奠定了其在AI芯片领域的领先地位。

如今跟随生成式AI浪潮,NVIDIA进一步拓展上下游布局,旨在打造围绕行业上下游运营的应用开发生态系统,进一步深化公司的技术和生态护城河。

中国算力产业将坚持走自主创新之路。

英伟达能否继续保持强势?中国何时才能迎来自主创新芯片的曙光?算力作为AIGC行业的基础设施层,是AIGC生产力瓶颈的关键一环。

对此,算力厂商纷纷发力,AMD、英特尔等追赶企业频频为AIGC推出新品。

对比NVIDIA的GraceHopper,AMD推出“CPU+GPU”双架构InstinctMI进军AI训练端。

Intel即将在2020年发布FalconShores GPU,将其混合架构改为纯GPU解决方案。

全球范围内掀起了一股 GPU 购买热潮。

马斯克正在抢购 10,000 张卡,加入 AIGC 战争。

不过,除了过去的库存之外,国内厂商受中美禁令限制,只能采购NVIDIA H版GPU,在算力和带宽方面都受到很大限制。

目前,国内大型模型训练芯片仍以NVIDIA GPU为主。

作为首批完成训练和部署框架及平台生态的公司之一,NVIDIA将进一步巩固其在生成式AI领域的主导地位。

不过,国内客户正在积极与国内外追赶企业合作。

如果AMD接触,则意在打破Nvidia的溢价和垄断体系。

2016年以来,美国陆续对中国企业实施贸易管制,美国列入黑名单的中国企业数量已达千余家。

尤其是在半导体、人工智能等先进技术领域,国产芯片实现自主创新刻不容缓。

中国科技部也出台政策推动公共人工智能算力平台建设。

国产芯片虽然在薄膜生产方面取得了突破,但尚未进入成熟阶段。

从适应AIGC大模型训练的角度来看,国产产品会存在宕机、兼容性差、AI框架支持度低、核心IP有限等过渡性问题。

AIGC浪潮下,AI芯片的发展路径将更加聚焦AISC品类。

中国算力层也将进一步尝试摆脱对领先厂商NVIDIA的依赖,以“云巨头自研自用+独立/初创公司服务信息创新和运营”的商业及其他ToG和ToB市场”是两条主要发展路径,等待国产替代的曙光和实现国产“算力+应用”的正循环。

#阿里云#创业者计划#中小企业服务#9月21日,创新创业年,阿里云正式启动阿里云创业者计划,联合知名投资机构、加速器、服务创造机构以及大企业的创新力量,旨在为初创企业提供全方位的赋能和服务,帮助初创企业在阿里云上快速建立自己的业务,开启智能时代的创业新范式。

不可忽视的资源引擎算力层

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 21上半年北美风险投资同比增长116%至1550亿美元,新增独角兽161家

    21上半年北美风险投资同比增长116%至1550亿美元,新增独角兽161家

    今日头条Crunchbase数据显示,北美初创企业2019年共融资1亿美元上半年,创下历史新纪录。 同比、环比增速分别为66%、66%。 同时,还添加了新的独角兽。 后期融资 近两个季度,北美后期融资蓬勃发展。 融资数量和总额均有所增加,金额已超过全年总额。 今年上半年,北美地区后

    06-17

  • 如何对隐形人使用抖音?

    如何对隐形人使用抖音?

    “你看这烤鸭,外焦里嫩,现在下单还有优惠哦!”盛先生“听”着主播在电话里大力喊叫,轻敲屏幕两下,成功下单。 对于很多人来说,这只是通过直播“剁手”的常见经历带货。 然而,对于以盛先生为代表的视障群体来说,这样“轻松”的使用场景曾经是一种奢侈。 曾几何时,盲人

    06-18

  • AI智慧庭院解决方案提供商“海森堡机器人”获数百万美元天使轮融资,由DCM

    AI智慧庭院解决方案提供商“海森堡机器人”获数百万美元天使轮融资,由DCM

    投资界(ID:pedaily)领投 7月12日消息,AI智慧庭院解决方案提供商“海森堡机器人”(以下简称“Heisenberg Robotics”)海森堡机器人公司)获数百万美元天使轮融资,本轮由DCM领投,江门创投跟投,万石资本担任本轮融资的唯一投资方。 融资将用于继续加大AI视觉算法等核心技

    06-17

  • 海尔民族时尚家电节:3大差异化优势赋能全场景智慧生活

    海尔民族时尚家电节:3大差异化优势赋能全场景智慧生活

    随着文化自信时代的到来,不难发现我们总是买进与民族时尚相关的品牌。 国民奶糖大白兔与气味图书馆联手推出“大白兔”香水,还没闻到就吸引了无数网友的支持。 此前,RIO六神鸡尾酒17秒售空一瓶,民族风情罐1天售空56罐。 宣布售空……每一个民族品牌潮流都能引发我们的购买

    06-18

  • 乐准智信完成Pre-A轮3500万元融资,三诺生物领投

    乐准智信完成Pre-A轮3500万元融资,三诺生物领投

    乐准智信近日宣布完成1万元Pre-A轮融资。 本轮融资由三诺生物领投,深瑞享源跟投,北拓资本负责交易。

    06-18

  • 15亿,上海半导体设备材料二期基金完成首关

    15亿,上海半导体设备材料二期基金完成首关

    投资圈-解码LP消息,近日,普尔科投资宣布旗下子公司上海半导体设备材料产业投资管理有限公司(简称“半导体设备材料”)新一期基金已完成首通,首通规模15亿元,并已在中国基金会协会登记,启动第一批项目投资。 该基金为上海半导体设备与材料私募股权投资基金(简称“二期基

    06-18

  • 国行版PS5起售价3099元,黄牛生意可要“爽”了

    国行版PS5起售价3099元,黄牛生意可要“爽”了

    4月29日,PlayStation中国发布会终于来了。 自2019年11月19日全球发售以来,由于疫情和产能不足,PS5的价格一直居高不下,甚至首批价格被炒至近10元。 今天发布的国行版PS5无疑是很多玩家“走出溢价汪洋”的希望。 发布会上公布了国行版PS5的官方售价。 光驱版售价人民币1,00

    06-21

  • 抖音收藏功能即将上线,首批权限将向知识创造者开放

    抖音收藏功能即将上线,首批权限将向知识创造者开放

    据投资界9月9日消息,为了更好地支持创作者传授知识和用户学习知识,抖音有新产品行动。 9月9日,在“DOU知识计划”2.0发布会上,抖音宣布即将推出收藏功能,让知识短视频的创造和学习更加系统化。 据抖音产品经理介绍,第一期的收藏功能支持抖音PC端创作、App端查看。 功能上

    06-17

  • SEMI发布半导体晶圆设备信息安全标准加速智能制造

    SEMI发布半导体晶圆设备信息安全标准加速智能制造

    据台媒《经济日报》报道,国际半导体工业协会(SEMI)于12月28日发布首个半导体晶圆设备信息安全标准,预计将加快高技术制造业安全化、智能化、数字化步伐。 据台湾媒体报道,国际半导体工业协会(SEMI)于12月28日发布首个半导体晶圆设备安全标准,有望加快高科技制造安全化

    06-08

  • 智联招聘正式提交IPO文件并在纽交所挂牌上市,

    智联招聘正式提交IPO文件并在纽交所挂牌上市,

    智联招聘正式递交IPO文件并在纽交所挂牌上市。 对于 ZPIN。 发行价格区间为每股12.5-14.5美元。

    06-18

  • 氪空间完成10亿元融资,IDG资本、歌斐资产、逸星资本联合领投,

    氪空间完成10亿元融资,IDG资本、歌斐资产、逸星资本联合领投,

    据投资界5月15日消息,氪空间宣布完成10亿元融资,由IDG资本、歌斐资产、耀明资本领投。 共同主导投资。 本次融资后,氪空间确立了打造“全周期企业办公服务商”的新战略。 在新战略指导下,氪空间将完成从“联合办公”到“综合办公服务+新资产管理”的商业模式升级,氪空间

    06-18

  • Twitter靠什么统治国家?数字先锋爱沙尼亚启动AI治理

    Twitter靠什么统治国家?数字先锋爱沙尼亚启动AI治理

    爱沙尼亚是一个波罗的海国家,拥有1万人口和1万公顷土地,其中一半是森林。 然而,对于一个小国来说,爱沙尼亚在国际舞台上却令人印象深刻。 该国政府已将数字化视为节省成本和平衡权力的手段,吸引了世界各地领导人、学者和风险投资家的关注。 据报道,数字化进程每年为爱沙

    06-18