中国互联网30年-互联网企业代表发言:360
06-17
亚马逊网络服务上个月扩大了其芯片业务,主要是这家云提供商巨头推出了第三代基于Arm的Graviton处理器,该处理器将为计算密集型的新云实例提供动力高性能计算 (HPC)、科学建模、分析和基于 CPU 的机器学习推理等工作负载。
在 AWS 的 re:Invent 大会上,该公司推出了目前处于预览阶段的 Graviton 3 处理器以及将在其上运行的 EC2C7g 实例。
与此同时,AWS 首席执行官 Adam Selipsky 还宣布了在该公司已有一年历史的 Trainium 芯片上运行的新 Trn1 实例,针对机器学习训练工作负载,并宣传了 2018 年推出的 Inf1 实例的经济高效功能,并利用 Inferentia 芯片执行机器学习推理任务。
。
该公司甚至推出了基于 Nitro 固态硬盘 (SSD) 的存储优化型 EC2 实例 - Im4gn/Is4gen/I4i,以提高 AWS 云中 I/O 密集型工作负载的存储性能。
AWS 专注于芯片 最新处理器和 EC2 实例的推出是 AWS 多年来努力构建自己的处理器以在其云实例和 Outposts 基础设施中运行的最新证明,这些基础设施旨在提供 AWS 服务并连接到 -随着您的企业通过混合云模型快速发展,部署数据中心。
这一切发生在 AWS 于 2017 年收购以色列初创公司 Annapurna Labs 五年后,使其成为其芯片制造工作的基础。
MoorInsightsandStrategy 首席分析师 Patrick Moorhead 告诉 TheNewStack:“AWS 多年来一直在投资自己的芯片,从 Nitro 开始,扩展到通用 Graviton、用于推理的 Inferentia,现在又扩展到用于训练的 Trainium。
” “AWS 可以挑选出它想要的每一项功能,以及它不需要利用自己的软件的每一项功能,它还可以针对其特定网络和存储优化其 I/O,这应该允许它以更低的成本做到这一点Moorhead 表示:“提供计算能力,并在某些情况下提供更高的性能。
”性价比是关键 在他的主题演讲中,Selipsky 强调,企业将看到人工智能、机器学习和分析等工作负载在利用 AWS 芯片的实例上运行,而不是英特尔和 AMD 的 x86 CPU 或这些供应商和 Nvidia 的 GPU。
负载性价比优势。
首席执行官表示:“借助 Trainium 和 Inferentia,客户可以获得机器学习的最佳性价比,从扩展训练工作负载到通过高性能推理加速生产中的深度学习工作负载,使所有客户都能充分利用机器学习的强大功能。
” 。
“这一直是我们长期以来的目标,降低训练和推理的成本是这一过程中的重要一步。
” AWS 没有透露有关 Graviton 3 的更多细节。
他表示,新的硅机箱比运行通用计算工作负载的 Graviton 2 驱动的机箱快 25%,并且对于某些专门的工作负载来说会更好。
例如,对于科学工作负载和加密作业,它的浮点性能是其两倍。
运行机器学习应用程序的速度也快了三倍。
电源效率是一个因素,在实现相同性能的情况下,Graviton3 的能耗可减少多达 60%,部分原因是使用 DDR5 内存,它比 DDR4 消耗更少的电量,同时提供多出 50% 的带宽。
该处理器将运行多达 64 个核心,拥有 1 亿个晶体管,时钟速度为 2.6GHz。
AWS副总裁Jeff Barr在一篇博文中写道,基于Graviton3的C7g云实例将提供多种尺寸,包括裸机模型。
基于 Inferentia 和 Trainium 的实例还旨在降低运行特定工作负载的成本。
Selipsky 表示,Inf1 实例的每次推理成本比类似的基于 GPU 的 EC 实例低 70%。
同时,Trainium 支持的 Trn1 实例将提供两倍于基于 GPU 的实例的带宽 - 高达 Gb/s 的 EFA 网络吞吐量,用于自然语言处理和图像识别等任务。
企业还可以在 EC2 UltraCluster 中部署 Trn1 实例,该实例可以扩展到数万个 Trainium 芯片并达到 PB 级。
这些 UltraCluster 将比之前的 EC2 UltraCluster 大 2.5 倍。
“Inferentia 和 Trainium 都是为了在生产级推理和核心训练上节省资金,”Moorhead 说。
“AWS 始终坚持节省资金的立场,因此在我看到 Trainium 结果之前,我非常有信心在某些工作负载上您会看到显着的节省。
Graviton、Inferentia 和 Trainium 等定制芯片的趋势是行业向专用处理器发展的更广泛趋势的一部分。
Arm 基础设施业务线高级副总裁兼总经理 Chris Bergey 在本周的一篇博文中写道,他的公司设计芯片并将这些设计授权给其他公司,正在以其高能效推动这一设计趋势。

“数据中心工作负载和互联网流量几乎每两年翻一番,因此每瓦性能优势对于防止计算增长至关重要。
它的碳足迹至关重要,”Bergey 写道,并补充道,Arm 在云中的增长“为开发人员提供了持续创新的选择,通过在每个核心的基础上提供一致的性能和可扩展性,实现性能和效率的可扩展组合,以提供业界领先的 TCO。
AWS 并不是唯一一家寻求设计自己芯片的超大规模企业,因为他们寻求更高的性能和效率。
据报道,微软去年决定构建基于 Arm 的芯片,用于 Azure 服务器和谷歌,谷歌拥有 Tensor 处理单元等产品和 OpenTitan 安全芯片等定制芯片。
Facebook 也在打造自己的数据中心芯片。
TheEnderleGroup 首席分析师 Rob Enderle 告诉 TheNewStack,他不确定当公司达到一定规模时,情况会如何发展。
“当时,他们倾向于相信内部规模经济将使他们能够与专注的供应商进行有效的竞争,”恩德勒说。
“这一最新趋势很大程度上是英特尔错过了一些关键里程碑的结果……迫使云行业的大多数人考虑这条道路。
不过,英特尔的执行力在首席执行官帕特·基辛格(Pat Gelsinger)的领导下正在改善。
与此同时,AMD 的 Epyc CPU 和他表示,GPU 继续给人留下深刻印象,这表明对定制芯片的需求可能正在减弱,“在供应短缺期间,AMD 和英特尔等公司可能更容易合作而不是单打独斗,因为这些公司不仅应该这样做。
公司拥有更好的供应冗余,但即使发生短缺,他们也应该能够更好地转移内部决策者的责任。
Enderle 表示:“成本确实仍然是单独行动的潜在优势,但前提是你忽略了每家公司的知识产权保护和数十年经验的价值,而这些经验往往为彼此提供了 Offset 的可靠性、一致性和可靠性。
”性能优势。
此外,随着时间的推移,成本将会增加,内部努力可能变得无利可图且不可持续。
分析人士表示,部分原因是很难找到和留住所需的人才,这对技术工人来说是一个严重的问题。
短缺时期的特殊挑战。
Enderle 表示:“虽然过去并不总是能预测未来,但像 AWS 这样规模的公司可以成功完成即使是最大的企业也无法完成的事情,”他进一步指出,“只要专业公司的基本优势得到执行,他们仍然有效。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-17
06-18
06-21
06-18
06-17
最新文章
欧盟宣布《芯片法案》,具体内容在这里!
TrendForce:第三季度内存价格小幅上涨3-8%,移动内存或贵却卖不动
英特尔、美光CEO:解决核心短缺危机不能单靠企业和政府援助
韩企Q1收购全球30%芯片制造设备
外媒:安博凯直接投资基金有意收购封测大厂Amkor
三星发布2nm计划,晶圆代工竞争迈向新节点
南通:打造国内最大的封装测试产业化基地
韩媒:三星正在研究用于芯片生产的聚焦环新材料