DPU芯片公司“芯启源”宣布完成数亿元Pre-A3轮融资
06-17
美光与 AMD 联手为客户和数据中心平台提供一流的用户体验。
双方在奥斯汀建立了联合服务器实验室,以减少服务器内存验证时间,并在产品验证和发布期间共同进行工作负载测试。
现在,美光用于数据中心的 DDR5 内存和第四代 AMD EPYC? 处理器已经发货,我们针对一些常见的高性能计算 (HPC) 工作负载对它们进行了基准测试。
超级计算机长期以来一直负责高性能计算工作负载。
如此大规模的数据密集型工作负载需要运行数百万个并行操作的 TB 级数据,以解决人类世界中的难题,例如天气和气候预测;地震建模;化学、物理、生物分析等。
随着计算机架构的进步,此类工作负载通常托管在非常大的“横向扩展”高性能服务器集群中。
这些服务器集群需要最强大的计算、架构、内存和存储基础设施,以满足关键工作负载的可扩展性、低延迟和高性能要求。
然而,随着服务器CPU性能和吞吐量的不断增长,DDR4无法提供足够的内存带宽来满足不断增长的高性能核心数量。
为了缓解这一瓶颈,美光DDR5内存与采用Zen 4服务器架构的第四代AMD EPYC处理器相结合,让服务器CPU能够更好地匹配内存产品,满足数据密集型工作负载的性能要求。
和效率需求。
美光 DDR5 内存可帮助企业更快地从本地和云数据中获得洞察。
我们在最新的 AMD Zen 4 96 核 CPU 和美光 DDR5 上进行了业界领先的高性能计算工作负载基准测试,所有结果都显示性能提高了两倍。
美光 DDR5 与第四代 AMD EPYC 处理器搭配,在 STREAM 测试中使内存带宽翻倍。
STREAM1是一种常见的基准测试工具,用于测量高性能计算机的内存带宽,可以捕获高性能计算系统的峰值内存。
带宽。
此工作负载使用软件堆栈 Alma 9 Linux 内核 5.14 STREAM.f,于 2018 年 11 月 29 日发布 测试设置 DDR4 系统,采用第三代 64 核 3.7 GHz AMD EPYC 处理 RDIMM DDR4 MHz系统2内存插槽已完全插入,总共64GB DDR5系统搭载第四代96核3.7GHz AMD EPYC处理器; DDR5 MHz系统3的RDIMM内存插槽已满,总共64GB 测试结果 DDR5系统每插槽内存带宽翻倍,达到GB/s 这个结果意味着客户可以运行更大的人工智能/机器学习 (AI/ML) 项目,或利用 DDR5 增加的内存带宽来实现更高性能的计算。
美光 DDR5 帮助天气研究和预报 (WRF) 4 速度提高 2 倍。
本次测试使用的高性能计算工作负载代码针对的是天气和气候。
WRF模型在一些支持高性能浮点处理、高内存带宽和低延迟网络的传统高性能计算架构中表现良好。
测试对象为美国大陆(CONUS),横向分辨率为2.5公里。
用于此工作负载的软件堆栈 Alma 9 Linux 内核 5.14 WRF 2.3.5 和 4.3.3 Open MPI v4.1.1 测试设置 具有第三代 64 核 3.7 GHz 的 DDR4 系统AMD EPYC(霄龙)处理器; DDR4 MHz 系统 2,RDIMM 内存插槽已完全填充,总计 64GB DDR5 系统,配备第四代 96 核 3.7 GHz AMD EPYC 处理器; DDR5 MHz 系统 3,RDIMM 内存插槽满载,总计 64GB 测试结果 美光 DDR5 搭配第四代 AMD EPYC 处理器可实现 1. 时间步/秒 VS DDR4 系统 2. 时间步/秒 更快的速度意味着可以使用更多的数据库空间或运行更多的天气预报模型以提高预报准确性。
美光DDR5帮助OpenFOAM5将速度提高2倍。
OpenFOAM 是一种用于计算流体动力学 (CFD) 的开源高性能计算工作负载。
它广泛应用于多个行业,有助于缩短开发时间并降低成本。
从消费产品设计到航空航天设计,OpenFOAM 可以模拟各种应用中的物理相互作用,包括摩托车挡风玻璃湍流。
在此模拟中,OpenFOAM 能够计算摩托车和骑手周围的稳定气流。
OpenFOAM可以根据用户指定的进程数量进行负载均衡计算,从而将网格分解为多个部分并分配给不同的进程进行求解。
解决方案完成后,网格和解决方案将重新组装成单个域。
此工作负载使用的软件堆栈 OpenFOAM CFD 软件(版本 8),其中摩托车网格尺寸为:x GHz AMD EPYC 处理器; DDR4 MHz 系统 2,RDIMM 内存插槽已满,总计 64GB DDR5 系统,配备第四代 96 核 3.7 GHz AMD EPYC 处理器; DDR5 MHz 系统 3,RDIMM 内存插槽已满,总计 64GB 测试结果 测试结果表明,美光 DDR5 产品组合将 OpenFOAM 性能提高了 2.4 倍。
OpenFOAM是五大高性能计算软件平台之一,拥有庞大的开源社区。
该软件广泛应用于大学和研发中心,利用高带宽内存和具有密集内核的高性能CPU来实现高度并行性。
美光 DDR5 帮助分子动力学 6 加速 2 倍 CP2K 是一款开源量子化学工具,适用于许多应用,包括固态生物系统模拟。
CP2K 为不同的建模方法提供了一个通用框架。
这次的测试对象是水(H2O)的密度泛函理论(DFT)。
模拟盒子总共包含6个原子(2个水分子)。
此工作负载使用软件堆栈 H2O-DFT-LS.NREP4 和 H2O-DFT-LS Alma 9 Linux 内核 5.14 测试设置 DDR4 系统,配备第三代 64 核 3.7 GHz AMD EPYC 处理器; DDR4 MHz 系统 2 已满载 RDIMM 内存插槽,总计 64GB DDR5 系统配备第四代 96 核 3.7 GHz AMD EPYC 处理器; DDR5 MHz 系统 3 已满载 RDIMM 内存插槽,总计 64GB 测试结果 测试结果显示,美光 DDR5 产品组合将分子动力学性能提高了 2.1 倍。
随着内核数量和内存带宽的增加,此类工作负载的性能显着提高。
总结 到目前为止,我们只测试了少量的高性能计算工作负载,因此这些只是我们的初步结果。
将高性能、高带宽内存与最新的服务器处理器(例如第四代 AMD EPYC 处理器)相结合,为高性能计算客户创造了新的可能性。
我们期待更多的企业数据中心和云服务提供商能够在新平台上应用美光DDR5产品,以释放更高的性能和能源效率。
________________________ 1 我们在 STREAM 基准测试中为 STREAM 基准配置了 25 亿个向量 - 在单个 AMD CPU 系统上运行 2 AMD DDR4 系统是 64 核 AMD EPYC 处理器,DDR4-MHz RDIMM 内存插槽已满。
共64GB3 AMD DDR5系统为96核AMD EPYC处理器,DDR5-MHz RDIMM内存插槽满装,共64GB4,横向分辨率12.5公里。
CONUS的WRF在DDR4系统上的运行时间是秒,在DDR5系统上的运行时间是秒(都包括内存输入/输出时间)。
本次测试的 WRF 配置为 2.5 公里 CONUS,测试结果为 1 时间步长/秒,而 DDR4 运行时间为 2 时间步长/秒。
5 对于 OpenFOAM,我们运行了三个变体: 5a:运行时间,DDR4 系统运行时间为 1,秒,DDR5 系统运行时间为 1,秒 5b:运行时间,DDR4 系统运行时间为 1,秒,DDR5 系统运行时间为 1,秒 5c:运行时间,DDR4 系统上 2 秒,DDR5 系统 1 秒 6 分子动力学工作负载在 DDR4 系统上运行 2 秒,在 DDR5 系统上 1 秒 作者: Krishna Yalamanchi Krishna 担任高级开发经理美光生态系统,专注于DDR5和CXL解决方案的开发。
他曾在英特尔 IT 部门工作,领导 SAP HANA 迁移,并通过与 SI、OEM 和云服务提供商合作的合作伙伴生态系统推出了适用于 SAP 工作负载的第三代和第四代英特尔至强。
处理器。

Sudharshan Vazhkudai 博士。
Sudharshan S. Vazhkudai 担任 Micron 系统架构和工作负载分析总监。
他领导着一个位于印度奥斯汀和海得拉巴的团队,致力于内存和存储(DDR、CXL、HBM 和 NVME)产品层次结构的可组合性,并优化与数据中心工作负载相关的系统架构。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-21
06-17
06-18
最新文章
PCBA质检员的日常工作内容
美国法院裁定VoIP不属于电信服务,需征税
雷达嵌入式工控主板如何使用?工控主板故障分析
摩托罗拉在西班牙促销Z8手机
中宇买下了一台三星机型,品牌和规模是合作的主要原因
舰载军用加固计算机热设计
谷歌开始对仍由HTC生产的谷歌手机进行内部测试
英国EE分享LTE发展经验教训,面临终端-语音-回传三大挑战