“曲工厂”获梅鹤资本领投数百万元天使轮融资
06-17
“鹅昌网络”由深圳市腾讯计算机系统有限公司技术工程组网络平台部运营,希望与业内志同道合的伙伴交流讨论网络与服务器行业最新动态资讯,同时分享腾讯在网络与服务器领域的实践知识、规划、运营、研发、服务等,期待与您共同成长。网络平台部打造业界领先的敏捷、灵活、低成本的海量互联网云计算服务平台,为支持腾讯业务的可持续发展持续贡献价值,为业务建立竞争优势,打造健康的产业生态!计算互连数据是一个芯片,寄存器通过总线将数据传输到运算单元。
在服务器中,内存通过 DDR 总线与处理器交互。数据中心、存储集群和计算集群通过以太网形成数据流的处理和处理。
互联是计算能力和数据之间的纽带。从芯片内部到数据中心,可以很好地解释这个基本的系统组合。
由此,我们开始想象服务器架构。在这个注重高效计算和存储的时代,我们可以实现多元化系统资源的敏捷交付:端到端解耦的组件资源,借助高性能可定义互联,按需组装,灵活交付裸机服务器-金属性能但更灵活的生命周期管理效率。
GONGGA系统架构 GONGGA系统是我们对这一理念的综合实践,让服务器配置“可编程”。技术发展的步伐继续突飞猛进。
芯片架构和工艺的迭代、物理颗粒的升级和创新、总线协议的优化和革命正在推动供给侧的多元化。同时,随着人工智能/云计算/物联网等业务的兴起,对业务性能和配置比例的差异化需求迫在眉睫。
如何实现内外部融合发展?带有腾讯基因的GONGGA服务器正是基于这样的思维,开始了对未来的探索:统一的系统形态、灵活的资源分配。 2U系统规格是腾讯基础设施中适应性最好的。
小小的机箱里,不再有CPU/内存等传统计算单元。取而代之的是高速PCIe互连芯片。
通过PCIe内部互连拓扑,将PCIe设备与传统CPU计算资源解耦。基于PCIe互连拓扑,通过管理芯片重构PCIe资源。
实现了业务端源扩展的精准匹配,为业务提供了更深层次的资源调整,为智能分配提供了基础。通过对传统资源的解耦重构,依托腾讯的自动化运营平台,满足业务部门的动态需求。
高性能存储系统的前窗(位置1)可配置多种模块化结构,可容纳24块U.2 NVMe磁盘或32块Ruler SSD。单盘存储容量为30TB,单个系统最多可提供1PB。
高性能存储密度。通过GONGGA系统内置的PCIe交换芯片,可以启动基于裸盘存储的共享经济初级模式。
多个用户可以根据需要划分使用物理磁盘槽位。它是PCIe直挂模式,硬件性能不受影响。
后期设计升级后,可以基于SR-IOV进行更精细的空间划分和管理。例如,当现有系统需要存储升级或扩容时,用户可以在现有核心系统上添加PCIe扩展卡,实现升级扩容,无需更换新的业务系统,避免大规模数据迁移,提高系统性能。
现有系统。使用效果。
在后窗配置全高全长的NVMeoF板卡,即块设备输出的共享高级模式。多块NVMeoF板在南向连接NVMe设备,在北向提供GbE网络带宽,并使用NVMeoF协议对外提供块设备服务。
PCIe交换芯片内置板间通信链路,可在未来提供额外的硬件冗余扩展功能。通过这种形式的结合,结合应用层的资源调度和负载均衡,可以实现类似AWS EBS的网络块设备服务。
NVMeoF板上的ARMv8拥有强大的处理能力,同时也支持相关二次开发,满足自身协议的实现和优化。 AI 在AI in All时代,GONGGA系统所能支持的组件中,离不开各类计算加速硬件。
从面向训练的全高全长GPU、多形态推理加速卡,到通用FPGA板卡,均可定量支持。主流的训练GPU系统主要采用每机8张卡,GONGGA系统可以实现更灵活的扩展。
四个GONGGA系统组装成一个具有16个计算卡的加速系统。 GPU和处理器之间的带宽可以通过布线自由配置。
它还支持一系列提高训练效率的功能:GPUDirect RDMA、GPU之间的P2P通信等。当前窗口充满了 24 个 U.2 形式的推理加速器卡。
你可以想象基于单台机器的图像/语音/文本等数据处理能力。 GONGGA系统还集成了通用计算支持能力,可容纳8个单通道高频x86微服务器刀片,满足游戏、Web服务器等目标应用的需求。
面向未来的互联理念,面向各种异构设备互联的解耦和融合,这是GONGGA系统的基本设计思想。从PCIe互连1.0版本开始,Gen-Z/OpenCAPI/CCIX等互连技术在业界蓬勃发展。
我们需要深入探索和参与,结合腾讯的运营理念,拥抱开放,逐步迭代。综上所述,以上是系统设计和功能场景的介绍。
我们还需要分析比较GONGGA系统带来的价值。对于AI应用4U8卡训练模型,两套GONGGA系统加上一台通用服务器作为机头即可满足相同的功能。
由于采用自主研发模式,保证了成本透明度。与同期购买的4U8卡型号相比,L6级别明显降低。
对于NVMe块设备系统,以两台各配备16块NVMe盘的2路服务器为参考,一套GONGGA系统可配置32块Ruler-SSD,内置2个单路系统头,提供同一系统在1:16格式。提供块设备服务,具备机头间相互备份的硬件能力,不仅降低了系统总成本,还实现了机架空间的隐式扩展。
还有其他的扩容和升级项目,面向硬件的连接方式降低了数据迁移和整体升级的成本,并能有效提高现有服务器的利用率。我不会一一讨论。
总结一下GONGGA系统的核心能力: 1、针对多种硬件资源的解耦重构能力; 2、通用服务器形式的非凡资源兼容性和可视化能力; 3、多种互连技术,对应用层完全透明; 4、依托腾讯高度自动化运维平台的智能管理能力。仰望星空,励志前行,我们向GONGGA进发!欢迎关注公众号“亿畅网络”。
我们将为您提供最新的行业新闻、最接地气的腾讯网络和服务器资讯,大量的互动交流板块和有奖活动正在准备中。需要你的热情。
参与并敬请关注!注1:所有标注来自“亿畅网络”的文字、图片等作品的版权均属于“深圳市腾讯计算机系统有限公司”。未经官方授权不得使用。
如有违规,一经核实,将保留追究索赔的权利;注2:本文部分图片来自网络。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-17
06-06
06-18
06-17
最新文章
【玩转GPU】ControlNet初学者生存指南
【实战】获取小程序中用户的城市信息(附源码)
包雪雪简单介绍Vue.js:开学
Go进阶:使用Gin框架简单实现服务端渲染
线程池介绍及实际案例分享
JMeter 注释 18 - JMeter 常用配置组件介绍
基于Sentry的大数据权限解决方案
【云+社区年度征文集】GPE监控介绍及使用