线性资本成功募集5亿美元,王淮写下深情信
06-17
冯·诺伊曼的存储与计算分离的架构模式已经不能满足人工智能应用的需求。
计算与存储的融合将突破AI算力瓶颈。
“这是达摩院十大技术趋势之一。
让外界没想到的是,早在这一趋势诞生之前,达摩院就已经在存储与计算融合领域布阵,暗中发力。
近日,达摩院宣布在存储与计算集成芯片研究方面取得新突破,成功研发出全球首款基于DRAM的3D键合堆叠存储与计算集成芯片,作为一项新技术分支,该芯片可能是国内首创。
芯片行业的一线曙光,但70年的冯·诺依曼攻击计算系统几乎已经成为行业的铁律,攻克技术和应用难题,达摩院能否突围?二战时,美军要求弹道研究实验室每天为陆军的炮兵部队提供6枚张射表,按照当时的计算工具,要雇佣多个计算器来计算一枚张射表至少需要2个月的时间。
为此,美国集结了一批科学家人前来投资。
48万美元,最终建成了世界上第一台通用电子计算机ENICA,可以实现每秒10次加法或2次乘法的计算能力。
工程师冯·诺依曼写了一篇报告作为反思。
报告明确提到,未来的计算机应包括控制器、存储器、运算单元等组件。
由此诞生了冯·诺依曼架构,意义重大,是存储与计算分离的设计。
,不仅简化了计算机的设计,而且使编程和控制变得更加容易。
从此,冯·诺依曼架构、晶体管和布尔逻辑计算形成了传统计算机的三大基石,以及硬件之上的软件、汇编语言和编译器。
、应用软件共同推动计算系统的发展。
如今,计算机已经经历了半个多世纪的迭代。
虽然架构发生了很多变化,但始终无法摆脱冯式架构的束缚。
使用冯·诺依曼架构是没有问题的。
问题在于,随着AI技术的快速进步,对算力的需求呈爆炸式增长。
虽然多核并行加速技术是提升算力的有效途径之一,但在后摩尔时代,晶体管微缩正在逼近物理极限,芯片算力的增长举步维艰。
最终,算力需求与实际增长之间的矛盾,指向了冯·诺依曼架构中存储与计算分离的局限性。
在计算过程中,需要不断地通过总线交换数据,并从内存读入CPU。
这种运作方式,让冯·诺依曼架构成为计算机领域阿克琉斯的脚后跟。
一方面,内存的发展速度严重落后于处理器的发展速度。
处理器的计算能力以每两年3.1倍的速度增长,而内存的性能每两年仅提高1.4倍。
处理器和内存就像漏斗。
结合起来,狭窄的内存端极大地影响了数据传输的速度。
另一方面,数据传输消耗大量能量。
数据显示,将数据从存储单元传输到计算单元所需的功耗大约是计算本身的两倍,实际用于计算的时间和功耗比例大大降低。
因此,工业界和学术界一直在努力减少数据处理开销。
高带宽存储器、高带宽数据通信、提高存储器速度、增加片上存储等方法相继出现。
然而,这些方法并没有改变数据存储和处理的方式。
一定程度的救济并不能从根本上解决冯·诺依曼建筑的瓶颈。
为此,计算与存储合二为一的存储与计算技术诞生了。
事实上,这项技术早在20世纪90年代就已被提出。
但由于技术复杂、设计成本高、应用场景缺乏等原因,过去几十年来业界对存储计算一体化芯片的研究进展缓慢。
直到近几年,英特尔、三星、美光等传统半导体公司,以及Facebook、谷歌等互联网公司都开始积极布局并逐步显现成效。
也有Mythic、Syntiant、智存科技、Flash Semiconductor等初创公司纷纷涌入这一领域。
但目前还没有一家公司的存储与计算一体化技术解决方案得到市场的广泛认可。
面对这种情况,阿里巴巴希望通过自主研发的创新技术解决行业问题。
打破技术局:达摩院另辟蹊径。
众所周知,平头哥是阿里巴巴旗下的一家半导体公司,但雷锋网了解到,这款存储计算一体化芯片的研发来自于达摩院。
阿里巴巴达摩院拥有16个实验室,涵盖机器智能、数据计算、机器人、金融科技、X实验室等5个领域。
其中,计算技术实验室是一支由国内领衔的前沿芯片技术研究精英团队,由毕业于国外名校、有各大半导体厂商工作经验的研究人员组成。
他们致力于计算、存储和互连芯片的前沿技术研究。
研究方向涵盖系统架构、计算机体系结构、芯片设计优化等领域。
达摩院成立四年来,计算技术实验室一直低调,但团队却交付了最优质的产品。
与产业链合作伙伴共同研发出全球首款基于DRAM的3D邦定堆叠存储计算一体化芯片,这意味着达摩院在存储计算一体化技术领域走出了一条全新的道路。
从全球范围来看,虽然存储与计算一体化技术的开发商众多,但尚未有一家公司交出出色的答卷,也没有成功的经验可供借鉴。
达摩院投资必须走自己的路! 2019年5月,项目启动时,达摩院计算技术实验室科学家和项目研发负责人郑洪忠带领团队成员反复调研比对现有技术路线,如近存储、内存计算和内存执行计算。
不同的技术路线都指向同一个最终目标,那就是像人脑一样实现存储与计算的完全融合。
在众多解决方案中,达摩院走上了近存计算的道路,并进一步选择了3D键合堆叠技术来实现。
“工艺成熟度和成本是我们选择使用内存逻辑键合的主要原因。
虽然研发之路坎坷,但我们并没有动摇。
”郑洪忠说道。
在郑洪忠看来,很多存储与计算一体化的技术方案对整个系统架构的破坏性很大,对外部流程、工具链、应用都有更加严格的要求。
通过绑定将计算和存储集成在一起,既可以单独设计,也可以绑定在一起。
此前所做的设计工作,是决定这场战斗成败的关键。
达摩院与上下游合作伙伴深度合作,开发多项创新技术。
例如,存储单元采用异构集成嵌入式DRAM(SeDRAM),具有超大带宽和超大容量的特点。
在计算芯片方面,达摩院开发设计了定制化的基于流的加速器架构,对推荐系统进行端到端的加速,包括匹配、粗排序、神经网络计算、精排序等任务。
达摩院实验证明,该芯片完美匹配数据中心推荐系统的带宽/存储需求。
在显着提升带宽的同时,还实现了超低功耗,展现了近存计算在数据中心场景中的潜力。
测试表明,在实际推荐系统应用中,该芯片较传统CPU计算系统可实现10倍以上的性能提升和30倍以上的能效提升。
这一成果很快得到国际顶级机构的认可,相关论文已被ISSCC收录。
“这款芯片的研发需要技术路线的选择和产品定义紧密结合,只有正确的技术才能解决真正的问题。
”郑洪忠说道。
打破应用格局:我们将在三到五年内看到结果。
目前全球布局存储计算一体化技术的公司主要包括存储基因和计算基因。

例如,以三星为代表的存储芯片厂商开发的存储与计算一体化芯片,更侧重于存储而非计算。
以英特尔为代表的计算芯片厂商更注重计算,而较少关注存储。
作为半导体领域的后起之秀,阿里巴巴仍然拥有巨大的机会。
在实现存储与计算平衡以及计算架构设计方面具有明显优势。
过去几年,达摩院计算技术实验室产出了多项创新成果,这是团队研发存储与计算融合技术的硬实力。
但不可忽视的是,阿里巴巴广阔的应用场景是阿里巴巴成为存储与计算融合从技术到商业落地的“游戏打破者”的重要驱动力。
“丰富的应用场景是存储和计算架构落地的关键驱动力。
”郑洪忠说道。
以搜索推荐为例。
该场景对内存带宽、功耗、延迟等要求非常高,如果使用传统计算来实现,成本会很高。
然而,这些问题可以通过存储和计算来解决。
同时,削减成本。
在早期测试中,达摩院的存储计算一体化芯片已被证明在推荐系统中具有巨大的应用价值。
针对真实需求,进行针对性的设计和研发,是达摩院区别于其他存储与计算融合技术研发团队的特色。
当然,达摩学院并不止于此。
达摩院表示,未来将逐步攻克技术难题,进一步攻克近存芯片三维堆叠后的内存计算技术。
另一方面,我们也会和阿里巴巴内部业务保持更紧密的合作,让这项技术能够更快落地。
这是一个浩大的工程,可能需要3到5年的时间才能完成。
“我们仰望星空,但也需要脚踏实地。
对于一项全新的芯片技术,我们需要有足够的耐心和决心。
”对于已有70年历史的冯·诺依曼计算机架构来说,这样的等待时间不会太久,前期各大研究机构和企业的持续投入,是人类追求极致算力的必然选择。
一旦这项技术进入市场,AI、VR/AR、天文探索等场景最终将迎来翻天覆地的变化。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-18
06-21
06-17
06-17
06-17
06-21
06-18
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态