黑石创始人:清华大学学者项目已融资2.6亿美元
06-17
作者:Mahendra Pakala,应用材料公司 在物联网、大数据和人工智能(AI)的驱动下,从交通、医疗保健到零售和娱乐等众多行业将迎来下一个时代步。
转型之路被应用材料公司统称为AI计算时代。
在之前的计算时代,大型机/小型机、PC/服务器以及智能手机/平板电脑都受益于摩尔定律的进步,摩尔定律在二维缩放、产品性能、功耗和面积/成本(也称为“PPAC”)方面都受到了摩尔定律的影响。
同时得到改善。
尽管AI时代的各种应用蓬勃发展,但摩尔定律已经放缓;因此,业界需要在2D小型化之外取得突破,以新的方式推动PPAC。
具体来说,我们需要新的计算架构、新材料、新结构(尤其是节省面积的3D结构)以及用于芯片堆叠和异构设计的先进封装。
AI时代的架构变化正在对逻辑和记忆产生影响。
机器学习算法在通用逻辑中广泛使用极其复杂的矩阵乘法运算,这推动了加速器及其存储器的变革。

AI计算由两个不同的内存任务组成:第一个是存储计算的中间结果;第二个是存储计算的中间结果。
第二个是存储与训练模型相关的权重。
性能和功耗对于云计算和边缘计算都很重要,内存创新可以提供帮助。
使用现有内存技术的一种方法是“近内存”,其中大量工作内存被压缩并物理放置在靠近逻辑内存的位置,通过高速接口连接。
例如,3D 堆叠和硅通孔技术正变得越来越流行。
在这些应用中,SRAM 和 DRAM 作为“工作存储器”的一个主要缺点是它们是易失性存储器,需要持续供电才能保留数据(例如重量)。
为了降低云端和边缘的功耗,设计人员正在评估高性能且非易失性的新型存储器,因为它们仅在主动读写时才需要电力。
引领新型存储器的解决方案有三种,分别是磁性RAM(MRAM)、相变RAM(PCRAM)和电阻式RAM(ReRAM)。
上述三种存储器没有使用电荷,而是使用新材料产生不同的电阻率状态,高电阻和低电阻依次代表1和0。
MRAM 利用磁场方向的变化来控制电阻率。
PCRAM 利用材料排列从非晶态到晶态的结构变化。
ReRAM 在材料中创建电流路径。
PCRAM 和 ReRAM 都提供电阻率中间级,可以在每个单元中存储多层数据位。
让我们看看AI时代的计算应用,看看它们如何驱动未来的创新。
图1.AI时代驱动的半导体创新复兴之路。
物联网边缘应用可分为低性能/低功耗应用和高性能/高功耗应用。
例如,使用人工智能算法的安全摄像头非常适合面部和语音识别等应用,但属于低性能/低功耗应用。
设计目标是处理尽可能多的边缘数据并仅将重要信息传输到云端。
由于采样频率低,所以性能要求也低。
功耗(包括待机功耗)至关重要,尤其是对于电池供电的设备。
目前,业界在边缘设备中使用 SRAM 存储器。
SRAM 并不理想,因为每个存储单元需要多达六个晶体管,并且源极泄漏功率可能很高。
在内存重量方面,SRAM的能效并不突出,尤其是在低频设计中使用时。
作为替代方案,MRAM 可确保晶体管密度增加数倍,从而实现更高的存储密度或更小的芯片尺寸。
MRAM 的另一个关键特性是它被设计为适合嵌入式片上系统产品 (SOC) 的后端互连层。
MRAM可用于存储SOC的操作系统和应用程序,无需嵌入闪存芯片,从而减少系统芯片总数和成本。
高性能“近边缘”应用,例如缺陷检测和医学筛查,需要更高的性能。
一种称为自旋轨道扭矩 MRAM (SOT-MRAM) 的 MRAM 变体已被证明在速度和功耗方面可能优于自旋转移扭矩 MRAM (STT-MRAM)。
云计算需要尽可能高的计算性能,并且在训练过程中,需要将大量数据传输到机器学习加速器附近。
相应地,机器学习加速器需要配备大型片上SRAM缓存,并辅以大型片外DRAM阵列——这需要使用持续的电源。
电力使用对于云服务提供商来说非常重要,因为人工智能时代数据将呈指数级增长,而电网电力有限且成本高昂。
PCRAM的功耗和成本低于DRAM,而性能高于固态硬盘和机械硬盘,使其成为云计算架构的首选解决方案。
除了上述“二进制”边缘应用、近边缘应用、云应用的广阔前景外,存储内计算的研究也日益深入。
可以想象在用于机器学习的存储器阵列中执行频繁的矩阵乘法运算。
设计人员正在探索伪交叉点架构,其中权重存储在各个内存节点上。
PCRAM、ReRAM 甚至铁电场效应晶体管 (FeFET) 都是绝佳的候选者,因为它们都具有每个单元多层存储的潜力。
目前,ReRAM 看起来是最适合此类应用的存储器。
可以使用欧姆定律和基尔霍夫定律在阵列内完成矩阵乘法,而无需将权重移入和移出芯片。
多级单元架构可将内存密度提升到新的水平,从而实现更大模型的设计和使用。
要将这些新型模拟存储器变为现实,需要对新材料进行全面的开发和工程设计,应用材料公司目前正在积极探索一些最具代表性的解决方案。
当摩尔定律的指数级发展速度逐渐放缓时,AI时代将迎来数据的指数级增长。
这种压力已经在推动架构、材料、3D 结构以及芯片堆叠和异构集成的先进封装方面的创新。
内存与AI计算引擎的关系越来越密切,最终,内存可能会成为AI计算引擎本身。
随着这些创新的实施,我们将看到性能、功耗和密度(面积/成本)方面的显着改进,并且随着新存储器的优化,边缘、近边缘和云应用程序的需求将最终得到满足。
我们需要硬件的彻底复兴,以释放人工智能时代的全部潜力。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-18
06-08
06-17
最新文章
英特尔收购芯片制造商eASIC,进一步减少对CPU的依赖
西门子携手现代汽车、起亚公司,共同推动交通运输行业数字化转型
行业领导者制定 Open Eye MSA 来帮助实现高速光连接应用
三星电子和 NAVER 合作
意法半导体和 Leti 合作开发 GaN-on-Si 功率转换技术
青岛将大力发展高世代TFT-LCD和Micro LED项目
长电科技参加IMAPS器件封装大会
三星正式发布Exynos 990旗舰处理器