中关村集成电路设计园正式开园
06-06
国产芯片发展面临两大机遇。
首先,核心短缺的困境下,国产化替代的呼声越来越大,这无疑为国产芯片创业者的发展提供了缓冲期。
对于2016年开始打造计算芯片业务的厚模智能创始人和首席执行官吴强来说,“在芯片发展的早期阶段,这种情况是中国独有的。
我不敢在美国开展芯片业务。
”而在人工智能高速发展的当下,对大算力的需求给了芯片创业新的机遇。
尤其是在自动驾驶领域。
传统汽车注重控制,对算力的要求很少,而L4级自动驾驶则需要T以上的算力。
不仅如此,汽车的供电和散热能力也对芯片的低功耗提出了新的要求。
虽然NVIDIA刚刚推出了计算能力高达T的DRIVE Thor计算芯片,但显然并不是所有机型都能配备这样的芯片。
对于“卡壳”并想参与这场“算力大战”的国内芯片厂商来说,显然无法依靠制程技术来实现芯片算力的提升。
在吴强看来,存储与计算一体化芯片或许是国产芯片算力反超的机会。
与传统冯·诺依曼架构芯片相比,“存储计算一体化”架构可以将计算单元和存储单元集成在一起,优化数据传输路径,提高芯片的算力上限。
在缩短系统响应时间的同时,也将能效比提升了数量级,使其更适合自动驾驶、泛机器人等边缘算力需求场景。
存储与计算一体化芯片的成本优势从何而来?目前已在哪些行业实施?国产芯片创业的机遇和差异化优势有哪些? 9月28日,在极客公园重建大会上,极客公园创始人总裁张鹏与吴强畅谈了存储与计算一体化的大算力AI芯片的发展与未来前景。
吴强做客极客公园“重建”专栏 |来源:直播截图 01 低成本大算力解决方案 张鹏:存储计算一体化到底是什么?会带来哪些变化?吴强:简单来说,存储和计算一体化是一种创新的计算芯片架构。
相比传统的计算与存储分离的冯·诺依曼架构,存储与计算一体化更好地将存储与计算结合起来,将存储与计算融为一体。
它可能接近甚至完全集成,例如存储中的计算。
这就是存储与计算一体化的基本理念。
存储与计算一体化更适合大数据量的计算,比如当下非常流行的AI计算。
它对于AI计算来说是最高效的,对于AI计算来说用途非常广泛。
很多人都误以为集存储与计算于一体的就是非常专用的AI芯片。
其实并不是因为存储和计算一体化本质上是乘法和加法运算的加速。
矩阵运算将非常高效。
矩阵运算本身就占用了数百次AI计算。
计算出百分之八十或百分之九十的成分。
基于此可以做出很多系列的指令,一些非常细微的指令甚至可以让客户定制操作符。
然后就可以制造出非常通用的人工智能芯片,类似于英伟达的芯片。
张鹏:存储与计算融合发展的关键技术点有哪些?吴强:存储与计算的融合在学术界已有十多年的历史,并且一直在发展。
近年来,学术界的一些技术取得了一定程度的突破,可以应用于算力更大的场景,比如智能驾驶或者主流的AI应用场景,才有了一些后续的商业化尝试。
首先,从产业链来看,它依赖于存储介质技术。
厚墨智能目前的产品是基于SRAM的,我们也有基于其他存储机制的下一代产品:MRAM、RRAM等。
存储技术依赖于台积电等上游厂商,他们正在做一些工艺或硬件层面的创新。
目前台积电 RRAM 的成熟度处于风险水平,全面量产大约需要两年时间。
这取决于产业链,但SRAM是一种完全成熟的存储介质,目前可以用于商业量产。
另外,存储与计算的一体化是一种新的设计方法,也是一种架构创新。
虽然学术界之前也做了很多工作,但基本上都是以学术研究的形式进行的。
距离学术化到商业化量产还有一定距离。
Houmo和其他一些初创公司更多地基于商业量产标准。
这两年我们一直在不断探索,比如怎么做量产,怎么做DFT,怎么做冗余,怎么做自我修复,这些都是我们想要解决的问题。
包括与AI芯片的集成、架构设计、编译器和算法等。
存储计算一体化架构与传统冯·诺依曼架构|来源:电子工程专题网 张鹏:存储计算一体化架构能否在成本方面带来优势?吴强:算力越大,成本就越高。
存储与计算一体化的优势之一是,如果不依赖先进的存储技术或者先进的封装技术,比如HBM的2.5D内存封装技术,也可以集成计算能力。
这样做的话,也能满足智能化的需求,这样成本就能得到控制。
例如,如果成本降低一半,也许一辆价值超过10万元的汽车就可以买得起几百TB计算能力的芯片。
所以我们的首要任务不是通过堆叠技术或者其他东西来增加算力,而是在不增加成本的情况下通过底层架构的创新来增加算力,让更实惠的汽车能够使用更智能的自动装置。
驾驶技巧。
其次,如果功耗低,散热就会很简单,而不像以前那样需要大量资金或增加系统复杂性。
从这些方面来说,我们希望为智能驾驶用户提供不一样的芯片。
张鹏:存储与计算一体化的大型芯片对芯片技术的要求是否更高?吴强:存储和计算的融合是架构上的创新,技术是二维的问题。
首先,好的技术绝对是好东西。
我们现在也会使用先进的技术,因为它是一个叠加的技术。
例如,如果没有先进的技术,有一天所有国内玩家都必须回归28纳米。
对于存储和计算一体化来说,先进技术的依赖程度实际上更低。
这是我们相对于传统设计方法的优势之一。
张鹏:感知、记忆、计算的融合是最近的一个热门话题。
你怎么认为?吴强:传感、内存和计算的融合是为了更好地将传感器和内存结合起来,进行更好的计算。
这是一个比较新的概念,近年来学术界也有很多研究。
目前,感知存储器计算在计算能力和存储容量方面都比较小,其数据处理方法和功能也比较有限。
比较适合AR、IoT等场景,但不适合算力大的场景。
我们暂时不讨论这个。
方向,但会密切关注。
02 国产替代需求催生芯片创业 张鹏:2019年决定创业是出于什么考虑?有没有新的技术突破?吴强:第一点是技术突破。
传统的存储与计算一体化是基于一些传统的存储介质,比如Nor Flash。
Nor Flash本身只适合语音等算力较小的场景。
今年以来,存储与计算一体化技术在提高计算能力方面开始取得突破,以SRAM为基础。
SRAM等存储介质更适合大计算能力。
首先,以台积电张孟凡老师为代表的学术界在整个电路设计上取得了一些突破,使得存储和计算融合在一起,具有更大的算力成为可能。
第二点是需求刚刚达到一个阶段。
无论是智能驾驶还是云,对算力的要求越来越高,行业也遇到了一些瓶颈和痛点。
我之前的工作是做CPU、GPU的,后来也做AI芯片的。
我发现很多时候算力没能提升。
并不是计算部分不好,而是带宽成为了瓶颈。
很多时候,计算都是在等待数据传输。
如果想提高计算能力,就必须优化带宽。
这是一个痛点。
我们也一直在思考如何解决数据带宽的瓶颈问题。
创业初期,创始团队中大概有两类人。
其中一批人是存储和计算领域的专家,一直致力于存储和计算,特别是大容量存储和计算技术。
另一群人和我一样,一直在做大型芯片,比如CPU、GPU、AI芯片等。
经过大家一起集思广益,觉得存储和计算的融合已经到了可以商业落地的地步,足够成熟,可以解决一些真正的痛点。
另一方面,需求方对传统芯片设计的要求越来越高,很多痛点无法解决。
存储与计算的融合或许能够解决这些问题。
2008年厚墨智能成立时,是国内第一家、也是唯一一家利用存储和计算来增加算力的公司。
如今,存储与计算的融合越来越流行,我们很高兴看到更多的公司加入到这个赛道。
张鹏:您如何评价创办一家芯片公司的可行性?吴强:我在硅谷生活多年,见证了国际芯片巨头的发展。
首先,芯片制作难度大。
中国有很多芯片初创公司。
为什么国外没有那么多芯片初创公司?首先,芯片创业需要大量高层次人才,属于人才密集型和资金密集型,落地时间也比较长。
在国外纯粹的商业环境下,创业很难。
这就是为什么自2000年以来美国很少有真正的芯片初创公司。
当然,也不乏一些大人物,比如Jim Keller(苹果A4、A5处理器和AMD Zen系列处理器的首席设计师)。
但还没有人用完。
中国有天然的优势。
我们有国产替代的需求。
国家对此高度重视,给予芯片初创企业足够的成长空间。
这个非常重要。
在芯片发展的早期阶段,这种情况是中国独有的。
我不敢在美国做芯片生意。
但中国有这样的机会,尤其是一年四季。
虽然不能保证成功,但毕竟只是给了你一个机会。
最终,你要做的产品是回归商业本质的。
因此,我们在产品差异化方面还需要做得更好。
如何做出一个即使与Nvidia相比,仍然具有一定差异化,在某些领域具有一定优势,而不仅仅是国产替代品的东西。
张鹏:芯片企业对人才的要求非常高。
贵公司目前技术人员构成是怎样的?吴强:我们与其他芯片公司不同。
毕竟,我们使用创新的架构。
我们首先需要一些有学术背景、做过集成存储和计算研究的人才。
他们需要了解集成存储和计算的电路架构。
我对它包括流程层面都非常熟悉。
这可能是其他芯片公司不需要的。
其次,我们正在做一个大芯片处理器,它也是一个用于AI的处理器。
存储和计算只是其中的一部分。
首先要考虑的是如何设计复杂的芯片并对AI算法有充分的了解。
,只有这样的人才能做出符合AI应用场景的AI芯片。
最后,除了芯片之外,还需要软件设计师。
此前有文章分析称,国内芯片企业的硬件差距并不大。
关键是编译器等软件系统差距比较大。
硅谷尤其是Intel有很多编译器相关的人才,但在中国却紧缺。
一个好的芯片需要搭配好的编译器、好的系统软件和工具链,这样客户才能感觉到芯片性能好。
许多初创公司最终因为缺乏编译器人才而未能起步。
张鹏:理想情况下,存储计算一体化架构在成本和功耗方面会带来什么程度的优势?吴强:英伟达能做T是因为它有很强的工程积累和强大的工程能力。
它采用最新的技术和最好的 HBM。
我相信它能做到。
但如果是一家初创公司,工程能力和资源不如巨头,想做这样的事情,可以通过架构创新,以更低的成本去做,比如整合存储和存储。
计算。
在成本方面,我们希望能够做到NVIDIA成本的一半,但是在功耗方面,我认为存储与计算的融合,理论上可以提升一个数量级,能效比预计在至少提高2-5倍。
厚墨智能存储计算一体化AI芯片验证片|来源:电子工程专题网 张鹏:以前存储计算一体化基本上是为了让可穿戴设备做小算力、低功耗,而厚墨智能直接做大算力,是不是很困难?吴强:难度更大。
首先,有两个难度级别。
首先,存储与计算的融合首先要解决很多问题,比如数据的准确性。
如果计算能力大,精度必须支持INT8。
另外,需要解决电路层面的容量问题,因为模型需要很大,而如何达到高精度是电路设计问题。
另一个很大的困难是,大芯片除了存储和计算之外,本身也非常复杂。
如果一个AI处理器能够处理数百TB的计算能力,那么相应的其他事情应该不会很大,比如如何设计CPU。
除了存储和计算,另外,支持向量等支持,如何使用编程内存,这些都是对大芯片的要求,包括如何配合编译器、算法、量化等。
这些与存储和计算无关,而是大芯片本身的复杂性。
对人才的要求也很高。
毕竟我国大规模芯片研发是近几年才开始的,这部分人才国内也比较缺乏。
张鹏:为什么不提高云的计算能力,而是直接做边缘计算?吴强:云的应用场景比较广泛。
如果是训练芯片,英伟达的软件生态壁垒特别厚。
这是很多国内创业同仁不得不面对的挑战。
另外,云数据中心的应用场景较多,对软件提出了相对较大的挑战。
云对功耗不太敏感。
毕竟,您还可以在数据中心使用空调等冷却设备。
低功耗当然是一个优势,但并不是像edge那样是绝对优势。
03芯片企业的竞争壁垒是软件生态 张鹏:如何理解您所倡导的软硬件解耦?吴强:这是我们设计芯片时的理念之一。
我们希望把自己定位为一家芯片公司,做有差异化、有优势的芯片。
制作自己的工具链和编译器,做好这些才能支持更多的客户。
客户可以有自己不同的算法。
我们尽可能支持各种算法。
这就是软件和硬件的解耦,应用层和芯片层完全可以解耦,集中精力把芯片和编辑器做得更好。
因此,对芯片的通用性要求比较高,这是一个挑战。
如何支持各种不同的算法和不同的用户?从我们创业的第一天起,我们就希望不仅提供算力,还希望提供更底层的接口,让客户可以定义自己的算子,这样在算法上可以有更大的空间和自由度。
各类客户都可以在上面使用我们的芯片,未来我们的芯片会有更广阔的应用场景。
这是我们一直坚持的技术方向。
张鹏:软硬件解耦会不会是商业模式上的一个很大的挑战?吴强:除了将中国制造的芯片本地化之外,我们还提供个人服务,但个人服务需要衡量。
对于之前的客户,我们可以用新的东西来帮助他们开发整个解决方案,但是对于后来的客户,我们希望把它变成一个标准化的东西。
我们可以利用我们简单易用的工具链,让客户自己去做,这样一家芯片公司才能做大,才不需要每个客户投入大量的人力。
这是我们的目标。
为此,我们必须将软件和硬件解耦。
我们一直在朝这个方向努力。
我们希望慢慢标准化整个供应链,以最小的支持支持更多的客户。
那么顾客就会越来越多。
我们还可以不断完善我们的工具链。
这就是我们一直在努力的目标。
目标。
张鹏:未来存储与计算融合还有哪些场景有机会发挥优势?吴强:存储与计算融合的特点是可以以更低的成本扩展算力。
此外,它还具有较高的能源效率和较低的功耗。
很多场景智能化要求比较高,算力要求比较大,对功耗比较敏感。
例如,许多边缘终端是电池驱动的。
这些都是可能的应用场景。
说白了,就是市场需求和产品功能相匹配。
比如无人机需要做一些避障、智能飞行、自动返航等,以及其他更高层次的智能。
我们还希望无人机结构紧凑。
大疆的无人机很多都是g以内的,最小的也是g。
电池虽小,但必须保证续航,对算力要求很高,对功耗也很敏感。
这是一个天然的矛盾。
我们有没有可能制造出一种能效极高的大型计算芯片,让即使是小型无人机也能变得非常智能?即使是大型无人机,比如美团的货运无人机,低功耗也能让电池部分承载更多的货物,而不是用来计算。
这些都是可能的应用场景。
包括目前在酒店、家庭中使用的机器人,人们对智能服务机器人的需求将会越来越多。
它们也是电池供电的。
如果想要提高计算能力,就需要考虑存储和计算的融合。
甚至还有VR设备。
作为边缘设备,它们由电池供电,需要环保意识和计算能力支持。
这也是一个可能的应用场景。
张鹏:你们的差异化竞争优势是什么?吴强:大芯片领域竞争激烈首先,有英伟达、高通等国际巨头,也有一些走在我们前面的国内初创公司。
如果我们想要生存,我们的经营策略还是不同的。
对于巨头来说,乡村包围城市多少有些想法。
首先,首先要选择合适的环节,不要触碰巨人最强的部分。
这包括产品定位,比如赛道,选云,选边缘,选乘用车,选自动驾驶,选无人机。

、机器人、安保等等,每个人都会选择自己更舒服的赛道。
同时详细字段很多,如何选择?攻克巨头相对薄弱的环节非常重要。
最好选择巨头不太重视的领域,比如无人车。
我们先切入其中,逐步形成城市周边农村的概况。
二是差异化。
NVIDIA正在推广具有T计算能力的芯片。
我们不需要比拼算力,而是要找到一些NVIDIA尚未解决或暂时无法解决的客户痛点。
例如,很多车企希望在中档车上安装大功率计算芯片,同时对功耗和散热也比较敏感。
这个需求目前NVIDIA还不能满足,但是我们可以提供服务。
寻找差异化,在局部做到极致。
这也是当年很多互联网巨头能够崛起的原因。
张鹏:如果像NVIDIA这样的巨头未来想要将存储和计算融合起来,你会如何应对?吴强:当我开始创业时,很多人问我这个问题。
首先,存储与计算的融合还比较新,特别是与大计算能力相关。
基于SRAM,我们有技术积累,让我们有先发优势。
。
对于英伟达来说,进入一个新的领域也会有其自身的障碍。
因为它之前的积累都是通过传统的方式完成的,而且很多架构的积累都是基于GPU的。
架构积累和软件积累是相反的方向。
如果转向存储和计算一体化,就需要抛弃很多旧的东西,才能进入新的领域。
侯莫没有这样的负担,因为我们是从零开始,一无所有。
英伟达进入这条赛道还需要一段时间,除非它发现存储和计算可以大规模商业化或者将其视为威胁,这将使初创公司在一段时间内获得先发优势。
如果有一天 NVIDIA 真的想进来怎么办?基于 SRAM 的存储是一个障碍吗?基于 RRAM 的存储是一个障碍吗?我的观点一直是,任何技术本身都不是障碍,它只能给你一定的先发优势。
我们在这方面拥有最长的技术积累,也是国内最早做到这一点的。
我们希望尽快将技术优势转化为产品优势,拿出好的产品。
它不可能是一个改进的模型,但在性能方面一定是最好的。
只有比别人好很多倍,最好是2-5倍,别人才会愿意尝试这个芯片。
我们希望有一个更好的芯片,解决一个真正的痛点,让别人愿意去尝试,逐步把我们自己的软件生态作为护城河。
真正的护城河不是技术本身,而是软件生态系统。
我的软件生态系统、工具链和合作伙伴是真正的护城河和真正的障碍。
有一天,当像NVIDIA这样的巨头进来时,就会有一定的障碍来阻止这个巨头。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-06
06-17
06-17
06-17
06-06
06-18
06-17
06-06
06-17
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态