双核微电子完成天使轮投资,创建东方投资
06-18
【题记】“预计到了今年,国际微电子技术水平将发展到14纳米,我们应该明确意识到核心技术我们买不来,得靠自己,但一代又一代引进新的生产能力跟不上世界先进水平,否则永远会被发达国家掐住脖子。
” ——江泽民《努力把握微电子、软件和计算机产业的技术主动权》(2019年12月10日)“如果因为外界的层层限制我什么都不做,那我当初为什么要创业呢?”国内GPU领军企业家。
该公司CEO对品万说道。
2020年10月7日,美国商务部工业与安全局(BIS)发布了厚厚一页的对华半导体出口管制措施。
其影响被描述为“将对华为的控制扩大到整个中国半导体行业”。
这种扩大的限制并非没有警告。
8月31日,英伟达披露美国政府对其实施出口管制要求,禁止其两款高性能GPU产品出口到中国。
这些紧迫的限制和封锁的一个重要目标是严重依赖GPU计算能力的人工智能的发展。
支持人工智能的深度学习系统可以存在于你的手机中,但更多时候它需要在数据中心连接在一起的机器“集群”来实现。
几十台鞋盒大小的服务器堆放在一个人高的“架子”上,一排排架子填满了仓库般的数据中心。
GPU 运行在这些盒子般的“仓库”中。
如今,Nvidia 在全球大型“仓库”中拥有最多的 GPU。
这些GPU的计算能力超出了普通人的想象,即使是最大胆的科幻作家也会感到惊讶——2007年的科幻电影《终结者3》中,几乎毁灭人类的超级计算机“天网”的计算能力为60tflops。
(即每秒6万亿次浮点计算)。
如今,NVIDIA最先进的数据中心GPU H在特定精度下的计算能力可达67 TFLOPS。
市场规模与计算能力一样快速增长。
据Verified Market Research估计,中国大陆GPU市场规模预计将超过5700万美元。
这是一个前所未有的大市场,也是最受阻碍的技术领域。
美国人近乎疯狂的限制,试图阻止中国本土企业取得任何进展。
然而,面对千载难逢的机遇,没有一个在国外巨头工作多年的中国芯片从业者愿意退缩。
“我们可以取代它” 2018年6月,与业界预期相反,AMD领先于NVIDIA发布了全球首款7纳米工艺GPU芯片,名为Radeon Vega。
该产品并非针对游戏市场,而是被定义为专为工作站和服务器的人工智能和深度学习而设计。
将人工智能带到今天的一个主要贡献者是神经网络。
神经网络本质上依赖于大量的乘法和加法:当网络中的“神经元”相互激活时,它们也会放大或减少彼此的信号,将它们乘以一定数量的权重。
这个过程实际上是在计算大量的加法和乘法。
GPU最初的设计目的是为了解决类似的工作:同时快速进行大量乘法和加法计算所有图形,从而生成游戏中的每个屏幕。
GPU的巨大机会已经从游戏转向人工智能市场,而这款首款7纳米GPU的发布也意味着在显卡行业追赶Nvidia的AMD也将战火引入了人工智能领域。
情报产业。
这一激进的战略充满了挑战。
AMD高管当时形容:“切换到7nm工艺是近几代芯片设计中最艰难的旅程,涉及到新的CAD工具的使用和多次设计变更。
7nm的晶体管连接方法相当特殊,AMD必须与半导体工厂更紧密地合作。
”然而,在当时关于这款芯片的各种讨论中,几乎没有人提到负责设计它的团队。
2009年,钱军在AMD上海负责GPU SoC核心部门,带领多人团队,流片了40多款芯片。
在众多国外芯片厂商中,AMD是最积极在华建设研发团队的一家。
到2020年,这个研发团队将达到数千人。
全球首款7纳米GPU芯片是由钱军领导的团队研发的。
六个月后,钱军辞职创业,创立了一家中国芯片公司——汉博半导体。
2008年的GPU和芯片创业领域,国产替代的概念并不像今天这样具有压迫性,也没有游资相伴。
钱军表示,他在事业蒸蒸日上时离开AMD,是因为他认为自己可以做得更好。
“制造芯片的初创公司已经不受欢迎了,投资者认为大投资的回报周期长,存在很大的不确定性。
但2007年机器学习概念的出现,把人工智能推到了风口浪尖,而且人们已经意识到计算能力和需求的差距(差距)非常大,在谷歌2018年推出TPU之后,很多初创公司都从硅谷看到了这个机会,我认为我应该做得到。
好好做吧。
”在一次分享中说道。
很快,核心团队就形成了。
知情人士称,钱军有呼必应,在AMD上海公司内部研发团队中具有很强的号召力。
“很多人愿意追随他。
“这个新组建的团队平均拥有15年的GPU开发经验,并没有立即发布符合Nvidia标准的GPU产品。
他们首先花了两年时间开发并向客户交付7nm半定制芯片。
后来,首款服务器级智能芯片SV和通用加速卡VA1已于今年第一季度量产,简单来说,这些芯片是针对AI+视频场景开发的,目前这些场景使用的主流芯片也是英伟达的GPU芯片。
在今年9月份的人工智能大会上,钱军发布了新一代产品VA10,目前已经在用户机房使用,据他介绍,VA10在一些主流应用场景的算力破纪录。
适合部署各种对实时性要求较高的云端AI应用,如实时视频增强、智能流量管理、实时语义理解等。
“这款芯片有时在客户端可以看到为%完成后,不会消耗过多的电量。
。
这太棒了。
业内其他竞品也有自己的想法。
我认为最终没有必要纸上谈兵。
你把它拿出来,让大家都跑。
你有多少件上衣或者我有多少件上衣并不重要。
只是取决于我要消耗多少电量才能达到同样的效果。
会比你更好吗? ”他说。
“如果你想知道怎么做,我们可以签署一份保密协议并进行讨论。
钱军开玩笑的说道。
与这些枯燥的数据相比,更换NVIDIA其实是更直观的实力证明。
当被问及替代NVIDIA的效果时,钱军介绍,在一些功能场景下,“汉博的75瓦卡已经可以替代其他瓦卡了”。
“现在对于任何形式的服务器结构,我都可以有相应的产品来与我的对手竞争并取代他们,所以完全是现在。
”全面更换。
”他说。
汉博也在开发一款GPU,SG。
“我们很快就会正式发布。
“有开发全球首款7纳米GPU和首款7纳米GPGPU架构AI芯片的经验,而且不是一个人的。
“一位有国企背景的投资人告诉品玩,他们看中了钱军的号召力和完善的团队。
“我相信他未来之所以能够打仗,是因为他打赢了仗。
“但即便如此,韩博的团队并不是中国GPU创业热潮中最耀眼的明星。
” width='' height='' />中国GPU创业热潮中,真正的明星在幕后闪耀。
前NVIDIA中国区负责人张建中创立的Moore Thread于今年3月发布了首款12nm GPU——速迪; AMD中国前图形研发高级总监陈伟良创立的沐希正在等待第7款纳米技术GPU产品的量产,而年底成立的天数智芯则发布了第7款纳米技术GPU产品。
-纳米GPU——去年3月的天盖。
其中,最受关注的是成立于2008年的必人,一诞生就筹集了超过47亿元的资金。
目前尚未量产产品,但今年 8 月它正式发布了一款对标 Nvidia 最精英 GPU 的产品。
:BR。
由于种种原因,国内对毕仁的关注也更多地集中在张文身上。
多家媒体讲述了这位芯片技术外行、商汤科技前总裁的故事,他利用一张名单吸引了众多技术专家,并借此获得巨额融资。
毕仁被誉为资本趋势大师。
但故事的另一面是中国高端芯片人才前所未有的整合。
中国和硅谷多位芯片从业者表示,中国GPU公司比人因其新技术尝试而备受全球芯片行业关注,这是中国企业近年来很少“享受”到的待遇。
与汉博不同的是,毕仁选择的路线是一步步发展GPU。
继8月发布BR后,毕仁于9月亮相全球最受关注的芯片行业大会HotChips。
在GPU领域,他做了继NVIDIA、AMD、Intel之后的主要技术分享。
“我发现 BR 的架构理念非常有趣。
它显然不想在上市时遵循 Nvidia 的理念。
”一位硅谷芯片行业的华人资深架构师告诉品玩。
“GPU采用多核结构,并行计算非常强大,但问题又来了。
无论有多少个核心,数据和存储都必须通过一扇门进出。
虽然核内计算很强大的时候,数据和存储都存在瓶颈,CPU太快了,内存跟不上,GPU数据传输也遇到问题,所以架构的各个方面都需要调整,比如采用什么。
一些分布式架构。
”??中国互联网投资基金管理公司。
总经理李小强表示。
我们可以将芯片设计比作固定面积土地上的城市规划:如何在有限的土地上组织街区之间的主干道和房屋之间的小路,决定了城市最终的交通效率。
根据多个芯片设计从业者的分析,Biren的公共架构设计表明它使用了大量的创新来提高这个交通网络的效率。
例如,在靠近街区的地方建造停车场,并使用一种技术可以将这些停车场连接起来并部署为一个大型停车场;例如,在其两个城市之间修建一条足够快的高速公路,使两个城市在人们看来也像同一个城市——BR使用了chiplet封装,但两个芯片可以被软件识别为运行在同一个GPU上。
当然,同时也会牺牲一些其他的性能,比如高负载下的计算精度和传输瓶颈。
并且,在实现Chiplet的过程中,对芯片厂商掌握的新技术的依赖也带来了相当大的不确定性。
不过,前述硅谷芯片业内人士认为,毕仁之所以能够将 BR 带到 HotChips34 来分享,是因为它的一些设计思路确实是近年来 GPU 行业中罕见的尝试——即使不是全新的,NVIDIA Over这些年来,垄断不仅限制了市场,也让其他公司在技术路线上不再雄心勃勃,因为试错成本很高。
据Biren内部人士透露,2016年成立之初,Biren就将自己的GPU设计的计算能力定为Nvidia当时产品的10倍。
2017年,NVIDIA正处于向Ampere架构过渡的过程中,但今年推出BR时,NVIDIA最新产品已经是Hooper架构下的H了。
但测试数据表明,BR在矩阵乘法吞吐量方面确实与H不相上下。
在GPU领域,最接近“工业标准认证”的权威评测莫过于MLPerf竞赛。
它是由业内几家重要公司发起的。
简单来说,它通过运行最主流的模型来测试各个公司产品的计算能力。
毕仁在HotChips上分享后,9月首次参加MLPerf,利用BR的“小弟”BR芯片拿下两项世界第一,即主流自然语言理解模型和图像分类模型。
从某种程度上来说,必仁科技是今年全球中国芯片从业者最关注的焦点公司:必仁科技CTO兼首席架构师周鸿在接受采访时曾形容“一家在更多领域成长起来的公司”。
从 20 世纪 90 年代开始,已经过去了 20 多年。
” (中国)建筑师基本上是站在我们这一边的。
“毕仁的节奏感很好,从推出到参加HotChips,再到MLPerf,再到目前的量产节点,都是基于整个芯片行业最专业的标准,正在达到标准。
如果量产的话年底能按计划完成,控制起来相当困难。
”上述硅谷人士表示,“天天背着包到处见客户”,在芯片设计上取得了突破。
接下来的问题是芯片制造工艺,有分析人士指出,美国商务部的最新限制实际上是“推定拒绝”原则,“计算速度达到TOPS(每秒1万亿次传输)”。
传输容量达到GB/s(每秒1G)。
位传输速率)高性能计算芯片将受到严格限制。
据毕仁在HotChips的PPT介绍,核心之间的传输速度达到了GB/s。
一方面,台积电等芯片厂商对美国的长臂新规心存警惕,另一方面,他们也迫切需要更多多样化的芯片设计客户,以减少对英伟达等大客户的依赖,这还有很多工作要做。
在美国商务部的限制出台后,有消息称台积电将暂停流片。
知情人士透露,毕仁确实已经开始主动对超限标准的相关芯片进行调整,寻找能够继续按计划产片的解决方案。
当被问及目前的影响时,另外两家国内主要GPU初创公司透露,目前尚未受到直接影响,但他们也在从订单和客户的角度研究和调整订单量和库存计划。
一家依赖台积电7纳米工艺量产的芯片公司高管回应道:“现在芯片上出现问题的可能性确实比较大,但可以肯定地说,我们或我们的同行都不希望出现这样的情况。
”让步。
” “我们这些人,其实心里还是挺自豪的,我们要完成这个,见证中国芯片的高光时刻。
”该芯片公司高管表示。
困难虽大,但办法还是有的。
在当今国内芯片创业热潮中,最大的特点之一就是这些核心人才普遍拥有真正的流片和市场占领经验。
他们更知道根据真实的市场需求向制造商施压有多么重要。
也有着丰富的经验。
“快手有3.5亿平台,每天上万条视频的大数据,我不缺数据,还有做算法的人,我只做热门视频,热门视频需要分层、分优先级为什么?我的计算能力不够。
快手视频算法团队的技术负责人表示:“我们测试了瀚博VA1卡。
作为算法开发者,说实话,无论是算法效果、加速、功耗,都比通用GPU要好。
”这种来自终端用户的认可是最关键的。
“我自己肯定会说“我的产品好,但如果我们的客户说我们的产品好,那么我们的产品就应该真的好。
”钱军说。
这些芯片初创公司的进步有时超出了外界对他们形成印象的速度。
虽然很多人仍然用PPT公司来形容他们,但这些公司已经建立了完整的企业体系,他们的产品实际上已经进入了一些重要的客户机房,这些真实的需求让制造商真正感受到他们所下的订单是可持续的。
”互联网客户的引进非常严格。
在快手的机房里,7天24小时都在高密度运行。
如果没有散热,你就无法承受这个温度。
所以如果你按照这个强度跑,你的芯片,如果你的芯片或者软件出现问题,稳定性不好的话,其实是很难做到的,所以进入互联网数据中心是一条很大的护城河。
如果你能进入互联网,那么无论你是什么。
这种卡表明,从性能、视频质量甚至迁移成本,一切都是全面胜利。
”事实上,这些初创公司从第一天起就花费了巨大的努力来拓展客户,走的是应用程序驱动的路线。
。
据品万了解,汉博的组织架构分为IP部(自研及第三方IP维护)、DV部(负责各种IP验证等工作)、SOC部(从前端到芯片的全流程实现)到后端)、PVP部门(用市场需求引导产品)、软件部门和解决方案部门(验证各种算法和云端部署需求)等。
其中,随着更多产品线的出现,汉博的IP部门开始使用中台的概念。
许多可互操作的核心技术IP是统一开发的,内部需求要求这些技术IP同时工作在GPU和AI产品中。
这种架构足够灵活,体现了以市场需求为导向研发的思想。
比人的组织架构也是围绕产品的市场需求而设计的。
“直接接触用户和市场需求的部门地位非常高,甚至是大多数业务项目的起点。
”一位资深员工说道。
就像在芯片设计过程中对性能进行对标的NVIDIA一样,在拓展市场时,他们的对手仍然是美国巨头。

被美国禁止向中国销售的英伟达高端GPU英伟达A 来源:英伟达某大厂芯片对接负责人对国内初创公司的努力印象深刻。
“NVIDIA其实不太关心我们,讨论需求需要很长时间,因为我们带来的本来就是增量的,他们从来没有和我们合作这么紧密过。
” “到了和国内这家公司对接的时候,他们的人就来到我们办公室,早上讨论了一下大概的要求,然后我们就去上班了。
他们的人留在了会议室,开始修修补补。
”当天晚上晚些时候,他们实际上运行了该模型。
多家芯片公司的管理层形容他们公司的销售是“每天背着包到客户的机房去适应,非常辛苦”。
“关键是要有突破,有了突破,就会有好的客户愿意和你交流。
”钱军说。
“我们有一些场景,世界上没有其他芯片可以支持。
如果他想做这个,他只能来找我,这是一个敲门砖,剩下的就是如何让你的软件更好用。
”努力和市场份额的变化正在向上传导到制造端。
“之前芯片法案出来后我们也在评估,但实际上近年来我们也遇到了同样的挑战。
”一家采用台积电7纳米工艺代工的公司员工表示。
据瑞银证券报道,台积电的7纳米工艺将于明年推出。
半年产能利用率“大概只有70%”。
“芯片是一个非常需要收入来支撑发展的行业。
”上述CEO表示,“所以台积电的态度在不断变化,主要客户都在削减订单、腾出产能,从我们的接触中可以看出他们也很着急。
”粉碎对“投降主义”的批判和人才爆炸带来的巨大机遇,受到了前所未有的关注。
而且他们并不都是出于好意。
越来越多的国内厂商举办的发布会上,展示的PPT中少不了与“主流产品”的对比。
即使没有标注,大家都知道“主流厂商”指的是NVIDIA。
但在很多围观者看来,在喊出挑战英伟达的那一刻,国产厂商就犯了原罪。
因此,在国内GPU行业最需要各种鼓舞人心的进步的同时,中国初创厂商如何表达自己的成果却成了一个大问题。
经常出现的批评之一是直击人心的批评——你不配被称为 GPU。
“如果你关注GPU相关的讨论,你会发现很多爱好者总是喜欢争论一个产品是不是GPU,他们并不关心计算需求本身。
”上述首席执行官说道。
“他们比任何地方的从业者都更喜欢讨论一个架构是否是GPU架构,并以此来定义一个产品是否足够先进。
”这些看似架构和技术的讨论背后,是英伟达塑造的叙事和行业现状。
他们看不起国内替代芯片厂商的研究和产品的一个重要原因就是GPU所代表的“通用性”——英伟达可以适应大多数机型,是真正的通用性。
但事实上,这些人所标榜的NVIDIA“生态系统”是一个前所未有的封闭系统。
NVIDIA之所以最全能,其实不仅仅是其不断更新的GPU架构带来的帮助,还有对CUDA的适配。
CUDA 代表计算统一设备架构,是 NVIDIA 提供的软件平台。
它于2011年推出,据报道,该软件平台早期需要NVIDIA每年投资5亿美元。
当时,NVIDIA的营收仅为30亿美元。
迄今为止,CUDA的总投资已超过1亿美元。
如今它已成为所有GPU软件开发和适配的“垄断”平台,开发者数量持续翻倍,达到数百万。
“NVIDIA自己定义了一套东西,它不开源,它不会告诉你里面的任何东西,它基本上是一种垄断,如果它做得好,别人就玩不了。
”钱军说道。
“你必须猜测,如果你猜测错误,你的性能就会下降很多,所以你必须要做CUDA适配。
事实上,理论上是不可能的,而且是完全闭环的。
” “很多算法甚至不是一开始就开发出来的,开发时也是在CUDA中完成的,这是一个巨大的优势。
”一位算法工程师表示。
当GPU进入更快的迭代阶段,架构受到挑战后,NVIDIA甚至可以根据自己新的架构特点,通过修改CUDA库来协同实现性能提升。
“就像路和??车一样,她可以把路改得更适合车,但你只能改车,努力改车后,你发现路又变了。
” “其实我们团队的人还比较多,我是一名软件开发人员,但加班加点,几年才适应了一些主要的模型,这和CUDA提供的库是没法比的。
”比人员工说道。
换句话说,用英伟达投入巨资获得的封闭通用性来衡量这些新公司是否“通用”,本身就是一个一厢情愿的比较标准。
不过,与那些渴望国内厂商尽快“投降”的人不同,越来越多真正扎根行业的中国企业家已经开始战略性地走出这个阴影。
一方面,他们知道必须从现阶段NVIDIA建立的体系中找到突破口:“作为一家想要进入这个场景的公司,我当然不能说我自己制定规则。
如果那样的话这样的话,你连卡都插不进当前客户的服务器,他们怎么跟你做,你又怎么证明你比它强呢?”钱军说道。
“其实现在所谓的框架并没有大的颠覆,更多的是融合和微创新。
” Pinwan是一家使用GPU进行图像生成业务的初创公司,他们表示,在Nvidia最新的Hopper架构中,添加了一个新的引擎来计算光与物体之间的关系,他们在开发底层框架时也采用了类似的技术思路。
他认为事实证明这样的迭代已经可以实现。
不同之处在于如何定义这个小发动机的重要性。
另一方面,这些年轻的公司已经开始摆脱对NVIDIA的迷信——通用性很重要,但他们必须知道什么技术路线对他们来说真正重要,而不是落入NVIDIA的议程。
“GPU的图形管线对我们来说只是计算机处理的一个维度,”钱军说。
“整个GPU渲染产品线和核心研发其实都在我们的计划之中,只是我们从来没有过多宣传过。
”他表示,Vastai发布的Vastai统一计算架构软件平台的目的是让未来更多的硬件加速核心能够集成到这个框架中。
“因此,未来不要感到惊讶,我们将在像我们这样的产品线中添加其他加速核心。
”在那些粉丝眼里,英伟达是无敌的,而在真正日夜进行国产换人练习的人眼里,也不是无敌的。
“相信我,软件工程师再优秀,他也会犯错误,软件团队再优秀,他也会犯错误。
所以这个地方一定是一个不断构建生态的循序渐进的过程。
” ”。
这些策略也在一点一点地添加。
市场份额证明有更多的国产芯片进入各公司的数据中心,这也粉碎了更多的谣言。
“没有哪个客户在选择芯片产品时会首先讨论是否值得称为GPU”,一位Biren员工表示。
决定订单的最重要因素是TCO(总拥有成本)——一款新产品是否可以帮助客户节省数亿,可以节省多少工程师及其投资时间,这些都是可以计算的。
不少国内GPU厂商的高管和负责人也表达了同样的观点:未来中国GPU厂商建立的生态系统一定是一个开放的生态系统。
“我希望这个规则能够公平、公开,然后让更多的人参与竞争。
国内公司需要有领先的公司来做这件事。
”" width='' height='' />Nvidia将于明年成立30年。
2008 年,黄仁勋、Chris Malakovsky 和 ??Katis Puri 刚刚创办了一家游戏显卡公司,当时没有人想到它会成为今天的 Nvidia。
“当时我们没有任何市场机会,但我们看到一波浪潮即将到来。
”马拉科夫斯基回忆说,“加州海滩上有一场冲浪比赛,只有五个月的窗口期。
当日本海边出现某种波浪时,他们告诉所有冲浪者都来加州,因为波浪会在两小时内来到这里。
” “这就是我们今天的处境。
”浪潮即将来临,而且很可能比黄仁勋等人在加州海滩等待的更加明显和汹涌。
这一次,中国企业家有机会了。
像靠近大海一样。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-17
06-18
06-18
06-18
06-17
06-18
06-18
最新文章
首先告诉我什么是智能汽车!
盲盒明星卡的暴利与泡沫:2元卡卖700万,直播卖卡月入百万
黑色星期五轰轰烈烈地回来了,结果这些中国企业扛起了全场
锂电池隔膜疯狂扩产:兴源材料欲夺回C位?
当我考上缅语专业时:凌晨三点我还在走廊里背单词,毕业后,我不仅仅是一名翻译者
被遗弃,被收获?老年人上网到底有多难?
海外日报 -今年,我国自主研发游戏海外实际销售收入实现两位数增长;三星电子正式成立机器人业务团队36氪海外·15分钟前
腾讯音乐:爱、相信、坚持