赋能行业发展,NLP如何避免走进“死胡同”?
06-18
“不可能超越NVIDIA”。
资深芯片投资人思杰斩钉截铁地说,“即使AMD拥有比NVIDIA参数更强的芯片,也无法撼动NVIDIA在AI市场的地位。
”这几乎是AI芯片从业者的共识。
无论是芯巨头还是拥有技术专家的美英初创公司,如果想坐上NVIDIA主导的加速计算桌上,与NVIDIA对抗的机会微乎其微。
然而,如果商业竞争受到非商业力量的影响,则可能会出现例外情况。
10月17日,美国商务部工业与安全局(BIS)更新了针对中国的AI芯片出口管制规定,给了国内高性能AI芯片企业追赶英伟达的机会。
“美国最新的出口管制规定发布后,很多客户都来联系我,包括那些之前表现冷漠的客户。
”一家AI芯片公司的销售人员安瑞明显感觉到,“当英伟达GPU无法购买时,客户考虑的不是谁能更好地使用它。
”禁令的进一步收紧,对国产高性能AI芯片企业造成了打击,也制约了英伟达在中国市场的发展“我们必须放弃一切幻想,打造国产替代品”,这是AI界经常听到的一句话。
美国最新禁令后的芯片圈,芯片领域的国产替代是一条极其艰难的道路,但当这条路必须走的时候,国产AI芯片从业者正在思考追赶英伟达的路径是什么。
你的想法是什么?有人认为走完全不同的道路就有超越的机会,也有人认为可以利用英伟达的魔力来超越,虽然他们各有各的看法。
都非常清楚,要想生存,就必须提高成本、改进软件、解决生产问题 01 放弃一切幻想,国产芯片是唯一的解决办法。
10月17日美国出口管制新规一出,原本就火爆的Nvidia HGPU就坐上了过山车。
在禁令更新之前,一机难求的8卡HGPU服务器的价格已经在万元左右。
美国禁令发布当天,价格立即跳涨至万元。
一周后,美国突然宣布11月份才生效的管制规定立即生效,瞬间将HGPU服务器的价格推向顶峰,跃升至万元。
与禁令升级前的1万元相比,涨幅高达67%。
虽然现在价格略有下降,但仍处于万元高位。
“10月底、11月底,客户基本都是忙着抢货,拿不到货后,大家才来认真谈国产芯片。
””熟悉芯片市场的于晨也看到了,“美国的禁令只是一拳而已。
没有人能够容忍美国日夜改变命令。
AI芯片企业要认真考虑下一代产品的走向,也要考虑国内代工厂的可能性。
性别。
》雷锋网获悉,10月17日禁令升级后,不少AI芯片企业不得不改变芯片设计,以符合美国新规要求。
此次禁令进一步收紧,影响范围为“2016年美国芯片禁令引起轩然大波时,我已经进入了AI芯片行业,当时我并不觉得AI芯片对我们来说是生死攸关的事情。
芯片软件工程师浩鑫此时感慨,“如果我们没有强大的AI芯片,我们就会被别人勒死,这关系到民族的命运。
” ”在芯片行业摸爬滚打十几年的紫雷也深有感触。
“从美国的限制也可以看出,美国政府已经预言AI代表了真正的生产力,而这就是军事家的战场。
“我不知道最后谁会赢,但我知道,如果我们输了,那就惨了。
我们不仅会失去技术上的领先地位,而且还可能被人工智能取代。
” 紫雷十分坚决,“无论是为了我们自己,还是为了下一代,我们都要站起来滚。
”美国、英国的企业也与国内AI芯片企业一样受到了头部打击。
英国初创公司Graphcore是少数拥有成熟国内团队的AI芯片公司之一。
禁令发布后,由于其芯片的特性,其修改了设计。
这将使其产品在中国市场失去竞争力,Graphcore员工的工作几乎陷入停顿。
最终,NVIDIA不得不解散中国队。
NVIDIA也受到了禁令的限制。
中国市场每年为英伟达数据中心业务贡献数百亿美元。
美元收入无法向中国市场出售利润可观的高性能芯片。
短期内,这对英伟达来说将是收入损失。
长期来看,在中国市场将会失控。
这就是为什么英伟达一直在积极推出符合美国监管限制的芯片。
“H20的性能大约是H的1/5,但价格不会太便宜。
因为占用了H的产能,价格可能是H的1/2或2/3。
这样的产品没有吸引力“对于客户来说,国内企业在采购此类产品时很难与美国企业竞争。
”雨辰还表示,“原定今年年底送测的H20现在将推迟到年底。
”明年上半年,这对于国产芯片来说是一个机会,“最强大的对手也受到了限制,AI是一个不能落后的行业。
国内人工智能企业别无选择。
他们必须放弃一切幻想,开始制造国产芯片。
02 禁令对所有人都不好,除了华为。
正如中国的AI芯片公司最有机会赶上英伟达一样,华为也是此次禁令下的例外。
华为自今年年初以来就受到美国的限制。
自此,华为开始本土化。
其比本次受影响的国内AI芯片企业提前四年开始国产替代,使其升腾AI芯片成为本次最热门的一款。
要购买的物体。
科大讯飞在三季度业绩发布会上公开表示,华为Ascend B已经基本达到了英伟达A的对标,“这说明华为在一些地方做得确实不错”。
芯片算法工程师易森直言,“对于采用DSA(特定域)架构的华为来说,芯片的标准化是个问题。
” DSA 可以看作是针对某一类模型专门设计的芯片,“其泛化性是局部体现的。
如果专门为某类模型设计的 DSA 芯片对于该类模型的泛化性不够,那么意味着:软件工作没有做好。
”伊森想。
这涉及到软件成熟度和生态问题,这也是英伟达的护城河所在。
对于华为能否基于自研架构构建像英伟达一样强大的软件生态系统,浩鑫和雨辰有着不同的看法。
“2016年Caffe还是主流AI框架时,Intel花费了大量精力制作了Caffe的OpenCL版本,目的是让更多开发者使用它来抢占AI市场。
”浩鑫表示,“但由于只有英特尔维护了这套东西,最终并没有动摇英伟达的地位,所以即使华为花费大量的人力和资源来适配算法和应用程序,也很难建立一个强大的生态系统。
”雨辰认为,升腾至少可以主导国内政治。
企业市场的成功。
“考虑到国家和政企市场的特殊情况,必须考虑国产替代,华为至少可以在这个市场投入巨资,让其Ascend芯片上市。
”雨辰还表示,“至于能否应用于商业市场,成功与否,目前还很难判断。
”考虑到芯片设计和公司资源等因素,华为是目前AI训练市场机会最多的中国公司,对AI芯片领域非常熟悉的云硕做出了乐观的预测,“国内。
未来的AI训练市场属于华为,非中国市场属于英伟达。
”但有一个前提:华为必须成功解决芯片制造问题。
按照思杰的乐观估计,国内最早扩产14nm芯片生产线要到今年之后才能上,国内14nm还没有成熟,而且涉及到半导体材料和设备的出口管制,需要时间。
“良率也非常关键,直接影响最终成本。
这是商业市场竞争的基础。
”思杰的态度很明确,“不过,国产半导体材料和设备企业每年都能给我带来一些惊喜,所以虽然短期内比较悲观,但长期来看我还是持乐观态度的。
”华为的成绩给了那些想通过创新追赶Nvidia的人和公司信心。
03 NVIDIA没有魔法,利用架构创新来追赶“ChatGPT的GPU利用率只有个位数,这是对计算的巨大浪费。
”云硕指出,“存储与计算的比例不合理,不利于生成式AI的普及。
”十年未变的计算机系统结构亟待改变,这也是一个机会。
追赶Nvidia。
“大型模型对计算能力的需求呈指数级增长,但GPU价格昂贵且功耗高,而且GPU集群的线性度也随着规模的增加而下降。
探索非冯·诺依曼架构已经变得非常流行。
”一森已经这样表示。
存储与计算一体化是解决AI计算存储与计算比例不合理的一个想法。
国内领先的互联网公司之一是积极引入存储计算一体化,解决算力成本问题 “存储计算一体化架构适合大模型计算,因为存储计算一体化架构计算密度低,存储密度高。
”存储和计算一体化架构在大模型时代的优势但这只是一个理论。
“存速的大规模实施将要解决很多制造问题。
”易森也看到了存储所面临的挑战。
而计算融合作为一种特殊的DSA,也会像华为升腾一样面临标准化和生态的挑战。
人工智能训练必须需要一个具有强大泛化能力的系统,但对于泛化到什么程度存在一些争论。
浩鑫坚持认为一定是NVIDIA GPGPU的生态系统,而一森则认为只要足够标准化就足够了。
很多人都和一森有类似的看法,于是通用性和高性能兼具、超越Nvidia的CPU+DSA的想法就诞生了。
“Pytorch 原生支持 x86 CPU。
Intel 最有机会通过 CPU+DSA 路径赶上 NVIDIA。
我不知道为什么 Intel 没有这样做。
”云朔有些疑惑。
子磊也认为x86 CPU有很好的机会,“一般来说,模型调试阶段都会使用CPU,CPU上的精度作为GPU上运行的精度要求。
x86 CPU的生态非常好,结合加速器有很好的加速机会,而且Intel确实推出过产品,但之前可能没有押注过大型机型。
“除了x86之外,CPU还包括Arm和RISC-V。
RISC-V CPU是国内企业探索CPU+DSA路径的最佳选择。
由于RISC-V的开源特性,可以更积极地应对以满足市场需求。
”看来RISC-V的CPU核心实际上是一个AI核心,一些公司已经开始探索使用RISC-V。
紫雷观察道。
即使CPU+DSA路径能够兼顾通用性和高性能,但NVIDIA最难超越的还是CUDA生态系统。
对于想走这条路的企业来说,这是最难解决的问题。
紫雷对此并不悲观。
“NVIDIA 没有任何魔法。
CUDA生态系统也是从NVIDIA在各个项目和模型适配的实际经验中积累起来的。
硬件每两年迭代一次,可复用的经验有限。
软件的体验有限。
可以不断积累。
如果我们决定必须在中国创建一个非GPU生态系统,我相信从长远来看我们可以做到。
” 相比之下,浩鑫则有些悲观,“NVIDIA的CUDA生态系统已经发展了十多年,而且是根据全球客户的需求一点一滴构建起来的生态系统。
即使有中国客户的需求、决心和耐心,也很难建立一个与NVIDIA的CUDA生态系统相媲美的生态系统。
“浩鑫并不完全悲观”,国内企业也可以联合起来打造一个相对开放的类似CUDA的生态系统。
”雷锋网获悉,有人试图拉拢国内走DSA路线的企业共同打造一个生态系统。
残酷的现实是,一些走DSA路线的企业已经因为迁移困难而失业。
开始思考如何兼容NVIDIA的CUDA生态,详情请加笔者微信BENSONEIT交流。
04 用NVIDIA的“魔法”追赶NVIDIA?有一种观点认为,沿着NVIDIA路线不可能超越NVIDIA,当然这种观点大部分来自于走DSA路线的人“如果连追都赶不上,那还谈什么超越呢?”坚持认为,“我不认为兼容 CUDA 就无法超越 NVIDIA。
”丝毫没有懈怠。
这是一个很难挑战的对手。

不过,自从NVIDIA在2016年发布了Volta架构GPU并增加了专用加速核心Tensor Core之后,每一代NVIDIA GPU的性能提升主要来自于专用计算单元。
“NVIDIA计算能力的增长也在放缓。
解决方案不是使用通用计算单元,而是使用专用计算单元。
”浩鑫发现,“即使是NVIDIA,开发者也很难使用其专用计算单元。
”加速单元方面,NVIDIA还推出了专门的加速库。
“按照这个思路,NVIDIA的CUDA生态可以看成是两部分,一是基于通用计算单元CUDA Core的生态,二是以Tensor Core为代表的专用加速生态。
”当我们兼容CUDA时,我们只能兼容CUDA Core部分,Tensor Core生态不需要兼容。
”浩鑫解释道,“兼容NVIDIA CUDA Core生态可以降低客户迁移的难度。
专用加速计算单元是为了赶超Opportunity。
”关于这个观点的讨论,可以在微信BENSONEIT添加作者。
这个想法和用DSA超越的想法类似,都是从专用加速方面,设计了比NVIDIA专用加速单元更好的架构。
“GPU也是特定时期设计的产品,它肯定有它的局限性。
”雨辰也认为CUDA兼容性有机会。
超越NVIDIA,但他从成本效益的角度推理“AI推理需求可能是训练需求的3-5倍。
通过CUDA兼容,可以对常用的大型模型进行推理优化,达到比NVIDIA高几倍性价比的推理性能。
”雨辰说,“在商业竞争中,同等条件下,对比的是性价比。
,而CUDA兼容性是一个非常重要的条件。
“国内企业一旦使用国产GPU,就很难再转回来了。
”浩鑫的想法是,“兼容CUDA是为了让用户迁移更容易”。
”,这也说明了一个问题,国产AI芯片公司是否兼容CUDA生态系统帮助NVIDIA构建生态系统?这就像WPS兼容如果不兼容Word,就没人会用,但WPS兼容Word的初衷并不是为了帮助Word构建一个生态系统,即使有这样的效果,这个贡献也微不足道。
“如果1%的CUDA兼容性做得不好,就会出现无法修复的漏洞。
而且CUDA的兼容性永远都会比NVIDIA慢很多,处于被动地位。
”伊森表示,CUDA兼容性问题不容忽视。
“国家是独立可控的。
CUDA兼容性是否自主可控? “看来通用+专用AI计算架构已经成为业界共识,并且各自在互相渗透、互相影响,很难判断哪条路更好。
无论哪条路,我们都必须面对一个共同的问题——NVIDIA问题是,比所有国内AI芯片公司都多的资源,以及全球领先的人才,什么情况下才有机会追赶和超越? 05 与其像英伟达那样卖整机,不如寻找创新商业模式的机会。
理论上优秀并不意味着最终会成功。
历史已经无数次证明,商业和竞争影响着成败。
”云硕解释道,“几乎所有国内的AI芯片公司都在向英伟达学习。
做整机。
这确实是大学和政企客户所需要的,芯片公司也能获得高额收入。
NVIDIA可以通过做整机获得更高的利润,但我们不应该这样做。
“Intel之所以能在IBM主导的大型机时代取得成功,是因为Intel只做了最难的CPU,横向整合,与微软、戴尔、甲骨文等公司一起抢占了IBM的市场。
Arm更胜一筹,只做了核心。
”芯片IP与谷歌Android、不同芯片公司和OEM一起,成为手机时代的领导者。
“Nvidia的GPU不仅单独出售,它必须与主板和8张GPU卡一起出售。
或者直接出售完整的 DGX 机器。
DGX的高毛利意味着整机中的机箱、风扇等也有巨大的毛利,帮助英伟达提升整体毛利。
”云硕认为,“这对于国内AI芯片企业来说是一个机会。
国内芯片企业如果能重点打磨芯片性能和SDK,联合上下游产业链做产品,从商业角度寻找超越Nvidia的机会。
” “光靠卖芯片可能连自己都养活不了。
而要做一款能够适应各种系统的芯片,对芯片团队的要求就特别高。
紫雷这样看待Arm的成功,“Arm的成功并不是因为他们做了IP,关键是在智能手机时代,经过操作系统的激烈竞争,最终成功的Android和iOS都选择了Arm芯片。
”系统和芯片深度适配,很难改变,这帮助Arm取得了成功,“NVIDIA在AI领域是Arm+Android。
我觉得这个想法不可能成功。
” “雨辰是这么认为的。
伊森的态度更加开放。
虽然带来颠覆的不一定是Intel、Arm,但商业模式创新一定是超越的理念。
就像商业模式创新是否是一条超越NVIDIA的路径的讨论一样,禁令之后,国内AI芯片从业者更加意识到自己所从事的行业和工作的重要价值,更加看好国产高性能AI芯片公司。
这种乐观还包括对生成式人工智能发展的算力需求的乐观。
在这样的背景下,大家都受到限制,想出超越英伟达的策略就很重要了。
更现实的问题是减少软件、降低成本、解决制造问题。
当然,所有AI芯片公司都需要先生存下来,然后再谈追赶和超越。
国产高性能AI芯片一直是讨论的焦点。
有关此主题的更多交流,请添加作者微信BENSONEIT。
注:文中思杰、安瑞、雨辰、浩鑫、紫雷、一森、云硕均为化名【本文经投资界合作伙伴微信公众号授权:雷锋网。
本平台仅提供信息存储服务。
】如有任何疑问,请联系投资界()。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-18
06-17
06-18
06-18
06-17
06-17
06-17
最新文章
三只松鼠:门店扩张已全面暂停
Nvidia 已准备好“统治”AI
【创业24小时】2023年11月16日
【创业24小时】2022年10月20日
倒计时一天,浙江这座小镇要火了!
沃图网络获数千万A轮投资,加大投入海外网红营销SaaS平台建设
泰山天使基金部分退出拉手半年回报180倍
西格数据完成1000万元A+轮融资,国发创投领投