英飞凌科技选择 LTIMindtree
06-06
作者|欣欣编辑|晶宇 制约AI人工智能发展的最大制约因素是什么?就在几年前,答案可能有所不同。
但现在大型模型盛行,这个问题只有一个答案——计算能力不够! 或者换句话说,英伟达的专用AI计算芯片还不够。
谁控制了英伟达的人工智能芯片,谁就控制了人工智能的未来。
现在,有这样一家公司,手里有数万张英伟达的AI“计算卡”,其客户包括OpenAI、微软等众多AI巨头。
作为“AI算力黄牛”,这家名为CoreWeave的公司在4年内对公司估值达到80亿美元。

除了获得 NVIDIA 的独家投资外,CoreWeave 还以其 NVIDIA 芯片为抵押,获得 Blackstone、Coatue 等顶级机构的 23 亿美元债务融资。
没有什么可以阻止CoreWeave的疯狂扩张。
它是如何管理英伟达,从一家加密货币“挖矿”公司转型为AI“计算基础设施”巨头的? 从“矿卡”到“算牌” CoreWeave 的创始团队由三人组成,分别是 Michael Intrator、Brian Venturo 和 Brannin McBee。
三人最初在金融领域工作,经营对冲基金和家族办公室。
当他们还在纽约管理基金时,加密货币挖矿热潮仍然强劲。
最初只是为了赚取额外收入,他们购买了第一个 GPU,然后购买越来越多,让华尔街的办公桌上摆满了 GPU。
“我们在 2016 年购买了第一个 GPU,将其插上电源,放在曼哈顿下城办公室的台球桌上,俯瞰东河,并开采了以太坊网络上的第一个区块。
” CoreWeave 首席执行官 Michael Intrator 在 2018 年的一篇博客文章中回忆了这一点。
很快,他们正式将副业变成了一家公司,名字最初与加密货币有关,后来改为CoreWeave。
当他们选择告别华尔街时,就像硅谷大亨喜欢在自家车库创业一样,他们把GPU硬件搬进了车库。
不过,这个车库并不在西海岸的硅谷,而是在东海岸的新泽西郊区。
它属于创始人之一。
男人的祖父。
CoreWeave 的三位联合创始人 Michael Intrator(左)、Brian Venturo(中)和 Brannin McBee(右)| CoreWeave 在过去的十年里,GPU 一直是加密货币和人工智能技术蓬勃发展的重要引擎。
年底,CoreWeave 成为北美最大的以太坊矿工之一,拥有超过 50,000 个 GPU,占以太坊网络的 1% 以上。
这期间,几人也开始了解其他公司对GPU资源的渴求。
他们还意识到,加密货币领域不存在持久的竞争优势,因为市场竞争激烈,而且受电价影响很大。
当加密货币价格在 2016 年和 2017 年暴跌时,他们决定多元化进入其他更稳定但也需要大量 GPU 计算的领域。
他们专注于人工智能、媒体娱乐和生命科学三大领域,自2016年以来,他们重点采购企业级GPU芯片组、构建专门的云基础设施,并围绕英伟达的芯片调整业务。
随着新业务步入正轨,以太坊挖矿业务逐渐被边缘化。
事实证明,转型的决定是正确的、幸运的。
创始人们都没有预料到人工智能浪潮即将到来,这让CoreWeave从一个小型办公室逐渐扩展到全国各地的数据中心,以应对不断扩大的人工智能市场需求。
据一位创始人介绍,CoreWeave 2018年营收约为3000万美元,预计2018年将突破5亿美元,增长10倍以上,已签订合同近20亿美元。
今年,它宣布在德克萨斯州投资 16 亿美元建设数据中心,并计划在年底前将数据中心扩展到 14 个。
AI“电网” CoreWeave成立仅几年后,用于AI的GPU已成为世界上最有价值的资产之一。
正如埃隆·马斯克(Elon Musk)和其他人开玩笑的那样,现在购买 GPU 比买药还难。
随着生成式 AI 市场火热,对 GPU 的需求急剧增加,而 CoreWeave 完全有能力为 AI 公司提供所需的资源。
CoreWeave作为云服务提供商,提供高性能计算资源租赁服务,主要面向需要大量算力的客户。
该模型是基础设施即服务,按小时租用 GPU。
客户只需根据使用时间和计算资源量付费。
从成本上来说,大客户也有定制设施。
标语是“比传统云提供商快 35 倍、成本降低 80%、延迟降低 50%”。
该公司专注于高性能计算服务,不像一般云服务提供商还提供存储、网络等服务。
去年,CoreWeave 高管在 Nvidia 最新芯片刚推出时就购买了大量芯片,包括 Stable Diffusion 和 Midjourney。
后来当ChatGPT发布时,他们意识到这样的投入是远远不够的。
这些人不仅需要数千个 GPU,而且需要数百万个。
他们将 CoreWeave 想要做的事情描述为“为 AI 市场构建一个电力网络”,并认为“如果不构建这些东西,那么 AI 将无法扩展”。
CoreWeave 正在德克萨斯州建设一个新的数据中心 | CoreWeave 首席战略官 Brannin McBee 在播客中表示,去年年底,包括亚马逊、谷歌、微软和甲骨文在内的所有超大规模计算公司都加入了 CoreWeave。
进去之后,他们总共提供了大约50万个GPU,到今年年底,可能会接近1万个。
从行业增速和利润率来看,他认为AI市场的需求可以分解为两个阶段:训练模型和执行推理任务。
目前训练阶段芯片供应不足,而推理阶段将是未来需求的主要增长点。
这才是真正的需求所在。
对于AI公司的模型来说,退出训练阶段后,产品上市前两年的商业化阶段的推理执行至少需要100万块GPU,但全球的AI基础设施不足以满足这一需求。
这将是一个长期挑战,至少还需要两年时间GPU供应短缺才可能开始缓解。
如今,投资AI领域的热钱大部分都得用在云计算上。
6 月,CNBC 报道称,微软“已同意在未来几年内花费数十亿美元用于初创公司 CoreWeave 的云计算基础设施”。
Inflection AI 等明星 AI 初创公司最近筹集了 13 亿美元资金用于构建大规模 GPU 集群,也选择了 CoreWeave。
今年4月,CoreWeave完成了2.21亿美元的B轮融资,投资方包括芯片制造商Nvidia、GitHub前CEO Nat Friedman和苹果前高管Daniel Gross。
一个月后,该公司宣布追加投资 2 亿美元,使融资总额达到 4.21 亿美元。
8 月,CoreWeave 通过使用备受追捧的 Nvidia H 作为抵押品,又获得了 23 亿美元的债务融资。
这些资金将用于购买更多芯片并建设更多数据中心。
据彭博社最新消息,CoreWeave 目前正准备出售 10% 的股份,其公司估值最高已达到 80 亿美元。
英伟达创始人黄延森在今年公司财报电话会议上表示:“你将看到大量新的GPU专用云服务提供商。
” “其中最著名的是 CoreWeave,他们做得非常好。
” CoreWeave 与 Nvidia 的联系早在 2020 年初,该公司就宣布将加入 Nvidia 合作伙伴网络的云服务提供商计划,主要目的是将 GPU 加速引入云端。
在最近的 Siggraph 计算机图形大会上,黄仁勋现身,每个 CoreWeave 展位上都专门用小写字母标注了“Powered by NVIDIA”。
Jen-Hsun Huang 亮相 CoreWeave 展位 | CoreWeave,包括黄仁勋在内的Nvidia高管毫不犹豫地认可了CoreWeave。
NVIDIA 全球业务发展、云和战略合作伙伴全球总监将 CoreWeave 称为“NVIDIA 合作伙伴网络中第一家精英计算云解决方案提供商。
他们以前所未有的水平为客户提供从 A 到 A40 的广泛计算选项。
”规模化并在人工智能、机器学习、视觉效果等方面提供世界一流的成果。
Nvidia 为 CoreWeave 感到自豪,”另一位 Nvidia 高管将其定位为“性能最高、能源效率最高”。
计算平台”。
这样的赞扬也与Nvidia自身的利益相关。
Nvidia 需要确保其计算最终用户能够以尽可能最高的性能大规模访问其计算资源,就像客户希望在新一代芯片发布后立即使用它们一样。
这也让他们不惜公开与CoreWeave的合作,多发展一个忠诚的“下线”总没有坏处。
CoreWeave 的构建旨在满足 NVIDIA 的标准和要求,大规模运营,在新一代芯片发布后的几个月内将其上线,而不是传统超大规模计算公司可能需要的几个季度。
这为 CoreWeave 提供了 NVIDIA 内部的高级访问权限。
Brannin McBee 表示:“作为一家企业,这让我们对 NVIDIA 产生了信任,因为他们知道我们的基础设施将比市场上任何其他公司更快地交付给客户,并以最高性能配置交付。
”硅谷巨头 然而,面对硅谷巨头的竞争,CoreWeave表现如何? 放眼整个行业,CoreWeave在AI基础设施运营方面的竞争对手包括微软、谷歌、亚马逊等科技巨头。
8月底,谷歌云首席执行官Thomas Kurian在年度Next大会上表示,目前行业内超过50%的AI初创公司和超过70%的生成式AI独角兽都是谷歌云的客户。
一家估值80亿美元的初创公司如何避免被一堆万亿美元的巨头碾压?目前的答案在于小公司本身的灵活性和业务重点,以及科技公司敏感的战略格局。
CoreWeave 高管喜欢用一个比喻:“通用汽车可以制造电动汽车,但这并不意味着它会成为特斯拉。
”他们认为,人工智能带来了传统云平台无法应对的挑战,使新兴公司能够领先于被迫适应的老牌公司。
亚马逊、谷歌、微软等硅谷巨头就像航空母舰,每次调整方向都需要更多的时间和空间。
在其看来,他们需要时间来适应构建人工智能基础设施的新方式,而最新芯片发布后通常需要一段时间才能提供大规模接入。
现在人们更加关注建造超级计算机,这需要这些计算机之间高度协作的任务和更高的数据吞吐量,但巨头的主要资源并不用在这里。
“当这三大巨头构建云服务时,他们这样做是为了服务其用户群内数十万甚至数百万个所谓的通用用例,而在这些领域内,可能只有一小部分容量专用于到 GPU 计算。
“CoreWeave 首席技术官 Brian Venturo 说道。
CoreWeave认为,其灵活性和专业知识使其能够在AI基础设施领域脱颖而出,在性能和成本效益方面具有竞争优势,更适合AI应用。
CoreWeave 仅有 200 多名员工,客户数量比员工还多,但它已与 Inflection AI 甚至 OpenAI 支持者微软达成协议,提供比通用计算服务器配置更多的定制系统和芯片。
高效的。
目前就规模而言,CoreWeave 声称有超过 0 个高端 Nvidia GPU 可供按需使用。
重要的不仅仅是数量,还有提供的访问权限。
在选择方面,CoreWeave 声称将保持业界最广泛的 Nvidia GPU 选择,以满足各种计算需求。
他们设计了“大小合适”的工作负载系统,声称“既不太多,也不太少:恰到好处”。
至于价格,CoreWeave的口号是“比竞争对手便宜80%”。
另一方面,英伟达背后的决策也至关重要。
通过控制稀缺的GPU资源,选择跟谁接货,也会影响整个市场。
尽管供应有限,Nvidia 仍将大量最新的 AI 芯片分配给 CoreWeave,从而摆脱了包括 AWS 在内的顶级云服务提供商的供应。
原因是这些公司正在尝试开发自己的AI芯片,以减少对Nvidia的依赖。
CoreWeave高管认为“不制造自己的芯片绝对不是劣势”,因为这将有助于他们争取更多来自Nvidia的GPU。
毕竟他们与英伟达并没有利益冲突,而胃口巨大的硅谷巨头可能就不是这样了。
不过,这家科技巨头毕竟还是英伟达的大客户。
今年8月底,黄仁勋现身谷歌云年度Next大会,宣布与谷歌达成新合作。
谷歌的GPU超级计算机A3 VM将于9月上市,搭载Nvidia的HGPU。
Google Cloud Next大会上,黄仁勋现身宣布与Google Cloud合作 |另外,如果一款新芯片突然出现,性能可以比Nvidia更好,或者不逊色于它,那会给CoreWeave业务带来什么影响? Brannin McBee认为,同一款芯片的寿命包括前两三年用于模型训练,然后四到五年用于推理执行,短期内没有太大风险。
此外,英伟达正在努力围绕其硬件构建开放的生态系统,以增加行业对其芯片技术的粘性。
其他厂商显然很有动力进入这个领域,但他们缺乏生态系统,这是一个不可忽视的差距。
在缺乏硬核芯片制造技术的情况下,CoreWeave的相对优势和成功与合作伙伴的供应链和稳定性紧密相连。
当整个行业 GPU 供不应求时,这种依赖性仍然是一种优势。
从加密货币“矿场”到人工智能“算力矿场”,CoreWeave的成功史令人咂舌——时代的一粒金子,即使落在上面,也能让一家初创公司迅速崛起。
在这个 AI 快速增长的时代,业界对算力的渴望让 NVIDIA 成为了万亿美元的公司,显然也让像 CoreWeave 这样的公司能够抓住机遇,全力以赴。
头图来源:Nvidia 本文为转载自IT橙子。
如需转载,请前往IT橙官网申请授权。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-06
06-18
06-18
06-18
06-21
06-18
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态