金信诺拟参与深圳投资控股发起设立创新科技产业投资基金
06-17
5月21日,武汉光谷万豪,阿里云“AI智慧领袖峰会”。
到达现场后,客人们发现了一些不寻常的情况。
一个月内,一系列峰会在杭州、北京、西安举行。
此次,阿里云智能事业群高级成员副总裁、公有云事业部总裁·刘伟光亲临现场。
——阿里云这次可能有大事了。
果然,发布会开始十多分钟,刘伟光就谈到了硬件领域的一个常见话题“摩尔定律”。
极客最高级的致敬就是“show me code”;商界教父最先进的致敬就是把他的观点转化为行业规律,摩尔定律就是其中之一。
2016年,英特尔联合创始人的一句话“单位面积晶体管的密度每18个月翻一番”主导了半导体行业60多年的发展。
然而,随着摩尔的去世,摩尔定律在微型晶体管领域逐渐褪色。
冯诺依曼架构和量子隧道原本的局限性已经成为我们面前的障碍。
把观察的角度换成宏观的角度,或者换成用户的角度怎么样?这是阿里云多年来一直在思考的问题。
从用户的角度来看,晶体管密度只是次要的。
摩尔定律最根本的意义在于,每18个月,用户可以以相同的价格购买两倍的算力。
但很明显,晶体管密度并不是实现越来越便宜的计算能力的唯一途径。
公有云和AI或许是阿里云超越摩尔定律的尝试。
01 AI推理成本开始呈指数下降。
“我认为,只有每年能够将AI推理的成本降低十倍甚至百倍,才能真正推动AI应用在各行各业的爆发。
”刘伟光一发言,台下的人面面相觑:目前中国80%的科技公司、一半的大型模型公司都跑在阿里云上。
一年一百次,这意味着阿里云将进一步将国产大机型的使用成本降至底价。
紧接着,阿里云正式宣布旗下核心商用和开源系列9款机型全部降价,并且全部可以通过阿里云白联官网开通使用。
其中,阿里云对标了GPT-4级别的长文本模型Qwen-Long,其价格降至GPT-4价格的1/,为全球最低。
Qwen-Long是统一钱文的增强型长文本模型。
主要适用于消耗token最多的长文本场景。
上下文长度可达1000万,可处理约10,000字或15,000页的文档。
官方公告发布后,其API输入价格从0.02元/千币降至0.02元/千币,降幅达97%。
这意味着1元可以购买10000个代币,相当于5本书的文字量。
相比之下,国内外厂商GPT-4、Gemini1.5 Pro、Claude 3 Sonnet、Ernie-4.0每千枚代币的投入价格分别为0.22元、0.元、0.元、0.12元,均贵很多。
高于Qwen-long。
与此同时,Qwen-Long产出价格也从0.02元/千代币下跌至0.02元/千代币,跌幅达90%。
前不久发布的统一千文旗舰大型号,在权威基准OpenCompass上性能与GPT-4-Turbo的Qwen-Max相当,也参与了本次降价,API输入价格降至0.04元/千代币,减少 67%。
其他开源型号方面,Qwen1.5-72B、Qwen1.5-B等5款开源型号的投入价格也分别下降了75%以上。
从最广泛的应用到最好的性能,阿里云拿出了最重要的产品,其决心可见一斑。
02 阿里云的决心:成为大模型爆发的基础设施。
为什么要降低价格? 答案写在本次活动的主题中:“让世界没有困难的AI应用”,成为大模型时代的基础设施。
多位业内人士表示,人工智能在阿里云的定位已经上升到前所未有的战略高度。
在多次内部会议上,阿里云高管将2019年的AI与2018年的移动支付进行了比较。
2010年到2018年,在3G向4G转型期间,中国移动支付两年增长了2%; 2017年,多项移动支付业务的爆发,带动整个中国移动支付市场增长8.5倍。
未来AI的爆发速度将远远超出大家的想象——现在国内所有大型模型公司每天的API调用量都不超过1亿次,而到年底这个数据量将达到1亿次,增加了一百倍。
为了实现“AI基础设施”的目标,阿里云对自己的定位是要做到四件事:第一,有实力提供全球领先的模型服务。
不久前,OpenAI 的 Sam Altman 转发了 Chatbot Arena 列表,以证明 GPT-4o 的能力。
在全球排名前20的模特中,三位同艺倩文模特代表了中国模特跻身世界顶尖的实力。
Sam Altman 在 X 上转发 GPT-4o 测试结果 | X有能力打造国内最大的推理集群。
拥有全球30个公有云区域,共计89个可用区,可实现4倍的推理吞吐量提升,8倍的计算资源节省,并在分钟内实现快速动态扩展。
第三就是要有坚持开放、持续开源的态度。
作为最早提出MaaS(Model as a Service)概念的云厂商,目前,以给模型提供更好的服务为目标,阿里云百联模型服务平台已经可以调用第三方、垂直领域的众多大型模型,如以及魔法塔社区规则。
国内最大的模特社区,模特总数、用户10000+;统一持续开源全模全尺寸模型家族,累计开源模型下载量达10000次。
第四,我们有信心迎接人工智能应用的爆发。
财报数据显示,阿里云AI相关收入较去年同期增长三位数。
与阿里云的“四件事”相对照,它是业界的“两件事”。
一方面,开发和微调的人力成本昂贵。
大尺度模特人才稀缺已成为行业共识。
某消费电子巨头曾测算,公司在大型机型研发方向的平均税后人才成本为1万元。
对于普通企业来说,即使跳过基础模型步骤,使用开源大模型进行微调,成本仍然很高。
另一方面,硬件成本“在硅谷很昂贵”。
一家初创公司拥抱大规模模型,实际上可以以起价购买 50 台 GPU 服务器,甚至 1、2 个甚至更大的集群。
如果对标世界顶尖水平,训练一个B级LLM,以Falcon系列模型为例,其资源消耗为3.5万亿代币,集群约为A个,训练时间约为70天。
其中,一张Ace的价格通常在1万以上。
搭建集群,除了购买GPU之外,还包括软件部署、网络费、电费、运维成本以及不断投入的试错成本。
其成本远远超出了一般企业的承受能力。
那么,对于阿里云来说,接下来的核心目标就是如何利用阿里云的“四件事”来解决AI爆发遇到的“两个成本”。
03 API价值决定因素:技术高度+包容能力。
不难发现,阿里云在本次活动中重点关注了两件事。
一是强调API的价值,二是能够降低价格,使其具有普惠性。
API很容易理解。
互联网的发展没有必要重新发明轮子。
在大模型的开发中,并不是所有人都需要从基础模型开始。
API与公有云的结合,不仅可以降低大模型开发的人力成本,也是实现大模型普惠的必由之路。
一方面,云厂商天然的开放性可以为开发者提供私有部署所不具备的丰富模型和工具链。
阿里云百联平台汇聚了同易、百川、ChatGLM、Llama系列等数百款国内外优质模型。
内置大型模型定制和应用开发工具链。
开发者可以轻松测试和比较不同的模型,开发专属的大型模型。
并轻松构建 RAG 等应用程序。
从选型、调型、应用开发到对外服务,一站式完成。
另一方面,云更方便多模型调用,并提供企业级数据安全。
阿里云可以为每个企业提供专用的VPC环境,实现计算隔离、存储隔离、网络隔离、数据加密,充分保证数据安全。
目前,阿里云已主导或深度参与了10余项大模型安全相关的国际国内技术标准的制定。
降价背后的逻辑是能够让所有人受益。
在PC时代,主导行业不断发展的是安迪·比尔定律。
其中,安迪代表英特尔,销售CPU,比尔代表微软,销售Windows操作系统。
两者结合意味着,随着操作系统所代表的软件规模越来越大,用户必须定期更新迭代新的硬件。

AI时代同样如此。
大模型发展得越好,对云计算等计算能力的要求就越高。
“生成式AI所依赖的算力不仅仅是CPU和简单技术带来的策略,更是大规模的集群。
大规模的GPU集群带来了算力的基础,包括网络背后能力的提升。
”所以生成式人工智能,无论是推理还是训练,都在逐渐更多地向云端转移,再次引发公共云的爆炸式增长。
”刘伟光直言不讳地说。
这次史无前例的降价,是因为云计算本身超越了摩尔定律。
过去,摩尔定律占主导地位,单位面积芯片晶体管的密度每18个月翻一番。
同等算力下,18个月用户使用成本降低一半。
如今,晶体管的摩尔定律已经到期,但公有云的技术红利和规模效应仍然可以带来算力成本的持续优化。
举个例子,阿里云在过去十年里,算力成本降低了80%,存储成本降低了90%。
具体在AI方向,阿里云基于异构芯片互联、高性能网络HPN7.0、高性能存储CPFS、人工智能平台PAI。
百联分布式推理加速引擎大大降低了模型推理的成本,加快了模型推理的速度。
因此,即使是同样的开源模型,公有云上的调用价格也远低于私有部署。
以Qwen-72B开源型号、每月使用1亿枚代币为例,直接调用阿里云白链上的API每月仅需1万元,私有化部署成本平均每月1万元以上。
此时,大机型的爆发才刚刚开始,但如何打好这场持久战,阿里云的基础设施已经悄然布局。
阿里云引发的连锁反应 事实上,阿里云发起如此激进的降价,并不会是故事的结局。
就在今天,上午阿里云大型机型大幅降价后,下午百度又宣布了两款轻量级主力机型免费。
虽然这与阿里云降价的模型能力并不完全匹配,从势头上看似乎是快速反应,但毫无疑问,阿里云推出的这一波大模型能力将会引发行业进一步的连锁反应。
对于应用创新来说,大模型API的成本已经下降,甚至可以开始接近免费试用。
真正跑起来之后再算钱,刺激应用创新是好事。
过去,中国被称为实体经济的基建狂人,“要想富,先修路”已经成为家喻户晓的常识。
其背后隐藏的经济规律是,基础设施的价格与社会创新总量之间存在着一种微妙的拉锯结构:只有当基础设施的价格下降时,创新才会像成熟的蒲公英一样借助风而播下种子。
距离。
过去实体经济是这样,我们预计AI时代也是如此。
*头图来源:视觉中国 本文为极客公园原创文章。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-06
06-18
06-18
06-06
06-18
06-18
最新文章
三只松鼠:门店扩张已全面暂停
Nvidia 已准备好“统治”AI
【创业24小时】2023年11月16日
【创业24小时】2022年10月20日
倒计时一天,浙江这座小镇要火了!
沃图网络获数千万A轮投资,加大投入海外网红营销SaaS平台建设
泰山天使基金部分退出拉手半年回报180倍
西格数据完成1000万元A+轮融资,国发创投领投