首页 > 科技动态 > 内容

阿里云大规模机型降价史无前例,开始超越摩尔定律

发布于:2024-06-17 编辑:匿名 来源:网络

5月21日,武汉光谷万豪,阿里云“AI智慧领袖峰会”。

到达现场后,客人们发现了一些不寻常的情况。

一个月内,一系列峰会在杭州、北京、西安举行。

此次,阿里云智能事业群高级成员副总裁、公有云事业部总裁·刘伟光亲临现场。

——阿里云这次可能有大事了。

果然,发布会开始十多分钟,刘伟光就谈到了硬件领域的一个常见话题“摩尔定律”。

极客最高级的致敬就是“show me code”;商界教父最先进的致敬就是把他的观点转化为行业规律,摩尔定律就是其中之一。

2016年,英特尔联合创始人的一句话“单位面积晶体管的密度每18个月翻一番”主导了半导体行业60多年的发展。

然而,随着摩尔的去世,摩尔定律在微型晶体管领域逐渐褪色。

冯诺依曼架构和量子隧道原本的局限性已经成为我们面前的障碍。

把观察的角度换成宏观的角度,或者换成用户的角度怎么样?这是阿里云多年来一直在思考的问题。

从用户的角度来看,晶体管密度只是次要的。

摩尔定律最根本的意义在于,每18个月,用户可以以相同的价格购买两倍的算力。

但很明显,晶体管密度并不是实现越来越便宜的计算能力的唯一途径。

公有云和AI或许是阿里云超越摩尔定律的尝试。

01 AI推理成本开始呈指数下降。

“我认为,只有每年能够将AI推理的成本降低十倍甚至百倍,才能真正推动AI应用在各行各业的爆发。

”刘伟光一发言,台下的人面面相觑:目前中国80%的科技公司、一半的大型模型公司都跑在阿里云上。

一年一百次,这意味着阿里云将进一步将国产大机型的使用成本降至底价。

紧接着,阿里云正式宣布旗下核心商用和开源系列9款机型全部降价,并且全部可以通过阿里云白联官网开通使用。

其中,阿里云对标了GPT-4级别的长文本模型Qwen-Long,其价格降至GPT-4价格的1/,为全球最低。

Qwen-Long是统一钱文的增强型长文本模型。

主要适用于消耗token最多的长文本场景。

上下文长度可达1000万,可处理约10,000字或15,000页的文档。

官方公告发布后,其API输入价格从0.02元/千币降至0.02元/千币,降幅达97%。

这意味着1元可以购买10000个代币,相当于5本书的文字量。

相比之下,国内外厂商GPT-4、Gemini1.5 Pro、Claude 3 Sonnet、Ernie-4.0每千枚代币的投入价格分别为0.22元、0.元、0.元、0.12元,均贵很多。

高于Qwen-long。

与此同时,Qwen-Long产出价格也从0.02元/千代币下跌至0.02元/千代币,跌幅达90%。

前不久发布的统一千文旗舰大型号,在权威基准OpenCompass上性能与GPT-4-Turbo的Qwen-Max相当,也参与了本次降价,API输入价格降至0.04元/千代币,减少 67%。

其他开源型号方面,Qwen1.5-72B、Qwen1.5-B等5款开源型号的投入价格也分别下降了75%以上。

从最广泛的应用到最好的性能,阿里云拿出了最重要的产品,其决心可见一斑。

02 阿里云的决心:成为大模型爆发的基础设施。

为什么要降低价格? 答案写在本次活动的主题中:“让世界没有困难的AI应用”,成为大模型时代的基础设施。

多位业内人士表示,人工智能在阿里云的定位已经上升到前所未有的战略高度。

在多次内部会议上,阿里云高管将2019年的AI与2018年的移动支付进行了比较。

2010年到2018年,在3G向4G转型期间,中国移动支付两年增长了2%; 2017年,多项移动支付业务的爆发,带动整个中国移动支付市场增长8.5倍。

未来AI的爆发速度将远远超出大家的想象——现在国内所有大型模型公司每天的API调用量都不超过1亿次,而到年底这个数据量将达到1亿次,增加了一百倍。

为了实现“AI基础设施”的目标,阿里云对自己的定位是要做到四件事:第一,有实力提供全球领先的模型服务。

不久前,OpenAI 的 Sam Altman 转发了 Chatbot Arena 列表,以证明 GPT-4o 的能力。

在全球排名前20的模特中,三位同艺倩文模特代表了中国模特跻身世界顶尖的实力。

Sam Altman 在 X 上转发 GPT-4o 测试结果 | X有能力打造国内最大的推理集群。

拥有全球30个公有云区域,共计89个可用区,可实现4倍的推理吞吐量提升,8倍的计算资源节省,并在分钟内实现快速动态扩展。

第三就是要有坚持开放、持续开源的态度。

作为最早提出MaaS(Model as a Service)概念的云厂商,目前,以给模型提供更好的服务为目标,阿里云百联模型服务平台已经可以调用第三方、垂直领域的众多大型模型,如以及魔法塔社区规则。

国内最大的模特社区,模特总数、用户10000+;统一持续开源全模全尺寸模型家族,累计开源模型下载量达10000次。

第四,我们有信心迎接人工智能应用的爆发。

财报数据显示,阿里云AI相关收入较去年同期增长三位数。

与阿里云的“四件事”相对照,它是业界的“两件事”。

一方面,开发和微调的人力成本昂贵。

大尺度模特人才稀缺已成为行业共识。

某消费电子巨头曾测算,公司在大型机型研发方向的平均税后人才成本为1万元。

对于普通企业来说,即使跳过基础模型步骤,使用开源大模型进行微调,成本仍然很高。

另一方面,硬件成本“在硅谷很昂贵”。

一家初创公司拥抱大规模模型,实际上可以以起价购买 50 台 GPU 服务器,甚至 1、2 个甚至更大的集群。

如果对标世界顶尖水平,训练一个B级LLM,以Falcon系列模型为例,其资源消耗为3.5万亿代币,集群约为A个,训练时间约为70天。

其中,一张Ace的价格通常在1万以上。

搭建集群,除了购买GPU之外,还包括软件部署、网络费、电费、运维成本以及不断投入的试错成本。

其成本远远超出了一般企业的承受能力。

那么,对于阿里云来说,接下来的核心目标就是如何利用阿里云的“四件事”来解决AI爆发遇到的“两个成本”。

03 API价值决定因素:技术高度+包容能力。

不难发现,阿里云在本次活动中重点关注了两件事。

一是强调API的价值,二是能够降低价格,使其具有普惠性。

API很容易理解。

互联网的发展没有必要重新发明轮子。

在大模型的开发中,并不是所有人都需要从基础模型开始。

API与公有云的结合,不仅可以降低大模型开发的人力成本,也是实现大模型普惠的必由之路。

一方面,云厂商天然的开放性可以为开发者提供私有部署所不具备的丰富模型和工具链。

阿里云百联平台汇聚了同易、百川、ChatGLM、Llama系列等数百款国内外优质模型。

内置大型模型定制和应用开发工具链。

开发者可以轻松测试和比较不同的模型,开发专属的大型模型。

并轻松构建 RAG 等应用程序。

从选型、调型、应用开发到对外服务,一站式完成。

另一方面,云更方便多模型调用,并提供企业级数据安全。

阿里云可以为每个企业提供专用的VPC环境,实现计算隔离、存储隔离、网络隔离、数据加密,充分保证数据安全。

目前,阿里云已主导或深度参与了10余项大模型安全相关的国际国内技术标准的制定。

降价背后的逻辑是能够让所有人受益。

在PC时代,主导行业不断发展的是安迪·比尔定律。

其中,安迪代表英特尔,销售CPU,比尔代表微软,销售Windows操作系统。

两者结合意味着,随着操作系统所代表的软件规模越来越大,用户必须定期更新迭代新的硬件。

阿里云大规模机型降价史无前例,开始超越摩尔定律

AI时代同样如此。

大模型发展得越好,对云计算等计算能力的要求就越高。

“生成式AI所依赖的算力不仅仅是CPU和简单技术带来的策略,更是大规模的集群。

大规模的GPU集群带来了算力的基础,包括网络背后能力的提升。

”所以生成式人工智能,无论是推理还是训练,都在逐渐更多地向云端转移,再次引发公共云的爆炸式增长。

”刘伟光直言不讳地说。

这次史无前例的降价,是因为云计算本身超越了摩尔定律。

过去,摩尔定律占主导地位,单位面积芯片晶体管的密度每18个月翻一番。

同等算力下,18个月用户使用成本降低一半。

如今,晶体管的摩尔定律已经到期,但公有云的技术红利和规模效应仍然可以带来算力成本的持续优化。

举个例子,阿里云在过去十年里,算力成本降低了80%,存储成本降低了90%。

具体在AI方向,阿里云基于异构芯片互联、高性能网络HPN7.0、高性能存储CPFS、人工智能平台PAI。

百联分布式推理加速引擎大大降低了模型推理的成本,加快了模型推理的速度。

因此,即使是同样的开源模型,公有云上的调用价格也远低于私有部署。

以Qwen-72B开源型号、每月使用1亿枚代币为例,直接调用阿里云白链上的API每月仅需1万元,私有化部署成本平均每月1万元以上。

此时,大机型的爆发才刚刚开始,但如何打好这场持久战,阿里云的基础设施已经悄然布局。

阿里云引发的连锁反应 事实上,阿里云发起如此激进的降价,并不会是故事的结局。

就在今天,上午阿里云大型机型大幅降价后,下午百度又宣布了两款轻量级主力机型免费。

虽然这与阿里云降价的模型能力并不完全匹配,从势头上看似乎是快速反应,但毫无疑问,阿里云推出的这一波大模型能力将会引发行业进一步的连锁反应。

对于应用创新来说,大模型API的成本已经下降,甚至可以开始接近免费试用。

真正跑起来之后再算钱,刺激应用创新是好事。

过去,中国被称为实体经济的基建狂人,“要想富,先修路”已经成为家喻户晓的常识。

其背后隐藏的经济规律是,基础设施的价格与社会创新总量之间存在着一种微妙的拉锯结构:只有当基础设施的价格下降时,创新才会像成熟的蒲公英一样借助风而播下种子。

距离。

过去实体经济是这样,我们预计AI时代也是如此。

*头图来源:视觉中国 本文为极客公园原创文章。

阿里云大规模机型降价史无前例,开始超越摩尔定律

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 金信诺拟参与深圳投资控股发起设立创新科技产业投资基金

    金信诺拟参与深圳投资控股发起设立创新科技产业投资基金

    据投资界9月24日消息,金信诺公告称,公司与深圳市投控资本有限公司(以下简称“深圳投控资本”)简称“深投控”)签署《战略合作协议》,将参与设立深投控股发起的创新科技产业投资基金。 据悉,该基金主要投资粤港澳大湾区的创新科技产业项目,重点关注金信诺所在行业及其

    06-17

  • 受疫情影响,小米、美团等300家企业共寻求贷款至少574亿元(附:小米回应)

    受疫情影响,小米、美团等300家企业共寻求贷款至少574亿元(附:小米回应)

    受疫情影响,人们生活的方方面面都受到不同程度的影响,企业亦然。 据路透社独家报道,多家中国企业正在寻求总额至少82亿美元(约合人民币1亿元)的银行贷款。 其中,潜在的借贷公司包括美团、小米、滴滴、旷视科技等。 名单上的公司还包括菜市场运营商、救护车制造商、环保公

    06-17

  • 日月光成立联合研发中心

    日月光成立联合研发中心

    据媒体报道,日月光近日举行联合研发中心启动仪式。 该中心与台湾“国立成功大学”合作。 双方将在注重人才培养的同时,共同探索异构集成、硅光子等基础技术并积极投入前瞻性技术研究。 以先进封装技术强化日月光的国际竞争力,同时提升成大的研发能力,巩固台湾在半导体领域

    06-06

  • 赛勒药业完成近亿元B轮融资,安徽创谷资本领投

    赛勒药业完成近亿元B轮融资,安徽创谷资本领投

    投资界(ID:pedaily)据8月12日消息,赛勒医药科技(上海)有限公司(精英药业)赛乐药业宣布完成近亿元B轮融资 据悉,本轮投资由安徽创谷资本领投,合肥产投资本、合肥创新共同完成。 募集资金将主要用于协助赛乐药业研发及临床试验、新生产基地建设等。 本轮融资由翠微投资

    06-18

  • 深圳超级LP即将出手

    深圳超级LP即将出手

    结果正式揭晓。 投资界-Decode LP获悉,2月4日,深圳市政府投资引导基金投资管理委员会审议并投票确定了第二批深圳市“20”产业基金入选机构名单。 此次公布的基金包括高端装备、新材料、脑科学与类脑智能、细胞与基因、数字创意装备等五支基金。 管理人为:招商致远资本、深

    06-18

  • 英实生物完成1500万美元B+轮融资,汇顶投资独家投资

    英实生物完成1500万美元B+轮融资,汇顶投资独家投资

    投资世界(ID:pedaily)5月9日消息,聚焦突破实体瘤耐药和肿瘤纤维化的全球创新药研发企业微环境英石生物科技(南京)有限公司(以下简称“英石生物”或“公司”)宣布完成10,000美元B+轮融资,由汇鼎投资独家完成。 本轮融资筹集的资金将用于支持国内外同步推广的IN8产品针

    06-17

  • 功率半导体多年协议

    功率半导体多年协议

    硅半导体 英飞凌科技、现代汽车公司和起亚公司签署了碳化硅(SiC)和硅(Si)功率半导体的多年供应协议。 英飞凌将在年内建立并储备制造能力,为现代/起亚供应SiC和Si功率模块和芯片。 现代/起亚将提供资金支持产能建设和产能储备。 现代汽车集团执行副总裁兼全球战略办公室

    06-06

  • 海格巴特勒完成1000万元Pre-A轮融资, 80后创业者盯上家政下沉市场

    海格巴特勒完成1000万元Pre-A轮融资, 80后创业者盯上家政下沉市场

    据投资界7月4日消息,家政品牌“海格管家”近日宣布完成千万元融资。 Pre-A轮融资,由本土投资者投资。 海格管家CEO董帆表示,本轮融资将用于团队迭代、服务质量升级、系统技术改进和营销投入,暂时不会进行区域扩张。 海格管家由一群云南昆明当地的80后企业家创立。 该平台

    06-17

  • 英飞凌将投资20亿欧元(约合22.7亿美元)提升芯片制造能力

    英飞凌将投资20亿欧元(约合22.7亿美元)提升芯片制造能力

    道琼斯通讯社2月17日报道,英飞凌科技周四表示,将投资20亿欧元(约合22.7亿美元)提升芯片制造能力宽禁带半导体领域。 制造能力。 这家德国芯片制造商表示,将在其位于马来西亚居林的工厂建造第三个模块,以大幅提高产能,一旦建成,新模块将额外产生20亿欧元的年收入。 英飞

    06-08

  • 利用大数据进行内容营销,投文科技获天使领投、梅花创投数百万美元投资

    利用大数据进行内容营销,投文科技获天使领投、梅花创投数百万美元投资

    据投资界7月5日消息,近日,企业内容营销平台投文科技宣布,完成天使数百万轮融资。 公司由梅花创投领投,东湖天使、大风资本跟投,公司整体估值1亿元。 本轮融资主要用于产品研发、内容矩阵拓展和销售体系建设。   梅花创投创始人合伙人吴世春表示,“投文科技是为数不多

    06-18

  • 产业链+金融链润禾软件区块链双渠道布局战略包围

    产业链+金融链润禾软件区块链双渠道布局战略包围

    10月,国内软件领域传出重磅消息。 本月初,某大型国有银行在北京召开新闻发布会,隆重推出基于区块链技术的全新产品。 贸易金融平台2.0,60余位行业代表参与。 值得注意的是,消息中提到的区块链技术和应用平台实际上来自润和软件及其参股公司。 润禾软件对区块链相关技术的

    06-18

  • 《2023年河南省数字经济发展工作方案》

    《2023年河南省数字经济发展工作方案》

    《年河南省数字经济发展工作方案》为贯彻落实中央和省委经济工作会议大力发展数字经济的决策部署,持续提升我省数字经济发展规模和水平,计划制定。 一、工作思路以习近平新时代中国特色社会主义思想为指导,全面贯彻党的二十大精神,全面准确全面贯彻新发展理念,抢抓战略机

    06-18