首页 > 科技动态 > 内容

阿里云大规模机型降价史无前例,开始超越摩尔定律

发布于:2024-06-17 编辑:匿名 来源:网络

5月21日,武汉光谷万豪,阿里云“AI智慧领袖峰会”。

到达现场后,客人们发现了一些不寻常的情况。

一个月内,一系列峰会在杭州、北京、西安举行。

此次,阿里云智能事业群高级成员副总裁、公有云事业部总裁·刘伟光亲临现场。

——阿里云这次可能有大事了。

果然,发布会开始十多分钟,刘伟光就谈到了硬件领域的一个常见话题“摩尔定律”。

极客最高级的致敬就是“show me code”;商界教父最先进的致敬就是把他的观点转化为行业规律,摩尔定律就是其中之一。

2016年,英特尔联合创始人的一句话“单位面积晶体管的密度每18个月翻一番”主导了半导体行业60多年的发展。

然而,随着摩尔的去世,摩尔定律在微型晶体管领域逐渐褪色。

冯诺依曼架构和量子隧道原本的局限性已经成为我们面前的障碍。

把观察的角度换成宏观的角度,或者换成用户的角度怎么样?这是阿里云多年来一直在思考的问题。

从用户的角度来看,晶体管密度只是次要的。

摩尔定律最根本的意义在于,每18个月,用户可以以相同的价格购买两倍的算力。

但很明显,晶体管密度并不是实现越来越便宜的计算能力的唯一途径。

公有云和AI或许是阿里云超越摩尔定律的尝试。

01 AI推理成本开始呈指数下降。

“我认为,只有每年能够将AI推理的成本降低十倍甚至百倍,才能真正推动AI应用在各行各业的爆发。

”刘伟光一发言,台下的人面面相觑:目前中国80%的科技公司、一半的大型模型公司都跑在阿里云上。

一年一百次,这意味着阿里云将进一步将国产大机型的使用成本降至底价。

紧接着,阿里云正式宣布旗下核心商用和开源系列9款机型全部降价,并且全部可以通过阿里云白联官网开通使用。

其中,阿里云对标了GPT-4级别的长文本模型Qwen-Long,其价格降至GPT-4价格的1/,为全球最低。

Qwen-Long是统一钱文的增强型长文本模型。

主要适用于消耗token最多的长文本场景。

上下文长度可达1000万,可处理约10,000字或15,000页的文档。

官方公告发布后,其API输入价格从0.02元/千币降至0.02元/千币,降幅达97%。

这意味着1元可以购买10000个代币,相当于5本书的文字量。

相比之下,国内外厂商GPT-4、Gemini1.5 Pro、Claude 3 Sonnet、Ernie-4.0每千枚代币的投入价格分别为0.22元、0.元、0.元、0.12元,均贵很多。

高于Qwen-long。

与此同时,Qwen-Long产出价格也从0.02元/千代币下跌至0.02元/千代币,跌幅达90%。

前不久发布的统一千文旗舰大型号,在权威基准OpenCompass上性能与GPT-4-Turbo的Qwen-Max相当,也参与了本次降价,API输入价格降至0.04元/千代币,减少 67%。

其他开源型号方面,Qwen1.5-72B、Qwen1.5-B等5款开源型号的投入价格也分别下降了75%以上。

从最广泛的应用到最好的性能,阿里云拿出了最重要的产品,其决心可见一斑。

02 阿里云的决心:成为大模型爆发的基础设施。

为什么要降低价格? 答案写在本次活动的主题中:“让世界没有困难的AI应用”,成为大模型时代的基础设施。

多位业内人士表示,人工智能在阿里云的定位已经上升到前所未有的战略高度。

在多次内部会议上,阿里云高管将2019年的AI与2018年的移动支付进行了比较。

2010年到2018年,在3G向4G转型期间,中国移动支付两年增长了2%; 2017年,多项移动支付业务的爆发,带动整个中国移动支付市场增长8.5倍。

未来AI的爆发速度将远远超出大家的想象——现在国内所有大型模型公司每天的API调用量都不超过1亿次,而到年底这个数据量将达到1亿次,增加了一百倍。

为了实现“AI基础设施”的目标,阿里云对自己的定位是要做到四件事:第一,有实力提供全球领先的模型服务。

不久前,OpenAI 的 Sam Altman 转发了 Chatbot Arena 列表,以证明 GPT-4o 的能力。

在全球排名前20的模特中,三位同艺倩文模特代表了中国模特跻身世界顶尖的实力。

Sam Altman 在 X 上转发 GPT-4o 测试结果 | X有能力打造国内最大的推理集群。

拥有全球30个公有云区域,共计89个可用区,可实现4倍的推理吞吐量提升,8倍的计算资源节省,并在分钟内实现快速动态扩展。

第三就是要有坚持开放、持续开源的态度。

作为最早提出MaaS(Model as a Service)概念的云厂商,目前,以给模型提供更好的服务为目标,阿里云百联模型服务平台已经可以调用第三方、垂直领域的众多大型模型,如以及魔法塔社区规则。

国内最大的模特社区,模特总数、用户10000+;统一持续开源全模全尺寸模型家族,累计开源模型下载量达10000次。

第四,我们有信心迎接人工智能应用的爆发。

财报数据显示,阿里云AI相关收入较去年同期增长三位数。

与阿里云的“四件事”相对照,它是业界的“两件事”。

一方面,开发和微调的人力成本昂贵。

大尺度模特人才稀缺已成为行业共识。

某消费电子巨头曾测算,公司在大型机型研发方向的平均税后人才成本为1万元。

对于普通企业来说,即使跳过基础模型步骤,使用开源大模型进行微调,成本仍然很高。

另一方面,硬件成本“在硅谷很昂贵”。

一家初创公司拥抱大规模模型,实际上可以以起价购买 50 台 GPU 服务器,甚至 1、2 个甚至更大的集群。

如果对标世界顶尖水平,训练一个B级LLM,以Falcon系列模型为例,其资源消耗为3.5万亿代币,集群约为A个,训练时间约为70天。

其中,一张Ace的价格通常在1万以上。

搭建集群,除了购买GPU之外,还包括软件部署、网络费、电费、运维成本以及不断投入的试错成本。

其成本远远超出了一般企业的承受能力。

那么,对于阿里云来说,接下来的核心目标就是如何利用阿里云的“四件事”来解决AI爆发遇到的“两个成本”。

03 API价值决定因素:技术高度+包容能力。

不难发现,阿里云在本次活动中重点关注了两件事。

一是强调API的价值,二是能够降低价格,使其具有普惠性。

API很容易理解。

互联网的发展没有必要重新发明轮子。

在大模型的开发中,并不是所有人都需要从基础模型开始。

API与公有云的结合,不仅可以降低大模型开发的人力成本,也是实现大模型普惠的必由之路。

一方面,云厂商天然的开放性可以为开发者提供私有部署所不具备的丰富模型和工具链。

阿里云百联平台汇聚了同易、百川、ChatGLM、Llama系列等数百款国内外优质模型。

内置大型模型定制和应用开发工具链。

开发者可以轻松测试和比较不同的模型,开发专属的大型模型。

并轻松构建 RAG 等应用程序。

从选型、调型、应用开发到对外服务,一站式完成。

另一方面,云更方便多模型调用,并提供企业级数据安全。

阿里云可以为每个企业提供专用的VPC环境,实现计算隔离、存储隔离、网络隔离、数据加密,充分保证数据安全。

目前,阿里云已主导或深度参与了10余项大模型安全相关的国际国内技术标准的制定。

降价背后的逻辑是能够让所有人受益。

在PC时代,主导行业不断发展的是安迪·比尔定律。

其中,安迪代表英特尔,销售CPU,比尔代表微软,销售Windows操作系统。

两者结合意味着,随着操作系统所代表的软件规模越来越大,用户必须定期更新迭代新的硬件。

阿里云大规模机型降价史无前例,开始超越摩尔定律

AI时代同样如此。

大模型发展得越好,对云计算等计算能力的要求就越高。

“生成式AI所依赖的算力不仅仅是CPU和简单技术带来的策略,更是大规模的集群。

大规模的GPU集群带来了算力的基础,包括网络背后能力的提升。

”所以生成式人工智能,无论是推理还是训练,都在逐渐更多地向云端转移,再次引发公共云的爆炸式增长。

”刘伟光直言不讳地说。

这次史无前例的降价,是因为云计算本身超越了摩尔定律。

过去,摩尔定律占主导地位,单位面积芯片晶体管的密度每18个月翻一番。

同等算力下,18个月用户使用成本降低一半。

如今,晶体管的摩尔定律已经到期,但公有云的技术红利和规模效应仍然可以带来算力成本的持续优化。

举个例子,阿里云在过去十年里,算力成本降低了80%,存储成本降低了90%。

具体在AI方向,阿里云基于异构芯片互联、高性能网络HPN7.0、高性能存储CPFS、人工智能平台PAI。

百联分布式推理加速引擎大大降低了模型推理的成本,加快了模型推理的速度。

因此,即使是同样的开源模型,公有云上的调用价格也远低于私有部署。

以Qwen-72B开源型号、每月使用1亿枚代币为例,直接调用阿里云白链上的API每月仅需1万元,私有化部署成本平均每月1万元以上。

此时,大机型的爆发才刚刚开始,但如何打好这场持久战,阿里云的基础设施已经悄然布局。

阿里云引发的连锁反应 事实上,阿里云发起如此激进的降价,并不会是故事的结局。

就在今天,上午阿里云大型机型大幅降价后,下午百度又宣布了两款轻量级主力机型免费。

虽然这与阿里云降价的模型能力并不完全匹配,从势头上看似乎是快速反应,但毫无疑问,阿里云推出的这一波大模型能力将会引发行业进一步的连锁反应。

对于应用创新来说,大模型API的成本已经下降,甚至可以开始接近免费试用。

真正跑起来之后再算钱,刺激应用创新是好事。

过去,中国被称为实体经济的基建狂人,“要想富,先修路”已经成为家喻户晓的常识。

其背后隐藏的经济规律是,基础设施的价格与社会创新总量之间存在着一种微妙的拉锯结构:只有当基础设施的价格下降时,创新才会像成熟的蒲公英一样借助风而播下种子。

距离。

过去实体经济是这样,我们预计AI时代也是如此。

*头图来源:视觉中国 本文为极客公园原创文章。

阿里云大规模机型降价史无前例,开始超越摩尔定律

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 欧洲车企需要中国电池

    欧洲车企需要中国电池

    9月中旬,欧盟委员会主席乌苏拉冯德莱恩正式宣布,欧盟将对中国电动汽车启动反补贴调查。 由于巨额国家补贴人为压低中国电动汽车的价格,欧盟市场正在被扭曲。 乌尔苏拉冯德莱恩在国情咨文中提到了他对当前欧洲电动汽车市场的看法。 她认为,由于巨额补贴,中国新能源汽车价格

    06-21

  • AMD要疯了!新一代最强AI芯片MI350系列登场,性能提升3500%|硅世界-钛媒体官网

    AMD要疯了!新一代最强AI芯片MI350系列登场,性能提升3500%|硅世界-钛媒体官网

    AMD CEO苏姿丰发布Instinct MIX AI加速器,拥有GB HBM3E内存、6TB/s一款功能强大的产品,具有内存带宽,为数据中心人工智能树立了新基准。 这个新的GPU系列不仅在内存容量和计算性能方面超越了Nvidia的H,而且还承诺为即将推出的Instinct MI系列(预计将于2020年发布)的AI推

    06-18

  • 一加Ace 2 Pro体验:2999元起,真香性能旗舰,内存比电脑还大

    一加Ace 2 Pro体验:2999元起,真香性能旗舰,内存比电脑还大

    8月16日,一加带来了Ace 2系列第三款新品一加Ace 2 Pro,拥有3款两个存储版本,售价为:12GB+GB、16GB+GB、24GB+1TB。 一加的标准外观机身将继续沿用Ace Pro系列“更接近一加旗舰”的设计思路,整机看上去和一加一样。 与 Plus 11 非常相似,后置摄像头模块采用圆形结构。 后

    06-21

  • SalaryTong获得5000万元A轮融资,小米、顺为资本、元易资本联合投资

    SalaryTong获得5000万元A轮融资,小米、顺为资本、元易资本联合投资

    3月23日投资界消息,据亿欧网消息,企业人事金融服务公司SalaryTong宣布完成万元A轮融资。 本轮融资由小米、顺为资本、元一资本共同投资。 本轮融资将主要用于开发和推广薪水通APP,继续在22个城市推广城市合伙人计划,提升员工信用大数据能力。   薪资通是上海伟杰互联网

    06-18

  • 香农科技获数千万元天使轮融资,由红杉资本中国投资

    香农科技获数千万元天使轮融资,由红杉资本中国投资

    据投资界1月15日消息,香农科技完成数千万元天使轮融资,由红杉资本中国投资。 本轮融资将主要用于团队扩张和第一代产品的推出。   香农科技成立于12月,利用自有的自然语言处理算法构建了一套简单易用的金融搜索和分析工具,满足高净值投资者或投资机构对数据的需求采矿一

    06-17

  • 铟泰公司专家将在CEIA惠州站演讲

    铟泰公司专家将在CEIA惠州站演讲

    铟泰公司华南技术经理梁银潭将于6月27日在CEIA惠州站发表演讲。 梁银潭的演讲《如何优化SMT工艺来降低空洞和锡珠》将解析技术减少电子组装中的这些常见问题,包括如何减少LED空洞和芯片上锡珠的产生。 梁银潭为Indium Corporation华南地区客户提供全系列Indium产品的技术支持

    06-06

  • 启源生物完成1亿元A轮融资,由季节投资

    启源生物完成1亿元A轮融资,由季节投资

    投资社区(ID:pedaily)领投 据8月31日消息,启源生物科技(杭州)有限公司(以下简称“启源生物”) 》)宣布完成1亿元A轮融资。 元A轮融资,本轮融资由季节投资领投,泰鲲基金、临平国投、杭州金融投资产业基金跟投。 本轮融资将用于推进QY、QY等多个管线的临床开发,进一

    06-18

  • 上海,年度最大融资诞生:吉塔半导体再融资135亿

    上海,年度最大融资诞生:吉塔半导体再融资135亿

    这势必成为年度最大融资之一。 投资界从浦东科创集团获悉,上海吉塔半导体有限公司(简称“吉塔半导体”)完成1亿元融资。 本轮融资汇聚了多家国家基金、产业投资者、地方基金、知名金融投资者等。 距离上一轮80亿元A轮融资仅一年半时间。 当时的投资者名单相当可观。 吉塔半

    06-18

  • 上海超级国资平台正式诞生

    上海超级国资平台正式诞生

    投资界获悉,近日,上海国投公司与科创投资集团联合重组及领导班子调整公告会召开。 会议宣布上海国投公司与上海科技创业投资集团联合重组,任命袁国华为上海国投公司党委书记、董事长。 至此,上海一个超级国资平台诞生了。 在联合重组和领导班子调整宣布会上,上海市委常委

    06-18

  • 摩纳哥阿尔贝二世亲王基金会捐赠支持清华大学

    摩纳哥阿尔贝二世亲王基金会捐赠支持清华大学

    摩纳哥阿尔贝二世-亲王基金会捐款支持清华大学”)近日签署协议,捐资设立“清华之友-摩纳哥亲王基金会奖学金”,选拔和奖励清华大学环境学院在碳达峰研究与实践方面取得的杰出成就学子基金会帮助清华大学培养具有扎实专业知识、广阔国际视野和全球领导力的生态环境科学研究领

    06-17

  • 王东升,坐拥另一只超级独角兽:奕斯伟算盘

    王东升,坐拥另一只超级独角兽:奕斯伟算盘

    再次见到王东升。 投资界获悉,北京奕斯伟计算技术有限公司(简称“奕斯伟计算”)近日宣布完成超30亿元D轮融资。 纵观本轮投资方名单,还是非常豪华的——由金融街资本领投,国信创投、亦庄国投、瑞丞基金、华新基金、亿航基金、广发干禾等机构共同领投。 建投投资、广州实业

    06-18

  • 2016年最贵新股步长药业IPO独家解密近600亿价值背后的发现者

    2016年最贵新股步长药业IPO独家解密近600亿价值背后的发现者

    拥有年度最贵新股称号的步长药业成功登陆主板18日在上海证券交易所上市。 步长药业发行的股票总数不超过10,000股。 创下今年最高发行价纪录——55.88元/股,总市值近亿元。   这家起家于陕西咸阳的民族中药企业生产的脑心通胶囊、稳心颗粒、丹红注射液等已成为国内心脑血管

    06-18