燧炻创新获数百万元天使轮融资
06-18
万万没想到,今年的《》竟然从AI大模开始。
短短几天,腾讯、阿里巴巴、百度、科大讯飞等国内大型机型纷纷降价,让我们提前感受到了淳朴的“购物节”氛围。
▲目前国产大车型降价汇总。
不过在展会开始之前,我们先来了解一下这些厂商所说的大机型价格到底意味着什么。
通常情况下,大型AI模型公司训练完自己的闭源大模型后,会将其API(应用程序编程接口)出售给开发者并收取费用。
▲PI在酒店就像服务生。
图片来自 hububbble.com。
基于大模型API,开发者通过喂数据、微调等方式进行优化,这是很多大模型厂商的变现模式。
不难看出,大机型价格的变化可能不会直接影响消费者,但会直接影响开发者制作应用的成本。
虽然目前也有一些大型AI模型公司采用会员制、按时段等模式,但一般都是按使用量计费,类似于手机数据套餐,只是计费单位从GB流量改为token。
但token与汉字字母的对应关系目前还没有统一标准,各公司也有自己的定义。
据此前消息,腾讯1 tok en≈1.8个汉字,统一钱文1 tok en=1个汉字,有的还有1 tok en≈0.5个汉字。
▲ 图片来自冰剑技术研究院。
因此,各个公司的计费标准有所不同,但一般都遵循大模型规模越大价格越贵的规律。
毕竟这里有培训费用。
现阶段各大厂商仍在探索销售API调用的商业模式。
很多厂商都在尝试通过各种方法增加大模型的API调用,但是增长并不明显。
在这种情况下,大模型API的降价可能会吸引一些开发者从“免费试用”开始尝试AI应用,这对于抢占市场、激活市场具有一定的积极意义。
这就是这场“战争”的前提和背景。
准备,投降! 5月6日,欢方量化率先打响了这波降价“战”的第一枪。
其大型型号DeepSeek-V2的价格降至每百万输入仅1元。
还推出了“登录就送W tokens”口号。
5月11日,智浦大模也“跟上步伐”,推出新的优惠措施,新注册用户可获得的金额从10,000 tokens增加到10,000王牌。
入门级产品GLM-3-turbo的价格从每百万5元降至1元,降幅达80%。
在公布售价时,他还“亲密”地将自己的GLM-3-turbo与阿里巴巴、百度、ChatGPT进行了比较,火药味十足。
随后,云厂商的进入将这波降价“战争”推向高潮。
5月15日,字节跳动宣布:“大机型降价了!”火山引擎总裁谭代宣布,豆宝主力机型在企业市场的售价为0./千tok,对比百度、阿里及市场上同规格机型的定价,一般为0.12/千tok,实现“从分钱到分钱”的价格内卷化。
他还举了个例子:“一元钱可以买一万个tok,豆宝的主力型号。
”大约一万个汉字,相当于生成三本书《三国演义》。
5月21日,面对字节跳动的价格战,阿里云相关负责人反击称:“友好的商业模式公司提出了各种降价主题。
降价的目的是为了让市场受益。
中国有什么样的降价?”公司真正的降价能力和资本取决于模型原型能力是否领先、是否有推理资源、当前模型是否已经被很多用户使用、大模型是否是核心业务。
”同时,阿里云也表示,打着“突破全球最低价格”的口号,旗下9款大机型集体降价,其中“GPT-4级别”辅助机型Qwen-Long的价格已经下调。
减少到每百万个tok的投入为0.5元,产出为2元,也就是说,1元可以购买1万个tok,相当于5本书的文字量,但价格仅为GPT-4的1/左右。
仅仅几个小时后,另一家一直被比较的公司百度也出手了,直接完全免费了两款主打机型ERNIE Speed和ERNIE Lite。
旗下大机型中,是目前百度文心大机型系列中服务用户最多的机型。
5月22日,科大讯飞还宣布将加入“降价大赛”,永久开放科大讯飞Spark Lite API。
免费,科大讯飞Spark Pro/Max低至0.21元/万元。
上面写着,“使用科大讯飞Spark 3.5生成《雨花《活着》内容仅需2.1元。
”同日,腾讯云宣布加入大模型降价阵营,旗下混元-lite模型API价格全面免费,从0.0元/千tok开始,新推出的混元-标准和最高配置万亿参数模型混元。
-Pro API 价格已降低,立即生效。

至此,几乎所有大型模型厂商都已入局。
似乎一夜之间,大机型集体开始疯狂降价。
“价格战”背后的技术创新不仅是国内厂商,以OpenAI为代表的国外大机型也在不断降低大机型的价格。
虽然不如国内厂商集中度高,但行动却比国内厂商早。
2020 年 3 月推出的 GPT-3.5 Turbo 将每千个 tokens 的成本降低至 0.00 美元,比之前的 GPT-3.5 Turbo 降低了 90%。
11月发布的GPT-4 Turbo,输入价格仅为GPT-4的1/3,输出价格为GPT-4的1/2。
最近发布的 GPT-4o 比之前的 GPT-4 Turbo 快了 2 倍,但价格却是之前的一半。
今年以来已连续四次降价。
不难看出,对于OpenAI来说,降价已经成为其不断升级、拓展市场的核心策略。
其他大型车型如Gemini也不忘在性能后加上价格变化,大幅降价已成大势所趋。
事实上,无论是国内大模型还是国外大模型,降价的根本原因是推理成本的快速降低。
不久前,DeepSeek-V2在论文中向我们介绍,它利用MLA(Multi-head Latent Attention)结合MoE(Mixture-of-Experts专家混合模型)实现模型性能的跨级提升。
同时减少计算量、现有推理和成本案例。
感兴趣的朋友可以点击查看原文:CEO李开复在近期接受采访时谈到最近的降价狂潮,还认为“预计整个行业每年都会降低10倍的推理成本,而且一定会发生” ”。
不过,他也表示,目前出现的是一种不可持续的“ofo式”双输做法,“如果技术不好,我们就纯粹靠折扣、靠亏损来做生意,我们绝不会效仿这样的做法”。
进行定价。
”这源于他对自己的大模型的信心。
“就像特斯拉一样,他不会因为其他品牌的汽车比他便宜就降价。
”然而,我们都知道特斯拉其实不一样。
如果他不降价,他甚至可能成为降价先锋。
不知道他的言论今后会不会成为“回旋镖”。
▲创新工场董事长兼首席执行官李开复,图片来自网络浪潮。
除了李开复之外,百川智能创始人王小川对这场价格战也有不同的理解:“我感觉就像原来的滴滴美团,这会刺激整个to B市场更快繁荣,大家会更愿意去尝试。
”他认为,价格战实际上会提醒那些因为害怕落后而盲目进入大模型行业的厂商重新考虑自己的定位,淘汰掉一些“没有想清楚”的企业。
“潮起潮落,终有珍珠,里面一定有泡沫。
价格战会让泡沫更加繁荣,并不代表没有泡沫。
在之前的泡沫中,许多公司觉得他们必须训练模型,这是不健康的,市场上不需要那么多模型提供商,也不需要几千个模型的战争或万个模型的战争。
” ▲百川智能CEO、猎豹移动董事长兼CEO傅盛认为,这就是大机型的同质化。
业绩无法打破差距后的无奈之举:“这次大降价基本上宣告了大车型初创公司必须寻找新的商业模式。
短期内,大车型的性能遇到了瓶颈,无人能获得。
”没有人能拿出王牌,降低推理成本和销售价格已经成为每个公司的首要任务。
毫无疑问,各大厂商纷纷降价,这对于很多初创公司来说意味着更多。
大型模型行业,竞争压力很大。
事实上,当一个行业进入全面降价阶段,就意味着大规模淘汰竞争的开始,最后往往只剩下几家企业。
看到,在行业发展初期,由于“窗户”的巨大诱惑,市场上常常出现各种良莠不齐的企业相互竞争,但经过一轮或几轮大规模降价后,行业出现了一些良莠不齐的现象。
重新洗牌,效率低下。
高绩效的公司被挤出市场。
目前,AI领域的这一进程似乎正在加速,尤其是对于大型号在市场上不具备优势的厂商来说。
但另一方面,大机型的降价对于用户来说是个好消息,因为这意味着他们可以以更低的成本接触和使用先进的AI技术,更容易在市场上产生优秀的AI应用。
。
但目前整个行业的商业化还远未形成生态系统。
国内除了大型模型公司外,AI应用的开发团队还存在很大差距。
根据百度最新公布的数据,文信大模型每天处理1亿条文本,字节跳动每天处理1亿条文本,但其中很大一部分是大厂商内部业务利用AI应用和业务探索。
可见,整个行业尚未形成生态系统。
彭博社分析师此前也指出:“中国在人工智能领域将面临漫长的盈利之路,行业洗牌可能会促进行业盈利,但这似乎不太可能很快发生。
”成本问题一直是限制行业发展的重要因素。
IDC预测,2019年中国AI大模型市场将达到1亿美元,人工智能将进入大规模落地的关键期。
我相信,随着大型号价格的下降,以及多模态的发展,推理速度的加快,成本的降低,搜索、AI PC/手机或者其他消费电子将成为广阔的空间。
开发人工智能应用程序。
这样的机会或许会让很多人回想起互联网鼎盛时期。
事实上,两者确实有很多相似之处。
这也是黄仁勋说当前时代是“下一次工业革命”的重要原因。
边际成本的下降可能是AI平台革命的直接原因。
A16Z合伙人马丁·卡萨多曾认为,历史上曾出现过两个因边际成本下降而引发平台转移和产业革命的案例,分别是芯片和互联网。
芯片的诞生,使计算的边际成本降低到接近于零。
在此之前,计算必须手动完成。
人们被要求在一个大房间里徒手制作对数表。
随后引入了ENIAC等机器,计算速度迅速提高了四个数量级。
随后的计算机革命带来了大量新产业,振兴了很多企业,催生了一批新企业。
然后到了互联网时代,配送的边际成本降到了0。
以前,无论你寄什么(一个盒子或一封信),都需要花费一定的费用。
互联网出现后,每比特的价格急剧下降。
也是四个数量级的提升,带动了相关产业的快速发展,引领了互联网革命。
这一时期,以亚马逊、谷歌、Meta等公司为代表涌现。
与上述两项技术类似,人工智能也是一场成本驱动的生产力革命。
大模型将创造的边际成本降低到0,比如创造图像、语言理解等,他也举了这样的例子。
如果你想创造一个关于你自己的皮克斯风格的动画角色,一个大模型大约需要 0.01 美分,只需要 1 秒,但雇用一个平面设计师一小时大约需要 1 美元,甚至更多。
人工智能不是稍微好一点,而是更便宜并且速度更快。
▲ 比较人工智能和图形设计师之间生成图像所需的成本和时间,英国经济学家 William Stanley Jevons 观察到,提高煤炭使用效率的技术改进反而会导致广泛行业的煤炭消耗量减少增加。
他认为,与许多人的直觉相反,效率的提高会导致价格下降,从而刺激更多的需求。
换句话说,当技术进步提高了资源利用效率,但成本降低导致需求增加时,资源消耗率不降反增。
这就是著名的“杰文斯悖论”。
▲ William Stanley Jevons (.9.1—.8.13) 过去,芯片和互联网就是这样的资源。
由于其计算和信息效率的提高以及价格的降低,刺激了更多的需求,产生了更多的价值和服务,催生了新的平台转移和产业革命,从而提高了生产力和人们的收入,最终改变了整个世界的面貌和生活。
我们每个人。
这是多年前芯片和互联网的故事,也是今天正在发生的人工智能的故事。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-17
06-18
06-17
06-18
06-18
06-18
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态