220万亿背后的富豪LP爸爸:我投资你是因为你的气质好,当然……
06-17
良渚文化村,除夕将至,孟章正靠在阳台上翻阅今年五福的信息,旁边还有刚晒干的酱鸭。
回想起来,这样的场景已经持续了四五年了。
家里的老人在2008年买了一部新的智能手机,这部新手机夺走了她人生中的第一个幸福。
那已经不再是最流行的那普赋了。
2020年1月28日(腊月十九)首次聚五福活动正式启动——“富贵祝福”、“和谐祝福”、“友谊祝福”、“爱国祝福” 》和《奉献祝福》——集齐五人共2.15亿元,可平分。
最终,不到80万人领取了全部5份祝福,平均每人收到的红包金额为0.66元。
当年,在支付宝上添加10个支付宝好友,就可以获得三张福卡卡。
有多少人拿着一叠福卡卡片走在街上,其中有四张丢失了。
“敬业福”是当年备受珍视的新年礼物,让支付宝瞬间火爆。
从那时到现在,奉献的祝福越来越多,“收五福”的行动也成为新年的一部分。
如今,收集五福已成为春节四大新俗之一。
当孟章靠在阳台上研究五福时。
几公里外的支付宝大楼内,一群技术人员正在一次又一次地重复这一年度定制的压力测试。
本届五福节技术总指挥陈亮(昵称:俊义)带领团队在除夕前10天左右完成了今年五福节的启动工作,随后从杭州出发前往北京。
他将于当天返回杭州,一切准备工作还没有结束。
俊义从PC时代进入移动互联网,如今已经在蚂蚁工作了16年。
去年他重新发现了移动互联网时代早期的兴奋。
不仅是俊义本人,在年底ChatGPT上线后,整个支付宝技术团队都非常兴奋。
今年春节的纪五福是俊义和支付宝尝试AI的机会,他不想错过。
12月28日晚上8点训练场开始,整个支付宝8楼挤满了人,最后一次测试开始了。
中午12点整,支付宝春节五福活动正式启动。
俊义和他的技术团队把这次五福聚会变成了五福节。
“五福节”将跨越整个春节,由短期活动升级为“数字庙会”。
整个周期包括三个阶段。
第一阶段是“五福年货节”,于1月10日启动,数万商家在直播间开播,为消费者提供热门年货;第二阶段是大家最熟悉的“收藏”。
《五福》1月29日正式开机;第三阶段是从大年初一开始的“元旦天天欢乐”。
这也是吉五福首次完全由AI驱动。
“大家来求福”是今年征集福卡的新方式。
所有图片均由AI生成。
通过像素级可控生成技术,生成超过10万张祝福图片。
用户可以一边寻找“福”字,一边与家人竞争寻找福卡。
除了寻找福卡之外,“表喜小剧场”、“会说话的红包”、“时空照相馆”等AI新玩法也首次上线。
仅仅一年的时间,没有人能清楚地知道年底ChatGPT的诞生意味着什么。
但这引起了所有人对人工智能的关注。
当然,也包括俊义。
他将这波大模型浪潮比作从经典力学向量子力学过渡的时刻,也似乎是另一个移动互联网的开始。
对于随移动互联网而繁荣起来的支付宝来说,这次“五福节”是一次难得的机遇。
如果人工智能成为新时代的基础设施,那么它必然有一天会有大规模的应用。
对于拥有9亿用户的支付宝来说,这样的新技术需要承受极限的压力测试。
一项新技术支持国家级项目后,开始应用于支付宝的日常技术支持中,然后通过开源和对外商业化,服务于外部合作伙伴和更多普通老百姓。
这就是蚂蚁内部技术的成长过程。
这已经不是第一次了。
自2008年加入支付宝以来,俊义一直走在技术的第一线。
从组建蚂蚁集团的SRE团队,到负责研发效率、AI Infra、数据库等基础设施建设,现任支付宝CTO在支付宝的前10年一直专注于双11。
双11从新玩法转变为全民消费心态的10年,也是支付宝快速成长的10年。
“2017年的时候,我记得淘宝给当时的CTO发了一封邮件——应该是逍遥子的——他们要举办一个活动,第二年就开始做‘双11’。
” 2017年,支付宝有2亿用户,现在已经是10亿了。
没有人比俊义更了解,当支付宝成为支付宝时,他经历了十多年双11的支付压力测试和技术支持。
“支付宝整个分布式技术的沉淀就是从那个时候开始的。
”双11成为支付宝首次内部技术迭代的契机。
一开始,蚂蚁集团自研的原生分布式数据库OceanBase就开始投入研发,试图去掉IOE中的“O”——Oracle。
从某种程度上来说,OceanBase是一个被双11逼出来的数据库,它需要熬过最严苛的极端场景。
经过3年的研发,支付宝于今年5月下线了最后一台IBM小型机。
今年双11午夜过后,交易峰值达到1万笔/分钟。
今年双11 10%的流量被砍到了OceanBase上,OceanBase 0.5版本首次成功应用于支付宝核心交易系统。
今年双11,OceanBase确实占据了领先地位。
蚂蚁交易创建%转移至OB,核心线会员、充值、支付转移比例达到50%。
现在OceanBase已经连续十多年稳定支持双11,成为金融领域市场份额最大的分布式数据库。
今年“双十一”期间,OceanBase日趋成熟,蚂蚁集团的绿色计算技术也迎来了首次大规模应用。
绿色计算主要分为两个方面。
物理层面,降低数据中心PUE(核心能耗指标,即数据中心总能耗/IT设备能耗);在算力层面,合理分配计算资源。
支付宝从软件技术入手,找到分时调度技术、AI弹性能力,然后加入成熟的线下混合部署技术作为技术方案。
在使用绿色计算技术之前,全球算力利用率与行业平均水平相同,为8%。
自2004年以来,研发投入四年内翻了数倍,达到近40%。
领导了支付宝分布式技术和绿色计算的俊义,被称为“双11技术总指挥”。
他还主导了支付宝小程序云的技术和产品发布。
大模型流行后,他立即带领团队进入了围绕大模型的这一新技术迭代。
如果说十多年前的第一次技术迭代是在支付宝扎根的话,那么现在的第二次迭代则是向上探索。
除夕夜22时18分,来自河南的张江按时打开了自己收集的五张福卡卡,领取了五福红包。
这是支付宝向全网用户发放奖金的第九年,今年依然是5亿。
支付宝公布的数据显示,今年有近6亿人通过AI技术过年。
累计发现用户近30亿个AI生成福字。
贾玲新电影《热辣滚烫》的换脸片段在五福“表喜小剧场”上线后,一天内近百万网友AI“参与”。
吉五福的AI是大规模应用落地的一次考验。
AI时代,它究竟在测试什么?“两个东西:算力上限和成本控制”,这是支付宝近四年来第二次技术迭代的核心。
参数以年复合增长率%增长,对AI算力的需求增长超过15万倍,这个增长曲线远远超过了摩尔定律,而如果未来出现AI应用的生态系统,对计算的需求。
支付宝在五福节期间推出了业界首款多人AI人像——时空影楼最多可支持6人同框——这还不足以满足需求。
一个大家庭的全家福,但6人已经是目前俊义团队测试后能达到的效果上限。
6人网上合影意味着包括单人照、情侣照、全家福等在内的近千对关系对,每种类型下有5-6个风格模板,每个风格模板最多有10种姿势可供选择,意味着支付宝拥有近3万个后端模板。
这是第一个敢于这样做的拥有数亿用户的产品。
其背后的计算能力在于Ant Basic大模型平台拥有10000-ka的异构集群。
目前蚂蚁基础大模型平台拥有万卡异构集群,其中千卡训练MFU可达40%,集群有效训练时间占比90%以上;在数据层面,除了全网通用语料和金融领域优质语料之外,蚂蚁还注入了优质的研究分析数据,以及大数据带来的超过1亿Token的知识-规模知识工程;在模型层面,蚂蚁认为金融专属指令能够更好地代表大模型和解决特定金融任务的能力,这些指令基于真实场景提取了超过60万条专属指令。
算力成功的背后是对算力成本的控制。
算力成本的控制将对大模型应用的常态化起到至关重要的作用,也将直接影响技术创新的速度。
随着算力成本的降低,可以为研究人员和开发人员提供更多的实验空间,促进新算法、新模型、新应用的创新。
而如果算力成本仍然居高不下,对大型模型训练和推理的需求不断增长也将转化为更多的能源消耗和更大的碳足迹。
通过优化计算效率、探索节能技术和新计算范式,精细控制算力成本已成为推动大模型技术发展和广泛应用的关键因素。
俊义透露,目前蚂蚁万卡异构集群的硬件计算效率(HFU)超过60%,集群有效训练时间占比超过90%。
同等模型效果下,RLHF训练的训练吞吐量性能较业界解决方案提升3.59倍,推理性能较业界解决方案提升约2倍,处于业界先进水平。
此外,蚂蚁的CPU利用率从去年的不足10%上升到去年的33%。
孟章也尝试过时空照相馆。
他通过支付宝点击进去,找到了“收集五福”的入口。
点击了三下,他终于找到了。
过程还是有点繁琐。
向爷爷介绍这个功能时,她直接搜索了“时空照相馆”四个字。
第15年的双11和第9年的吉五福,支付宝已经成为一个庞大而复杂的产品,而这也是俊义在谈论大模型时最兴奋的地方。
对于俊义来说,大型模型给世界带来的变化首先是在交互方面。
他对支付宝未来的愿景是,它或许能够摆脱复杂的图形界面,从GUI转向LUI产品。
这将为支付宝的界面乃至整个产品形态带来新的变化。
“我们希望从技术上把支付宝改成LUI的支付宝,不仅在手机上功能齐全,而且希望大家在开车的时候也能使用支付宝,让支付宝出现在按键上、出现在音箱上。
这就是我作为CTO的想法,基于技术趋势我们要做的就是在很多地方安装支付宝,同时使用大部分功能,这意味着支付宝本身推动技术迭代的逻辑也会发生变化,尽管AI的大规模应用仍然依赖。
人机协作,从Copilot到Agent的道路已经开始。
支付宝构建了完整的AI Copilot解决方案。
去年9月,蚂蚁集团首次开源大型代码模型CodeFuse。
CodeFuse是基于Ant基础大模型开发的。
在最近的代码完成度 HumanEval 评估中,CodeFuse 得分为 74.4%,超过了 GPT-4 的得分(67%),并超过了 WizardCoder-34B 得分的 73.2%。
CodeFuse最独特的地方在于它的微调语料库完全来自Ant内部的代码库,这使得它非常适合Ant内部的产品开发。

俊义表示,目前约有50%的Ant程序员在编写代码时使用Codefuse,其中AI生成的代码占比超过10%,大大提高了代码开发效率。
CodeFuse背后,基于万亿级Token语料库训练的百灵大模型已于今年11月完成注册,百灵多模态大模型也已进入内测阶段。
从AI基础设施到基础模型,再到行业大模型和应用产品,已经形成了一整套完整的技术链路。
这热闹的五福合集,也是支付宝迎接下一次变革必须集齐的“五福”。
一个全新的支付宝将从新的一年开始成长。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-17
06-18
06-17
最新文章
首先告诉我什么是智能汽车!
盲盒明星卡的暴利与泡沫:2元卡卖700万,直播卖卡月入百万
黑色星期五轰轰烈烈地回来了,结果这些中国企业扛起了全场
锂电池隔膜疯狂扩产:兴源材料欲夺回C位?
当我考上缅语专业时:凌晨三点我还在走廊里背单词,毕业后,我不仅仅是一名翻译者
被遗弃,被收获?老年人上网到底有多难?
海外日报 -今年,我国自主研发游戏海外实际销售收入实现两位数增长;三星电子正式成立机器人业务团队36氪海外·15分钟前
腾讯音乐:爱、相信、坚持