首页 > 科技未来 > 内容

零一五物发布千亿参数模型Yi-Large,李开复:中国大模型追赶美国,立志匹敌GPT-5

发布于:2024-06-21 编辑:匿名 来源:网络

时隔一年,李开复再次出圈“零一”呜呜”。

去年5月,零一五五成立,六个月后发布了首款中英双语大模型易系列。

从一开始,李开复就设定了一个雄心勃勃且艰巨的目标:“成为世界第一”。

自诞生以来就是“当红辣鸡”的零一玩物,也凭借着大厂背景和优秀模型表现的团队,估值达到了10亿美元。

今天,他们带来了第二个产品:Yi-Large 闭源模型。

进击全球SOTA大型模型 去年11月,零一五五发布的Yi-34B以其“甜点级”尺寸登上开源社区抱脸榜单,超越了Llama2-70B、Falcon等数倍大的模型-B,成为当时世界上最强大的开源基础模型之一。

半年后,零一五五正式发布参数规模千亿的Yi-Large。

在第三方权威评测中,零一五五易模型在全球头部模型的中英双语PK中表现出色。

在斯坦福评测机构AlpacaEval 2.0最新官方认证的模型排名中,Yi-Large模型的英语水平主要指标LC Win Rate(控制回复长度)排名全球第二,仅次于GPT -4 Turbo,胜率甚至排名全球第一。

此前,国产车型中只有逸和Qwen进入过该榜单的前20名。

智能地使用大型模型的一个重要前提是它必须知道你在说什么。

国外模型表现出色,但都是基于英语上下文。

然而,出生在国内的国内大模特在懂中文方面有着得天独厚的优势。

中文能力方面,在SuperCLUE更新的4月份基准表现中,Yi-Large也位列国产大型机型第一名。

亿大的中英双语综合能力展现了出色的表现。

在对大型模型的综合能力进行更全面的评测中,Yi-Large的大部分指标超过了GPT4、Claude3、Google Gemini 1.5等同类模型,达到了第一名。

在通用能力、代码生成、数学推理、指令跟随等方面,取得了优于全球领先者的成绩,稳居全球第一梯队。

随着各家公司的大模型能力进入力争对标GPT4的新阶段,大模型评测的重点也开始从简单的通用能力转向数学、编码等复杂的推理能力。

Yi-Large还在代码生成能力的HumanEval、数学推理能力的GSM-8K和MATH、领域专家能力的GPQA等评估集上取得了亮眼的成绩。

此外,从行业实现的角度来看,理解人类指令、契合人类偏好已经成为大型模型不可或缺的能力,指令跟随(Instruction Follow)相关评估越来越受到全球大型模型公司的重视。

斯坦福开源评估项目AlpacaEval和伯克利LM-SYS推出的MT-bench是两套英文指令符合性评估集,AlignBench是清华大学团队推出的中文对齐评估基准。

在国内外权威指令的评测集中,Yi-Large的表现优于国际前五名机型。

发布会上,李开复还宣布零一五五启动了下一代Yi-XLarge MoE模型训练,这将对GPT-5的性能和创新产生影响。

与此同时,零一也在考虑一些非常复杂的问题。

李开复总结了三个关键点:一方面要为技术的进步做好准备,能够生产什么样的车型;另一方面要做好准备。

第二,如何最小化推理成本,让我们点燃包容点;第三,还有传统的PMF来寻找用户需求。

李开复表示,这些考虑是他们在硅谷公司中普遍看不到的:这是我们独特的做法,也是中国独角兽公司的机会。

Yi-1.5全面升级,API平台全球上线。

在本次发布会上,零一易系列开源机型也得到了全面升级。

Yi-1.5分为34B、9B、6B三个版本,并提供Yi-1.5-Chat。

微调模型可供开发者选择。

从评测数据来看,Yi-1.5系列延续了Yi系列开源机型的出色表现。

数学逻辑和编码能力全面增强的同时,语言能力也保持了原有的高水平。

经过微调,Yi-1.5-6B/9B/34B-Chat在数学推理、编码能力、指令跟随等方面都达到了一个新的水平。

Yi-1.5-6B/9B-Chat在GSM-8K、MATH等数学能力评价集以及HumanEval、MBPP等代码能力评价集上的表现与参数级模型相差甚远,也比最近发布的 Llama-3-8B -Instruct 更好。

MT-Bench、AlignBench、AlpacaEval 上的得分在相同参数量级的模型中也处于领先地位。

去年,零一五五选择开源推出Yi系列模型,其优异的性能得到了国际开发者的高度认可。

2019年11月Yi开源版本上线后的第一个月,就占据了开源社区热门模型排行榜近50%的份额。

发布一个月后,Yi-34B 就被纳入 Nvidia Large Model Playground。

在大型车型开发、产品落地等问题上,李开复也有自己的解决思路。

李开复在接受APPSO采访时表示:我们是AGI务实的信徒。

我们必须用最少的芯片和最低的成本来训练出最好的模型。

同时,我们也会继续探索和寻找TC-PMF。

与硅谷公司相比,国内初创公司的不同之处在于我们可以仰望星空,但我们也可以脚踏实地。

零一唯一的思考是,万物不会凭纯粹的武力产生奇迹,追求用百亿美元还是千亿美元能做到。

OPEN AI有资格尝试这条路,但这并不是他们想要走的路。

当然,他们不会花时间去预测AGI的燃点,但他可以肯定地告诉大家,与他们更相关的是AI普惠。

观点。

今天,零一五五还宣布,已向国内市场一次性发布了Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-K、Yi-Vision、Yi-Spark等多个模型API接口。

时间。

易API平台英文站同时向全球开发者开放试用申请。

其中千亿参数规模的Yi-Large API拥有超强的文本生成和推理性能,适用于复杂推理、预测、深度内容创作等场景; Yi-Large-Turbo API 基于性能、推理速度和成本。

均衡高精度调优,适合全场景,高质量推理和文本生成。

Yi-Medium API的优势在于能够遵循指令,适合常规场景下的聊天、对话、翻译等场景;如果您需要超长内容文档相关的应用,还可以选择Yi-Medium-K API,它可以一次解释20万字的文本; Yi-Vision API具有高性能的图像理解和分析能力,可以服务基于图像的聊天、分析等场景; Yi-Spark API注重轻量级和极快响应,适用于轻量级数学分析、代码生成、文本聊天等场景。

更重要的是,已经有实际应用,为胰腺肿瘤患者设计的“小胰腺”就是其中之一。

小医宝AI助手可以每周7天、每天24小时向患者介绍全面的治疗知识。

这个助手背后的技术支撑就是零一的万物之理模型。

使用Yi API调用大AI模型后,小胃宝突破了胰腺肿瘤治疗的信息壁垒,可以准确、系统地向胰腺肿瘤患者呈现胰腺癌治疗路线图和治疗方案。

目前,这个慈善项目已经帮助了很多胰腺肿瘤患者。

一站式工作平台 今天的发布会还介绍了零一五五近期推出的一站式人工智能工作站“万智”。

据官方介绍,万智是专为中国用户打造的一站式人工智能工作平台。

可以制作会议纪要、周报、写作助手、解读财务报告、论文、制作PPT。

它是中英文双语的,并且完全免费。

目前,用户可以通过官网和微信小程序“玩智AI”登录体验。

发布会上,万智官方举了一个很实际的例子:你刚到公司楼下,突然被领导要求做会议演示,但电脑不在身边。

现在通过玩智,您??可以在手机上输入您想要演示的主题。

然后等你从电梯到工作站的两分钟内,万智网页上的PPT就已经准备好了。

之后只需进行一些简单的文字、图片和修改即可直接使用。

除此之外,万智还有很多其他的功能。

首先是文档阅读能力。

万智AI助手可以快速阅读和理解大量文档内容,包括长文档和复杂的财务数据。

它可以在几秒钟内提取关键信息,并支持中英文双语阅读。

其次,在一般问答场景中,万智也展现出了出色的产品表现,能够快速给出合适的答案,并提供专业、快速的反馈。

此外,万智AI助手不仅支持文本输出,还可以以表格、公式、代码等多种形式展示信息,让工作报告和人生规划更加清晰。

最后,万智AI助手可以实时访问互联网信息,确保用户获得的数据和见解是最新、最准确的。

据万智团队研究观察,使用万智后个人工作效率平均提升50%以上,特别是在知识检索、文档构思和写作等方面,节省了大量时间。

目前,万智AI助手完全免费向用户开放。

万智官方表示,类似大机型的应用必将成为今年在国内的重要落地点。

李开复还提到,今年将是AI生产力工具元年,因为今年有些领域将会爆发。

他认为AI-Frist的真正价值在于谁来打造一个AI抖音、AI微信、AI淘宝?零一希望他们能够充当这样的点火者。

但整个AI的包容点不会同时到来,某些领域的应用要求会非常高。

比如说我们现在做的生产力工具,用户最终要对这个生产力工具产生的内容负责。

所以如果里面有一些错误,不完美,需要微调,甚至是一些小量的错觉,最终决定是否可以修改的是用户,所以用户的指标就是我能否产出更好的内容比没有此工具的时间更快。

李开复表示,TC-PMF实际上已经实现了,但还可以更好,所以今年肯定会在生产力工具中发生。

目前,零一五五海外生产力应用用户总数已接近千万,今年单款ToC产品收入达亿元。

李开复透露:我们的ROI还在1左右。

因此,这样的成绩是非常有优势的,至少从国内大型模型公司的角度来看。

年初,当国内大型模型领域混战时,各种评测榜单铺天盖地,有不少车型登上了各大榜单的前茅。

AI 1.0时代,人工智能尚未展现出高度的泛化和涌现能力,针对头部客户的私有化部署模式已成为主流。

然而,时间证明,以项目为导向的重交付模式带来的收入增长存在上限,其可持续性挑战严峻。

如今我们正处于AI 2.0时代,人工智能进入了新的发展阶段。

与1.0相比,AI 2.0标志着从基于规则的自动化处理向深度学习和自主学习能力的飞跃。

由此看来,AI领域的“百团大战”只会愈演愈烈。

去年以来,越来越多的国产大型车型在激烈的竞争中脱颖而出,也在全球知名榜单中取得了骄人的成绩。

今年,行业将进入更加现实的商业落地阶段,用户将根据应用端展现的能力用脚投票。

零一五物发布千亿参数模型Yi-Large,李开复:中国大模型追赶美国,立志匹敌GPT-5

如何在基础模型能力的基础上,尽可能提高应用效果,是追赶TC-PMF的重要问题。

李开复说:一年前,中国的大模式感觉太落后了(美国)。

但今天我们很自豪地说,我们狂奔了一年,就车型而言,我们至少赶上了一年前发布的美国顶级(大车型)产品。

当然,未来我们还会继续努力。

但是,我们需要有沉淀,对未来有展望,不能只是疯狂奔跑。

在长江后浪推前浪的AI时代,对于用户来说最大的意义就是在厂商的竞争中认识AI、了解AI、使用AI,甚至将其带到工作、学习和生活中。

而这也是AI技术的初衷和归宿。

零一五物发布千亿参数模型Yi-Large,李开复:中国大模型追赶美国,立志匹敌GPT-5

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 疫情影响下的MWC:赞助商退出、湖北人员被禁止入场、参与者“不握手”

    疫情影响下的MWC:赞助商退出、湖北人员被禁止入场、参与者“不握手”

    目前看来,新冠病毒疫情对科技行业的影响不小。 半个月后,科技界将集体聚焦西班牙巴塞罗那世界移动通信大会(以下简称MWC)——全球移动通信领域规模最大、最重要的贸易展会,全球移动通信发展风向标。 移动新技术。 。 每年的MWC上,各大厂商都会发布自己的最新设备,吸引了

    06-17

  • BOSS直聘计划下半年赴美IPO,融资5亿美元,

    BOSS直聘计划下半年赴美IPO,融资5亿美元,

    BOSS直聘计划下半年赴美IPO,融资5亿美元。

    06-17

  • 餐饮行业客服机器人:快速响应客户需求

    餐饮行业客服机器人:快速响应客户需求

    .wp-block-column h3{margin-left:0} 在餐饮行业,客户服务质量直接影响客户满意度和品牌形象。 近年来,随着技术的快速发展,客服机器人逐渐成为推动行业变革的关键因素。 其中,GaussMind客服机器人凭借出色的语音识别和智能回复功能,为餐饮行业提供了无与伦比的客服体验。

    06-17

  • 车云计算公司智协慧通获数千万元融资,由缤富资本

    车云计算公司智协慧通获数千万元融资,由缤富资本

    投资社区(ID:pedaily)领投。 8月10日消息,智协慧通近期完成数千万元A1轮融资。 本轮融资由宾富资本领投,富资本领投,瑞穗MLI基金、老股东MLI基金、世奇投资跟投,易博资本担任融资顾问。 智协慧通成立于2007年,业务定位是基于边缘计算、数据库等基础软件技术,为智能汽

    06-17

  • 分布式HTAP数据库初创公司“泽拓科技”完成A轮融资

    分布式HTAP数据库初创公司“泽拓科技”完成A轮融资

    投资社区(ID:pedaily)4月6日消息,分布式HTAP数据库初创公司“泽拓科技”近日宣布完成A轮融资。 投资者正在为复星创造财富,老股东常春藤资本持续加大投资。 本轮资金将主要用于产品研发和团队建设。 泽拓科技成立于2007年,是一家专注于于云原生分布式HTAP数据库的初创公

    06-17

  • 加密货币交易所Coinbase申请上市,估值或达千亿美元

    加密货币交易所Coinbase申请上市,估值或达千亿美元

    据美国证券交易委员会官网消息,加密货币交易所Coinbase披露S-1注册声明文件,离上市又近了一步清单。 文件显示,Coinbase计划在纳斯达克上市其A类普通股,股票代码为“COIN”,高盛、花旗集团、摩根大通等公司担任财务顾问。 据彭博社报道,该公司股票估值近1000亿美元,可

    06-17

  • 维修工单制度:制造业售后领域变革的源头

    维修工单制度:制造业售后领域变革的源头

    .wp-block-column h3{margin-left:0} 1.引言随着制造业市场竞争的加剧,售后服务已成为为企业带来竞争优势。 关键环节。 维修工单系统作为制造售后领域的重要工具,发挥着越来越重要的作用。 下面我们将通过一些具体的例子来深入探讨维修工单系统在制造售后领域的应用和意义。

    06-17

  • 德邦基金总经理陈星德辞职,一季度公司规模下跌5.62%

    德邦基金总经理陈星德辞职,一季度公司规模下跌5.62%

    今日德邦基金发布公司高级管理人员换人公告。 陈星德因个人原因辞去公司总经理职务。 辞职日期为2020年5月17日,无调动其他职务的情况。 邮政。 据悉,代理基金经理总经理是左昌。

    06-17

  • 美国品牌聚合初创公司「Heyday」获 5.55 亿美元 C 轮融资,估值超 10 亿美元

    美国品牌聚合初创公司「Heyday」获 5.55 亿美元 C 轮融资,估值超 10 亿美元

    总部位于旧金山的初创公司「Heyday」近日宣布完成 5.55 亿美元 C 轮融资,融资方为Raine Group 和 PremjiInvest 共同领投,其他参与方包括现有投资者 General Catalyst、Victory Park Capital 和 Khosla Ventures。

    06-18

  • 相约重庆,畅谈AI——创享百城·重庆人工智能助力产业创新发展论坛诚邀您报名

    相约重庆,畅谈AI——创享百城·重庆人工智能助力产业创新发展论坛诚邀您报名

    人工智能的崛起,标志着一个以数据驱动、以数据为驱动的新时代的到来基于智能的一个以技术为核心、以技术为催化剂的时代。 为推动中小企业在AI智能时代有效运用前沿技术提升自身效率和能力,阿里云打造“创享百城”主题论坛活动,旨在帮助中小企业中型企业深刻理解数据背后的

    06-18

  • 创业不易,我们与您同在!双11创业节火热进行中

    创业不易,我们与您同在!双11创业节火热进行中

    热销产品买买买!在云上创业 Go Go Go!阿里云双11创业节持续火爆,宝宝创新团队陪你云上创业。 【数百款创业服务产品低至0.40折】热门云产品,全年最低价新客户特别优惠,云服务器起价低至0.40折,从IT技术开发、网站建设、品牌营销、融资对接、工商知识产权都有适配的产品,

    06-18

  • 小鹏汽车树立2024年旗帜:3年推出30款汽车,新增员工4000人,智能驾驶投入35亿

    小鹏汽车树立2024年旗帜:3年推出30款汽车,新增员工4000人,智能驾驶投入35亿

    2月18日,龙年开工第一天,小鹏汽车CEO何小鹏写道致全体员工的一封信 内部信就像一位将军鼓励战士,言语中充满了战斗的味道。 信的开头,何小鹏首先回顾了明年,称这是“痛并快乐着”的一年。 我们在组织、规划、业务、运营、效率等方面进行了多方面的调整。 我们经历过痛苦,

    06-18