首页 > 科技未来 > 内容

Step Stars：大模型“新游戏”中的新玩家

发布于：2024-06-18 编辑：匿名来源：网络

在2019年3月23日的全球开发者先锋大会上，通用大型模型初创公司Step Stars正式发布了Step系列通用模型。

大模型包括Step-1千亿参数大语言模型、Step-1V千亿参数大多模态模型、Step-2万亿参数MoE语言大模型预览版。

据Stepstar CEO姜大昕介绍，2019年8月，一次性训练出千亿参数的Step-1大规模语言模型，仅用了两个月时间，综合性能超过GPT-3.5； 11月，千亿参数多模态语言模型训练成功。

大模型Step-1V也已经训练完成； Step-2万亿参数MoE语言大模型预览版是国内大模型初创公司发布的首个万亿参数模型。

过去一年，国内大型模型领域经历了一场“百模型大战”。

20年过去了，这家初创公司为何现在出现？因为“新游戏”已经开始了。

虽然在过去的一年里，每隔一天就有一款新的大机型正式官宣，不到10月的时间里就有超过3款大机型，但现在回想起来，很多机型已经悄然沉默，停止了更新。

一个变化是，业界围绕Scaling Law（即模型尺寸扩大带来的性能提升）的共识逐渐清晰。

业界关心的问题不再是单纯的模型发布，而是模型能否继续遵循Scaling Law的路径，不断提升规模和性能。

在这个新阶段，谁能掌握缩放法则的力量，谁就能在这场“新游戏”中脱颖而出。

同时，多模态也是这场“新游戏”的关键。

OpenAI的发展轨迹以及Sora最近对大家的影响都证明了这一点。

文本模型发展到一定阶段后，多模态模型将成为AGI的重要路径。

步星选择这个时刻来揭晓过去一段时间的“跳水成绩”。

自成立以来，步星就在算力、数据、算法、系统四大要素上进行了全面布局，坚定投入在大模型技术道路上攀登Scaling Law。

成立初期就实现了多模态理解和生成统一，是通向AGI的必由之路。

他们相信自己来得正是时候，甚至在这场“新游戏”中占据了领先地位。

01 千亿起步，万亿在路上。

擅长多模态理解的Model Step Star，这家自成立以来就备受关注的大型模型公司，在3月23日的全球开发者先锋大会上正式发布了模型。

一年积累的成果——Step系列通用大型模型。

第一个是Step-1千亿参数语言模型，历时两个月训练成功，并已全面打磨。

其在逻辑推理、中文知识、英语知识、数学、编码方面的表现全面超越GPT-3.5。

Step-1V千亿参数多模态大模型在我国权威大型模型评估平台“OpenCompass”多模态模型评估榜单中排名第一，性能与GPT-4V相当。

尤其值得注意的是，Step-1V具有出色的多模态理解能力。

它可以准确地描述和理解图像中的文本、数据、图表等信息，并基于图像信息实现内容创作、逻辑推理、数据分析等多项任务。

此外，Step-1V还可以实现视频理解。

Step-1V理解与分析能力展示 |来源：步星官网同时，步星还发布了Step-2万亿参数语言大模型的预览版，提供API接口供部分合作伙伴尝试。

该模型采用MoE架构，专注于深度智能的探索。

据了解，参数数量从千亿增长到万亿数量级，对算力、系统、数据、算法提出了极高的要求。

业内只有少数企业能够做到这一点。

Step-2万亿参数语言大模型预览版 |来源：步星官网能够成功一次性训练千亿个参数，高效训练万亿参数模型，体现了步星的核心技术能力，而这背后是AGI的核心团队旨在设计更精准。

Step Star的CEO姜大昕也是该团队的算法负责人。

当他第一次接触ChatGPT时，他感到震惊。

多年的研究工作让他清楚，对于自然语言处理来说，常识和推理是最困难的两个问题。

以前，如果向聊天机器人询问年龄，一般基于检索的聊天机器人无法使用今天的日期。

如果减去常识中的“出生”日期，你会给出一个随机答案，但 ChatGPT 给出了不同的答案，“我当年受过训练，今天是当年的日子，所以我 3 岁”今年。

”常识和推理能力已经存在。

姜大昕认识到ChatGPT是一次划时代的技术变革。

但如果他继续留在微软，他只能在OpenAI模型上做一些应用。

模型的“黑匣子”不会向他开放。

他要打开模型的“黑匣子”，做自己的算法，自下而上做。

更大的颠覆是，“这是让我真正充满激情的一件事，我必须自己做。

”创业的想法就是在这里形成的。

有了想法，下一步就是组建团队。

姜大昕认为，大型模型的开发非常依赖于数据的质量。

目前负责步星数据团队的焦滨兴博士是前微软Bing引擎核心搜索团队负责人。

此前在微软工作了11年，基本研究了搜索引擎相关，这些经验，尤其是Bing搜索引擎在跨语言数据上的独特积累，对于中国大模型训练数据的优化和训练效率的提升至关重要。

和质量。

对于大型模型来说，除了算法和数据之外，重要的是系统。

只有足够强大的系统能力，才能不断探索缩放法则的“无限算力”要求。

步星系统负责人朱一波也曾在微软研究院工作过很长时间，对于单集群万多卡的系统搭建和管理有很多实践经验。

如此庞大的算力系统的经验是极其宝贵的。

在一线经历了过去10年的AI更新迭代，当ChatGPT模型的大潮到来时，姜大昕三人意识到，“这是一个非常大的技术变革，我们必须自己结束它，用最快、最灵活、最全面的变革方式”2017年4月，步星成立，国内算法、数据、系统最强的团队组合诞生。

姜大昕坚信，他的团队是该国最能应用规模法则的团队。

同时，步星与国内其他大型模型公司最大的区别在于，它不仅仅只是复制和追赶OpenAI的文本模型能力，而是追求多模态理解和生成的统一，因为他认为如果它最终的目标是实现AGI，那么这种统一是最重要的路径。

这也是随着过去一年技术发展不断拨开迷雾而日益清晰的判断。

多模态能力也是步星的核心优势之一。

从OpenAI推出Sora可以看出，语言模型的发展一方面在Scaling Law下看到了明确的路径，同时语言模型也在进一步推动多模态能力的突破，比如GPT- 4V为Sora训练标志着大模型的作用带来了令人兴奋的新发展空间。

因此，多模态领域大模型的后续发展，尤其是理解和生成的统一，是一个“新游戏”，也是一个更重要的方向。

了解步星不仅训练了自己的大模型，还围绕Step-1和Step-1V千亿参数大模型推出了两款C端产品、效率工具“阅文”和AI开放世界平台“风险”。

“泡鸭”现已全面开放使用。

《泡泡鸭》有剧情、有人物，用户可以开放探索。

以有趣好玩为主，强调模特的高情商； “阅文”是效率工具，注重实用性，强调模特的高智商。

同时，这两款产品的共同点是在多轮对话、执行指令、进行逻辑推理方面都有很强的表现。

《悦文》与《泡泡鸭》|来源：步星官网此外，步星还与财联社、中文在线、中国知识基建等合作伙伴在财经、网络文学、知识服务等领域达成深度合作。

合作推广大模型应用。

02 “新游戏”需要新玩家、新能力。

虽然这是步星第一次正式亮相，但其实在一年前就已经开始布局。

去年4月，步星成立。

7月，开始训练千亿参数模型Step-1。

8月底培训取得圆满成功。

11月，还训练了千亿参数的多模态模型Step-1V。

图片来源：GDC大会之所以时隔一年仍有勇气进入“百模型之战”，是因为步星在算力、系统、数据、算法四个方面都有自己的技术自信。

在算力方面，步星科技自成立以来就意识到算力的重要性。

它自建机房，同时租用云端算力。

目前，步星拥有相应的计算能力来训练万亿参数模型。

同时，正是因为团队深知算力是稀缺且宝贵的，步星也强调了系统的重要性。

该系统的优点在于，如果系统设计和优化得当，可以放大计算能力的利用率。

姜大昕在采访中表示，“说到系统，如果有几万张卡，裸机放在一起是没有用的，也没有办法训练模型。

要训练模型，必须建立一个系统并在其上形成高性能系统。

”一个培训平台。

难点在于将数万张卡放在一个集群中，同时又保证集群的稳定性和效率。

一不小心，就会踏入陷阱。

”之所以步步没有踏入陷阱，是因为朱一波博士建立并领导的强大的系统团队。

据悉，朱一波有很多单集群一万多张卡的系统建设和管理的实践经验，源于姜大昕及其团队对AGI的追求。

多模态理解和生成的统一是唯一可行的道路吗？业界领先的OpenAI实际上正在走这条路，尽管它最近的动作令人眼花缭乱，包括DALL·E、Sora的推出。

，还有对机器人公司Figure的投资，还有去年“宫斗”期间还传出的神秘Q*计划……但这些举动对于姜大昕来说其实是有其来龙去脉的：一条主线+两条支线。

lines：主线：大模型的演化——这个演化分为三个阶段：早期：语言、视觉、声音等不同模态独立发展，各自学习如何表示特征。

当前阶段：虽然多种模式开始融合，但理解模型和生成模型是分开开发的。

其结果是理解模型理解能力强但生成能力弱（如GPT-4V），或者生成模型生成能力强但理解能力弱（如Sora）。

“人类无法创造他们不理解的东西。

”这句话也适用于AI。

为了解决这个问题，理解和生成必须统一在一个模型中。

Step Stars：大模型“新游戏”中的新玩家

也就是说，多模态理解和生成的统一是通向AGI的必由之路。

年初Sora车型的发布，拉开了这一切的序幕。

未来阶段：理解与生成的统一，可以进一步与具身智能结合，形成世界模型。

更进一步，在世界模型的基础上增加规划复杂任务的能力和总结抽象概念的能力，已经真正进化到了AGI阶段。

第一个分支：体现智能。

将多模态模型应用于机器人或其他设备，以便它们能够与物理世界交互、自主收集数据并构建世界模型。

在此基础上增加复杂任务规划能力和抽象概念归纳能力，实现AGI。

OpenAI 对机器人公司Figure 的投资是体现智能的一个分支。

第二个分支：超对齐。

通过Q*计划等，OpenAI可能正在解决系统对齐问题并补充系统2（大脑的复杂任务规划、抽象概念归纳等能力）。

OpenAI的发展道路给姜大昕和核心团队带来了启发，但事实上，步星从一开始就已经确定了路径。

为此，在公司办公室，绘制了单模-多模-体现智能世界模型的发展阶段图。

Step Star此次推出的Step-1和Step-2是单模态语言模型，Step-1V是多模态理解模型，其他正在开发的模型都是沿着这个思路开发的。

他甚至觉得，从技术发展的现阶段开始，或许是一件好事。

“如果AGI是一座需要长期攀登的高山，那么看到正确的道路并建立正确的能力比早走几步更重要。

”姜大昕觉得，这一年来，虽然公司一直在低调前行，没有露面，但他始终处于创业兴奋的状态。

他感叹道，“人工智能一日，人类世界一年，我们每天都会被很多新消息轰炸。

世界变化真快。

在微软，我只看到这些新闻，但它有什么？”与我有关吗？我只是觉得整个世界都在我身边呼啸而过，让我在风中凌乱，所以我不得不开始创业。

现在，距离“百模之战”已经过去了一年，并且不乏另一种模式的结局，但行业的发展也进入了新的周期，从GPT-4到Gemini，多模态能力成为新的焦点，也是步星过去一年的积累。

它所设定的发展方向，或许就是支撑其此时正式登场，成为“新游戏中的新玩家”的底气。

*头图来源：GDC大会本文为极客公园原创文章。

转载请联系极客君微信geekparkGO #阿里云#创新创业#创业支持#创业资讯我们关注国内外最热门的创新创业动态，提供一站式信息服务，传递行业热点新闻，实时深度评论和前瞻观点，帮助创业者把握新兴技术趋势和行业变化，洞悉未来技术趋势。

站长声明

标签：

上一篇：中国首个音乐SOTA模型「天工音乐大模型」今日公测

下一篇：《全球企业家自贸港峰会暨2023投资合作发展大会》开幕

HBM 4，即将到来

高带宽内存（HBM）已经存在了大约十年，在其发展过程中，其速度稳步提高，数据传输速率从1 GT/s不等（从最初的HBM开始）并达到超过 9 GT/s（即将推出的 HBM3E）。这使得带宽在不到 10 年的时间内实现了令人印象深刻的跃升，使 HBM 成为随后投放市场的新型 HPC 加速器的重要

06-17
襁褓中的“特斯拉模型Q”：仅售不到20万，志在全球销量第一

年底特斯拉股东大会落下帷幕，留给观众最深刻的记忆翻了原来是老马背着孩子上台感受了股东大会的气氛，大概是想让年轻人尽快接受资本家的打吧。话虽如此，投资者日之后，老马开始猜测他的宏伟计划的“冷饭”。不过，“炒冷饭”也有“炒冷饭”的优点。冷饭炒到了情深意重的

06-21
温州：《龙湾区政府产业基金管理办法》

《龙湾区政府产业基金管理办法》第一章总则第一条是规范和加强龙湾区政府产业基金（以下简称区产业基金）的管理和运作，发挥发挥产业基金的引领和撬动作用。根据《浙江省财政厅关于印发浙江省产业基金管理办法的通知》（浙江财检〔〕75号）、《温州市科技创新创业投资基金管

06-17
流行“阿童木鞋”：上天打不倒妖怪，但可以下地插秧

MSCHF，这个充满想象力的创意团队，又来搞事了！上次我们报道了出圈率爆款的“骨折鞋”，这简直就是创意鞋的流量磁石。这一次，他们故技重施，从无数人童年记忆中的动画片《人物：铁臂阿童木》中汲取灵感。铁臂阿童木的历史可以追溯到《铁臂阿童木》，是一部连载了16年的连

06-21
【融资24小时】2022年5月18日投融资事件汇总及明细

今日国内市场共发生21起投资披露事件，其中先进制造6起（昆宇动力、奇灵芯、科视光学、翠展微电子、五爱易达、北旭电子）、企业服务5家（知步、棱镜数码、耀明科技、Brandgogo、中科江南）、医疗健康案例4家（云康集团、森朗生物、欧力生物、莱卡医疗）、汽车交通案例2个（科

06-17
《枣庄市政府投资引导基金管理办法》

枣庄市政府投资引导基金管理办法第一章　总则第1条　为了规范枣庄市政府投资引导基金的管理和运作，进一步提高财政资金的使用效率，更好发挥财政资金引导和杠杆作用，根据《政府投资基金暂行管理办法》（财预测号【】】）、《山东省人民政府办公厅关于进一步推动山东省新旧动

06-17
阿里的中台变故

近日，有媒体报道称，阿里菜鸟网络前CTO谷雪梅（昵称：康朵）将回归集团，协调中台业务。不过，菜鸟网络随后辟谣，并表示不会有这样的调整。。中台业务是阿里在2018年12月成立的事业群，当时的组织架构层面甚至与阿里巴巴集团的零售电商事业群平行，直接对阿里CEO张勇负责

06-17
报告：一季度全球房价调查中，房地产市场表现最强劲的是黑山、波多黎各、埃及等，

亚洲最大房地产科技公司居外IQI集团2日发布的报告显示，一季度，欧洲、亚太、美国等多个国家和地区，包括加拿大、加拿大等地，房价涨幅都在加速。低利率和货币宽松被视为全球房价上涨的主要原因。在第一季度全球房价调查中，最强劲的房地产市场是黑山（.7%）、波多黎各（.6

06-17
屏幕护眼设置来了！另外推荐3款应用

当我控制萨姆斯打败最终BOSS，登上飞船，逃离ZDR星球时，我感受到的不是战后的轻松，而是“啊，我的眼睛好痛” ”。不仅仅是游戏，从休闲看电视剧、综艺，到上班上网课、写文档，从早到晚对着屏幕已经成为我们的常态。那么，如何才能最大程度地减少屏幕对眼睛的伤害呢？屏幕

06-21
【创业24小时-本地生活】2024年5月17日

5月17日TOP事件1、上海咖啡馆数量全球领先，女性成为消费主力。据《年上海咖啡市场调研报告》统计，上海连续三年成为全球咖啡店数量最多的城市，远远超过东京、纽约和伦敦。咖啡已经成为上海人日常生活中不可缺少的一部分。无论是提神醒脑、奖励自己还是放松身心，咖啡都是

06-18
美瞳垂直电商平台“美瞳汇”获战略投资

据投资界消息，据36氪获悉，美瞳垂直电商平台“美瞳汇”，近日获得锦波生物科技实际控制人战略投资。本次融资后，Contact Center将与锦波生物科技就隐形眼镜材料的生产技术进行深度合作。美瞳汇公司成立于2007年，旗下美瞳汇垂直电商平台“美瞳汇”正式上线。截至目前，色

06-17
三年后，北京5G热点将全面覆盖

“到2020年，北京5G网络投资将突破1亿元，实现首都功能核心区、城市副中心、重要功能区、和重要的地方。 ”北京市经济和信息化局记者获悉，《北京市5G产业发展行动计划（年度）》近日发布。根据规划，北京将集中优势力量补齐5G关键部件等技术短板，在行业应用中率先形成应用

06-06