首页 > 科技未来 > 内容

2024年的大模式：科技“在天上”，创业者“在地上”

发布于：2024-06-17 编辑：匿名来源：网络

作者|宛辰编辑|靖宇之年，OpenAI引发了科技圈久违的兴奋。

创业者感觉自己在前进的同时，也随着AI模型的反复进化感受到了压力。

春节前夕，算力、模型、应用领域的大模型齐聚创业者社区活动，讨论他们在大模型演进中找到的空间。

面对即将推出的GPT-5和Llama3，他们也有了新的想法。

在模型层面，区分是困难的，但方向几乎已经明确——增强推理能力和多模态。

技术路线也存在差异。

例如，阿里云同义实验室智能对话负责人李永彬透露，目前正在考虑是否可以在模型中加入搜索增强等插件能力，进一步提高模型的可用性。

但在应用层，有很多共识和机会。

比如最快的一批创业者已经实现了一定程度的业务闭环，他们得出的结论甚至有些令人惊讶：“大模型含量”不应该太高。

这群终于打造大模型的实干家也说出了行业最真实的情况。

智谱AI COO张帆表示，根据一些公布的榜单，GPT-4甚至可能排不到榜单前10名。

他认为，在这种情况下，肯定会出现从模式为王到价值为王的转变。

百川智能联合创始人洪涛更关心的是成本。

他说，他不确定自己在各种私有化项目上辛苦工作一年能赚多少钱。

至此，大家也讨论了云计算厂商能否在整个行业有商业模式之前降低算力成本，从而可以少花点钱。

近日，阿里云创业者社区在北京举办创业者之夜活动 |阿里云“创业者之夜”，大模先驱分享对行业的“预测”； AI应用的创业者们也分享了他们对大模型的“焦虑”。

，大模型去哪儿了？ 2017年，阿里云李永彬走在大模特业务的第一线。

经过一整年的努力，他发现：最初，大型模型可以让所有人惊叹，将“AI解决问题”的效果从20分提高到60分。

不过，对于很多问题来说，60分和0分几乎是一样的。

因为在某些应用场景下，不可能推出评分60分的产品，效果也达不到90分，客户也可能不会买单。

这也是年轻模特创业者的普遍感受。

从兴奋回归理性的背后是一个普遍的困惑——大模型不够通用。

是否会像上一波AI一样，尽管展现出惊人的能力，但落地时仍然需要逐个项目定制？自然，大家对2019年的大型模型抱有第一个期望——通用能力的进一步提升，甚至期望模型在一些复杂场景下直接达到90分。

这种可能性并非不可能。

IDEA研究院首席科学家张家兴认为，从目前OpenAI、Google等大公司对下一代大型模型的判断来看，大型模型解决复杂问题的能力将成为下一个进化方向。

AlphaGeometry：几何奥数级AI系统｜图片来源：DeepMind官网就在两周前，谷歌DeepMind推出的AlphaGeometry（阿尔法几何）人工智能系统已经能答对30道国际奥数题中的25道，接近达到人类表现水平（人类金牌得主平均答对了 25.9 题）。

能够解决像这样的奥林匹克级几何问题被视为迈向更先进和通用人工智能的重要里程碑。

在IDEA研究院张家兴看来，“奥数都是复杂的问题，问题的描述非常复杂，求解过程和证明过程也非常复杂。

”能够解决复杂问题是模型变得更加通用的表现之一。

阿里云创业孵化部总经理李忠宇认为，从GPT-5目前发布的信息来看，模型的泛化能力正在提升，解决复杂任务的能力也在提升。

未来，GPT-5甚至可以解决15%-20%%的人工任务。

还有一些新的想法可以提高模型的多功能性。

一位模型厂商的参会者分享道，最近，大多数公司在实现大型模型时都会使用RAG（搜索增强），将大型模型与私有数据结合起来，提高模型的可用性。

不过，作为模型端的开发者，他们也在探索算法创新，通过算法创新提高模型的学习能力，并加入像RAG这样的插件知识库，从而减少对模型数据训练的依赖。

也就是说，通过算法创新，我们希望让模型像人类一样学习，看一本书就能理解知识，而不是需要读完所有书才能理解一个问题。

在这一点上，GPT-5提供了很好的示范。

智谱AI张帆认为，更强的推理能力使得处理复杂的任务成为可能，同时也带来非常强的泛化能力。

模型在各个行业场景下都会具备良好的 Zero-Shot 和 One-Shot 能力（给模型一个例子甚至不给模型，就会出现相应的能力），从而减少对训练数据的依赖。

通过小数据集的训练，可以将模型引入更多垂直领域。

这样可以降低客户使用模型的门槛，提高模型的可用性。

除了多功能性之外，多模态能力也有望在2018年有更大的突破。

去年年底，从GPT-4到Google Gemini，大模型的进化已经得到充分展现。

以大语言模型为核心扩展更大系统的AI，必然涉及到多模态能力。

张家兴预测，就像年底ChatGPT的出现，引发大家在2019年做大语言模型一样，2020年整个行业可能会聚焦多模态。

这不仅仅是因为多模态能够带来能力更强，还因为多模态有很多应用场景。

在汽车、机器人等端侧场景中，多模态非常重要。

在多模态技术实施方面，技术融合也出现了一些新的视角。

在探索多模态领域时，中科深度智能创始人程伟忠注意到前段时间图灵奖获得者Lecun的采访。

他并不认同目前多模态还原图片和视频到Pixel的技术路线，Lecun认为未来的多模态训练应该侧重于表征事件。

在这个话题的讨论中，与会者认为ChatGPT不是计划好的。

技术路线可能已经制定出来了。

它是利用当今技术不断前进和持续改进的前提。

另一方面，尽管存在路线争议，但并非不可调和。

有很多中间路线可以走，而且是连续的。

比如，张家兴分享了IDEA的内部实践，表示目标识别等计算机视觉特征可以作为多模态大模型的输入，实践中的效果非常好。

从左至右为阿里云创业孵化事业部总经理李忠宇；智谱 AICOO 张帆；陶洪，百川智能联合创始人兼总裁；刘毅然，元璟资本管理合伙人； IDEA研究院认知计算与自然语言主任科学家张家兴及同益实验室对话智能负责人李永彬 |阿里云，如何实现大模型？如前所述，对于后续大模型的趋势预测，推理能力和多模态能力的提升成为了明确的目标。

但说到人工智能应用，更多的是非共识思维。

创业者同意，需要在非共识中寻找机会。

应用大型模型时首先要考虑的就是模型选择。

目前尚未达成共识。

智谱AI张帆开玩笑说，在当前模型评估的背景下，“OpenAI的GPT-4甚至没有排在模型评估列表的前两页”。

过去几个月，多位模特创业者都向极客公园表达了类似的看法：模特评审名单并不能反映真实情况。

在“模型为王”的愿景下，确实会出现要求模型提前“读题”、“背题”以获得高分的情况。

但更重要的是，当涉及到数千个行业的不同场景时，很难用一套标准来评估模型的可用性。

经过实践，大家一致同意在真实、具体的场景中不断进行测试和评估。

比如猎聘在探索+大模型的时候，最大的研发成本是花在测试不同的模型上。

猎聘CEO戴克斌表示，什么场景使用什么模型、什么尺寸的模型最高效，没有标准答案。

甚至评价标准也要根据情况进行调整。

除了模型选择之外，一些用于模型实施的操作判断标准也开始出现。

无论是在原有应用中使用大模型，还是探索一些AI Native应用，都有形成业务闭环的可能性。

这里首先要考虑的是大型模型技术分布的独特性。

远璟资本管理合伙人刘毅然认为，AI应用存在巨大的不确定性和非共识机会，这与这波AI技术的特点有关。

移动互联网时代，应用的底层基础设施是一样的，产品都是基于苹果iOS和LBS定位。

相比之下，大模型的应用是一个垂直优化的过程。

底层模型哪些部分使用开源版本，对哪些部分进行微调，调整哪些问题，然后根据情况优化功能和应用。

创业者在包装产品之前需要充分了解技术。

这个过程中有很大的优化空间和机会。

这就提出了探索AI应用的第一个原则——TPF（技术产品匹配）。

百川智能创始人王小川曾在极客园创新大会上提到这个词，指的是现有的大型车型。

当技术还不完善的时候，先明确“这样的技术适合什么样的产品”，而不是产品经理洞察市场需要什么，回来就开始做。

因为从大型模型到人工智能应用，“今天最大的挑战不是找到‘什么不起作用’，这并不难，每个人都能做到。

难的是找到‘什么起作用’，找到‘什么不起作用’。

”模型能力与业务的最大公约数成为正向循环。

智谱AI张帆认为，这将成为新模型的重点，尽管这种做法可能不是投资者所看重的AI Native应用。

百川智能联合创始人陶洪表示，从务实的角度来看，通过在可用场景下基于模型和工程方法将大型模型应用产品化，数据和客户反馈的飞轮将推动AI应用进入下一个迭代阶段。

从事AI应用的创业者甚至觉得，鉴于目前大模型技术的成熟度，AI应用的“大模型体量”应该不会太高。

在游戏领域，昆仑万维集团董事长兼首席执行官方瀚也有类似的看法。

2024年的大模式：科技“在天上”，创业者“在地上”

通过纯AI大模型直接生成3D游戏内容会出现人脸数量多、规格不匹配等问题。

这个时候，如果你改变主意，将一些传统的简单动画工具融入到AI大模型的工作流程中，产品的易用性将会得到极大的提升。

在他看来，什么好用就用什么，创建对用户最有价值的工作流程。

这就是作为AI应用开发者的价值。

可见，在原有应用中加入大模型，探索更好的工作流程，是将大模型智能转化为生产力的最直接方式。

智谱AI张帆认为，这也是今年行业关注的焦点。

与此同时，一些令人惊叹的 AI Native 应用程序开始出现。

就像移动互联网技术下，用户有随时随地浏览短视频的需求，一些独特的场景在大模型技术下开始出现。

例如，一位AI应用投资者在现场分享了一款仍在进行针对性测试的海外应用Can of Soup，一款富有想象力的社交软件。

用户利用AI生成虚拟图像，将其发布到网站上，互相评论，并邀请好友创作和评论“想象力”。

该产品可以比作“想象版的Instagram”。

“这个应用在海外的DAU增长非常快，我不知道它最终会不会成功，但这是一个非常有意义的探索。

它意味着不仅现实生活可以分享和社交，你的想象力也可以这也是一个非常典型的 AI 原生应用发现新的行为模式，”他补充道。

新技术除了捕捉汤罐头等新技术下的人类新需求外，还为熟悉的场景带来更好的解决方案，为用户提供更加人性化、人性化的体验。

以最流行的人工智能为例，智谱AI张帆认为，很多GPT能做的事情非常肤浅，很难用作生产工具。

这些GPT背后的流程一般都是按照人类理解的逻辑来执行的。

先做分类，再做模型，最后做任务。

然而，这种智能代理的运作方式是有限的。

他认为，“严格来说，这种插件项目方式并不算代理，它只是一个大型模型应用。

”相比之下，他发现字节跳动在海外推出的Coze玩法有所不同。

它也是一个 GPT 应用程序。

Coze的模型利用了其背后的大模型的递归和迭代能力以及表现力。

这是一个更原生的智能代理。

，效果也比较好。

张帆表示，这是他更兴奋的方向。

它可以使用更简单、更通用的方法，无需进行微调。

它可以仅用基本表达式来解决实际复杂问题，并弥合模型和应用程序之间的差距。

公里降至米。

但也有先决条件。

像 Coze 这样的原生模型高度依赖于其背后的模型功能。

只有模型足够强大、足够通用才能实现。

智谱AI COO张帆在活动中分享 |除了基于软件的AI应用之外，阿里云结合客户端场景的应用也值得期待，尤其是在机器人领域。

说起今年最引人注目的应用，张家兴认为，当属谷歌的RT-2（Robotics Transformer 2，大型机器人模型），它看到了使用自然语言定义任意机器人任务的曙光。

他认为，大型模型正在期待他们在机器人领域的 ChatGPT 时刻。

远景资本的刘毅然举了一个例子。

过去，机器人领域有一些约定，比如用数学定律来描述复杂动态体的运动。

现在，大型模型对此类数学描述过程具有放大作用，但大型模型真正进入该领域还有很长的路要走。

机器人或者手机、汽车、AI Pins 等硬件可能还需要一些时间。

“天上的大模型能否落地到地面的设备上，值得期待。

”他说。

虽然物理世界的普适大尺度模型具有最大的价值，也是科学家们所梦想的，但在它前面加上适当的定语，才是创业者今天可以做的事情，并从中有所收获。

难点在于如何在前面加上定语词，使其能够符合当今的技术阶段，又能将商业化和产品结合起来，不断向前发展。

大模型“基础设施”的意义引发了人们对AI应用蓬勃发展的期待和判断。

创业者也对大模型的整个技术体系，特别是数据、算力和开源算法有了新的期望。

数据被视为模型训练、微调等行动产生结果的最重要因素之一。

对于获取高质量数据，方瀚提出了不同的想法。

在他看来，很多大型模型都有更快的方式获取数据，比如使用GPT-4作为“教练”。

但在数据获取方面，团队应具有“长远主义”精神，否则“难以走远”。

”。

昆仑万维董事长兼CEO方瀚在交流会上分享昆仑万维+大模式的实践 |图片来源：阿里云在对比全球市场后，昆仑万维方瀚认为，垂直数据是中国企业首先进入和发展的发力方向。

只有拥有高质量的垂直数据，我们才有机会在垂直场景中实现SOTA（指最前沿的、一线的模型），并率先获得垂直场景的红利。

在计算能力层面，成本成为主要关注点。

百川智能洪涛坦言，大规模商业模式的探索需要一个相对长期的试错过程。

云计算的持续突破、摊薄创新成本是当前值得关注的方向。

对此，阿里云公有云总裁刘伟光认为，云与AI的结合将逐步解决这个问题。

云计算对于传统IT的意义与融合AI的意义完全不同。

人工智能和云就像鱼和水一样，密不可分。

两者的结合是人工智能应用的催化剂。

同时，云计算能力的不断演进，包括GPU计算能力、支撑计算存储、网络能力的演进，将为AI提供巨大支撑。

“在谈论AI原生应用之前，实际上忽略了一件事——AI是云的原生应用。

两者的结合还有很大的优化空间。

”他说。

随着包括AIGC（应用）在内的大模型变得更加细分，对算力的需求也会逐渐细分，而不是简单地购买算力。

这是阿里云不断探索的事情。

此时，云与端的结合也被寄予厚望。

昆仑万维方瀚认为，要降低模型推理成本，需要结合终端侧推理。

手机端可以对小参数量的模型进行推理，大参数量的模型可以在云端进行推理。

模型推理相结合。

在算法层面，Meta开源的LLaMA和Llama2加速了产业模型的发展，带来繁荣的开发者生态。

不久前，Mistral 的创始人也透露自己借鉴了 Llama2 的开源模式，但开发者普遍表示 Mistral 的效果其实比 Llama2 更好。

国内模型厂商也越来越多地选择开源模型，但创业者也表示，他不确定国内尤其是大厂商开源模型背后的考虑是否只是暂时的。

比如，猎聘戴克斌认为阿里云开源的72B大模型非常有效，但他也很好奇其背后的思考。

创业者之夜，阿里云市场总裁刘向文正面面对这个问题。

她表示，阿里云将继续开源，不仅仅是为了公益，而是基于商业判断。

阿里云创业者之夜活动场景|阿里云在这次创业者活动中，极客公园看到了共识，也看到了更多共识观点在嘉宾之间的激烈碰撞。

而这恰恰代表了大模型引发的人工智能新浪潮所蕴含的机遇。

你可以想象，20年前移动互联网刚刚兴起时，类似的事件充满了同样的争论和见解。

不同的是，变革的“基础设施”从运营商变成了以阿里云为代表的云计算厂商。

大模型时代，阿里云不仅需要自己“摸清”大模型上下游的真实情况，还需要与大模型行业的“玩家”一起寻找方向创业者之夜等活动对行业发展的影响。

根据后者不断变化的需求，增加了阿里云“AI基础设施”的各种能力，以与创业者一起成长和成功。

在大模型时代，“计算，产生不可估量的价值”有了新的内涵。

在阿里云举办的创业者之夜活动上，这群先驱者率先探索了最开放的技术体系的新变化。

写在最后：创业者之夜活动由阿里云创业者社区举办。

社区聚集了中国最前沿的技术创新者，围绕云、AI技术方向以及AI在行业应用等核心主题，开展各类技术与产业闭门活动和讨论，形成与社区成员长期共同创造。

体系，与科技创新者共同成长。

#阿里云#创业者计划#中小企业服务#创新创业年9月21日，阿里云正式推出阿里云创业者计划，联合知名投资机构、加速器、服务创造机构以及大企业的创新力量，共同打造阿里云创业者计划。

为初创企业提供全面的赋能和服务，帮助初创企业在阿里云上快速建立自己的业务，开启智能时代创业新范式。

站长声明

标签：

上一篇：广州市国有企业创新投资基金宣布成立

下一篇：国内最早开展虚拟代表的创新科技公司青云科技完成数亿元B轮融资

2024年医药行业将走向何方？

“只有时代的产业，没有XX产业的时代。 ”这是每个行业从繁荣期走向寒冬时，严肃的人都会发出的感叹。过去的一年，医药行业彻底经历了由繁荣到寒冷的转变。裁员、关闭工厂、抛售、撤资……这一年轮番发生。不过，在过去的一年里，我们也能看到这个行业的诸多成熟迹象：龙头

06-18
上海工业技术研究院已成功量产多款非制冷红外探测器产品

上海微技术产业研究院近年来，随着集成电路技术和微机电系统（MEMS）技术的快速发展，非制冷红外探测器平面阵列探测器技术日趋成熟，系列化产品逐步实现规模化量产。上海产业研究院专注于“超越摩尔”集成电路核心工艺研发，2016年开始布局非制冷红外探测器技术，经过多年

06-06
时隔一个月，共享住宿“千屿群岛”又获坤中资本千万元A+轮融资

据投资界5月10日消息，时隔一个月，城市共享住宿空间品牌“千屿群岛”再次获得昆仲资本1000万元A+轮融资。《Islands》近日又获新一轮融资。宣布获得数千万元A+轮融资。本轮投资方为鲲众资本。　　千屿群岛于当年7月成立。同年8月，获得真格基金、华创资本、执信资本、零

06-18
明年的新 iPhone 和 Android 旗舰可能都会标配这个新功能

潜望镜镜头。事实上，它有点像“没有它我也可以使用，但没有它你就活不下去”的功能。在新机发布后的讨论中，很多发烧友或者用户都会强调没有潜望式长焦镜头，这有点令人失望。尽管用户需求相当大，但厂商总是善于做出权衡。他们选择各种中焦距组合，而不是潜望式长焦结构

06-21
耀明未来获UPS投资，加速无人驾驶卡车研发应用

据投资界8月16日消息，UPS宣布投资自动驾驶公司耀明未来。目前，UPS未来正与图森合作，在美国亚利桑那州的一条路线上进行无人驾驶卡车的试点道路测试，以评估无人驾驶技术如何改善UPS运输网络的服务和效率。试点道路测试于今年三月开始。在此期间，图森未来在凤凰城和亚利

06-18
科技巨头之间的并购战愈演愈烈：迅速收割移动互联网

在梅耶尔的领导下，雅虎的收购风格变得高效果断；自去年收购 Instagram 以来，Facebook 今年的举动似乎悄然进行。谷歌正在扩大版图，他们不断采取行动，不断充实自己的长期战线；与前三者相比，微软、苹果、亚马逊停步不少，冷漠地观察别人的“婚礼”。　　科技巨头的收购

06-18
美国娱乐大亨在港设立私募基金拟投资亚洲股票

据港媒报道，美国娱乐大亨海姆Saban旗下私募股权基金公司Saban资本集团注册成立子公司Saban上个月香港资本集团（亚洲）将主要投资亚洲的媒体和通讯行业。　　据香港《明报》报道，亚洲相对强劲的经济增长前景引起了美国娱乐大亨海姆Saban的关注。以引进和制作美国版日本特摄

06-18
10亿元，重庆经开区设立生态城市基金

12月14日，与重庆经开区、渝富集团合作的“广阳湾智慧生态城基金”签约仪式举行。区委书记、重庆经开区党工委书记（兼）许洪斌、区委副书记、重庆经开区党工委副书记、管委会主任黄红、重庆经开区领导王建华、谭浩出席活动签约仪式。据了解，重庆经开区与渝富集团作为主要合

06-17
餐饮供应链服务商“蜀海供应链”完成8亿元B轮融资

据投资界（ID：pedaily）9月5日消息，蜀海供应链（以下简称“蜀海”）宣布近日，其完成8亿元B轮融资。本轮融资由中银投资、华垦基金及公司现有股东华润消费基金共同领投。公司现有股东君联资本继续投资，泰合资本继续投资。充当专属财务顾问。树海成立于2007年，是一家专

06-17
满座网冯晓海：团购拐点是一个谬论没有规模就不可能上市

目前，针对一些团购网站盲目扩张、管理混乱等问题，记者采访了满座网CEO冯晓海。他表示，团购拐点是一个谬论，团购网站已经进入精耕细作阶段，各家企业比拼运营能力和盈利能力。　　以下为采访实录：　　1.近期，团购行业裁员、资金削减的消息频传。这种情况发生了吗？这是

06-18
“阶梯上进，颀心展望”尚颀资本2023年度投资者大会顺利召开

12月15日，尚颀资本年度投资者大会在上海盛大召开。上汽总裁王晓秋、上汽副总裁卫勇、上汽金融事业部总经理吴恒、尚颀资本投资人、被投企业代表、行业专家等齐聚一堂，共同探讨时代剧变背景下的行业发展趋势和机遇，分享尚颀资本对新时代变革与挑战的深度思考和应对策略。会

06-18
爆炸性的Sora，准备出国的男人

一年前AI智能兴起的场景再现。年初，Sora在全球科技圈引起集体躁动。当地时间2月15日，OpenAI发布了最新的视频生成模型Sora。根据OpenAI的描述，Sora可以根据用户输入的短文本命令生成长达1分钟的高清视频，并创建具有多个角色、特定类型的动作以及准确的主体和背景细节的

06-17