首页 > 科技未来 > 内容

AIGC“巅峰系列” -李大海:我们将进入群体智能新时代(现场问答)

发布于:2024-06-18 编辑:匿名 来源:网络

AIGC“巅峰系列” |李大海:我们将进入群体智能新时代(现场问答) 源代码永远不会停止以博大的胸怀探索 源代码资本 微信ID源代码资本关于特色为企业创造价值,与创业者共同成长12-12 14 :31Posted on ChatGPT 今年上半年,北京东风迅速掀起了极具想象力的AIGC创业浪潮。

中国涌现出一批大型模型相关创业公司。

如今半年过去了,关于大模型和人工智能的讨论进入了另一个阶段:从“谈概念、谈未来”演变为“谈产品、看落地”。

在技??术的底层逻辑得到验证并被广泛接受后,AI创业者正在反复验证基于大模型的应用产品的落地,而行业外的创业者仍在观望这些落地的产品能否给行业带来具体的效益和企业。

经营企业能在多大程度上带来改变?近日,在“码脑嘉宾·私聊会”上,源码资本联手亚马逊云科技,特邀面墙智能联合创始人兼CEO、知乎合伙人兼首席技术官李大海分享他的心得体会。

对AGI的看法。

他还提出了从单一智能向群体智能的发展趋势。

他还指出了AI代理人的六大典型特征,并与众多创业者就中国大模型相关的创业进行了交流。

李大海毕业于北京大学数学系。

他是谷歌中国的创始成员之一。

随后担任云运网工程技术负责人、豌豆荚搜索技术负责人。

拥有连续十余年的创业经历。

除了担任面壁智能CEO外,他还是知乎合伙人兼首席技术官,带领着100多人的团队。

他在构建顶尖技术系统、战略规划、技术管理和商业化方面拥有丰富的经验。

以下是现场问答环节的主要内容: 问:您如何看待Open AI的新品发布会以及行业未来的发展?李大海:中国和美国是两个故事。

大约一两个月前,一群大型模特公司的老总聚集在一起交流。

在大家发表意见后,终于有人问道:“我们应该清楚地思考,大语言模型是一种技术,仍然是一种产品。

“这个问题我当时没有想清楚,但是后来想了一下,中国和美国的答案是不一样的。

在美国,大语言模型是一个产品,在中国是大语言模式是一个技术,Open AI发布之后,它可以给中国带来几个方向,但是它不能完全解决中国的问题,我们这里的企业家很少从事企业服务,这几年是相当困难的。

曾经有一波企业服务的投资,现在回想起来,那波浪潮中幸存下来的公司应该是比较少的,因为中国ToB市场的企业服务市场非常分散,而且Open AI可以利用API获得非常好的效果。

业务增长和毛利润非常好,这个东西在中国基本不成立,现在中国很多大模型公司都有自己的API,但是毛利润基本是负的,肉眼是看不出来的。

这是一个巨大的市场。

相信大家都能明白其背后的原因。

如果真是这样的话,中国和美国的商业模式就不一样了。

一个好的跨代产品,其实是伴随着跨代产品的。

技术有非常好的应用场景和相匹配的商业模式。

这些事情是相互依存的。

早年,谷歌赚钱是因为找到了搜索广告和按点击付费的模式;另一个是Facebook。

Facebook的社交平台作为一个产品是非常成功的,它的推荐技术与产品结合得非常好。

它也因此上市,但由于其商业模式后来改为Facebook,其股价下跌。

一旦找到了模型,模型组合起来就变得非常好。

中国目前的情况还处于寻找模式的过程中。

中国大语言模型对应的商业模式并不像Open AI。

开放人工智能是一种模式。

它不可能是主要支持中国企业发展的模式。

我觉得两国的土壤不同,所以我们要有自己的答案。

问:我觉得在今天这个阶段,其实大语言模型还是像小孩子的智力水平,是可以的。

沟通却又认真依赖是不现实的。

在此基础上,我想听听业界的意见。

你认为这种智力未来会发展到什么水平?就我个人而言,我有点悲观。

摩尔定律已经结束。

人类可用的知识和工程工作是有限的。

,即训练好的语言模型的规模大约是这个。

是不是可以进一步提高,或者说智力可以进一步提高吗?我们处于 ToB 市场。

如果说API在中国不是一个好的模式的话,我们已经在这个市场做了一些应用。

当我们推动的时候,就有一个很大的问题。

用户部署这个东西很难。

对我来说,为应用程序部署模型几乎是不可靠的。

我的应用有20万元,部署一个模型一年需要1万元。

他不可能为我的应用程序部署另一个模型。

你打算做这个市场吗?如果你打算做这个市场,这个市场未来会是什么样子?李大海:第一个问题,我是乐观的。

我认为 AGI 是一场革命。

我们可以看到,整个工业革命的持续时间接近数百年。

如果我们从第一台计算机出现算起信息革命,其实已经经历了几十年。

AI革命不是短期的事情,至少第一个版本ChatGPT是AI时代的蒸汽机,还有很多问题需要解决。

我有足够的信心。

在过去的几年里,我们目睹了模型大小呈指数级增长,每年增长十倍。

这种不断演化并非偶然,而是技术涌现规律的必然结果。

这就是所谓的“暴力美学”。

在达到基本可用模型的里程碑后,我们见证了增长的战略放缓和成本的优化,这一转变既可行又合理。

数据方面,纯粹从文本角度来看,我们似乎已经挖掘到了互联网数据的底线。

但作为一名前谷歌搜索引擎工程师,我知道爬虫只能访问数据海洋的一小部分。

在搜索引擎的世界里,我们称之为“深网”,人类社会中有用的数据远不止于此。

此外,除了文本之外,还有大量的多模态数据有待挖掘,学习空间极其广阔。

数据天际线还远远没有被触及,算力的挑战激发了我们对摩尔定律的新认识。

随着数据量不断扩大,问题不再局限于单位算力,而是整体算力的提升。

总体而言,我们对未来的发展保持乐观。

对于API来说,它代表了客户的能力和需求,意味着客户有意愿、有能力寻求和使用API??。

但在中国,解决“最后一公里”问题至关重要。

这并不一定要通过私有部署来实现,API可以作为工具提供给用户,但这并不是结束。

中间环节我们还需要进行大量的交互,需要专门的人员进行系统集成。

这种集成可以以更经济的方式促进交互。

我相信这两种方法可以相辅相成。

问:刚才代理之间的通讯对话已经被很多人使用了,包括我们的数据。

首先,您有什么特别有价值的东西可以在这里分享吗?第二,他们之间的交流和对话有没有可能产生一些有创意的东西?现阶段我个人认为创作出一些有创意的东西还是有难度的。

李大海:有价值的东西关键是要有敬畏自然、顺应自然的态度。

很多时候,我们可以通过观察人类协作方式和业务环境来获得有用的见解。

具体方法包括如何利用工具和反思技巧来提高质量,以及如何从不同的角度进行沟通。

这些对我们来说都是宝贵的经验。

另一方面,您提到了代理人如何在他们之间创造创造性的东西。

创造力通常是通过团队合作产生的。

有时候人类的思维可以看作是从别人那里获取想法片段A,然后从别人那里获取想法片段B,然后经过个人思考后加入C,从而形成自己独特的想法。

事实上,创造力往往涉及排列组合的过程,大型模型往往在这方面表现出色。

它们生成的内容不是直接从原始的、预先训练的文档中逐字复制,而是通过组合、分解和重新组装已知信息来创建。

这个过程确实具有创造性,因为人类有时会从错误的记忆中产生有趣的想法。

问:Agent其实和大模型的能力密切相关。

我们也知道,大型车型也在快速发展。

Agent中比较复杂的一点是任务拆解,这是一个比较困难的问题。

任务拆解可能与大型模型的开发有关。

能力有很大关系。

你可能会做很多事情。

最后你发现,大模型一旦升级,所有的能力都具备了。

事实证明,很多产品可能不需要做。

怎么判断大模型能做哪些事情?开放AI比如你提到我们要解决记忆问题、情感问题、知识归属问题、成长问题、知识库问题。

哪些应该用大模型来解决,哪些应该用大模型来解决?李大海:首先,说到创业,最核心的问题就是要明确什么是用户价值,以及如何把这个用户价值精准地传递给他们。

这是大型模型公司或者Open AI所完全没有能力做到的。

无论是帮助中国创作者,还是解决某个领域的特定用户痛点,往往这些问题仅靠大模型或模型的能力是无法解决的。

模型通常需要与各种技术叠加。

有时模型可以覆盖一部分,从而减少一些工作量,但模型并不能完全取代最终交付给用户的完整产品。

其次,我们需要思考技术发展的时间限制。

任何技术的领先地位,比如我们发布的其中一款模型,都不会持续太久,因为技术发展得非常快。

因此,除了解决具体问题外,我们还需要考虑如何在技术优势之上打造其他优势。

问题也很关键,那就是如何将技术和产品优势转化为其他方面的优势。

问:我有三个问题: 1.从Agent本身来看,基本模型不同。

它给Agent带来了哪些不同?你刚才说我们也从3.5走向面墙,用我们自己的模型。

李大海:不同基础型号的能力肯定是有区别的。

另一方面,我们需要改变自己的模型,让你的模型能够与上层应用产生数据闭环。

我们刚改的时候,我们的模型比3.5稍微差一些,但是我觉得这个差距还不错,而且还有很多好的。

可以提出申请。

问题:这个原型带来了多大的差异?李大海:有很多细节。

Agent需要一个能够非常严格地跟进你需要的输出模式的模型。

可能跟进不够,所以效果会变差。

除了代码生成功能之外,我发现我们的模型具有很高的 CPM。

它在很多方面会比ChatGPT3.5更好,但在某些方面会更差。

问:底座是通过API连接的,因为很多像AutoGPT这样的大厂商也在做。

事实上,我们可以认为是一个有基本模式的初创公司。

有许多专门从事代理的独立初创公司。

这两个方面来自于发展的方向。

前景和格局是什么?李大海:从这一点来说,我认为模特公司往往更容易获得商业上的成功。

从另一个角度来说,为什么开发AI时不使用ChatGPT的模型,而是选择开发自己的模型?这是因为自主开发的模型能够更好地适应复杂的任务。

虽然不是每个人都需要开发基础模型,但是对于Agent这样复杂的应用,自研模型可以让模型的数据循环更加高效。

当然,现在OpenAI也提供了微调的能力,可以根据它的模型进行微调,但是我认为从商业角度来看,完全依赖它可能会存在一些风险。

问:这个风险意味着什么?李大海:比如说,如果Open AI也出了同样的框架,你该怎么办?问:我认为未来初创企业还有做生意的机会吗?尽管各大公有云高度中心化,但多云管理平台和第三方上市公司仍然有市场。

如果打个比方的话,那么Agent就是我们自己的。

或者有原型的初创公司自己做吗?李大海:其实我们应该讨论的是基于Agent的应用,它会有更多的优势。

如果你把自己看作Agent框架的一部分,在中间,下面是LLM层,上面是应用层,那么中间的价值链可能会很弱。

我个人认为这不是一个好的模型。

但如果你将Agent与应用结合起来,有特定的应用场景,并通过这些应用场景构建自己的优势,那么这种方式可能更可行。

问:我想和大家讨论的第三件事是,Agent肯定会带来很多新的空间。

哪些会颠覆传统软件或者这一类行业或者赛道,哪些会给想象插上翅膀?它会让它更快吗?李大海:我认为未来的公司可以分为两种类型。

这也是一位投资者朋友的看法。

我想分享的是,我认为未来的企业基本上可以分为两种类型:一种是“+AI”,另一种是“AI+”,致力于颠覆现有的格局。

颠覆可以是自我颠覆,也可以是被其他公司颠覆。

我们应该考虑加入AI之后会发生什么变化,这将更有利于思考未来的发展方向。

问题:我有一个小细节问题。

现在有很多大型号问世。

除了对大模型进行排名之外,你们内部有没有更具体的量化指标来评价这个模型好不好?李大海:如果评估不是为了追求排名或者其他虚假动机,并且在评估过程中注意避免数据污染,那么得到的数据会更可靠,可以用来判断模型的性能。

问:定量评价标准是什么?李大海:评价的层次有很多。

使用大型模型进行应用评估是最实用的。

问:我想表达的是内部是否有比较明确的量化指标,因为训练需要一轮又一轮,而且你需要知道第二轮比第一轮好,所以应该有一个量化指标。

李大海:现在有大量的开源评测题可供使用。

这些评估问题可以由机器评估,因此具有客观的指标。

同时,我们还开发了一套越来越复杂的主观题,涵盖多个领域,需要人工评分。

这种评分的成本是比较高的。

评级通常以分数的形式表示,例如特别满意2分,一般满意1分,不满意0分,然后得到总分。

问:不知道您是评估SFT的潜力还是直接产生结果的潜力?是指通用模型基础能力、知识能力、逻辑能力,还是指SFT在专业领域的能力和表现?李大海:在SFT专业领域,一般来说,模型越大,能力越强。

这些是我在知乎的一些做法。

当你有10000个高质量的数据时,一个7B,一个10B,一个13B,无论你用什么模型SFT都几乎是一样的。

如果你的数据足够好,模型就不重要了。

问:我想问一个关于最后一公里的问题。

我们正在帮助企业营销公司在最后一英里提供人工智能代理。

我们觉得单个Agent、单个智能可以帮助企业在很多场景下优化场景。

对比非常明显,付费意愿也非常强烈。

与 XAgent 框架一样,该框架非常酷,我们很高兴尝试一些。

相当于从模拟个人转变为模拟组织。

它可以做更多的事情,但从实际效果来看,现阶段的结果还很初步。

公司不注重过程,而是直接注重结果。

与现在相比,并没有什么特别的。

优势大且明显,从具体的应用场景、实现和实际产出来看,需要什么样的发展和距离才能达到企业应用级的成果,或者说一些关键卡点在哪里?李大海:具体来说,多体智能之间的通信需要更长的内存,大型语言模型需要更高的性能。

这是一个相当重要的考虑因素。

如果你在这些方面做得不够好,你可能会受到限制。

例如,如果我们处理超过 7 个代理的交互,由于 LLM 的上下文长度问题,性能可能会下降。

此外,群体智能是模拟人类社会过程的良好模型。

从这个角度来看,它有潜力在创造新的人工智能流程方面发挥作用。

我认为这就是它的价值,它有很大的潜力。

当然,如果目前其他方案有更好的效果,那就先使用效果更好的,不必太纠结。

问:我觉得Agent的想象空间非常大。

我们想到最完美的情况。

未来我们会有一个超级终端。

手机将变得不再那么复杂。

就像AI智能一样,你可以告诉它任何需求。

才能达到这样的境界,这是一个非常完美的状态。

我们将会有一个过渡。

现在考虑具体的场景,我希望Agent可以操作美团API和京东API来帮助我预订飞往目的地的航班。

它会直接回复我一切都完成了,我可以直接刷脸登机、办理登机手续。

酒店不需要全程接触这种所谓的当前互联网概念。

这个空间想象确实非常大,会彻底改变你所谓的人机关系。

如果要做的话,说到具体操作,我觉得京东或者美团像现在这样已经占领了市场数据用户的人怎么可能愿意把自己的数据和API给你来操作呢?如何进行转型?第二个问题是,手机厂商其实有很大的优势,因为操作系统掌握在他们手里。

例如苹果就推出了这样的代理。

AIGC“巅峰系列” -李大海:我们将进入群体智能新时代(现场问答)

大多数企业家都有很大的优势。

为了实现这个ROA世界,创业者有哪些机会?李大海:我觉得创业者要始终寻找具体的、下沉的场景。

企业家应该忘记开放人工智能。

问:从去年到今年,Open AI 实际上崩溃了很多次,Agent 也偶尔崩溃,Open AI 根本就失败了,不能再暂停了。

基于它做产品的时候,无论ToB还是ToC,都需要SLA,包括我们使用的国内各大SaaS模式公司提供API的产品。

如何确保我的产品的 SLA?推测?李大海:如果是这种问题,没有好的答案,就是服务降级。

正常成熟的企业,应该做好灾难准备,也应该做好破坏性检查。

如果大模型服务不可用,那么您的整个服务应该降级,而不是灾难性地使用户完全无法使用。

这是一个工程问题。

面壁智能?面壁智能是一家从清华大学计算机系NLP实验室孵化出来的大型样板公司。

公司创始团队由行业经验丰富的企业家、行业AI技术领军人物、知名NLP科学家学者组成。

核心技术团队成员来自国内顶尖的自然语言处理研究实验室。

他们均拥有知名大学的博士、硕士学位。

他们在国际国内权威期刊和会议上发表论文100余篇,并获得多项专利授权。

科研技术实力处于国内领先水平;此外,具有丰富行业产品和商业化经验的高端人才汇聚一堂,主导大规模模型场景和现场应用的落地。

AIGC“巅峰系列” -李大海:我们将进入群体智能新时代(现场问答)

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 【创业24小时】2022年4月25日

    【创业24小时】2022年4月25日

    投融资2022年4月24日,国内市场共发生11起投资披露事件,其中医疗健康领域4起(帕德生物、盾恩医疗、艾捷博雅、登特菲) )、先进制造案例3个(云南中科星城、玖熠半导体、开元通讯)、汽车交通案例2个(华讯光通信、爱西车)、当地生活案例1个(鸡肉包装)、教育案例1个(一

    06-18

  • 10月融资额环比翻一倍,医疗、企服最热

    10月融资额环比翻一倍,医疗、企服最热

    10月融资额环比翻倍,医疗和企业服务最受欢迎。 据创头条统计,10月份披露的风险投资总额约为5100万元。 与9月份的8亿元相比,翻了一番。 增加了一倍。 据创头条统计,2018年10月国内一级市场公开披露的投融资事件占8%,较9月下降8%。 从投融资事件轮次分布来看,早期融资占比

    06-18

  • 凸版光掩模公司向上海工厂引进先进的光掩模制造设备

    凸版光掩模公司向上海工厂引进先进的光掩模制造设备

    2020年1月24日/美通社/ -- 全球首选光掩模合作伙伴凸版光掩模公司今天宣布,其将成为凸版光掩模有限公司上海分公司。 (TPCS)追加投资装备新设备,用于大规模生产先进光掩模产品。 TPCS工厂是Toppan Photomasks Co., Ltd.的子公司,生产半导体应用的光掩模产品。 这套新的尖

    06-06

  • “出不去”海南岛

    “出不去”海南岛

    王云兰一家人在大年初一(2月10日)来了一场说走就走的旅行。 当天,一家人乘车抵达海南岛。 经过两天的游览,大年初三(2月12日)返回时,王元云打开官方售票网站,发现直到3月2日,都没有可以买到的票。 能源“汽车和乘员”票。 他也跟风在港口睡了两晚,希望能开放现场售票

    06-18

  • 【硬币的另一面】华申瑞利:EMB的龙头企业,汽车制动的终极解决方案

    【硬币的另一面】华申瑞利:EMB的龙头企业,汽车制动的终极解决方案

    【硬币的另一面】华申瑞利:EMB的龙头企业,汽车制动的终极解决方案 另一面清流资本 清流资本 微信IDC 晶流资本 关于特色 清流资本是成功人士创业者创办的风险投资公司,专注于投资TMT领域的初创企业。 团队成员均来自顶尖互联网公司,拥有丰富的互联网运营实践经验。 我们了

    06-17

  • 总投资10亿元,菏泽首个半导体封装项目即将建成投产

    总投资10亿元,菏泽首个半导体封装项目即将建成投产

    牡丹晚报牡丹晚报(全媒体记者孟欣)近年来,菏泽开发区瞄准前沿技术,加快主导产业向数字化、高端化转型。 转型升级将加速新一代信息技术产业崛起。 4月26日,位于菏泽开发区汉邦装备制造产业园的诚信半导体一号项目厂房,工人们正在紧张装修,近期将投入使用。 “得益于开发

    06-06

  • 中国企业海外并购70%未能整合,小心模仿目标公司,

    中国企业海外并购70%未能整合,小心模仿目标公司,

    中国的并购市场每年都呈现爆发式增长,交易数量和交易金额都打破历史记录。 清科研究中心最新数据显示,2018年中国并购市场共完成1000笔交易,较2018年增长24.3%。   但近十年60%-70%的并购交易是没有达到原来设定的并购目标。 这是一组被业界认可的数字。 业内人士指出,7

    06-18

  • 云从科技与中国电信深化战略合作,每月服务500万人

    云从科技与中国电信深化战略合作,每月服务500万人

    9月19日,为期四天的天翼智能生态博览会在广州广交会展馆拉开帷幕。 展会以“HELLO 5G赋能”为主题,以“未来”为主题,聚焦5G下的新技术、新产业、新生活蓝图。 云从科技作为中国电信重要合作伙伴出席,并与中国电信签署战略合作协议。 云从科技与中国电信深化战略合作 早在

    06-18

  • 愉悦资本完成募资超7亿美元

    愉悦资本完成募资超7亿美元

    据投资界7月29日消息,愉悦资本宣布已完成早期及成长期基金募资总额超7亿美元,管理基金总额超过1亿元人民币。 除了现有投资者(LP)的持续支持外,本次融资还增加了来自数家顶级公共养老基金和大型保险公司的投资者。 愉悦资本的投资者群体由全球知名的长期机构投资者组成,

    06-17

  • imToken完成3000万美元B轮融资,由启明创投

    imToken完成3000万美元B轮融资,由启明创投

    投资世界(ID:pedaily)领投 3月31日,全球领先的数字资产钱包imToken宣布完成1万美元B轮融资。 本轮融资由启明创投领投,IDG资本、HashKey、Breyer Capital、Signum Capital、隆领资本、SNZ和个人投资者梁信军跟投。 A轮独家战略投资者IDG资本持续投资。 imToken成立于2006

    06-17

  • 万通科技熟食6日挂牌后者开盘大涨59.33%

    万通科技熟食6日挂牌后者开盘大涨59.33%

    青科投资信息讯,山东熟食、安徽万通科技今日在深交所挂牌上市。 安徽科技首日开盘报42.00元,上涨55.56%,动态市盈率为77.4倍,换手率为2.82%。 熟食首日开盘价21.00元,上涨59.33%,动态市盈率为62.2倍,换手率为4.05%。   万通科技首次公开发行股票数量不超过10,000股。

    06-17

  • 富力地产再次买下万达酒店项目,王健林正在逐步清偿全部海外有息负债

    富力地产再次买下万达酒店项目,王健林正在逐步清偿全部海外有息负债

    据投资界3月15日消息,万达酒店发展(股票代码:9.HK)发布公告昨日,主要阐述了伦敦项目的出售情况,具体来看,买家确定为富力地产(股票代码:7.HK)。   据此前公告(1月16日),万达酒店发展拟以9万英镑(约合人民币3.15亿元)出售英国伦敦项目万达一九榆树(万达伦敦

    06-18