首页 > 科技未来 > 内容

全球首个支持20万字输入的大型模型来了！一口气读完几十份文献和一本20万字的小说

发布于：2024-06-18 编辑：匿名来源：网络

作者：李扬霞编辑：陈彩娴10月9日，杨植麟创立的月之暗面也发布了一款大型模型产品——Moonshot AI。

该模型的智能助手Kimi Chat是全球首个支持20万字输入长度的大型模型。

据杨植麟介绍介绍，Claude支持约8万字，而GPT4只支持约2万字。

换句话说，Moonshot AI已经超越了支持K输入长度的大模型Claude和支持32K代币处理能力的GPT4。

其中，Claude通过提供长文本问答服务实现了产品层的突破，并于近期获得了亚马逊40亿的投资。

成立不久，月暗面已获得红杉资本、今日资本、理思资本等知名投资机构近20亿元融资。

那么杨植麟在国内大型模型公司中的地位如何呢？硅谷极具影响力的科技媒体The Information列出了MiniMax、智普AI、Light Years Beyond和兰州科技等五家被认为可能成为“中国OpenAI”的候选人。

另一个立场是杨植麟。

杨植麟不仅师从清华大学教授、IEEE Fellow唐杰。

随后，他还前往世界排名第一的 NLP 研究机构 CMU（卡内基梅隆大学）的语言技术学院（LTI）攻读博士学位，师从苹果公司 AI 负责人 Ruslan Salakhutdinov、首席科学家 William W. Cohen。

谷歌人工智能科学家。

博士卡内基梅隆大学计算机科学专业的学生往往需要六年的学习才能毕业，而杨植麟从卡内基梅隆大学只用了四年就毕业了（）。

其团队核心成员大多来自清华大学，具有明星团队的光环，备受关注。

杨植麟表示，本次创业针对的是ToC赛道，并阐述了创业的三个主要原因：一是探索智能的边界，满足好奇心；第二，探索对世界有用的东西，并与用户一起创造和发现它们。

实施场景；第三，我们希望人工智能具有包容性，为实现个性化融合提供更有力的方式。

（Kimi Chat内测界面） 1、瞄准ToC赛道 “大模型产品将进入长文本时代”，杨植麟在媒体沟通会上指出。

Moonshot AI认为，更长的上下文长度可以为大型模型的应用带来新的篇章，促使大型模型从LLM时代进入L(Long)LLM时代。

“我们认为，不仅要有足够多的参数，同时还要具备长上下文能力，这是新一代大模型记忆的标志。

“在杨植麟看来，制作一个大模型有两个条件。

第一个是参数的数量，因为参数的数量决定了能处理什么。

多么复杂的计算；第二个条件是文本长度，因为上下文杨植麟表示，突破长文本能力是“登月计划”的第一步，也为后续的多模态能力奠定了基础。

他告诉雷锋网，他计划推出多模态能力。

Moonshot AI的技术路线不是走捷径，而是脚踏实地解决算法和工程的双重挑战，在杨植麟看来，目前很多长上下文模型都走了以下三个捷径： “鲸鱼模型”、“蜜蜂模型”、“蝌蚪模型”可以理解为以滑动窗口的形式直接主动丢弃上面的很多，虽然号称范围很远，但实际上支持的范围很远。

短的。

这种鲸鱼模型很难解决很多任务。

“蜜蜂模式”只关注局部，忽视全局。

虽然可以输入整个上下文，但模型可能只采样其中的一部分。

例如，如果一篇文章的关键位于中间，那么它无法提取关键信息。

“蝌蚪模型”的能力还不够。

它可能只有10亿个参数，而不是数千亿个，所以它的能力是有限的。

目前，Moonshot AI在存储、算力、带宽等方面做了很多优化。

杨植麟说，这是一篇真正可用且可产品化的长文本。

2、惊人的长文本处理能力为什么在这场如火如荼的AI战争中，大模型的长文本处理能力成为各家公司对比的关键。

使用过大模型产品的朋友一定遇到过这样的现象：当你和大模型进行多轮对话时，它可能会忘记你之前说过的话，这时候回答的内容会过于铺天盖地。

现实情况是，大型模型在处理大量新内容时会有点不知所措，因此它们看起来会分心。

长文本处理是生成式AI的重要应用场景之一，因为良好的长文本处理能力可以让AI系统理解书籍、研究报告、法律文件等足够复杂和冗长的信息，这将为知识获取、文档分析、语义理解等方面带来实用价值。

沟通会上，杨植麟为我们展示了Kimi Chat从20万字小说中提取关键信息的能力；可一次性输入几十个文档进行提取；还可以输入链接，直接提取链接内的内容进行角色扮演；此外，您还可以分析财务报告并了解法律规定。

当被问及上下文输入太长会分散注意力的问题时，杨植麟告诉雷锋网，当你输入20万个单词时，模型肯定很难准确连接到某个token。

全球首个支持20万字输入的大型模型来了！一口气读完几十份文献和一本20万字的小说

变得更大。

因此，这里实际上需要一些更高效的对齐方法，比如如何高效地获取好的数据并通过工程的方式实现。

这需要大量的迭代和训练，传统的鲸鱼、蜜蜂和蝌蚪模型无法解决这些问题。

Moonshot AI突破这些困难的两个关键词是“全局”和“大规模参数”。

一方面是全局思考上下文，另一方面是用千亿个参数进行训练。

这两点非常重要。

杨植麟是快车终点站。

据雷锋网（公众号：雷锋网）报道，目前各大车型仍在相互追赶的竞争中。

未来，生成式人工智能的技术竞争将集中在长文本处理领域。

本文中的作者：李扬霞、微信12月。

他长期关注网络安全领域，也关注AIGC、大模型等内容。

欢迎对以上领域感兴趣的读者添加作者微信。

雷锋网原创文章，未经授权禁止转载。

详情请参见转载说明。

全球首个支持20万字输入的大型模型来了！一口气读完几十份文献和一本20万字的小说

站长声明

标签：

上一篇：元璟资本联合领投，「Realibox引力波」完成近亿元A轮投资 -元璟family

下一篇：股价爆跌，电子烟路在何方

乐视网发起设立规模5亿至10亿元的投融资并购基金

据4月15日晚间消息，乐视网今日晚间发布公告，宣布将联合发起设立与乐视控股设立的利融投资并购业务基金，暂名。引领投资并购资金潮流，预计总规模5亿至10亿元。　　公告显示，乐视网作为该基金的有限合伙人，出资总额为1万元，乐视控股或其子公司出资总额为9万元。剩余部

06-18
木蚁机器人已完成近亿元融资，德邦快递等投资方投资，

木匠蚂蚁机器人宣布完成近亿元融资。投资方包括兰驰创投、德邦快递等。本次融资将主要用于产品研发、市场营销和团队扩张。听，中小企业反馈平台。倾听用户需求，倾听创业者声音，解决中小企业痛点。点击立即参与调查并获得礼物。

06-18
蔚来汽车与中国科学技术大学达成战略合作

据《安徽日报》5月12日消息，蔚来汽车与中国科学技术大学近日在合肥签署框架协议，达成战略合作伙伴关系。双方拟依托中国科大信息智能学科基础研究优势，在联合技术攻关、人才培养和互动等方面开展务实合作，共同推动技术创新和产业化，努力引领信息智能学科未来发展。行业

06-18
青少年编程教育平台“啊哈编程星球”获数千万天使轮融资，资本大手笔投资

据投资界7月3日消息，青少年编程教育平台“啊哈编程星球”获数千万天使投资轮融资。本轮投资方为峰分资本，盛大网络前联合创始人、总裁谭群钊将担任公司董事。本轮融资主要用于现有产品的迭代以及新产品的研发。　　阿哈编程星球创始人阿哈雷表示，本轮融资完成后，将进一

06-17
AI和裁员未能让科技巨头飙升

AI（人工智能）技术推动了全球科技巨头微软和谷歌的业绩增长，但华尔街一致认为业绩“不够好”。北京时间1月31日，市值近3万亿的美国科技巨头微软（纳斯达克股票代码：MSFT）发布了财年第二季度（即自然年第四季度）财报。与此同时，谷歌母公司Alphabet（纳斯达克股票代码：

06-17
浪潮信息：2020年营收630.38亿元，同比增长22.04%

浪潮信息近日发布年报。报告显示，2019年其营收为3800万元，同比增长22.04%；归属于上市公司股东的净利润14.66亿元，同比增长57.90%。

06-17
你距离拥有“强AI”女友还有多久？让专家告诉你

什么是强人工智能（strong AI）？简单来说，就是类似于人脑的智能。它可以独立地理解世界并学习知识，而不需要人类预先建立其感知和实践的模型（像当前的深度神经网络和比它弱的程序有数千种）。强人工智能是人工智能的终极形态。有很多人相信它能给人类带来福祉和灾难。

06-18
海南：支持符合条件的企业首发上市和企业并购重组，吸引具有一定产业优势的上市企业落户海南

海南发布《关于贯彻落实金融支持海南全面深化改革开放意见的实施方案》。方案提出，完善企业上市工作体系，加强行业主管部门、市县政府、重点园区在企业培育上市各环节的联动，围绕旅游、现代服务业、高新技术产业等建立体系。科技产业、热带高效农业等产业。完善企业上市

06-18
很久以前羊肉串完成近亿元B轮融资，由黑蚁资本独家投资

据投资界6月8日消息，烧烤连锁品牌很久以前羊肉串近日完成近亿元B轮融资，由黑蚁资本独家投资。 B轮融资，由黑蚁资本独家投资。羊肉串成立于2007年，截至年底已在北京、上海等城市开设了59家门店。公司专注于自助烧烤模式和来自呼伦贝尔大草原的羊肉，着力通过供应链质量控

06-18
ZAKER创始人李森和：重点布局泛生活信息

早上8点，人们在公交车、地铁上习惯性地打开手机，利用这段碎片化时间阅读新闻。手机上的新闻客户端包括聚合移动应用程序ZAKER。与腾讯、网易等新闻客户端相比，ZAKER在聚合信息的细分领域具有更大的优势。目前，ZAKER国内激活用户1.3亿，日活跃用户1万。在APP死亡率高达

06-18
小米造车“传闻”不断，雷军到底有多“委屈”

赢得淘汰赛才是小米汽车真正的挑战。雷军已经忍无可忍了。自从小米正式公布汽车以来，多日来一直是网络热议的焦点。俗话说，名人多，相关传闻时不时流传。尤其是上个月的技术发布会之后，围绕小米汽车的价格、材料、自主研发、供应链等传闻层出不穷。对此，雷军在微博上

06-18
大脑逆向工程是实现强人工智能的唯一途径吗？

目前世界上所有的AI都是弱AI。我想对AI有所了解的人肯定不会反驳上面这句话。尽管这些弱AI已经强大到足以击败世界顶级围棋选手，但这并不妨碍他们仍然是弱AI。人工智能虽然有智能，但事实上，当今世界上还没有一个人工智能具有真正的智能。我一个研究AI的朋友说得很好：A

06-18