首页 > 科技未来 > 内容

全球首个支持20万字输入的大型模型来了!一口气读完几十份文献和一本20万字的小说

发布于:2024-06-18 编辑:匿名 来源:网络

作者:李扬霞编辑:陈彩娴10月9日,杨植麟创立的月之暗面也发布了一款大型模型产品——Moonshot AI。

该模型的智能助手Kimi Chat是全球首个支持20万字输入长度的大型模型。

据杨植麟介绍介绍,Claude支持约8万字,而GPT4只支持约2万字。

换句话说,Moonshot AI已经超越了支持K输入长度的大模型Claude和支持32K代币处理能力的GPT4。

其中,Claude通过提供长文本问答服务实现了产品层的突破,并于近期获得了亚马逊40亿的投资。

成立不久,月暗面已获得红杉资本、今日资本、理思资本等知名投资机构近20亿元融资。

那么杨植麟在国内大型模型公司中的地位如何呢? 硅谷极具影响力的科技媒体The Information列出了MiniMax、智普AI、Light Years Beyond和兰州科技等五家被认为可能成为“中国OpenAI”的候选人。

另一个立场是杨植麟。

杨植麟不仅师从清华大学教授、IEEE Fellow唐杰。

随后,他还前往世界排名第一的 NLP 研究机构 CMU(卡内基梅隆大学)的语言技术学院(LTI)攻读博士学位,师从苹果公司 AI 负责人 Ruslan Salakhutdinov、首席科学家 William W. Cohen。

谷歌人工智能科学家。

博士卡内基梅隆大学计算机科学专业的学生往往需要六年的学习才能毕业,而杨植麟从卡内基梅隆大学只用了四年就毕业了()。

其团队核心成员大多来自清华大学,具有明星团队的光环,备受关注。

杨植麟表示,本次创业针对的是ToC赛道,并阐述了创业的三个主要原因:一是探索智能的边界,满足好奇心;第二,探索对世界有用的东西,并与用户一起创造和发现它们。

实施场景;第三,我们希望人工智能具有包容性,为实现个性化融合提供更有力的方式。

(Kimi Chat内测界面) 1、瞄准ToC赛道 “大模型产品将进入长文本时代”,杨植麟在媒体沟通会上指出。

Moonshot AI认为,更长的上下文长度可以为大型模型的应用带来新的篇章,促使大型模型从LLM时代进入L(Long)LLM时代。

“我们认为,不仅要有足够多的参数,同时还要具备长上下文能力,这是新一代大模型记忆的标志。

“在杨植麟看来,制作一个大模型有两个条件。

第一个是参数的数量,因为参数的数量决定了能处理什么。

多么复杂的计算;第二个条件是文本长度,因为上下文杨植麟表示,突破长文本能力是“登月计划”的第一步,也为后续的多模态能力奠定了基础。

他告诉雷锋网,他计划推出多模态能力。

Moonshot AI的技术路线不是走捷径,而是脚踏实地解决算法和工程的双重挑战,在杨植麟看来,目前很多长上下文模型都走了以下三个捷径: “鲸鱼模型”、“蜜蜂模型”、“蝌蚪模型”可以理解为以滑动窗口的形式直接主动丢弃上面的很多,虽然号称范围很远,但实际上支持的范围很远。

短的。

这种鲸鱼模型很难解决很多任务。

“蜜蜂模式”只关注局部,忽视全局。

虽然可以输入整个上下文,但模型可能只采样其中的一部分。

例如,如果一篇文章的关键位于中间,那么它无法提取关键信息。

“蝌蚪模型”的能力还不够。

它可能只有10亿个参数,而不是数千亿个,所以它的能力是有限的。

目前,Moonshot AI在存储、算力、带宽等方面做了很多优化。

杨植麟说,这是一篇真正可用且可产品化的长文本。

2、惊人的长文本处理能力 为什么在这场如火如荼的AI战争中,大模型的长文本处理能力成为各家公司对比的关键。

使用过大模型产品的朋友一定遇到过这样的现象:当你和大模型进行多轮对话时,它可能会忘记你之前说过的话,这时候回答的内容会过于铺天盖地。

现实情况是,大型模型在处理大量新内容时会有点不知所措,因此它们看起来会分心。

长文本处理是生成式AI的重要应用场景之一,因为良好的长文本处理能力可以让AI系统理解书籍、研究报告、法律文件等足够复杂和冗长的信息,这将为知识获取、文档分析、语义理解等方面带来实用价值。

沟通会上,杨植麟为我们展示了Kimi Chat从20万字小说中提取关键信息的能力;可一次性输入几十个文档进行提取;还可以输入链接,直接提取链接内的内容进行角色扮演;此外,您还可以分析财务报告并了解法律规定。

当被问及上下文输入太长会分散注意力的问题时,杨植麟告诉雷锋网,当你输入20万个单词时,模型肯定很难准确连接到某个token。

全球首个支持20万字输入的大型模型来了!一口气读完几十份文献和一本20万字的小说

变得更大。

因此,这里实际上需要一些更高效的对齐方法,比如如何高效地获取好的数据并通过工程的方式实现。

这需要大量的迭代和训练,传统的鲸鱼、蜜蜂和蝌蚪模型无法解决这些问题。

Moonshot AI突破这些困难的两个关键词是“全局”和“大规模参数”。

一方面是全局思考上下文,另一方面是用千亿个参数进行训练。

这两点非常重要。

杨植麟是快车终点站。

据雷锋网(公众号:雷锋网)报道,目前各大车型仍在相互追赶的竞争中。

未来,生成式人工智能的技术竞争将集中在长文本处理领域。

本文中的作者:李扬霞、微信12月。

他长期关注网络安全领域,也关注AIGC、大模型等内容。

欢迎对以上领域感兴趣的读者添加作者微信。

雷锋网原创文章,未经授权禁止转载。

详情请参见转载说明。

全球首个支持20万字输入的大型模型来了!一口气读完几十份文献和一本20万字的小说

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 搜房网今晚在纽交所IPO融资1.2亿美元

    搜房网今晚在纽交所IPO融资1.2亿美元

    北京时间9月16日消息。 据外媒报道,中国搜房网将于美国东部时间(北京时间)9月16日启动IPO。 9月16日晚)在纽约证券交易所挂牌上市,交易代码为SFUN。   搜房网计划发行30,000股美国存托股票(ADS),发行价格在40.50美元至42.50美元之间。 每股ADS股份相当于4股搜房网普

    06-18

  • 增长黑客教父的产品经理讲述:我的硅谷“增长黑客”之旅

    增长黑客教父的产品经理讲述:我的硅谷“增长黑客”之旅

    雷锋网出版社:作者曲辉曾被增长黑客教父Sean Ellis招募,曾从事著名的增长黑客网络(Growthhakers.com)担任增长产品经理;目前担任美国领先的个人理财应用程序 Acorns 的营销总监。 本文发布在 GrowingIO 博客和公众号上,并已获得许可发布。 有一群人,用数据驱动营销,用

    06-18

  • Kura AR获数百万美元Pre-A轮融资

    Kura AR获数百万美元Pre-A轮融资

    3月23日消息,据36氪报道,Kura AR近期完成新一轮融资,融资金额达数百万美元。 本轮投资者包括行业内部个人投资者、企业合作伙伴等,本轮融资主要用于产品量产和业务拓展。 Kura AR成立于2008年,公司专注于轻量AR眼镜的研发。 通过自主研发光学显示芯片、光机结构和光学仿真

    06-17

  • 南非:计划推出2.6GW风电、光伏招标项目

    南非:计划推出2.6GW风电、光伏招标项目

    据南非独立媒体网站11月1日报道,南非矿产资源和能源部长曼塔谢表示,该部门计划推出独立发电项目到今年一月,可再生能源发电。 商业采购计划(REIPPPP)的第六个招标窗口包括兆瓦级陆上风电和兆瓦级太阳能光伏。 Mantashe上周宣布了25个优先招标项目,风能和太阳能发电总量

    06-08

  • “中国企业500强”之一的威高集团选择兰陵知识管理

    “中国企业500强”之一的威高集团选择兰陵知识管理

    “我们身处技术密集、创新密集的医疗器械和制药领域,知识的有效管理和利用尤为重要兰陵已服务了众多医疗医药标杆企业,有大量成功的知识管理项目实践,我们希望与兰陵共同推动知识管理建设,提高知识管理水平,推动业务高质量发展。 ” Ming,与威高集团数字化转型办公室有关

    06-18

  • 飞行时间质谱公司“普源生物”获赤子基金

    飞行时间质谱公司“普源生物”获赤子基金

    投资界(ID:pedaily)数千万融资 7月22日消息,近日,全球领先的MALDI-TOF MS全自动仪器、耗材上市解决方案提供商湖州普源生物科技有限公司获得赤子基金数千万融资。 本轮融资由赤子基金独家投资。 本轮融资将主要用于建设新的研发基地和拓展销售渠道。 质谱法是一种分离和检

    06-17

  • 中国版Alphago只是另一个“民科”的故事吗?

    中国版Alphago只是另一个“民科”的故事吗?

    《神雕侠侣》结尾,我们看到一群武功差但自尊心很高的人跑到华山“论剑”,但原型出现在杨过这样一个真正的高手面前。 这其实并不奇怪。 想要成名,挑战天下第一武功,是最容易的事情。 人总得有一些梦想,万一梦想成真。 近期,人工智能领域也发生了类似的事情。 不不不,我

    06-18

  • 自动驾驶公司“Plus科技”宣布计划在纽交所上市,市值约33亿美元

    自动驾驶公司“Plus科技”宣布计划在纽交所上市,市值约33亿美元

    自动驾驶公司“Plus科技”(Plus)宣布已签署合并协议与特殊目的收购公司(SPAC)轩尼诗资本投资公司V根据协议,合并完成后,智嘉科技将于今年第三季度在纽约证券交易所挂牌上市,股票代码为“PLAV” ”。 根据交易条款,合并后,智嘉科技市值约33亿美元,并将获得约5亿美元

    06-18

  • 168万,比亚迪发布电动“保时捷911”

    168万,比亚迪发布电动“保时捷911”

    说到跑车,大多数人的脑海里都会浮现保时捷、法拉利、兰博基尼等世界知名品牌。 这些超级跑车承载着“速度”、“声音”、“激情”等标签,成为了很多男生的梦想。 随着电动化的兴起,超跑领域不再是传统巨头的专属舞台。 中国汽车品牌也推出了Polestar 6、耀明SSR、红旗S9等产

    06-18

  • 浦东科技创新基金设立,初始规模55亿元,重点支持六大核心产业,

    浦东科技创新基金设立,初始规模55亿元,重点支持六大核心产业,

    据投资界10月10日消息,今日,浦东科技创新母基金正式成立并投入运营,初始规模55亿元,聚焦中国等六大核心产业芯片、创新药、蓝天梦、未来汽车、智能制造、数据端口。 同时,设立一批特色鲜明的行业子基金,吸引各类社会资本,扩大基金规模,创新“产业+基地+基金”联动发展

    06-18

  • 马可- 「深度智控」完成数千万战略轮融资,源码领投Pre A+轮

    马可- 「深度智控」完成数千万战略轮融资,源码领投Pre A+轮

    近日,行业领先的深度节能与数智创新服务商深度智控宣布获得汇川产投数据千万级战略轮融资。 本轮融资是深度智控继获得腾讯、红杉、源码资本投资后今年的第三轮融资。 相关资金将用于加强深度智控的研发部署和市场推广。 其中,Source Code是该公司Pre A+轮的领投方。 汇川技

    06-17

  • 梨视频获6.17亿元A轮融资,腾讯领投、百度跟投

    梨视频获6.17亿元A轮融资,腾讯领投、百度跟投

    据投资界4月16日消息,新榜显示,梨视频近日宣布完成6.17亿元A轮融资A轮融资,由腾讯领投。 、百度等也纷纷效仿。 去年11月,梨视频获得中国文化、人民网联合投资的1.67亿元Pre-A轮融资。   据李视频透露,A轮融资完成后,将继续打造全球最先进、高效、严谨的信息内容生产网

    06-17