首页 > 科技未来 > 内容

全球首个支持20万字输入的大型模型来了!一口气读完几十份文献和一本20万字的小说

发布于:2024-06-18 编辑:匿名 来源:网络

作者:李扬霞编辑:陈彩娴10月9日,杨植麟创立的月之暗面也发布了一款大型模型产品——Moonshot AI。

该模型的智能助手Kimi Chat是全球首个支持20万字输入长度的大型模型。

据杨植麟介绍介绍,Claude支持约8万字,而GPT4只支持约2万字。

换句话说,Moonshot AI已经超越了支持K输入长度的大模型Claude和支持32K代币处理能力的GPT4。

其中,Claude通过提供长文本问答服务实现了产品层的突破,并于近期获得了亚马逊40亿的投资。

成立不久,月暗面已获得红杉资本、今日资本、理思资本等知名投资机构近20亿元融资。

那么杨植麟在国内大型模型公司中的地位如何呢? 硅谷极具影响力的科技媒体The Information列出了MiniMax、智普AI、Light Years Beyond和兰州科技等五家被认为可能成为“中国OpenAI”的候选人。

另一个立场是杨植麟。

杨植麟不仅师从清华大学教授、IEEE Fellow唐杰。

随后,他还前往世界排名第一的 NLP 研究机构 CMU(卡内基梅隆大学)的语言技术学院(LTI)攻读博士学位,师从苹果公司 AI 负责人 Ruslan Salakhutdinov、首席科学家 William W. Cohen。

谷歌人工智能科学家。

博士卡内基梅隆大学计算机科学专业的学生往往需要六年的学习才能毕业,而杨植麟从卡内基梅隆大学只用了四年就毕业了()。

其团队核心成员大多来自清华大学,具有明星团队的光环,备受关注。

杨植麟表示,本次创业针对的是ToC赛道,并阐述了创业的三个主要原因:一是探索智能的边界,满足好奇心;第二,探索对世界有用的东西,并与用户一起创造和发现它们。

实施场景;第三,我们希望人工智能具有包容性,为实现个性化融合提供更有力的方式。

(Kimi Chat内测界面) 1、瞄准ToC赛道 “大模型产品将进入长文本时代”,杨植麟在媒体沟通会上指出。

Moonshot AI认为,更长的上下文长度可以为大型模型的应用带来新的篇章,促使大型模型从LLM时代进入L(Long)LLM时代。

“我们认为,不仅要有足够多的参数,同时还要具备长上下文能力,这是新一代大模型记忆的标志。

“在杨植麟看来,制作一个大模型有两个条件。

第一个是参数的数量,因为参数的数量决定了能处理什么。

多么复杂的计算;第二个条件是文本长度,因为上下文杨植麟表示,突破长文本能力是“登月计划”的第一步,也为后续的多模态能力奠定了基础。

他告诉雷锋网,他计划推出多模态能力。

Moonshot AI的技术路线不是走捷径,而是脚踏实地解决算法和工程的双重挑战,在杨植麟看来,目前很多长上下文模型都走了以下三个捷径: “鲸鱼模型”、“蜜蜂模型”、“蝌蚪模型”可以理解为以滑动窗口的形式直接主动丢弃上面的很多,虽然号称范围很远,但实际上支持的范围很远。

短的。

这种鲸鱼模型很难解决很多任务。

“蜜蜂模式”只关注局部,忽视全局。

虽然可以输入整个上下文,但模型可能只采样其中的一部分。

例如,如果一篇文章的关键位于中间,那么它无法提取关键信息。

“蝌蚪模型”的能力还不够。

它可能只有10亿个参数,而不是数千亿个,所以它的能力是有限的。

目前,Moonshot AI在存储、算力、带宽等方面做了很多优化。

杨植麟说,这是一篇真正可用且可产品化的长文本。

2、惊人的长文本处理能力 为什么在这场如火如荼的AI战争中,大模型的长文本处理能力成为各家公司对比的关键。

使用过大模型产品的朋友一定遇到过这样的现象:当你和大模型进行多轮对话时,它可能会忘记你之前说过的话,这时候回答的内容会过于铺天盖地。

现实情况是,大型模型在处理大量新内容时会有点不知所措,因此它们看起来会分心。

长文本处理是生成式AI的重要应用场景之一,因为良好的长文本处理能力可以让AI系统理解书籍、研究报告、法律文件等足够复杂和冗长的信息,这将为知识获取、文档分析、语义理解等方面带来实用价值。

沟通会上,杨植麟为我们展示了Kimi Chat从20万字小说中提取关键信息的能力;可一次性输入几十个文档进行提取;还可以输入链接,直接提取链接内的内容进行角色扮演;此外,您还可以分析财务报告并了解法律规定。

当被问及上下文输入太长会分散注意力的问题时,杨植麟告诉雷锋网,当你输入20万个单词时,模型肯定很难准确连接到某个token。

全球首个支持20万字输入的大型模型来了!一口气读完几十份文献和一本20万字的小说

变得更大。

因此,这里实际上需要一些更高效的对齐方法,比如如何高效地获取好的数据并通过工程的方式实现。

这需要大量的迭代和训练,传统的鲸鱼、蜜蜂和蝌蚪模型无法解决这些问题。

Moonshot AI突破这些困难的两个关键词是“全局”和“大规模参数”。

一方面是全局思考上下文,另一方面是用千亿个参数进行训练。

这两点非常重要。

杨植麟是快车终点站。

据雷锋网(公众号:雷锋网)报道,目前各大车型仍在相互追赶的竞争中。

未来,生成式人工智能的技术竞争将集中在长文本处理领域。

本文中的作者:李扬霞、微信12月。

他长期关注网络安全领域,也关注AIGC、大模型等内容。

欢迎对以上领域感兴趣的读者添加作者微信。

雷锋网原创文章,未经授权禁止转载。

详情请参见转载说明。

全球首个支持20万字输入的大型模型来了!一口气读完几十份文献和一本20万字的小说

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • LP说要签名打赌,我一晚上都睡不着

    LP说要签名打赌,我一晚上都睡不着

    你可能不知道,这样的场景正在VC/PE圈子里发生。 一年来,我们密集走访了一圈投资机构,一个话题开始被频繁提及——LP开始尝试与GP签署对赌协议。 这意味着,当GP业绩不如预期时,LP要求其拿出底线,退回投资。 过去,投资者和项目方之间经常出现赌博行为。 小米、巨头等互联

    06-18

  • 张燕冬对话陈章良:靶向药物将是未来五到十年的热门话题

    张燕冬对话陈章良:靶向药物将是未来五到十年的热门话题

    12月17日,在三亚市人民政府支持、《财经》协办的“三亚财经国际”上、财经网、《财经智库》论坛》、《财经》执行主编、《财经智库》总裁张燕冬对话著名科学家陈章良。 《财经》杂志执行主编、《财经智库》总裁张燕冬对话著名科学家陈章良陈章良表示,与传统的化学药物相比,

    06-18

  • 存款资金被占用、利益被转移?珠海冠宇回应科创板首轮IPO问询

    存款资金被占用、利益被转移?珠海冠宇回应科创板首轮IPO问询

    珠海冠宇电池股份有限公司(以下简称:珠海冠宇)回应科创板首轮问询2月2日董事会IPO。 首轮问询共关注珠海冠宇的基本信息、业务与技术、公司治理与独立性、财务会计与管理层的讨论与分析等五个方面。 上海证券交易所涉及对赌协议、资金拆借、关联交易等48个问题。

    06-18

  • 音乐教育领域最大一笔融资诞生, VIP陪练获腾讯、兰信亚洲领投数亿元B轮投资

    音乐教育领域最大一笔融资诞生, VIP陪练获腾讯、兰信亚洲领投数亿元B轮投资

    据投资界1月8日消息,在线音乐教育平台VIP陪练宣布于近日完成B轮融资。 以知名企业腾讯、蓝信亚洲领投,其他投资方还有蓝驰创投、金沙江创投、长石资本等。 巨头全部参与了投资。 本轮融资金额达数亿元人民币。   今年以来,他开始尝试互联网+音乐教育模式。 VIP陪练年底获

    06-17

  • 为推动大众创业、万众创新深入发展,“新时代科技大众创业、高质量发展论坛”在全国大众创业万众创新活动周期间举办

    为推动大众创业、万众创新深入发展,“新时代科技大众创业、高质量发展论坛”在全国大众创业万众创新活动周期间举办

    10月19日,全国大众创业万众创新周、科技部火炬高技术产业新时代科技大众创业高质量发展论坛,由发展中心、河南省科技厅主办,由郑州市金水区人民政府主办、创头条主办,在河南省郑州市隆重举行。 科技部党组成员副部长邵新宇,河南省人民政府副省长霍金花,郑州市委常委、党

    06-18

  • 西门子收购Insight EDA,拓展Calibre可靠性验证系列

    西门子收购Insight EDA,拓展Calibre可靠性验证系列

    此次收购可以帮助客户在集成电路(IC)设计过程中更轻松地进行针对特定设计的可靠性验证和分析。 西门子数字工业软件最近宣布完成对 EDA 公司 Insight Acquisition 的收购,该公司为全球集成电路 (IC) 设计团队提供突破性的电路可靠性解决方案。 Insight EDA 成立于 ,致力于

    06-06

  • 《西湖区产业基金管理办法》2.0版正式发布

    《西湖区产业基金管理办法》2.0版正式发布

    近日,《西湖区产业基金管理办法》2.0版(以下简称《管理办法》)正式发布,进一步优化和完善原有政府投资基金运营管理机制支持西湖区重点产业“助力”创业企业,培育上市企业和拟上市梯队企业。 《管理办法》共八章三十六条,包括总则、组织架构与运作模式、投资原则与要求

    06-18

  • ASML将在新加坡扩建新生产线

    ASML将在新加坡扩建新生产线

    光刻机巨头ASML在新加坡工厂开业仪式上宣布,将在该工厂建设第二个制造车间,预计年初投入生产年。 扩建后的工厂将使该公司在新加坡的产能增加两倍,全球产能增加一倍。 ASML是全球领先的科技公司之一,也是全球半导体价值链的主要参与者。 这里设计的技术和机器有助于在新加

    06-08

  • 智慧在粤港澳!汇聚数字原生创新力量,共商云前路

    智慧在粤港澳!汇聚数字原生创新力量,共商云前路

    阿里云加速器带来数字原生创业时光路演,六家加速器企业创始人将带来时光故事分享,涵盖虚实融合、智能网联、自动驾驶、智能网联、智能制造、企业服务赛道。 阿里云智能分发生态系统及中小企业事业部总经理潘立维、阿里云智能云原生应用平台王牌(舒通)、存储团队Alex、达摩

    06-18

  • 「富树科技」已累计获得C轮、B轮数亿元融资

    「富树科技」已累计获得C轮、B轮数亿元融资

    「富树科技」今日正式宣布完成C轮、B轮融资。 C轮投资方包括中国互联网投资基金、同创伟业,B轮融资亚信证券、晨兴资本等,两轮融资累计金额达数亿元人民币。 本轮融资后,浮数科技将继续投入技术研发和产品打磨,加强市场拓展,加速隐私计算在商业层面的大规模应用,构建互联

    06-18

  • 珠海炬力:公司产品包括不同系列的低功耗系统级芯片

    珠海炬力:公司产品包括不同系列的低功耗系统级芯片

    每日经济新闻 每条AI新闻,都有投资者在投资者互动平台上问:您好。 现在各地学校因为疫情只能上网。 在线教学需要使用该公司的产品吗?珠海炬力(49.SH)4月13日在投资者互动平台表示,公司产品包括不同系列的低功耗系统级芯片,主要应用于无线音频、智能穿戴及语音互动智能

    06-06

  • 硬核防窃听! Mac独有的功能来到iPad:业界最严格的保护机制,基于T2芯片

    硬核防窃听! Mac独有的功能来到iPad:业界最严格的保护机制,基于T2芯片

    苹果在保护用户个人隐私方面真是不遗余力。 这种不遗余力也体现在苹果最新的设备上。 不久前发布的MacBook Air搭载了苹果自主研发的T2安全芯片。 作为当前Mac设备的重要组成部分和独特的产品标志,T2安全芯片的核心功能之一就是实现麦克风的硬件屏蔽。 (硬件断开)。 现在,

    06-18