首页 > 科技未来 > 内容

大模型是不是有点太多了?

发布于:2024-06-18 编辑:匿名 来源:网络

上个月,AI行业爆发了一场“动物大战”。

一方面是Meta推出的Llama,由于其开源特性一直深受开发者社区的欢迎。

在认真研究Llama论文和源代码后,NEC(日本电气)迅速“自主开发”了日语版ChatGPT,帮助日本解决了AI卡顿问题。

另一边是一个名为Falcon的大型模型。

今年5月,Falcon-40B问世,击败Llama登上“开源LLM(大语言模型)排行榜”榜首。

该榜单由开源模型社区Hugging Face制作,提供了一套衡量LLM能力的标准并对其进行排名。

排行榜基本都是Llama和Falcon轮流排名。

《Llama 2》推出后,Llama家族卷土重来;但9月初,Falcon推出B版本,再次取得了更高的排名。

Falcon以68.74分击败Llama 2。

有趣的是,“猎鹰”的开发商并不是一家科技公司,而是位于阿联酋首都阿布扎比的科技创新研究所。

人士政府表示,“我们参与这场游戏是为了颠覆核心玩家”[4]。

B版本发布次日,阿联酋人工智能部长奥马尔被《时代周刊》评选为“人工智能领域最具影响力人物”;与这张中东面孔一起入选的还有“AI教父”Hinton和OpenAI。

奥特曼、李彦宏。

如今,AI领域早已进入“示范”阶段:各国和有一定财力的企业都或多或少有打造“XX中国版ChatGPT”的计划。

仅在海湾国家的圈子里,玩家就不止一个——8月份,沙特刚刚帮助国内大学购买了多件H用于培养LLM。

金沙江创投的朱啸虎曾在朋友圈抱怨:“当年我看不起(互联网上)商业模式创新,认为没有任何壁垒:几百个团队的战争,几百辆汽车的战争,一场百播之战;没想到,大规模的硬科技模型创业,还是一场百模具之战……”承诺的高难度硬科技,怎么一个模具就能在一个国家实现?每亩产量10万公斤? 1. 变形金刚吞噬世界。

美国初创企业、中国科技巨头和中东石油大亨能够追求大模型,这一切都归功于那篇著名论文:《Attention Is All You Need》。

在这篇论文中,八位谷歌计算机科学家向全世界公开了 Transformer 算法。

这篇论文目前是人工智能历史上被引用次数第三多的论文。

Transformer的出现拉动了这一轮人工智能热潮的导火索。

无论现在的大型车型是什么国籍,包括惊世骇俗的GPT系列,它们都站在Transformer的肩膀上。

在此之前,“教机器阅读”是一个公认的学术问题。

与图像识别不同,人类在阅读文本时,不仅会关注当前看到的单词和句子,还会根据上下文进行理解。

比如“Transformer”这个词,其实可以翻译为“变形金刚”,但本文的读者肯定不会这样理解,因为大家都知道,这不是一篇关于好莱坞电影的文章。

然而,早年神经网络的输入是相互独立的,不具备理解大段文本甚至整篇文章的能力,因此存在将“open water room”翻译成“开放式水房”。

直到 2000 年,曾在 Google 工作、后来跳槽到 OpenAI 的计算机科学家 Ilya Sutskever 才率先拿出了成果。

他使用循环神经网络(RNN)来处理自然语言,很快使谷歌翻译的性能与竞争产品有所不同。

RNN提出了“循环设计”,让每个神经元既接受当前时刻的输入信息,也接受上一时刻的输入信息,从而使神经网络具有“组合上下文”的能力。

循环神经网络RNN的出现点燃了学术界的研究热情,Transformer论文的作者Noam Shazeer也一度对其痴迷。

然而,开发人员很快意识到 RNN 有一个严重缺陷:该算法使用顺序计算。

虽然可以解决上下文问题,但运行效率不高,且难以处理大量参数。

RNN 的繁琐设计很快让 Shazer 感到厌烦。

因此,从今年年初开始,Shazer 和 7 位同事就开始开发 RNN 的替代品,成果就是 Transformer[8]。

与RNN相比,Transformer有两个变化:首先,它使用位置编码来代替RNN的循环设计,从而实现并行计算。

这一改变极大地提高了 Transformer 的训练效率,使其能够处理大型任务。

数据推动AI进入大模型时代;二是进一步强化情境能力。

随着Transformer一口气解决了很多缺陷,它逐渐发展成为NLP(自然语言处理)的解决方案。

有一种似曾相识的感觉,“Transformer不是天生的,NLP就像长夜”。

就连Ilya也放弃了自己亲自推上神坛的RNN,转投Transformer。

换句话说,Transformer是当今所有大型模型的始祖,因为他将大型模型从一个理论研究问题变成了一个纯粹的工程问题。

LLM技术发展树图,灰色树根为Transformer[9] 2016年,OpenAI基于Transformer开发了GPT-2,一度令学术界惊叹。

作为回应,谷歌迅速推出了更强大的人工智能,名为 Meena。

与GPT-2相比,Meena在底层算法上没有任何创新。

它仅比 GPT-2 多出 8.5 倍的训练参数和 14 倍的计算能力。

《Transformer》论文的作者谢泽尔对“一堆暴力”感到非常震惊,以至于当场写下了备忘录《米娜吞噬世界》。

Transformer的出现,大大减缓了学术界底层算法的创新。

数据工程、算力规模、模型架构等工程要素日益成为人工智能竞赛胜负的重要因素。

任何有一定技术能力的科技公司都可以打造出大型模型。

因此,计算机科学家吴恩达在斯坦福大学演讲时,提到了一个观点:“AI是工具的集合,包括监督学习、无监督学习、强化学习,以及现在的生成式人工智能。

所有这些都是通用的”技术,类似于电力、互联网等其他通用技术[10]”虽然OpenAI仍是LLM的风向标,但半导体分析机构Semi Analysis认为GPT-4的竞争力来自于工程解决方案——如果是开源的话,任何竞争对手都可以很快重新出现。

分析师预测,其他大型科技公司可能不需要太长时间就能创建出与 GPT-4 性能相当的大型模型 [11]。

“百模之战”不再是一种说辞,而是客观现实。

相关报道显示,截至今年7月,中国大型模特数量已达2万辆,这一数字高于美国。

大模型是不是有点太多了?

已经成功实现弯道超车,各种神话传说已经不足以让国内科技公司指名道姓了[12]。

除了中国和美国之外,一些相对富裕的国家也初步实现了“一国一模式”:除了日本和阿联酋,还有印度政府领导的大模式巴希尼,韩国互联网公司Naver创建的HyperClova X等等。

眼前的战斗,仿佛回到了天空布满泡沫、“金钱能力”相互较量的互联网创业时代。

如前所述,Transformer 将大型模型转变为纯粹的工程问题。

只要有人有钱、有显卡,剩下的就交给参数了。

不过,虽然入场券并不难获得,但这并不意味着每个人都有机会成为AI时代的BAT。

开头提到的“动物战争”就是一个典型案例:虽然Falcon在排行榜上击败了美洲驼,但很难说它对Meta产生了多大的影响。

众所周知,企业开源自己的科研成果不仅是为了与公众分享科技成果,也是为了调动民众的智慧。

随着大学教授、研究机构和中小企业不断使用和改进Llama,Meta可以将这些成果应用到自己的产品中。

对于开源大模型来说,活跃的开发者社区是其核心竞争力。

早在2016年成立AI实验室时,Meta就已经定下了开源的主基调;扎克伯格靠社交媒体生意发家,深谙“改善公共关系”。

例如,10月份,Meta举办了一场特别的“AI版本创建者激励”活动:使用Llama 2解决教育、环境等社会问题的开发者将有机会获得50万美元的资助。

时至今日,Meta的Llama系列已经成为开源LLM的标杆。

截至 10 月初,Hugging Face 开源LLM排行榜前 10 名中,共有 8 个基于 Llama 2 构建,且均使用其开源协议。

仅在 Hugging 脸上,就有超过 1000 个LLM使用了 Llama 2 开源协议 [13]。

截至10月初,Hugging Face上唯一的Future是基于Llama 2的。

当然,像Falcon一样提高性能也未尝不可,但时至今日,市面上大多数的Future仍然与GPT有明显的性能差距-4。

例如,日前,GPT-4 在 *AgentBench 测试中以 4.41 分的成绩排名第一。

AgentBench标准由清华大学、俄亥俄州立大学、加州大学伯克利分校联合推出。

用于评价LLM在多维开放生成环境下的推理和决策能力。

测试内容包括操作系统、数据库、知识图谱、卡片等。

不同环境下的战斗和其他 8 个任务。

测试结果显示,第二名的克劳德只得到了2.77分,差距还是很明显。

至于目前流行的开源LLM,其测试成绩大多徘徊在1分左右,不到GPT-4的1/4[14]。

AgentBench测试结果 要知道,GPT-4是今年3月份发布的,比全球同行追赶了半年多。

造成这种差距的原因是OpenAI拥有极高“智商密度”的科学家团队以及长期学习LLM积累的经验,因此始终能够遥遥领先。

也就是说,大模型的核心能力不是参数,而是生态构建(开源)或者纯粹的推理能力(闭源)。

随着开源社区变得越来越活跃,每个LLM的表现可能会趋同,因为每个人都在使用相似的模型架构和相似的数据集。

另一个更直观的问题是:除了中途,似乎没有哪个大模式能够赚钱。

3.价值锚今年8月,一篇题为《OpenAI年底可能破产》的文章引起广泛关注[16]。

文章的主旨几乎可以用一句话来概括:OpenAI 烧钱太快了。

文章提到,自ChatGPT开发以来,OpenAI的亏损迅速扩大,短短一年时间就损失了约5.4亿美元,只能等待微软投资者来买单。

文章的标题虽然煽情,但也道出了很多大型模型提供商的现状:成本与收入严重失衡。

成本太高,所以目前靠人工智能赚大钱的只有英伟达,顶多还有博通。

据咨询公司 Omdia 估计,Nvidia 今年第二季度 H 机销量超过 30 万台。

这是一款训练AI极其高效的AI芯片。

世界各地的科技公司和科研机构都争相收购。

如果将售出的 30 万件 H 叠在一起,其重量相当于 4.5 架波音飞机[18]。

英伟达的业绩也起飞,营收同比飙升%,一度震惊华尔街。

顺便说一句,目前H在二手市场的价格已经卖到4万美元到5万美元,但其材料成本只有1万美元左右。

算力成本高昂在一定程度上成为行业发展的阻碍。

红杉资本曾算过一笔账:全球科技公司预计每年花费1亿美元用于大规模模型基础设施建设;相比之下,大型模型每年最多只能产生1亿美元的收入,中间至少还有1亿美元的收入。

缺口达1亿美元[17]。

另外,除了中途这样的少数案例外,大多数软件公司在付出巨大成本后还没有弄清楚如何赚钱。

尤其是行业内的两大领头羊微软和Adobe,更是令人瞠目结舌。

微软和 OpenAI 合作开发了人工智能代码生成工具 GitHub Copilot。

虽然每月收取10美元的费用,但微软将因设施成本而损失20美元。

重度用户甚至会让微软每月花费 80 美元。

据此猜测,售价30美元的微软Copilot可能会损失更多。

无独有偶,刚刚发布Firefly AI工具的Adobe也迅速推出了支持积分系统,以防止用户大量使用给公司造成损失。

一旦用户使用的积分超过每月分配的积分,Adobe 将减慢服务速度。

要知道,微软和Adobe已经是软件巨头,拥有清晰的业务场景和大量现成的付费用户。

对于大多数参数巨大的大型模型来说,最好的应用场景就是聊天。

不可否认,如果没有OpenAI和ChatGPT的出现,这场AI革命可能根本就不会发生;但目前,训练大型模型带来的价值可能值得怀疑。

而且,随着同质化竞争加剧,市场上开源机型越来越多,留给纯大机型供应商的空间可能会越来越少。

iPhone 4受欢迎并不是因为它的45nm工艺A4处理器,而是因为它可以玩植物大战僵尸和愤怒的小鸟。

【本文由投资界合作伙伴元川研究院授权发表。

本平台仅提供信息存储服务。

】如有任何疑问,请联系投资界()。

大模型是不是有点太多了?

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 红山科技完成1亿元天使轮融资,君联资本领投

    红山科技完成1亿元天使轮融资,君联资本领投

    据投资界6月5日消息,北京红山信息技术研究院有限公司(以下简称红山科技)正式宣布现场举行天使轮融资完成暨签约仪式,本轮融资由君联资本领投。 北京红山信息技术研究院有限公司成立于今年11月,位于北京经济技术开发区。 是北京市政府重点支持的、专注于以5G为代表的新一

    06-17

  • 专注女性健康管理,闺巢生明获数百万元种子轮融资

    专注女性健康管理,闺巢生明获数百万元种子轮融资

    据铅笔路12月22日报道,国医集团旗下女性健康医疗品牌“闺巢生明”获数百万元种子轮融资融资。 ,由时尚女性品牌“俪凝美居”投资基金投资,双方将共同打造女性全生命周期健康医疗管理服务平台。 本轮融资将主要用于医院、仪器、研发团队等核心系统建设。 据了解,闺巢生明专

    06-17

  • 生酪拿铁单周销量659万杯,瑞幸独家热销逻辑来了

    生酪拿铁单周销量659万杯,瑞幸独家热销逻辑来了

    瑞幸又火了。 10月10日,瑞幸与知名动漫IP《JOJO的奇妙冒险 石之海》推出了联名咖啡——生酪拿铁。 一经推出就立即引起轰动。 首日销量突破万杯,成为瑞幸首日单品之王。 场面有多壮观?纵观微博、小红书、朋友圈等社交媒体,我们经常看到网友发帖、分享图片自发组成的“生酪

    06-17

  • 泸州北方化工有限公司与兰陵数字智能OA签约

    泸州北方化工有限公司与兰陵数字智能OA签约

    泸州北方化工有限公司(国营厂)隶属于中国兵器工业集团有限公司,总部位于位于四川省泸州市(宜宾市设有川安分公司),是我国西南地区唯一的炸药企业。 它的前身是中国近代史上第一个化学兵工厂。 1999年建于河南省巩县,2011年搬迁至四川省泸州,2011年改制为泸州北方化工有

    06-18

  • 极好的!阿里云创新中心又添两家国家级选手...

    极好的!阿里云创新中心又添两家国家级选手...

    近日,科技部发布《关于印发年度国家备案众创空间的通知》,阿里云创新中心常州武进基地、阿里云创新中心长春基地成功入选国家级注册创客空间。 阿里巴巴云创新中心家族又添两名国家级选手。 截至目前,阿里云创新中心家族拥有6个国家级众创空间,这6个创新中心率先从60个基地

    06-18

  • 合肥设立战新产业基金,35亿

    合肥设立战新产业基金,35亿

    据投资界(ID:pedaily)消息,9月29日,国风新材(股票代码:59)发布公告称,公司将作为有限合伙人与其自有资金3亿元参与设立合肥市国有资本与新兴产业投资基金合伙企业(暂名,待工商审批)。 该基金总规模35亿元,合肥建成资本管理有限公司担任基金管理人。 基金投资范围

    06-18

  • 北京:到2025年,培育一批专业化、新型企业,

    北京:到2025年,培育一批专业化、新型企业,

    成为头条新闻。 最近,《北京市国资委国有经济“十四五”发展规划》发布了。 《规划》提出加大创新投入,加快攻克一批“卡壳”技术。 到2020年,高精尖产业营业收入占比将超过三分之一。 不仅将形成10至15家世界领先或行业领先的公司,而且还将创建一批专业化、新型公司。 《

    06-18

  • 净资产77亿美元!海底捞老板娘成立家族办公室

    净资产77亿美元!海底捞老板娘成立家族办公室

    进入量化投资领域后,海底捞随后成立了家族办公室。 疫情期间,作为国内餐饮行业的巨头,海底捞创始人、张勇一直保持沉默。 这次是张勇的妻子出面。 据《彭博》3月4日报道,海底捞联合创始人舒萍于2018年在新加坡设立家族办公室。 至此,海底捞的投资版图逐渐扩大。 VC/PE圈

    06-18

  • 云计算解决方案服务商BoCloud博云完成1亿元C轮融资

    云计算解决方案服务商BoCloud博云完成1亿元C轮融资

    投资界获悉,1月12日,云计算解决方案服务商BoCloud博云(以下简称“博云”)宣布完成1亿元C轮融资C融资。 本轮融资新投资方包括蔚来资本、康力君卓、天创资本,以及元和控股、邦盛资本、京东云等老股东追加投资。 据悉,本轮融资将主要用于博云产品矩阵核心技术的研发与创新

    06-17

  • 投资世界24小时 -恒大回应破产重组消息;泡泡玛特投资动漫公司; 700家明星工作室取消

    投资世界24小时 -恒大回应破产重组消息;泡泡玛特投资动漫公司; 700家明星工作室取消

    重要消息:这家独角兽再融资12亿,红杉IDG来了电子签名行业首轮E轮融资来了。 据投资界9月13日消息,电子签名服务商eSignature今日宣布完成12亿元E轮融资,由红杉中国、IDG资本、普洛斯隐山资本、粤投集团领投、温氏资本及老挝股东大陈财智、元一投资也参与了投资。 值得一提

    06-18

  • 左电完成数千万元A轮融资,天图独家投资

    左电完成数千万元A轮融资,天图独家投资

    据投资界(微信ID:pedaily)6月23日消息,左电ZDEER,一家专注于智慧医疗、智能家居的创新科技品牌消费医疗领域,宣布近日完成数千万元A轮融资,由天图投资独家投资。 本轮融资将主要用于产品研发、品类拓展和营销推广。 12月,左电ZDEER成立。 是专注于智能医疗领域的创新

    06-18

  • 最赚钱的健身博主帕梅拉:25岁,抖音抢走了她的

    最赚钱的健身博主帕梅拉:25岁,抖音抢走了她的

    就在刘畊宏姑娘破万的时候,健身界最强潮流风向标——帕梅拉,进场了抖音。 5月2日,帕梅拉正式入驻抖音,并于抖音开启直播首秀。 当晚,她两次登上微博热搜。 截至目前,帕梅拉的第一条视频播放量已超过一万次,网友大呼“救命”,“我以为逃过了刘畊宏,没想到帕梅拉也这么

    06-17