首页 > 科技未来 > 内容

大语言模型前所未有的突破

发布于：2024-06-18 编辑：匿名来源：网络

不久前的9月底，号称“ChatGPT最强替代品”的Anthropic获得了亚马逊40亿美元的投资。

不久之后，他们发表了一篇论文《朝向单义性：通过词典学习分解语言模型》（Towards Monosemanticity：Decompositing Language Models With Dictionary Learning），其中详细阐述了解释神经网络和大型语言模型（通常称为 LLM）行为的方法。

Anthropic之所以被戏称为“ChatGPT最强替代品”，主要是因为其几乎所有创始成员都参与了GPT系列早期版本的开发，尤其是GPT-2和GPT-3。

众所周知，GPT系列真正引起关注是从GPT-3之后的3.5开始。

俗话说“罗马不是一天建成的”。

而且，Anthropic的AIGC产品Claude并不逊色于ChatGPT。

克劳德2的最新版本于今年夏天推出。

英国人《卫报》对此评论道，“训练时安全是首要考虑因素，可以称为‘宪政AI’”或“宪政机器人””，人工智能或机器人的新分类和研究也可能由此开始。

现在市场上流行的LLM基本上都是基于海量神经网络构建的，而神经网络是基于海量数据AIGC进行训练的，比如文本、图片、视频等多模态或者跨模态的内容。

..，可以保证相当的精度，而且数量越来越丰富，但是可解释性始终是一个很难突破的难点，比如我们找一个AI，问1=？他们都说1=2，但是没有一个能做到。

解释这个过程是如何发生的。

即使可以进行简单的解释，也只是基于对语义的肤浅理解，就像我们人类睡觉时做的梦一样，每个人都可以粗略地描述梦的内容。

对于梦的成因，几千年来一直没有合理、统一的解释。

像ChatGPT这样的LLM经常会出现无序、混乱、虚假信息等问题，这种行为被称为“AI幻觉”，通常被说成是严重的无稽之谈，主要是因为人类无法控制大型模型中的AI和神经网络。

行为。

因此，Anthropic的研究对于提升LLM，甚至是AI和大型模型的整体准确性和安全性，以及减少有害内容的输出非常有帮助。

这篇论文作为参考还是很有用的。

论文链接：0 1 关于神经元和神经网络为了更好地理解人择研究的意义，这里简单介绍一下几个基本概念。

神经元是神经网络的基本组成部分，主要输入、计算和输出数据。

它的工作原理是模拟大脑神经元的工作方式，接收一个或多个输入，每个输入都有相应的权重。

将这些输入和权重的乘积相加，然后添加偏差项。

得到的总和被输入到激活函数中，激活函数的输出就是该神经单元的输出。

神经元工作流程示意图，其中a1-an是输入向量的分量，w1-wn是神经元每个突触的权重值，b是偏置项，f是传递函数，通常是非线性函数，t是神经元最终的输出结果。

如前所述，神经元是神经网络的基本形式。

一定数量的神经元可以组成神经网络。

这种系统起源于对人类中枢神经系统的观察、研究和逆向应用。

最初的概念早在 20 世纪 40 年代初就被提出。

它于 2001 年首次在 IBM 计算机上实现，但此后陷入沉寂，直到 1980 年“反向传播算法”的发明，“分布式并行处理”（当时称为“连接主义”）的思想开始流行20世纪80年代中期，促使社会各界重新开始关注神经网络。

进入新世纪后，特别是2006年出现的“残差神经网络”概念，极大地突破了神经网络的深度限制。

随着“深度学习”概念的提出和流行，神经元和神经网络也越来越受欢迎。

引人注目的头发。

0 2 LLM 等大型模型的重要性。

前面说过，现在的LLM、大模型、AIGC等基本上都是靠神经元、神经网络来发展和成长的。

雄辩的 ChatGPT 也依赖于 Transformer 神经网络架构的发展。

来。

LLM 使用神经网络来处理和生成文本。

在训练过程中，他们学习如何预测文本序列中的下一个单词，或给定文本一部分的可能的后续内容。

为了做到这一点，法学硕士需要理解该语言的语法、语义以及某种程度上的上下文。

综上所述，神经元和神经网络提供了处理和生成自然语言的计算框架，LLM 使用该框架来理解和生成文本。

这也是很多人把现在LLM、AIGC、甚至整个AI的原理概括为“概率论+魔法”的主要原因之一。

客观地说，这种说法有点极端但确实有道理，因为目前大部分大型型号包括GPT系列的生成原理确实可以这样概括。

前面提到，AI的工作方式可以看作是对人脑工作方式的逆向应用和模仿，而GPT使用的黑匣子系统在结构上也模仿了大脑，由大量的神经元组成。

因此，要说“可解释性”，你必须了解每个神经元在做什么。

0 3 Anthropic的研究 Anthropic的研究是基于Transformer模型的小规模实验，将每个神经元分解为多个特征并一一排序，例如DNA序列、法律术语、HTTP请求、营养说明等。

经过实验和研究发现，单个特征的行为比神经元的行为更容易解释和可控，而且每个特征在不同的大模型中基本具有通用性。

为了验证这一研究结果，Anthropic还创建了一个盲评估系统来比较个体特征和神经元的可解释性。

从图中可以看出，特征（紫红色）的可解释性得分远高于神经元部分。

较少（青蓝色）。

大语言模型前所未有的突破

此外，Anthropic还采用了自动解释方法。

最终的结果是特征得分高于神经元得分。

但这种方法比较复杂，这里不再讨论。

详细信息请参阅其论文。

Anthropic 的这项研究确实意义重大，但 OpenAI 几个月前也做了类似的事情。

今年5月初，OpenAI在官网发表了一篇博客文章《语言模型可以解释语言模型中的神经元》（语言模型可以解释语言模型中的神经元），文中称：“我们使用GPT-4自动编写LLM中神经元行为的解释，并对这些进行评分解释，现在 GPT-2 中每个神经元的这些（错误）解释和分数的数据集已经发布了，“几乎所有当时读过这篇论文的人都被 OpenAI 的奇思怪想所震惊。

头皮发麻。

当时之所以进行这项研究，主要是为了回答ChatGPT在全球的流行引发的一个问题：“AI发展到这个阶段，是如何实现如此强大的功能的？”为了回答这个问题，OpenAI当时的做法可以简单概括为“用黑匣子解释黑匣子”。

而且，OpenAI此次的研究成果，可以算是AI、大模型等相关公司后续研究探索的新方向，自然意义重大。

前面提到，AI可以看作是大脑工作原理的逆向应用，而LLM等大型模型所使用的黑匣子结构也是由海量神经元组成，同样是在模仿大脑。

OpenAI 当时给出的解释过程分为三个步骤：给 GPT-4 一个 GPT-2 的现有神经元，GPT-4 显示相关文本序列和激活状态，从而生成对此类行为的解释；再次使用GPT -4，模拟解释的神经元会做什么；比较两者的结果，根据匹配程度对GPT-4解释进行评分。

最终，OpenAI 表示，GPT-4 解释了 GPT-2 中全部约 30 万个神经元，但绝大多数实际得分较低。

只有不到一千多个分数高于0.8，这意味着神经元Most*激活行为是由这一千多个神经元引起的。

看来AI也可能有意无意地遵循着“80-20规则”。

当时，这一研究成果迅速引起全球各大科技平台的广泛关注。

有人感叹AI进化的方式越来越先进：“未来，AI将被用来改进AI和大型模型，这将加速进化。

”还有人批评其得分过低：“这就是GPT-2的解释，那么如何理解GPT-3.5和GPT-4的内部结构呢？但这就是现在很多人更关注的答案。

”虽然计算机是为了模仿人脑的原理而发明的，但人脑的结构实际上并不高效。

例如，没有存储设备和神经元。

交流也是通过激素或荷尔蒙等化学手段进行的，这是相当尴尬的。

这样“落后”的“部件”居然能够赋予人类如此高的智能，这说明人脑的强大主要在于它的架构。

当前，探索智能的本质也是脑科学研究的中心任务之一。

了解人类自身、破译思维和智能的成因，是一种科学探索的需要。

脑科学与人工智能密切相关。

它不仅可以提高我们对自身奥秘的认识，还可以提高我们对脑部疾病的认识。

同时，相关科研成果也可以为类脑计算的发展提供基础，突破传统计算机架构的限制。

但目前，类脑计算仍然有巨大的空间，等待科学研究来填补。

如今，具有数千亿参数的大型模型很常见。

如果将参数视为神经突触，那么大模型只对应人脑中的1亿个神经元。

人脑的1亿个神经元与数千亿个神经元之间的差距多达千倍之多，而这个差距也可能是人类科学迈向AGI必须跨越的鸿沟。

OpenAI和Anthropic所做的研究也给我们的科技进步展示了一种可能性：当未来的AI变得更加强大，甚至有一天可能超越人类时，它未来也能做更多的事情。

尖端科技为人类提供帮助；而在智能的研究中，AI系统也是除了生物大脑之外的新的研究对象，这也为解开智能之谜带来了新的希望。

【本文由投资社区合作伙伴微信公众号授权：壹欧网。

本平台仅提供信息存储服务。

】如有任何疑问，请联系投资界（）。

站长声明

标签：

上一篇：可米生活获京东数字科技集团旗下千树资本投资

下一篇：AI语音视频技术解决方案提供商“盛熙科技”完成数千万元Pre-A轮融资

Netflix版《三体》上线，耗资1.6亿美元却被国内版打败？

Netflix版《三体》正式上线。第一季8集全部上线，每集约60分钟！由《权力的游戏》制作人团队打造，平均每集预算高达1万美元，第一季总预算约1.6亿美元。它是 Netflix 历史上最昂贵的单集投资项目之一。贵就一定是好的吗？ Netflix一贯的标准是，当前Netflix版本《三体》的

06-21
馋匪完成数千万元天使轮融资

据投资界（ID：pedaily）4月19日消息，据36氪获悉，即食特色零食品牌“馋匪”已获完成数千万元天使轮融资。本轮融资由Telescope Venture Capital独家投资，亿纬资本担任独家投资方。本轮融资主要用于品牌及供应链建设。 “馋匪”于年底成立。其主营业务是将地方特色零食从

06-18
【每日投资事件】唯品会：资本市场蓬勃发展，上市不是终点

唯品会从血腥上市到利润扩张：“上市永远不是终点”　　时隔两年多，记者曾经再次探访广州荔湾区位于醉观公园的唯品会总部，由六座旧粮仓改建而成的花园式办公区，依然安静，与马路对面车水马龙的车流相比，显得格外安静。这非常符合唯品会的气质：在喧闹的电商行业环境中，

06-17
买鞋的九西店破产了吗？

零售业正在经历一个动荡时期。据不完全统计，仅去年一年就有超过15起破产案件，其中包括全球最大的玩具制造商玩具“反”斗城。　　而现在，破产大军中又加入了新成员。全球最大的女鞋及配饰制造商和销售商之一的九西终于不堪重负，于4月6日申请破产保护。　　这个美国品牌

06-18
荣耀会员体系升级的背后，与用户的关系进一步加强

在现有市场竞争环境下，厂商的关注点正从“以产品为中心”转向“以用户为中心”。一方面我们在打磨硬件，为用户带来更好的体验，另一方面我们也在完善服务，满足用户更多场景的需求。荣耀全新升级的会员体系是站在用户角度思考的结果。把用户放在第一位，开辟了各种会员平

06-21
中南建设：3月房地产业务销售金额同比增长122.2%

中南建设房地产业务3月合同销售金额2亿，同比增长0.2%去年期间；销售面积0.7万平方米，增加.同比增长0.8%。

06-18
SEMI：半导体设备年度销售总额突破1000亿美元，同比增长44.7%

根据SEMI年终半导体设备总额预测，按原始设备计算，全球半导体制造设备销售总额制造商预计今年将达到 1 亿美元的新高，比去年行业记录的 1 亿美元增长 44.7%。随着全球晶圆厂扩产，到今年半导体制造设备市场总额将扩大至1亿美元，并且这种增长预计将持续下去。 SEMI总裁兼首

06-08
是德科技与中国移动合作开发以太无损网络（RoCE）测试方案

是德科技与中国移动合作开发无损以太网测试解决方案是德科技是一家领先的技术公司，帮助企业、服务提供商和政府客户加速创新，创建一个安全的互联世界。无损以太网（RoCE）是IBTA（InfiniBand Trade Association）定义的标准协议，支持通过以太网进行更高效的数据传输。该技

06-06
海派世通推出用例跟踪器来优化 NAND 闪存配置和管理

通过启用跟踪和分析应用程序如何使用闪存的功能，制造商现在可以确定适合任何用例的最佳闪存存储技术。德国康斯坦茨，2019 年 4 月 23 日——海派世通很高兴为客户提供其用例跟踪器技术，该技术利用其在 NAND 闪存管理方面的专业知识来跟踪和分析客户的独特用例。海派世通

06-06
日本发力碳化硅功率半导体

日本正在重点发展碳化硅功率半导体，以扩大纯电动汽车（EV）的需求。日本企业已开始增加节能性能更高的下一代半导体的产量。该材料采用新型材料代替传统的硅。东芝将在年底前将生产规模扩大至10倍，罗姆也将投资1亿日元加强生产。为了稳定获得原材料，各家企业也会通过并

06-08
【创业24小时】2023年6月8日

投融资昨天，国内市场共发生15起投资披露事件，其中先进制造6起（友基软件、点石航空、科耀能源、耀明新能源、新塔电子、宇芯半导体）、企业服务案例4个（TradeMonday、UPHOTO优派云、舒心、智慧优视）、医疗健康案例3个（阿基米德光学、百力康、嘉悦药业）、电商零售1个（UF

06-17
【CSHE2015】2015中国智能硬件开发者大会取得圆满成功

在全国创客和智能硬件生态建设者的热烈期待下，由思瑞达传媒主办的“中国智能硬件开发者大会”于5月召开21日在中国硅谷深圳隆重举行。与“中国智能家居博览会”和“深圳（国际）集成电路技术创新与应用展”同期举办，引爆深圳会展中心。我们穿过人群，直奔引人最关注的“中

06-17