首页 > 科技未来 > 内容

最厉害的开源大模型深夜爆炸!马斯克喜欢《骆驼3王者归来》,与GPT-4一样接近-附体验链接

发布于:2024-06-21 编辑:匿名 来源:网络

不出意外,Meta带着Llama 3系列模型来“炸街”,被誉为“史上最强大的开源大型模型”。

具体来说,Meta开源了8B和70B两种不同尺寸的型号。

Llama 3 8B:基本上与最大的 Llama 2 70B 一样强大。

Llama 3 70B:一级AI模型,媲美Gemini 1.5 Pro,全面超越Claude。

大杯及以上只是Meta的开胃菜,真正的盛宴还在后头。

未来几个月,Meta将陆续推出一系列具有多模态、多语言对话、更长上下文窗口等能力的新模型。

其中,超B级重量级选手有望与Claude“掰手腕”3次超级杯。

Llama 3体验地址:GPT-4关卡模型来了,Llama 3开放。

与上一代Llama 2车型相比,Llama 3可以说达到了一个新的水平。

得益于预训练和训练后的改进,本次发布的预训练和指令微调模型是当今8B和70B参数尺度上最强大的模型。

同时,训练后过程的优化也显着降低了模型的错误率。

,增强了模型的一致性并丰富了响应的多样性。

扎克伯格曾在公开演讲中透露,考虑到用户不会向Meta AI询问有关WhatsApp中编码的问题,Llama 2在这方面的优化并不突出。

这次,Llama 3 在推理、代码生成和跟随指令方面实现了突破性改进,使其更加灵活和易于使用。

基准测试结果显示,Llama 3 8B 在 MMLU、GPQA、HumanEval 等测试中的得分远高于 Google Gemma 7B 和 Mistral 7B Instruct。

用扎克伯格的话说,最小的Llama 3基本和最大的Llama 2一样强大。

Llama 3 70B跻身顶级AI模型之列。

其整体表现全面超越Claude3杯。

与Gemini 1.5 Pro相比,是双赢的局面。

为了准确研究基准下的模型性能,Meta 还开发了新的高质量人类评估数据集。

该评估集包含涵盖 12 个关键用例的提示:寻求建议、头脑风暴、分类、封闭式问答、编码、创意写作、提取、角色、开放式问答、推理、重写和总结。

为了防止 Llama 3 在这个评估集上过度拟合,Meta 甚至禁止他们的研究团队访问该数据集。

在与Claude十四行诗、Mistral Medium和GPT-3.5的一对一比赛中,Meta Llama 70B以“压倒性的胜利”结束了比赛。

据Meta官方介绍,Llama 3在模型架构上选择了相对标准的纯解码器Transformer架构。

与 Llama 2 相比,Llama 3 有几个关键改进:Llama 3 使用具有 K 个 token 词汇表的 tokenizer,可以更有效地对语言进行编码,从而显着提高模型性能。

8B 和 70B 模型均采用分组查询注意力(GQA)来提高 Llama 3 模型的推理效率。

在标记序列上训练模型,使用掩码确保自注意力不会跨越文档边界。

训练数据的数量和质量是推动下一阶段大模型能力涌现的关键因素。

从一开始,Meta Llama 3 就被设计为最强大的模型。

Meta 在预训练数据上投入了大量资金。

据悉,Llama 3使用了超过15T从公开来源收集的代币,是Llama 2使用的数据集的7倍,其包含的代码数据是Llama 2的4倍。

考虑到多语言的实际应用,Llama 3 预训练数据集超过 5% 由覆盖 30 多种语言的高质量非英语数据组成。

不过,Meta 官方也承认,与英语相比,这些语言的性能预计会稍逊一筹。

为了确保 Llama 3 接受最高质量数据的训练,Meta 研究团队甚至使用启发式过滤器、NSFW 过滤器、语义重复数据删除方法和文本分类器提前预测数据质量。

值得注意的是,研究团队还发现前几代 Llama 模型在识别高质量数据方面出奇的出色,因此他们让 Llama 2 为 Llama 3 支持的文本质量分类器生成训练数据,真正实现了“AI 训练 AI” ”。

除了训练质量之外,Llama 3在训练效率上也实现了质的飞跃。

Meta透露,为了训练最大的Llama 3模型,他们结合了三种类型的并行化:数据并行化、模??型并行化和管道并行化。

在 16K GPU 上同时训练时,每个 GPU 的计算利用率可达到 TFLOPS 以上。

研究团队在两个定制的 24K GPU 集群上进行了训练。

为了最大限度地延长 GPU 的正常运行时间,研究团队开发了一种先进的新训练堆栈,可以自动执行错误检测、处理和维护。

此外,Meta还大大提高了硬件可靠性和静默数据损坏检测机制,并开发了新的可扩展存储系统来减少检查点和回滚的开销。

这些改进使整体有效训练时间超过95%,也使Llama 3的训练效率比上一代提高了约3倍。

更多技术细节请查看Meta官方博客:VS闭源作为Meta的“儿子”,Llama 3也很自然地融入到了AI聊天机器人Meta AI中。

追溯到去年的Meta Connect大会上,扎克伯格在会上正式宣布推出Meta AI,随后迅速向美国、澳大利亚、加拿大、新加坡、南非等地区推广。

在此前的采访中,扎克伯格对Llama 3搭载的Meta AI更加充满信心,称这将是人们可以免费使用的最智能的AI助手。

我认为这将从类似聊天机器人的格式转变为一种你只需提出问题它就会给你答案的格式,你可以给它更复杂的任务它会完成这些任务。

附上Meta AI网页体验地址:如果AI“尚未在您的国家/地区上线”,您可以使用开源模式最简单的使用渠道——Hugging Face,全球最大的AI开源社区网站。

附试用地址:其他平台也很快宣布将Llama 3集成到平台服务中。

您还可以通过调用开源模型平台的Replicate API接口来体验Llama 3。

其使用价格也已曝光,大家不妨按需使用。

有趣的是,在Meta正式公布Llama 3之前,眼尖的网友就发现微软的Azure市场盗用了Llama 3 8B Instruct版本。

然而,随着消息的进一步传播,当网友蜂拥而至试图再次访问该链接时,我得到的只是“”页面。

目前已恢复:3的到来正在社交平台X上掀起新的讨论风暴。

Meta AI首席科学家、图灵奖得主Yann LeCun不仅为Llama 3的发布喝彩,还再次预测将会有更多版本发布在接下来的几个月内推出。

就连马斯克也出现在评论区,用简洁含蓄的“还不错”表达了对骆驼3的认可和期待。

NVIDIA 高级科学家 JIm Fan 将注意力集中在即将推出的 Llama 3 B+ 上。

在他看来,Llama 3的推出已经脱离了技术的进步,是开源模式和顶级闭源模式的象征。

从其分享的基准测试可以看出,Llama 3 B+的实力几乎可以与Claude超级杯和新版GPT-4 Turbo相媲美。

虽然还有一定的差距,但足以证明它在顶级大车型中占有一席之地。

今天恰逢斯坦福大学教授、人工智能顶级专家吴恩达 (Andrew Ng) 的生日。

Llama 3的到来无疑是庆祝他生日最特别的方式。

不得不说,如今的开源模式真是百花齐放、百家争鸣。

今年年初,在接受 The Verge 采访时,拥有 35 万个 GPU 的扎克伯格用坚定的语气描述了 Meta 的愿景——致力于打造 AGI(通用人工智能)。

与不开放的OpenAI形成鲜明对比的是,Meta沿着开源路线向AGI的圣杯发起了冲锋。

正如扎克伯格所说,致力于开源的Meta在这段充满挑战的旅程中并非没有收获:我总体上非常倾向于认为开源对社区和我们都有好处,因为我们会从创新中受益。

过去一年,整个AI圈子一直围绕开源还是闭源路线争论不休。

这场争论已经超越了技术层面的优劣对比,触及了人工智能未来发展的核心方向。

最厉害的开源大模型深夜爆炸!马斯克喜欢《骆驼3王者归来》,与GPT-4一样接近-附体验链接

就连亲自被免职的马斯克,也通过开源Grok 1.0为世界树立了榜样。

不久前,有观点称开源模式将越来越落后。

如今羊驼3号的到来,也给了这种悲观的观点一记响亮的耳光。

然而,虽然 Llama 3 给开源模式带来了一些严重的缓解,但开源与闭源的争论还远未结束。

毕竟,正在秘密准备推出的GPT-4.5/5可能会在今年夏天以无与伦比的性能结束这场旷日持久的争论。

最厉害的开源大模型深夜爆炸!马斯克喜欢《骆驼3王者归来》,与GPT-4一样接近-附体验链接

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 21上半年北美风险投资同比增长116%至1550亿美元,新增独角兽161家

    21上半年北美风险投资同比增长116%至1550亿美元,新增独角兽161家

    今日头条Crunchbase数据显示,北美初创企业2019年共融资1亿美元上半年,创下历史新纪录。 同比、环比增速分别为66%、66%。 同时,还添加了新的独角兽。 后期融资 近两个季度,北美后期融资蓬勃发展。 融资数量和总额均有所增加,金额已超过全年总额。 今年上半年,北美地区后

    06-17

  • 如何对隐形人使用抖音?

    如何对隐形人使用抖音?

    “你看这烤鸭,外焦里嫩,现在下单还有优惠哦!”盛先生“听”着主播在电话里大力喊叫,轻敲屏幕两下,成功下单。 对于很多人来说,这只是通过直播“剁手”的常见经历带货。 然而,对于以盛先生为代表的视障群体来说,这样“轻松”的使用场景曾经是一种奢侈。 曾几何时,盲人

    06-18

  • AI智慧庭院解决方案提供商“海森堡机器人”获数百万美元天使轮融资,由DCM

    AI智慧庭院解决方案提供商“海森堡机器人”获数百万美元天使轮融资,由DCM

    投资界(ID:pedaily)领投 7月12日消息,AI智慧庭院解决方案提供商“海森堡机器人”(以下简称“Heisenberg Robotics”)海森堡机器人公司)获数百万美元天使轮融资,本轮由DCM领投,江门创投跟投,万石资本担任本轮融资的唯一投资方。 融资将用于继续加大AI视觉算法等核心技

    06-17

  • 海尔民族时尚家电节:3大差异化优势赋能全场景智慧生活

    海尔民族时尚家电节:3大差异化优势赋能全场景智慧生活

    随着文化自信时代的到来,不难发现我们总是买进与民族时尚相关的品牌。 国民奶糖大白兔与气味图书馆联手推出“大白兔”香水,还没闻到就吸引了无数网友的支持。 此前,RIO六神鸡尾酒17秒售空一瓶,民族风情罐1天售空56罐。 宣布售空……每一个民族品牌潮流都能引发我们的购买

    06-18

  • 乐准智信完成Pre-A轮3500万元融资,三诺生物领投

    乐准智信完成Pre-A轮3500万元融资,三诺生物领投

    乐准智信近日宣布完成1万元Pre-A轮融资。 本轮融资由三诺生物领投,深瑞享源跟投,北拓资本负责交易。

    06-18

  • 15亿,上海半导体设备材料二期基金完成首关

    15亿,上海半导体设备材料二期基金完成首关

    投资圈-解码LP消息,近日,普尔科投资宣布旗下子公司上海半导体设备材料产业投资管理有限公司(简称“半导体设备材料”)新一期基金已完成首通,首通规模15亿元,并已在中国基金会协会登记,启动第一批项目投资。 该基金为上海半导体设备与材料私募股权投资基金(简称“二期基

    06-18

  • 国行版PS5起售价3099元,黄牛生意可要“爽”了

    国行版PS5起售价3099元,黄牛生意可要“爽”了

    4月29日,PlayStation中国发布会终于来了。 自2019年11月19日全球发售以来,由于疫情和产能不足,PS5的价格一直居高不下,甚至首批价格被炒至近10元。 今天发布的国行版PS5无疑是很多玩家“走出溢价汪洋”的希望。 发布会上公布了国行版PS5的官方售价。 光驱版售价人民币1,00

    06-21

  • 抖音收藏功能即将上线,首批权限将向知识创造者开放

    抖音收藏功能即将上线,首批权限将向知识创造者开放

    据投资界9月9日消息,为了更好地支持创作者传授知识和用户学习知识,抖音有新产品行动。 9月9日,在“DOU知识计划”2.0发布会上,抖音宣布即将推出收藏功能,让知识短视频的创造和学习更加系统化。 据抖音产品经理介绍,第一期的收藏功能支持抖音PC端创作、App端查看。 功能上

    06-17

  • SEMI发布半导体晶圆设备信息安全标准加速智能制造

    SEMI发布半导体晶圆设备信息安全标准加速智能制造

    据台媒《经济日报》报道,国际半导体工业协会(SEMI)于12月28日发布首个半导体晶圆设备信息安全标准,预计将加快高技术制造业安全化、智能化、数字化步伐。 据台湾媒体报道,国际半导体工业协会(SEMI)于12月28日发布首个半导体晶圆设备安全标准,有望加快高科技制造安全化

    06-08

  • 智联招聘正式提交IPO文件并在纽交所挂牌上市,

    智联招聘正式提交IPO文件并在纽交所挂牌上市,

    智联招聘正式递交IPO文件并在纽交所挂牌上市。 对于 ZPIN。 发行价格区间为每股12.5-14.5美元。

    06-18

  • 氪空间完成10亿元融资,IDG资本、歌斐资产、逸星资本联合领投,

    氪空间完成10亿元融资,IDG资本、歌斐资产、逸星资本联合领投,

    据投资界5月15日消息,氪空间宣布完成10亿元融资,由IDG资本、歌斐资产、耀明资本领投。 共同主导投资。 本次融资后,氪空间确立了打造“全周期企业办公服务商”的新战略。 在新战略指导下,氪空间将完成从“联合办公”到“综合办公服务+新资产管理”的商业模式升级,氪空间

    06-18

  • Twitter靠什么统治国家?数字先锋爱沙尼亚启动AI治理

    Twitter靠什么统治国家?数字先锋爱沙尼亚启动AI治理

    爱沙尼亚是一个波罗的海国家,拥有1万人口和1万公顷土地,其中一半是森林。 然而,对于一个小国来说,爱沙尼亚在国际舞台上却令人印象深刻。 该国政府已将数字化视为节省成本和平衡权力的手段,吸引了世界各地领导人、学者和风险投资家的关注。 据报道,数字化进程每年为爱沙

    06-18