首页 > 科技未来 > 内容

GPT-4地位难保,谷歌新双子座王会登基吗?

发布于:2024-06-17 编辑:匿名 来源:网络

当地时间12月6日,谷歌正式公布了最新的大型机型Gemini 1.0。

Gemini 1.0 与 LLaMA 模型类似。

它也是一个系列模型,包括三个版本: Gemini Ultra——参数数量最多,能力最强,适合高度复杂的任务。

Gemini Pro – 可以扩展到多种任务的模型。

Gemini Nano - 高效的设备端任务模型。

Gemini 1.0 侧重于多模态能力。

谷歌将 Gemini 定义为“原生多模式”模型。

在模型能力方面,谷歌表示,在大型语言模型(LLM)研发中使用的 32 个广泛使用的学术基准中,Gemini Ultra 的性能超过了当前最先进的结果中的 30 个。

在MMLU(大规模多任务语言理解)测试框架中,Gemini Ultra 得分高达 90.0%,甚至超越了人类专家。

Gemini 被 Google CEO Sundar Pichai 称为“Google 迄今为止最大、最强大的 AI 模型”。

Sundar Pichai 在 Gemini 官方公告博客上写道:“在许多领先基准测试中都具有先进的性能。

Google 的第一个版本 Gemini 1.0 针对不同的外形尺寸进行了优化:Ultra、Pro 和 Nano。

这些是 Gemini 时代的第一个型号,也是第一个为了实现谷歌今年早些时候创建谷歌 DeepMind 时的愿景,这个新时代的模型代表了谷歌作为一家公司所做的最大的科学和工程努力之一,Gemini 对于它将给世界各地的人们带来的机会感到非常兴奋。

”目前,谷歌官方宣称其旗舰聊天机器人Bard已经升级至Gemini Pro版本,其在推理、规划、理解等方面的能力得到了显着提升,并将继续免费为用户提供服务。

谷歌预计明年初推出更先进的“Bard Advanced”,它将使用Gemini Ultra,而在Gemini、PaLM 2和LaMDA发布之前,谷歌主要在生成式AI和LLM方面推广的两个模型还没有出现。

在用户中获得了很高的评价,远远落后于业界领先的GPT-4,因此传闻中谷歌研发重点的Gemini模型一直备受期待。

Gemini 也是 Google Brain 和 DeepMind 合并形成 Google DeepMind 后最重要的产品。

我们来看看,双子座在哪里? 01 超越人类专家,离强人工智能又近了一步? “Gemini 在 MMLU 基准测试中超越了人类专家。

”虽然,有了AlphaGo的经验,我们并不认为AI在某些领域超越人类是什么新鲜事。

但今天与过去不同。

在AGI和ChatGPT带来的强人工智能的“威慑”下,任何号称优于人类的AI,或多或少都会引起人们的关注。

那么在这个测试集上超越人类专家到底有多强大呢? 大型语言模型(LLM)的主流评估数据集包括:GLUE、SuperGLUE、SQuAD、CommonsenseQA、CoQA、LAMBADA等。

通常用于评估模型在语言理解、推理、阅读理解和常识推理方面的能力。

MMLU(大规模多任务语言理解)是一个测试集,结合了数学、物理、历史、法律、医学和伦理学等 57 个学科。

与其他测试集相比,MMLU 更加广泛和深入。

它考验AI模型通过大量、多样化的任务理解自然语言的能力,尤其是在复杂多变的现实场景中的表现。

这使得MMLU成为综合评估和促进大型语言模型发展最具挑战性的评估框架。

GPT-4 和 Gemini 在 MMLU 测试集上的比较 该框架通常包含数千个不同的任务,涵盖广泛的主题和挑战。

MMLU的目的是提供一种全面且多样化的方法来测试和评估语言模型在各种复杂和现实场景中的性能。

测试任务可能包括理解笑话、回答有关世界历史的问题、解释科学现象以及许多其他更接近人类知识、常识和理解的项目。

在MMLU测试中超越人类专家也可以理解为在这个测试框架下,Gemini在“各种复杂和现实场景下的表现”上超越了人类专家。

谷歌在其官方博客中表示:Gemini 使用 MMLU 基准方法使 Gemini 能够利用其推理能力在回答难题之前更仔细地思考,从而比仅使用 * 印象得到显着改进。

除此之外,Gemini Ultra 还在新的 MMMU(专家 AGI 大规模多学科多模态理解和推理)基准测试中取得了 59.4% 的最高分,该基准测试由跨不同领域的深思熟虑的推理组成。

域。

由多模式任务组成。

谷歌的测试表明,Gemini Ultra 的性能优于之前最先进的模型,无需借助对象字符识别 (OCR) 系统从图像中提取文本以进行进一步处理。

这些基准凸显了双子座与生俱来的多模态性,并显示了双子座更复杂推理能力的早期迹象。

Gemini 在文本、编码等一系列基准测试中的表现在某个测试集上超越了人类专家。

虽然距离AGI或者强人工智能还有很远的距离,但仍然可以说是在这条道路上迈出了坚实的一步。

02 原生多模态,比GPT-4更强大? 事实上,Gemini的LLM表现并不是它的亮点。

Gemini真正值得关注的差异化能力是“原生多模态”。

首先,什么是“双子座原生多模态”? 原生多模态能力是指Gemini模型直接理解和处理多种不同类型的数据而不需要额外的专门处理或转换的固有能力。

有人可能会问,这和GPT-4有什么不同? 我们打个简单的比方:如果GPT-4是一位诗人,他不仅擅长写诗,而且还会画画,但写诗是他的职业,画画只是他的副业。

GPT-4可以处理文本(写诗)和图片(画画),但主要强在文字处理方面。

拥有“天生的多模态能力”的双子座,是诗人和画家的“双才”。

他诗书画画同样出色,谁也不比谁弱。

双子座可以处理文本和图像,并且两者都做得很好,没有优先级。

GPT-4的多模态能力可能更多地是通过将不同模型的能力集成到一个框架中来实现的,而不是所有功能都在一个统一的模型中原生实现。

作为一个大型语言模型,GPT-4的主要优化和训练是围绕语言理解和生成。

对于图像处理来说,虽然它展现出了一定的能力,但可能不如那些专门针对图像处理优化的模型。

真正的本地多模式模型在所有模式之间进行平衡和优化。

双子座的多模态理解能力。

原生多模态能力意味着模型能够更自然、高效地处理和融合多种类型的数据,这对于实现更复杂的人工智能应用具有重要意义。

当然,这也更接近人类的理解。

人类在认识世界时,会自然地整合视觉、听觉、语言等多种感官的信息。

具有本地多模态能力的AI模型在处理信息时也采用类似的综合方法,更接近人类理解和识别的方式。

03 全面“击败”GPT-4 Gemini不仅在模型能力、多模态能力上敢于与GPT-4抗衡。

在应用方面,也提供了更多的选择。

“小型号” Gemini Nano 型号是该型号系列中最小的型号,旨在适用于内存受限的端侧设备。

它在各种任务上表现出出色的性能,特别是多模式和多语言处理。

Gemini Nano 的这些功能使其成为适合在资源有限的环境中使用的强大工具。

虽然目前大模型的主流趋势仍然是“云端诞生”,但在未来AI的商业化中,离线化、个性化、小型化的端侧模型越来越受到关注。

过去几个月,高通、联想等多家巨头多次强调在端侧生成AI的战略布局。

高通推出的最新一代Snapdragon芯片为生成式AI提供了强有力的支持。

GPT-4地位难保,谷歌新双子座王会登基吗?

联想提出了AI PC的概念,并强调未来现有的所有产品都将围绕AI进行根本性的变革。

不过,虽然硬件设备厂商非常活跃,但AI厂商对于终端侧的关注度却并不高。

以数百款车型竞争的国内市场为例,目前只有个位数厂商正式公布了自己的小型端对端车型。

其中包括雷军在8月年度演讲中提到的13亿参数版本的小米MiLM模型,以及12月1日统一钱文开源的Qwen-1.8B模型。

在这方面,相比OpenAI,谷歌更胜一筹有动力研究小型端侧模型。

毕竟谷歌本身就拥有Pixel手机和Android的双重优势。

训练谷歌在Gemini的训练过程中使用了大量自研的张量处理单元(TPU)v4和v5e。

在 TPU 上,Gemini 的运行速度明显快于早期、较小且功能较弱的型号。

这些定制设计的人工智能加速器一直是谷歌人工智能产品的核心,为搜索、YouTube、Gmail、谷歌地图、Google Play 和 Android 的数十亿用户提供支持。

它们还使世界各地的公司能够经济高效地训练大规模人工智能模型。

Google 数据中心内的一排 Cloud TPU v5p AI 加速器超级计算机。

随着Gemini的出现,谷歌还宣布了TPU系统最强大的升级——Cloud TPU v5p,专为训练尖端AI模型而设计。

在训练优化方面,Gemini增加了模型并行性和数据并行性的利用率,优化了网络延迟和带宽。

Gemini 还使用 Jax 和 Pathways 编程模型为复杂的数学运算(例如机器学习中常见的数学运算)提供优化支持。

Jax 特别适合高效执行大规模数组操作。

路径是指用于管理和协调大规模培训任务的编程模型或框架。

通过使用这些工具,Gemini模型的开发人员可以使用单个Python进程来协调整个训练过程,这可以简化开发和训练工作流程,同时利用Jax和Pathways的高效性能。

复杂推理能力Gemini 1.0的复杂多模态推理能力可以帮助理解复杂的书面和视觉信息。

这赋予了它在大量数据中发现难以辨别的知识的独特能力。

为物理作业评分其*通过阅读、过滤和理解信息从数十万份文档中提取见解的能力将有助于在从科学到金融的许多领域以数字速度实现新的突破。

Gemini 1.0 经过训练,可以同时识别和理解文本、图像、音频等,因此它可以更好地理解微妙信息并回答有关复杂主题的问题。

这使得它特别擅长解释数学和物理等复杂学科的推理。

编程双子座能够理解、解释并生成世界上最好的编程语言(例如 Python、Java、C++ 和 Go)的高质量代码。

它跨语言工作和推理复杂信息的能力使其成为世界顶级的编码基础模型之一。

Gemini Ultra 在多个编码基准测试中表现良好,包括 HumanEval(评估编码任务性能的重要行业标准)和 Natural2Code(Google 内部保存的数据集),该数据集使用作者生成的源而不是基于网络的信息。

Gemini 还可以用作更高级编码系统的引擎。

两年前,谷歌推出了AlphaCode,一个竞赛级别的人工智能代码生成系统。

现在基于Gemini技术开发,AlphaCode 2刚刚开发出来,专门针对竞技性编程任务进行了优化和增强。

04 Gemini的下一步计划 虽然谷歌在技术文档和官方博客中对Gemini赞誉有加,但似乎已经踩上了OpenAI。

但今天发布的其实只是一份“论文”。

真正能够对标GPT-4的Gemini Ultra要到明年初才会推出。

Gemini 家族的第二个孩子 Gemini Pro 现在已准备好开始支持 Google 的对话机器人产品 Bard。

谷歌在博客中表示:从今天开始,巴德将使用经过微调的 Gemini Pro 版本进行更高级的推理、规划、理解等。

这是 Bard 自推出以来的唯一升级。

它将在多个国家和地区提供英语版本,谷歌计划在不久的将来扩展到不同的模式并支持新的语言和地区。

不过,截至发稿,对bard的测试依然显示并未升级为Gemini,而且bard对Gemini的了解也非常有限。

当被问及 Bard 是否升级了 Gemini 时,Gemini Nano 计划用于 Pixel。

谷歌将首次将 Gemini Nano 内置到 Pixel 8 Pro 中。

从 WhatsApp 开始,这款手机将支持 Recorder 应用中的 Summarize 和 Gboard 中的 Smart Reply 等新功能,明年还将支持更多消息应用。

从 12 月 13 日开始,开发者和企业客户可以通过 Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 访问 Gemini Pro。

Google AI Studio 是一款免费的基于网络的开发人员工具,可让您使用 API 密钥快速构建原型并启动应用程序。

当需要完全托管的 AI 平台时,Vertex AI 允许对 Gemini 进行定制,提供全面的数据控制,并受益于额外的 Google Cloud 功能,以实现企业安全、安保、隐私以及数据治理和合规性。

Android 开发人员还可以通过 AICore(Android 14 中提供的新系统功能,从 Pixel 8 Pro 设备开始)使用 Google 最高效的设备端任务模型 Gemini Nano 进行构建。

此外,Gemini已确定将很快融入谷歌业务。

未来几个月,Gemini 将出现在更多 Google 产品和服务中,例如搜索、广告、Chrome 和 Duet AI。

谷歌表示,已开始在搜索领域试验 Gemini,为用户提供更快的搜索生成体验(SGE),将美式英语的延迟减少 40%,并提高质量。

值得注意的是,对于谷歌来说,搜索一直是它的看家业务。

Gemini在谷歌搜索和广告业务的全面推出,可能会彻底改变未来的广告和营销逻辑。

在最近的一次工业软件研讨会上,一位工业公司高管向虎嗅抱怨,“谷歌的竞争对手在网上发布了很多软文,但我们没有购买软文。

这导致这些软文成为了LLM培训的数据,然后在AI的意识中,我们的竞争对手已经将这种现象视为默认的行业标准,“SEO已死,LLMO万岁”。

当时的ChatGPT还没有联网能力,但今天的Gemini几乎肯定会融入Google的搜索引擎,彻底改变未来的网络搜索逻辑【本文由合作伙伴虎秀网授权发布。

投资界。

本平台仅提供信息存储服务。

】如有疑问,请联系投资界()。

GPT-4地位难保,谷歌新双子座王会登基吗?

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 天风天瑞两只基金已完成募资设立,总规模达2.5亿元,

    天风天瑞两只基金已完成募资设立,总规模达2.5亿元,

    据投资界4月22日消息,天风天瑞公告称,两只新基金已同时完成募资设立,总规模达2.5亿元。 人民币。 两只基金分别为专项医疗并购基金和科技产业投资基金,基金规模分别为2亿元和1万元。 截至目前,天风天瑞管理的基金总规模超过61亿元人民币。 风蓝(淄博)医疗投资合伙企业(

    06-18

  • 马斯克:Cybertruck将更新,预计今年二季度发布

    马斯克:Cybertruck将更新,预计今年二季度发布

    据外媒近日报道,特斯拉CEO埃隆马斯克近日在社交媒体上表示:特斯拉近期将修改Cybertruck,并且预计将于今年第二季度发布。 每季度发布一次。 同时,更新的功能和选项也将在发布会上公布。 听,中小企业反馈平台。 倾听用户需求,倾听创业者声音,解决中小企业痛点。 点击立

    06-17

  • 星轮VIULUX亮相China Joy,为VR游戏带来超高沉浸感

    星轮VIULUX亮相China Joy,为VR游戏带来超高沉浸感

    沉寂已久的诺基亚突然向虚拟现实领域吹响了号角,推出了虚拟现实设备。 焦躁不安的索尼频频出手,公布虚拟游戏计划。 虚拟现实的世界是动荡的。 游戏玩家,请保持冷静,等待小编去查明真相。 7月30日,万众瞩目的第十三届ChinaJoy在上海拉开帷幕。 据悉,索尼、盛大游戏、腾讯

    06-18

  • “只退款”回味无穷

    “只退款”回味无穷

    在竞争压力下,淘宝和京东再次默契,开启了拼多多的“只退款”运营。 12月26日,淘宝正式实施最新《平台争议处理规则》,增加了“只能退款”规则。 12月27日,京东宣布支持无退货退款新实施标准,支持交易纠纷仅限用户退款。 零售的本质就是以更低的价格为用户提供更好的产品

    06-18

  • “英华辰睿”获数千万元天使轮融资,由线性资本领投

    “英华辰睿”获数千万元天使轮融资,由线性资本领投

    投资社区(ID:pedaily)12月28日消息,“英华辰睿”近日获数千万元天使轮融资,领投由线性资本、蓝晶微生物跟投,明德资本担任独家财务顾问。 英华辰睿成立于今年8月。 其主营业务为生物材料的高性能改性及应用创新。 现阶段研发团队占比超过60%。 创始人周桢博士曾担任全球

    06-18

  • 拉拉活向左,满帮向右

    拉拉活向左,满帮向右

    今年8月,满帮上演了抢眼的表演,引发一片狂欢。 众所周知,满帮高管团队准备的套现计划很快浮出水面,领头人正是满帮创始人张晖。 下半年,张晖和另外三位高管合计套现超过6.3亿元,其中张晖一人套现就高达5.1亿元。 四人分成两组行动,这似乎是为了避免广大中小股东反应过

    06-18

  • 潘石屹年收租金超10亿,告别深圳

    潘石屹年收租金超10亿,告别深圳

    SOHO中国董事长潘石屹出售资产套现的计划被搁置。 消息一出,SOHO中国股价暴跌。 截至9月15日收盘,SOHO中国股价报2.15港元,跌幅2.27%。 9月10日,SOHO中国宣布黑石集团终止对公司的收购。 收盘价为2.15港元/股,较消息公布前一天收盘价3.5港元/股大幅下跌62.79%。 不过,潘

    06-18

  • 可口可乐第二季度EPS和营收超预期,上调全年业绩指引

    可口可乐第二季度EPS和营收超预期,上调全年业绩指引

    北京时间7月21日晚,可口可乐发布第二季度财报。 可口可乐公司第二季度营收3亿美元,同比增长42%,超出市场预期的94亿美元; EPS为0.68美元,同比增长61%,高于市场预期的0.56美元;全球单盒销量同比增长18%,亚太单盒销量同比增长16%。 可口可乐公司表示,将上调全年业绩指引

    06-18

  • 最受关注的大型样板项目路演现场,百度智能云千帆AI加速器首个Demo Day已拉开帷幕!

    最受关注的大型样板项目路演现场,百度智能云千帆AI加速器首个Demo Day已拉开帷幕!

    自动化智能企业AI智能法务、私密专属的健康双胞胎、打破求职信息鸿沟的AI职业规划助理、精准高效可靠的AI行业顾问……近期,百度智能云AI加速器*演示日活动在北京成功举办。 从AI加速器一期、二期运营企业+项目中脱颖而出的10个AI原生应用项目登台展示了他们在法律、医疗、招

    06-18

  • 六年六轮融资,十年仅一轮融资?

    六年六轮融资,十年仅一轮融资?

    10月16日,新元素药业宣布完成6亿元D轮融资。 投资方除了老股东凯泰资本、大辰资本和青岛集团外,还包括华金投资和信义投资两个新面孔。 。 自2016年成立以来,新元素累计融资金额约12亿元。 三个在研产品中,只有一个在研产品进入临床试验,即治疗慢性痛风的1.1类创新药ABP-

    06-17

  • 蓝瓶咖啡,请靠边!永璞第一家线下咖啡店来了 -探店

    蓝瓶咖啡,请靠边!永璞第一家线下咖啡店来了 -探店

    咖啡文化一直被年轻人视为时尚生活必备的生活方式之一。 许多品牌也想出了咖啡馆的想法。 无论是他们投资开店,还是无意间将咖啡概念与快闪店结合起来,总能吸引年轻人的大量目光。 ▲ 图片来自:Maison Margiela Caf 户外巨型咖啡杯 ▲ 最新热门打卡点:Maison Margiela Caf

    06-21

  • 【融资24小时】2022年3月31日投融资事件汇总及明细

    【融资24小时】2022年3月31日投融资事件汇总及明细

    今日国内市场共发生29起投资披露事件,其中医疗健康领域7起(瑞科生物、Metanovas、荣昌生物、艾登科技、爱凯生物、奥速博信ACXEL、科慧智能医疗)、先进制造案例6个(必科驰微电子、奇普微电子、兴安科技、永善锂业、乐捷能源、PX电子康帕特)、智能硬件项目3个(筑面、智辉

    06-18