首页 > 科技未来 > 内容

谷歌大模Gemini能否打败GPT4?

发布于:2024-06-17 编辑:匿名 来源:网络

?“沉寂”许久的谷歌终于有大动作了。

美国当地时间12月6日,谷歌发布了Gemini的大型多模态模型。

谷歌DeepMind直接宣布Gemini是“谷歌第一个也是最强的人工智能模型”。

谷歌Deepmind官方账号截图,来源:谷歌DeepMindGemini谷歌是一个从头开始构建的多模态模型,这也更接近人类理解世界的方式。

作为Google对付GPT-4的“杀手锏”。

Gemini在32项多模态基准测试中取得了30项SOTA(State Of The Art)记录,并且是第一个在MMLU(大规模多任务语言理解)评估中超越人类专家的模型。

Gemini在这一类别中的得分为90.0%。

作为比较,人类专家的得分为89.8%,GPT-4为86.4%。

Gemini共有三个版本: Gemini Ultra:适合高度复杂的任务; Gemini Pro:一个可以扩展到多种任务的 Gemini 模型; Gemini Nano:尺寸更小,适合特定任务和移动设备。

谷歌 DeepMind 产品副总裁 Eli Collins 表示:“Gemini 的多功能性使其能够在从移动设备到大型数据中心的所有设备上运行。

” “我们正在离新一代人工智能模型的愿景越来越近。

”有了人工智能,我们将有机会在更大规模上做重要的事情。

”谷歌CEO桑达尔·皮查伊在谷歌成立25周年的公开信中特别提到了人工智能。

面对强大的OpenAI,学霸谷歌需要一款现象级的产品来证明Gemini在人工智能领域的强项是Google的答案 1.“只打精英” Google Gemini模型的核心优势在于其原生的多模态特性,过去大型多模态模型往往是通过训练来构建的。

虽然它们在某些任务(例如图像描述)上表现良好,但在处理需要更深入概念理解和复杂推理的任务时,它们往往表现不佳。

从一开始就在不同模态上进行预训练,然后使用额外的多模态数据进行微调,进一步提高模型的有效性。

这种原生的多模态训练方法使得Gemini在处理多类数据和复杂任务时更加高效准确,从而在多模态人工智能领域树立了新标准。

而且,Gemini此次推出主要是“针对OpenAI的GPT-4”。

用《亮剑》里李云龙的话来说——“打仗的就是精英”。

在计算性能方面,Gemini几乎“完全击败”了GPT-4。

Gemini Ultra拥有32个广泛应用于大型模型开发的学术基准测试集,其中30个的性能超过了之前的SOTA结果。

其中,Gemini在多项选择题、数学题、Python代码任务、阅读等方面的表现都超过了之前的最先进水平。

谷歌表示,他们对MMLU采用了新的基准方法,这使得Gemini可以利用他的推理能力来思考在回答困难的问题之前要更加仔细。

与简单地根据问题的第一印象来回答相比,Gemini的表现有了明显的提高。

Gemini Ultra 在多个编码基准测试中表现良好,包括 HumanEval 和 Natural2Code。

其中,只有Gemini在HellaSWAG数据集上的测试逊色于GPT-4。

HellaSWAG数据集主要用于研究扎根常识推理能力,但NLP领域的研究者专家告诉《甲子光年》:“这并不意味着GPT4的常识推理性能更好,因为它无法排除了 ChatGPT 模型在 HellaSWAG 数据集上训练的性能更好《Gemini 模型与 GPT-4 部分测试成绩的比较》,图片来源:Google 另外,在多模态方面,Gemini Ultra 取得了领先的成绩。

在新的 MMMU 基准上得分为 59.4%,凸显了其多模态和复杂推理能力。

在图像基准测试中,Gemini Ultra 可以在不从图像中提取文本的情况下进行 OCR 处理,并且表现优于之前最先进的模型。

Gemini模型与GPT-4V在多模态方面的测试对比。

图片来源:Google Gemini 1.0 经过训练可以同时识别和理解文本、图像、音频等,因此可以更好地理解有细微差别的信息。

回答复杂主题的问题,特别擅长解释数学和物理等复杂主题的推理。

“推理缺陷”也是GPT系列的问题。

著名的语言模型批评家加里·马库斯博士评论道:“大型语言模型无法完成一些严格定义的任务:遵守国际象棋规则、五位数相乘、在家谱中进行可靠的推理、比较不同的物体的重量等。

”尽管技术取得了重大进步,但人工智能生成的虚假或伪造信息的问题仍然存在,这仍然是一个尚未完全解决的研究问题,但他也强调,Gemini接受了谷歌迄今为止最全面的安全评估。

为了确保其可靠性和安全性,谷歌针对Gemini进行了一系列对抗性测试,模拟恶意用户使用该模型并输入各种提示词,以检测该模型是否产生仇恨言论或表现出政治偏见,这些测试包括“真实的毒性线索”。

值得注意的是,Gemini在谷歌自主研发的云芯片张量处理单元(TPU)上完成了训练,特别是TPU v5p版本的性能有了显着提升。

模型训练速度比上一代快2.8倍 据悉,TPU v5p芯片专为数据中心训练和大规模模型运行而设计。

从 12 月 13 日开始,开发者和企业客户可以通过 Google AI Studio 或 Google Cloud Vertex AI 访问 Gemini Pro 模型。

Google AI Studio 是一款免费的基于网络的开发工具,为开发人员提供 API 密钥以快速创建原型和启动应用程序。

Vertex AI 提供定制服务,以提供更全面、更托管的 AI 平台,该平台具有完整的数据控制功能,并能够利用 Google Cloud 的附加功能,包括企业级安全性、隐私保护以及数据治理和合规性。

性别。

此外,从 Pixel 8 Pro 设备开始,Android 开发者还可以通过 Android 14 中的新系统功能 AICore 使用 Gemini Nano。

Gemini Nano 是专为设备上任务而设计的高效模型。

通过注册AICore早期预览版,开发者可以深入挖掘其潜力,更方便地利用Gemini的先进技术,在Android生态的应用开发中迸发出更多的火花。

可能性。

到今年,谷歌计划推出 Bard Advanced,它与 AI 代理的初级形式非常相似。

Bard Advanced 将由 Gemini Ultra 提供支持,它可以快速理解多模式输入,包括文本、图像、音频和视频,并做出相应的响应。

2. Google VS OpenAI 尽管OpenAI的GPT大放异彩,但Google似乎太安静了。

今年2月,谷歌在巴黎举办活动时,其聊天机器人巴德的一个错误导致市值蒸发1亿美元,同时也引发了人们对巴德准确性的担忧。

随着OpenAI推出ChatGPT,特别是在将GPT技术集成到Bing搜索中并在应用程序下载量上首次超越谷歌之后,人们开始怀疑谷歌在人工智能领域是否落后于竞争对手。

事实上,谷歌是2011年提出Transformer模型的先驱,并为今天的游戏制定了规则。

谷歌意识到大模型“高地”竞争的时间不晚于OpenAI。

2018年,谷歌推出了1.6万亿参数的Switch Transformer,强调稀疏多模态结构的潜力。

谷歌大模Gemini能否打败GPT4?

同时,谷歌还提出了Flan-T5模型,通过更多的监督数据来减小模型大小。

它比 GPT-3 模型参数更少,但性能更好。

为了进行技术评估,《经济学人》在今年 1 月进行了对比测试,向 ChatGPT 和 Google 基于 Lamda 的机器人 Bard 询问数学、阅读和约会建议等问题。

测试结果显示,Google AI 在数学问题上表现更好,但 ChatGPT 在常识问题上表现更准确。

几天后,OpenAI 升级了 ChatGPT,在另一项测试中,它在数学问题上与 Google AI 不相上下。

尽管ChatGPT是一个大规模语言模型,训练成本高且迭代困难,但它也显示了其持续进化的巨大潜力。

值得注意的是,Google 的语言模型在性能上与 ChatGPT 相当。

在这场对决中,谷歌和微软都需要更具成本效益的解决方案。

谷歌在人工智能领域取得了大量研究进展,但尚未将这些成果进行部署和货币化,这与过去某些时期的微软类似。

这可能是因为谷歌低估了微软和OpenAI的竞争实力,或者是对其在搜索引擎领域的主导地位过于自信。

《甲子光年》多角度分析,得出结论:谷歌在技术方面更具前瞻性*,而OpenAI则更注重打磨产品。

OpenAI由Sam Altman领导,专注于产品导向的工作,致力于扩展和优化模型,主要关注细节的微调方法。

谷歌在技术发展方向上始终保持积极、前瞻性的态度,但其整体战略规划却多次调整。

Google 对稀疏模型架构进行了深入的探索。

仅仅两年过去了,万亿级开关变压器还没有引起什么轰动,而千亿参数级GPT系列却正在蓬勃发展。

同样,经过反复改进的Flan-T5模型虽然在性能上超越了GPT-3,但其优化进度却相对缓慢。

在谷歌“选择困难症”时期,OpenAI完成了ChatGPT的训练。

今年9月,谷歌子公司DeepMind推出了Sparrow模型,该模型与ChatGPT一样,采用了基于人类反馈的强化学习(RL)框架。

该模型采用了较小的参数设置,与Google看重的LaMDA和PaLM模型的思路有显着不同。

然而,谷歌未能迅速确定Sparrow模型是否是最佳选择,这也导致了Sparrow模型的产品化进程迟缓,最终未能“飞上枝头,成凤凰”。

“优柔寡断”似乎一直是谷歌的一个长期问题。

“但迟到总比不到好!OpenAI 王座终于有了强有力的竞争者。

” Nvidia AI 科学家 Jim Fan 在谷歌宣布这一消息后发表评论。

今年4月,谷歌将Google Brain和DeepMind团队合并,成立了Google DeepMind。

有人戏称这支队伍为“AI复仇者”。

谷歌人工智能产品前负责人伊莱·柯林斯 (Eli Collins) 被任命为新团队的产品副总裁。

目前,Gemini Pro和Gemini Nano已经集成在聊天机器人Bard和智能手机Pixel 8 Pro上,实现更高级的推理、规划、理解等能力。

更强大的Gemini Ultra将于明年发布。

不知道OpenAI会如何“应对”?或许我们可以等待 GPT-5 尽快发布。

不过,学霸谷歌并不完全关心这场暂时的战斗,而是着眼于未来。

“我们对答案的探索将在未来 25 年推动非凡的技术进步。

如果世界上某个地方有一个青少年对我们用人工智能构建的一切耸耸肩,我们就会知道我们成功了。

然后,我们回去工作”谷歌首席执行官桑达尔·皮查伊在谷歌成立25周年的公开信中表示。

联系投资界 ()。

谷歌大模Gemini能否打败GPT4?

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 沃尔沃第四季度调整后营业利润超出分析师预期

    沃尔沃第四季度调整后营业利润超出分析师预期

    沃尔沃第四季度调整后营业利润为3亿瑞典克朗,而分析师预期为89.4亿瑞典克朗(范围为80.3亿瑞典克朗至1亿瑞典克朗)。 第四季度净销售额为 15 亿瑞典克朗,分析师预期为 5000 万瑞典克朗(范围为 4 亿瑞典克朗至 1.7 亿瑞典克朗)。

    06-18

  • 美创科技完成新一轮融资1.5亿元

    美创科技完成新一轮融资1.5亿元

    据投资界5月21日消息,据36氪消息,杭州美创科技有限公司(以下简称“美创科技”),国内数据安全领域的领先公司,近日完成新一轮1.5亿元融资。 本轮融资由盛宇投资、宽带资本领投,赛博乐、鱼跃科技、东方富海跟投。 本轮融资所得资金将主要用于产品研发,坚持技术驱动路线,

    06-18

  • 连物智能获百万天使轮融资,专注文旅+AR

    连物智能获百万天使轮融资,专注文旅+AR

    投资社区(ID:pedaily)据4月12日消息,景区AR服务商“连物智能”近日完成数百万人民币天使投资本轮融资,投资方为华盛仁和。 本轮融资资金将用于内容团队建设和市场开拓。 联物智能成立于2016年,专注于探索景区+AR之路。 目前已与20余家5A级景区签约,开展内容开发、数字I

    06-17

  • 听说你有电池焦虑症?一招教你如何保持MacBook电池健康

    听说你有电池焦虑症?一招教你如何保持MacBook电池健康

    如果你有经常检查电池、待在无法提供持续充电便利的地方时感到不安的“症状”,那么你可能有电池焦虑症。 虽然电池焦虑很常见,但并不可怕。 各种快充方式已经走进了每个人的生活。 有W快充的国产机,也有苹果从12系列开始推出的5V1A快充线。 厂商的进步和改变或多或少可以解

    06-21

  • 5亿元合作!耀明汽车获广东省产业发展基金战略投资

    5亿元合作!耀明汽车获广东省产业发展基金战略投资

    打造头条3月15日消息 近日,耀明汽车宣布与广东粤财投资控股有限公司战略合作,双方投资广东省产业发展基金基金与耀明汽车子公司广州承兴智能汽车科技有限公司达成5亿元合作协议。 耀明汽车CEO何小鹏表示:在政府和相关领导部门的指导下,在粤金控股等合作伙伴的支持下,耀明

    06-17

  • 张朝阳:畅游未来有计划在香港上市,但搜狐还不确定

    张朝阳:畅游未来有计划在香港上市,但搜狐还不确定

    今天,搜狐董事局主席和CEO张朝阳表示,旗下畅游计划于今年在香港上市未来如何,但搜狐还不确定。 这取决于具体情况。 当然。 谈到搜狐未来的定位,张朝阳表示,仍然会采取垂直发展模式,专注做好一件事,做搜狐擅长的事情,那就是专注于媒体业务。

    06-18

  • 骁龙无处不在,是平台也是生态

    骁龙无处不在,是平台也是生态

    Snapdragon无处不在,它是一个平台,也是一个生态系统。 今年是我国新能源汽车快速进步的一年。 在这个历史转折点上有一个小插曲。 今年7月,极氪汽车宣布,所有极氪汽车用户均可免费升级至搭载Snapdragon(第三代骁龙座舱旗舰平台)的全新智能座舱。 此举扭转了一度陷入舆论

    06-21

  • 河南省创业投资引导基金实施方案公布,总规模150亿元,

    河南省创业投资引导基金实施方案公布,总规模150亿元,

    据投资界8月24日消息,河南省发布《创业投资引导基金实施方案》(以下简称《实施方案》)。 《实施方案》明确发挥政府资金的示范引导作用,带动更多社会资本投资创业投资领域。 据了解,创业投资引导基金总规模1亿元,其中协调整合支持创新创业的现有资金50亿元,新增增量资

    06-18

  • 炮轰谷歌“实现量子霸权”理论,IBM拿出终极依据

    炮轰谷歌“实现量子霸权”理论,IBM拿出终极依据

    语音播放文章内容由深声科技提供技术支持。 您的浏览器不支持音频元素。 最近,谷歌遭到IBM的炮轰;这一切都始于一个月前的一篇论文。 谷歌的“量子霸权”雷锋网注:上图来自 Kim Stallknecht/Reuters 今年 9 月,《金融时报》 报道称,谷歌研究人员向 NASA(美国国家航空航天

    06-17

  • 用AI赋能医疗,小白世纪完成数千万元A轮融资

    用AI赋能医疗,小白世纪完成数千万元A轮融资

    据投资界12月28日消息,基于视觉识别的AI公司“小白世纪”已获数十家融资获得广东珠江投资集团数百万元A轮融资。 此前,小白世纪已获得多轮融资:2018年8月获得1万元种子投资; 2018年8月获得清华大学Pre-A轮天使投资1万元,摩洛哥一号基金1万元融资。 小白世纪成立于2007年

    06-18

  • 特斯联实现多项计算机视觉科研突破,成果入选CVPR、TPAMI等国际顶会顶刊

    特斯联实现多项计算机视觉科研突破,成果入选CVPR、TPAMI等国际顶会顶刊

    特斯联取得多项计算机视觉科研突破,成果入选CVPR、TPAMI等国际顶级会议顶级期刊。 作为互联网国家枢纽节点,“东数西数”工程正式启动。 作为数据处理核心的新型基础设施,人工智能、物联网、云计算、区块链等技术将迎来更加精细化的发展前景。 。 近期,作为成渝地区的深度

    06-18

  • 先锋薄膜完成45亿元B轮融资,由中金资本旗下基金领投

    先锋薄膜完成45亿元B轮融资,由中金资本旗下基金领投

    投资界(ID:pedaily)9月29日消息,先锋薄膜材料股份有限公司(以下简称“先锋薄膜”)近日宣布完成B轮融资,由中金资本管理旗下基金领投,包括中国建材新材料基金、中电基金、中化高新技术产业基金、中船海洋基金、五矿创投、SK中国、以及国投创合、东三峡、大湾区基金、招

    06-18