首页 > 科技未来 > 内容

谷歌大模Gemini能否打败GPT4？

发布于：2024-06-17 编辑：匿名来源：网络

?“沉寂”许久的谷歌终于有大动作了。

美国当地时间12月6日，谷歌发布了Gemini的大型多模态模型。

谷歌DeepMind直接宣布Gemini是“谷歌第一个也是最强的人工智能模型”。

谷歌Deepmind官方账号截图，来源：谷歌DeepMindGemini谷歌是一个从头开始构建的多模态模型，这也更接近人类理解世界的方式。

作为Google对付GPT-4的“杀手锏”。

Gemini在32项多模态基准测试中取得了30项SOTA（State Of The Art）记录，并且是第一个在MMLU（大规模多任务语言理解）评估中超越人类专家的模型。

Gemini在这一类别中的得分为90.0%。

作为比较，人类专家的得分为89.8%，GPT-4为86.4%。

Gemini共有三个版本： Gemini Ultra：适合高度复杂的任务； Gemini Pro：一个可以扩展到多种任务的 Gemini 模型； Gemini Nano：尺寸更小，适合特定任务和移动设备。

谷歌 DeepMind 产品副总裁 Eli Collins 表示：“Gemini 的多功能性使其能够在从移动设备到大型数据中心的所有设备上运行。

” “我们正在离新一代人工智能模型的愿景越来越近。

”有了人工智能，我们将有机会在更大规模上做重要的事情。

”谷歌CEO桑达尔·皮查伊在谷歌成立25周年的公开信中特别提到了人工智能。

面对强大的OpenAI，学霸谷歌需要一款现象级的产品来证明Gemini在人工智能领域的强项是Google的答案 1.“只打精英” Google Gemini模型的核心优势在于其原生的多模态特性，过去大型多模态模型往往是通过训练来构建的。

虽然它们在某些任务（例如图像描述）上表现良好，但在处理需要更深入概念理解和复杂推理的任务时，它们往往表现不佳。

从一开始就在不同模态上进行预训练，然后使用额外的多模态数据进行微调，进一步提高模型的有效性。

这种原生的多模态训练方法使得Gemini在处理多类数据和复杂任务时更加高效准确，从而在多模态人工智能领域树立了新标准。

而且，Gemini此次推出主要是“针对OpenAI的GPT-4”。

用《亮剑》里李云龙的话来说——“打仗的就是精英”。

在计算性能方面，Gemini几乎“完全击败”了GPT-4。

Gemini Ultra拥有32个广泛应用于大型模型开发的学术基准测试集，其中30个的性能超过了之前的SOTA结果。

其中，Gemini在多项选择题、数学题、Python代码任务、阅读等方面的表现都超过了之前的最先进水平。

谷歌表示，他们对MMLU采用了新的基准方法，这使得Gemini可以利用他的推理能力来思考在回答困难的问题之前要更加仔细。

与简单地根据问题的第一印象来回答相比，Gemini的表现有了明显的提高。

Gemini Ultra 在多个编码基准测试中表现良好，包括 HumanEval 和 Natural2Code。

其中，只有Gemini在HellaSWAG数据集上的测试逊色于GPT-4。

HellaSWAG数据集主要用于研究扎根常识推理能力，但NLP领域的研究者专家告诉《甲子光年》：“这并不意味着GPT4的常识推理性能更好，因为它无法排除了 ChatGPT 模型在 HellaSWAG 数据集上训练的性能更好《Gemini 模型与 GPT-4 部分测试成绩的比较》，图片来源：Google 另外，在多模态方面，Gemini Ultra 取得了领先的成绩。

在新的 MMMU 基准上得分为 59.4%，凸显了其多模态和复杂推理能力。

在图像基准测试中，Gemini Ultra 可以在不从图像中提取文本的情况下进行 OCR 处理，并且表现优于之前最先进的模型。

Gemini模型与GPT-4V在多模态方面的测试对比。

图片来源：Google Gemini 1.0 经过训练可以同时识别和理解文本、图像、音频等，因此可以更好地理解有细微差别的信息。

回答复杂主题的问题，特别擅长解释数学和物理等复杂主题的推理。

“推理缺陷”也是GPT系列的问题。

著名的语言模型批评家加里·马库斯博士评论道：“大型语言模型无法完成一些严格定义的任务：遵守国际象棋规则、五位数相乘、在家谱中进行可靠的推理、比较不同的物体的重量等。

”尽管技术取得了重大进步，但人工智能生成的虚假或伪造信息的问题仍然存在，这仍然是一个尚未完全解决的研究问题，但他也强调，Gemini接受了谷歌迄今为止最全面的安全评估。

为了确保其可靠性和安全性，谷歌针对Gemini进行了一系列对抗性测试，模拟恶意用户使用该模型并输入各种提示词，以检测该模型是否产生仇恨言论或表现出政治偏见，这些测试包括“真实的毒性线索”。

值得注意的是，Gemini在谷歌自主研发的云芯片张量处理单元（TPU）上完成了训练，特别是TPU v5p版本的性能有了显着提升。

模型训练速度比上一代快2.8倍据悉，TPU v5p芯片专为数据中心训练和大规模模型运行而设计。

从 12 月 13 日开始，开发者和企业客户可以通过 Google AI Studio 或 Google Cloud Vertex AI 访问 Gemini Pro 模型。

Google AI Studio 是一款免费的基于网络的开发工具，为开发人员提供 API 密钥以快速创建原型和启动应用程序。

Vertex AI 提供定制服务，以提供更全面、更托管的 AI 平台，该平台具有完整的数据控制功能，并能够利用 Google Cloud 的附加功能，包括企业级安全性、隐私保护以及数据治理和合规性。

性别。

此外，从 Pixel 8 Pro 设备开始，Android 开发者还可以通过 Android 14 中的新系统功能 AICore 使用 Gemini Nano。

Gemini Nano 是专为设备上任务而设计的高效模型。

通过注册AICore早期预览版，开发者可以深入挖掘其潜力，更方便地利用Gemini的先进技术，在Android生态的应用开发中迸发出更多的火花。

可能性。

到今年，谷歌计划推出 Bard Advanced，它与 AI 代理的初级形式非常相似。

Bard Advanced 将由 Gemini Ultra 提供支持，它可以快速理解多模式输入，包括文本、图像、音频和视频，并做出相应的响应。

2. Google VS OpenAI 尽管OpenAI的GPT大放异彩，但Google似乎太安静了。

今年2月，谷歌在巴黎举办活动时，其聊天机器人巴德的一个错误导致市值蒸发1亿美元，同时也引发了人们对巴德准确性的担忧。

随着OpenAI推出ChatGPT，特别是在将GPT技术集成到Bing搜索中并在应用程序下载量上首次超越谷歌之后，人们开始怀疑谷歌在人工智能领域是否落后于竞争对手。