首页 > 科技启迪 > 内容

新曝光的Claude3直击OpenAI最大弱点

发布于：2024-06-17 编辑：匿名来源：网络

随着OpenAI GPT3开发负责人创业项目，Anthropic被认为是最能与OpenAI竞争的创业公司。

当地时间周一，Anthropic发布了一组Claude 3系列大型模型，称其最强大的模型在各种基准测试中超越了OpenAI的GPT-4和谷歌的Gemini 1.0 Ultra。

然而，处理更复杂的推理任务的能力、更加智能、响应速度更快，这些跻身大型模型前三名的综合能力只是Claude3的基本功。

Anthropic致力于成为企业客户的最佳合作伙伴。

这首先体现在Claude3中，它是一组模型：Haiku、Sonnet和Opus，允许企业客户根据自己的场景选择不同性能和成本的版本。

其次，Anthropic强调自己的模式是最安全的。

人种总裁丹妮拉·阿莫代介绍，在??Claude三号的训练中引入了一种名为“宪法人工智能”的技术，以增强其安全性、可信性和可靠性。

爱丁堡大学大模型与推理专业博士生傅耀在看完Claude3的技术报告后表示，Claude3在一些复杂的推理基准上表现得特别好，特别是在金融和医疗领域。

作为一家 ToB 公司，Anthropic 选择优化最赚钱的领域。

现在，Anthropic已在各国开放使用Claude3系列的两个型号（Opus和Sonnet），而最强大的版本Haiku也即将推出。

同时，Anthropic还通过亚马逊和谷歌的云平台提供服务。

后者分别向Anthropic投资40亿美元和20亿美元。

联合创始人 Dario Amodei 和 Daniela Amodei 表示，Claude 3 的推出再次表明“Anthropic 更像是一家企业公司，而不是一家消费公司。

》｜图片来源：Anthropic 更智能、反应更灵敏的Claude 3家族：Opus、Sonnet和俳句据Anthropic官网介绍，Claude 3是一个系列型号，包括三个最先进的型号：Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus ，允许用户针对其特定应用选择智能、速度和成本的最佳平衡点。

在模型的通用能力方面，Anthropic表示，Claude3系列在分析和预测、详细内容生成、代码生成以及非英语语言等方面“为广泛的认知任务树立了新的行业基准”如西班牙语、日语和法语。

对话方面，其能力更强大，任务响应更及时。

其中，Claude 3 Opus 是这组模型中最聪明的模型，尤其是在处理高度复杂的任务方面。

Opus 在大多数常见基准测试中均优于同行，包括本科水平专家知识 (MMLU)、研究生水平专家推理 (GPQA)、基础数学 (GSM8K) 等。

它显示出对复杂任务的接近人类水平的理解和流畅性。

它是目前 Anthropic 对通用智能最前沿的探索，“展示了生成式人工智能的外部极限”。

Claude三模范家庭|图片来源：人Claude3十四行诗在智能水平和响应速度之间达到了理想的平衡，尤其是对于企业场景中的任务。

它以比同类产品更低的成本提供强大的性能，专为大规模人工智能部署中的高耐用性而设计。

对于绝大多数工作负载，Sonnet 的速度比 Kongfz 2 和 Kongfz 2.1 快 2 倍，也更智能。

它擅长执行需要快速响应的任务，例如知识检索或销售自动化。

Claude3俳句是最紧凑的型号，也是最具性价比的型号。

而且，它的响应速度也非常快，不到三秒就可以读取 arXiv 上包含图表、图表和数据密集型研究论文（约 10k token）的信息。

针对企业客户的迭代联合创始人 Daniela Amodei 表示，除了通用智能的进步之外，Anthropic 特别关注企业客户将生成式 AI 集成到其业务中时面临的诸多挑战。

对于企业客户，Claude3家族在视觉能力、准确性、长文本输入和安全性方面都有改进。

许多企业客户拥有多种格式的知识库，无论是 PDF、流程图还是演示幻灯片。

Claude 3 系列模型现在可以处理各种视觉格式的内容，包括照片、图表、图形和技术图表。

Claude 3 还优化了长文本窗口的准确性和功能。

在准确性方面，Anthropic使用大量复杂的事实问题来针对当前模型中已知的弱点，将答案分类为正确答案、错误答案（或幻觉）以及承认不确定性。

因此，Claude3模型表明它不知道答案，而不是提供错误的信息。

其中最强大的版本，Claude 3 Opus，在挑战性开放式问题上的准确性（或正确答案）比Claude 2.1 提高了一倍，同时也减少了错误答案的水平。

与Claude2.1版本相比，Claude3系列全面提升了响应的准确性。

|图片来源：Anthropic 同时，由于上下文理解能力的提升，与之前的版本相比，Claude 3 家族在响应用户任务时会做出更少的拒绝。

除了更准确的回答外，Anthropic 表示还将为《Claude 3》带来“引用”功能，该功能将指向参考资料中的精确句子来验证他们的答案。

目前，Claude 3系列模型将为K代币提供上下文窗口。

随后，所有三个模型都将能够接受超过 10,000 个代币的输入，并且此功能将提供给需要增强处理能力的精选客户。

Anthropic在其技术报告中简要阐述了Claude3的文本开窗能力，包括较长上下文提示词的有效处理和回忆能力。

“宪法人工智能”应对“不精确科学” 值得注意的是，Claude3作为多模态模型，可以输入图像，但无法输出图像内容。

联合创始人 Daniela Amodei 表示，这是因为“我们发现企业对图像的需求要少得多”。

新曝光的Claude3直击OpenAI最大弱点

《Claude3》的发布是在谷歌Gemini生成的图像引发争议之后发布的。

面向企业客户的Claude也必然要控制和平衡人工智能带来的价值偏差等问题。

对此，达里奥·阿莫代强调了控制人工智能模型的难度，称其为“不精确的科学”。

他表示，该公司有一个专门的团队，致力于评估和减轻该模型带来的各种风险。

另一位联合创始人 Daniela Amodei 也承认，目前的方法可能无法实现完全无偏见的人工智能。

“创建一个完全中立的生成人工智能工具几乎是不可能的，不仅在技术上，而且因为并不是每个人都同意什么是中立，”她说。

此前，Anthropic宣布用于对齐大型模型的“宪法人工智能” |图片来源：Anthropic 然而，Anthropic 使用了一种称为“宪法人工智能”的方法，使模型尽可能符合广泛的人类价值观。

模型遵循《宪法》规定的调整和优化原则。

作为OpenAI的核心开发者，Amodei兄弟姐妹的离开与马斯克最近对OpenAI的抱怨类似，认为OpenAI不再是一个非营利组织，不再遵循其造福人类的初心使命。

有记者问Amodei，Anthropic符合您海外创业的愿景吗？阿莫代表示：“走在人工智能发展的前沿，是引导人工智能发展轨迹、为社会带来积极成果的最有效方式。

” #阿里云#创新创业#创业支持#创业资讯我们关注国内外最热门的创新创业动态，提供一站式资讯服务，真实传递行业热点新闻、深度评论和前瞻观点时间，帮助企业家把握新兴技术趋势和行业变化，洞察未来技术趋势。

站长声明

标签：

上一篇：阿里巴巴组织再次升级：钉钉并入阿里云，盒马成立独立事业群

下一篇：耀火微电子获5000万元A轮融资，IDG资本独家投资

同程艺龙成为继携程、去哪儿、途牛上市后又一后起之秀：拟赴港IPO，融资至多15亿美元！

2020年10月，同程公关负责人否认同程旅游与艺龙有资本层面的合作。从那时起，仅仅过去了半年时间。 2020年12月，同程网络与艺龙旅行宣布合并，如今才过去半年时间。还有不到4个月的时间。　　时间过得真快，转眼间，这家来自同城的“牵手”艺龙公司即将在香港IPO……　　据

06-18
三星SDI正式进军美国市场，将与Stellantis成立电池合资公司

作为唯一一家未在美国设立电池生产工厂的韩国电池制造商，三星SDI正计划与Stellantis携手全球第四大汽车集团，要建立一家本土电池合资企业，预计投资至少数万亿韩元。这标志着三星SDI将正式进军美国市场。据ETNews报道，三星SDI在美国密歇根州拥有一家电池组工厂，但该公司

06-08
流程挖矿厂商“熵平科技”完成数千万元A1轮融资，赛智创投、浪马风创投出手

投资圈（ID：pedaily）6月20日消息，流程挖矿厂商“熵平科技”科技“科技”近日宣布完成数千万元A1轮融资。本轮融资由赛智创投领投，老股东朗迈创投跟投。据介绍，这笔资金将主要用于产品研发、服务生态建设以及拓展海外市场。熵平科技是一家科技创业公司，致力于打造基于

06-17
传奇生物获1.5亿美元战略融资，投后估值19.5亿美元

据投资界3月31日消息，传奇生物近日获得1.5亿美元战略投资。本轮投资方为Hudson Bay Capital、强生创投、礼来亚洲基金、维梧资本、RA Capital等，投后估值为19.5亿美元。传奇生物科技是弗拉基米尔金斯瑞 (Vladimir 金斯瑞) 旗下的一家公司。成立于2001年，是肿瘤细胞免疫

06-18
康普生物制药完成近亿元B+轮融资，由一村资本

投资圈（ID：pedaily）领投据8月30日消息，康普生物制药科技（合肥）有限公司（以下简称：康普生物制药（Compo Biopharmaceuticals）宣布完成近亿元B+轮融资。本轮融资由一村资本领投，现有股东北极光创投、龙蟠投资、一景资本、瑞禾资本、银杏谷资本继续跟投，凯诚资本担任

06-18
OPPO刘作虎：10年后手机仍将是AI最好的载体

手机AI功能应该如何落地？过去时代最重要的智能设备的体验会在AI时代得到升级，还是会被新设备取代？日前，魅族宣布停止新传统“智能手机”项目的开发，全力投入新一代AI设备，引发小范围热议。 2月20日，仿佛作为回应，OPPO作为最积极将AI功能部署到手机上的手机厂商之一，

06-18
台积电五天内三次提价，5G手机或将迎来涨价热潮

金石数据今年年初的芯片“荒”已经从汽车行业蔓延至手机行业。全球最大芯片制造商台积电在短短五天内三次宣布芯片涨价。一是决定将12英寸晶圆价格上调25%；随后宣布从4月份开始提高晶圆代工价格；然后还考虑在年底取消客户折扣，变相涨价。除台积电外，中芯国际、联华电

06-06
专注新一代4D成像雷达芯片组解决方案，Arbe获3200万美元B轮融资

投资界消息，据36氪报道，以色列雷达芯片组解决方案公司Arbe宣布获得1万美元B轮融资B轮融资，投资方包括光大催化剂中以基金、北汽资本、源清资本（MissionBlue Capital）、韩国现代汽车背景的AI联盟（现代、韩华、SKT）等新投资方，以及早期投资方和行业投资者包括 Canaan Pa

06-17
骑自行车吃麦当劳汉堡，谁的减肥“DNA”受到影响？

对于那些试图通过控制饮食和运动来减肥或减脂的人来说，“欺骗餐”是一个熟悉的术语。是指连续低能量饮食后，身体的保护机制会降低基础代谢。消耗并减缓脂肪的消耗，所以需要高热量、高碳水化合物的饮食来“欺骗”身体。通常情况下，很多人在高热量饮食后都会通过运动来燃

06-21
安富利与Samtec扩大合作范围，共同开拓亚洲市场

中国北京，2020年1月2日 - 全球领先的技术解决方案提供商安富利（纳斯达克代码：AVT）与全球领先的私营电子连接器制造商Samtec今天宣布，双方将加强现有的合作伙伴关系，并进一步扩大经销合作范围。亚太地区和日本的安富利客户现在可以购买 Samtec 的完整产品组合。此前，安

06-06
美的地产计划2023年全部绿色指标，不排除分拆物业上市

年内，美的地产营收人民币（下同）8400万元，同比-同比增长27.6%；年内实现核心净利润48.05亿元，较上年同期增长15.0%。总体收入和利润实现平稳较快增长。

06-17
阿里巴巴达摩院前技术大师创办的公司获得百度等1亿元投资；沙特20亿美元帮助联想集团设立中东总部 - IT橙周刊

前阿里巴巴达摩院技术大牛创办的公司获得百度等1亿元投资；沙特20亿美元助力联想集团设立中东总部 | IT橙周刊原创IT橙IT橙IT橙微信IDitjuzi关于专题新经济权威创投数据服务商，从数据洞察创投趋势06-03 12:23 来源北京丨IT橙封面图片来源| Pexels旗下IT橙周刊，每周一更新，盘

06-18