首页 > 科技启迪 > 内容

新曝光的Claude3直击OpenAI最大弱点

发布于:2024-06-17 编辑:匿名 来源:网络

随着OpenAI GPT3开发负责人创业项目,Anthropic被认为是最能与OpenAI竞争的创业公司。

当地时间周一,Anthropic发布了一组Claude 3系列大型模型,称其最强大的模型在各种基准测试中超越了OpenAI的GPT-4和谷歌的Gemini 1.0 Ultra。

然而,处理更复杂的推理任务的能力、更加智能、响应速度更快,这些跻身大型模型前三名的综合能力只是Claude3的基本功。

Anthropic致力于成为企业客户的最佳合作伙伴。

这首先体现在Claude3中,它是一组模型:Haiku、Sonnet和Opus,允许企业客户根据自己的场景选择不同性能和成本的版本。

其次,Anthropic强调自己的模式是最安全的。

人种总裁丹妮拉·阿莫代介绍,在??Claude三号的训练中引入了一种名为“宪法人工智能”的技术,以增强其安全性、可信性和可靠性。

爱丁堡大学大模型与推理专业博士生傅耀在看完Claude3的技术报告后表示,Claude3在一些复杂的推理基准上表现得特别好,特别是在金融和医疗领域。

作为一家 ToB 公司,Anthropic 选择优化最赚钱的领域。

现在,Anthropic已在各国开放使用Claude3系列的两个型号(Opus和Sonnet),而最强大的版本Haiku也即将推出。

同时,Anthropic还通过亚马逊和谷歌的云平台提供服务。

后者分别向Anthropic投资40亿美元和20亿美元。

联合创始人 Dario Amodei 和 Daniela Amodei 表示,Claude 3 的推出再次表明“Anthropic 更像是一家企业公司,而不是一家消费公司。

》|图片来源:Anthropic 更智能、反应更灵敏的Claude 3家族:Opus、Sonnet和俳句 据Anthropic官网介绍,Claude 3是一个系列型号,包括三个最先进的型号:Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus ,允许用户针对其特定应用选择智能、速度和成本的最佳平衡点。

在模型的通用能力方面,Anthropic表示,Claude3系列在分析和预测、详细内容生成、代码生成以及非英语语言等方面“为广泛的认知任务树立了新的行业基准”如西班牙语、日语和法语。

对话方面,其能力更强大,任务响应更及时。

其中,Claude 3 Opus 是这组模型中最聪明的模型,尤其是在处理高度复杂的任务方面。

Opus 在大多数常见基准测试中均优于同行,包括本科水平专家知识 (MMLU)、研究生水平专家推理 (GPQA)、基础数学 (GSM8K) 等。

它显示出对复杂任务的接近人类水平的理解和流畅性。

它是目前 Anthropic 对通用智能最前沿的探索,“展示了生成式人工智能的外部极限”。

Claude三模范家庭|图片来源:人Claude3十四行诗在智能水平和响应速度之间达到了理想的平衡,尤其是对于企业场景中的任务。

它以比同类产品更低的成本提供强大的性能,专为大规模人工智能部署中的高耐用性而设计。

对于绝大多数工作负载,Sonnet 的速度比 Kongfz 2 和 Kongfz 2.1 快 2 倍,也更智能。

它擅长执行需要快速响应的任务,例如知识检索或销售自动化。

Claude3俳句是最紧凑的型号,也是最具性价比的型号。

而且,它的响应速度也非常快,不到三秒就可以读取 arXiv 上包含图表、图表和数据密集型研究论文(约 10k token)的信息。

针对企业客户的迭代联合创始人 Daniela Amodei 表示,除了通用智能的进步之外,Anthropic 特别关注企业客户将生成式 AI 集成到其业务中时面临的诸多挑战。

对于企业客户,Claude3家族在视觉能力、准确性、长文本输入和安全性方面都有改进。

许多企业客户拥有多种格式的知识库,无论是 PDF、流程图还是演示幻灯片。

Claude 3 系列模型现在可以处理各种视觉格式的内容,包括照片、图表、图形和技术图表。

Claude 3 还优化了长文本窗口的准确性和功能。

在准确性方面,Anthropic使用大量复杂的事实问题来针对当前模型中已知的弱点,将答案分类为正确答案、错误答案(或幻觉)以及承认不确定性。

因此,Claude3模型表明它不知道答案,而不是提供错误的信息。

其中最强大的版本,Claude 3 Opus,在挑战性开放式问题上的准确性(或正确答案)比Claude 2.1 提高了一倍,同时也减少了错误答案的水平。

与Claude2.1版本相比,Claude3系列全面提升了响应的准确性。

|图片来源:Anthropic 同时,由于上下文理解能力的提升,与之前的版本相比,Claude 3 家族在响应用户任务时会做出更少的拒绝。

除了更准确的回答外,Anthropic 表示还将为《Claude 3》带来“引用”功能,该功能将指向参考资料中的精确句子来验证他们的答案。

目前,Claude 3系列模型将为K代币提供上下文窗口。

随后,所有三个模型都将能够接受超过 10,000 个代币的输入,并且此功能将提供给需要增强处理能力的精选客户。

Anthropic在其技术报告中简要阐述了Claude3的文本开窗能力,包括较长上下文提示词的有效处理和回忆能力。

“宪法人工智能”应对“不精确科学” 值得注意的是,Claude3作为多模态模型,可以输入图像,但无法输出图像内容。

联合创始人 Daniela Amodei 表示,这是因为“我们发现企业对图像的需求要少得多”。

新曝光的Claude3直击OpenAI最大弱点

《Claude3》的发布是在谷歌Gemini生成的图像引发争议之后发布的。

面向企业客户的Claude也必然要控制和平衡人工智能带来的价值偏差等问题。

对此,达里奥·阿莫代强调了控制人工智能模型的难度,称其为“不精确的科学”。

他表示,该公司有一个专门的团队,致力于评估和减轻该模型带来的各种风险。

另一位联合创始人 Daniela Amodei 也承认,目前的方法可能无法实现完全无偏见的人工智能。

“创建一个完全中立的生成人工智能工具几乎是不可能的,不仅在技术上,而且因为并不是每个人都同意什么是中立,”她说。

此前,Anthropic宣布用于对齐大型模型的“宪法人工智能” |图片来源:Anthropic 然而,Anthropic 使用了一种称为“宪法人工智能”的方法,使模型尽可能符合广泛的人类价值观。

模型遵循《宪法》规定的调整和优化原则。

作为OpenAI的核心开发者,Amodei兄弟姐妹的离开与马斯克最近对OpenAI的抱怨类似,认为OpenAI不再是一个非营利组织,不再遵循其造福人类的初心使命。

有记者问Amodei,Anthropic符合您海外创业的愿景吗? 阿莫代表示:“走在人工智能发展的前沿,是引导人工智能发展轨迹、为社会带来积极成果的最有效方式。

” #阿里云#创新创业#创业支持#创业资讯我们关注国内外最热门的创新创业动态,提供一站式资讯服务,真实传递行业热点新闻、深度评论和前瞻观点时间,帮助企业家把握新兴技术趋势和行业变化,洞察未来技术趋势。

新曝光的Claude3直击OpenAI最大弱点

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 【24小时创业】2022年10月26日

    【24小时创业】2022年10月26日

    投融资 昨日,2019年10月26日国内市场共发生投资披露事件14起,其中医疗健康3起(天虹胜杰、柯林布瑞、大源晨光),先进制造3起(祎智量芯、上阳软件、高石科技) )、企业服务2个案例(黑哈文化、欧拉智能)、电商零售2个案例(学园圣诺、集集精选)、娱乐传媒1个案例(妍嘉

    06-17

  • 360发文《十一电信诈骗大数据》看看骗子假期里都干了什么

    360发文《十一电信诈骗大数据》看看骗子假期里都干了什么

    国庆期间,虽然是假期,电信诈骗分子依然非常猖獗,对公众人身财产安全造成巨大威胁。 近日,中国最大的网络安全公司发布了《十一电信诈骗大数据》,全面曝光了不法分子国庆期间的诈骗手段、诈骗领域、作息规律等。   大数据显示,7天假期期间,手机卫士为全国用户识别拦截

    06-18

  • 上海最新独角兽:真趣科技融资6亿

    上海最新独角兽:真趣科技融资6亿

    这可能是上海最新的独角兽了。 投资界获悉,真趣科技宣布完成超6亿元D轮融资,由君联资本、普金联合领投,郑志刚联合创始人C资本、鑫商资本、华泰宝利投资等跟投方、敦诚投资、九松明星、奥飞娱乐创始人、总裁蔡晓东等。 这距离其上一轮融资仅一个月。 投资界已向投资者核实,

    06-17

  • “吃”马斯克,摸耐克,这个牌子酷得离谱

    “吃”马斯克,摸耐克,这个牌子酷得离谱

    这看起来就是一双普通的灰色滑板鞋。 佩戴时间越长,看起来就越好。 灰色绒面革表面磨损后,露出明亮的黄色、蓝色和红色。 它的名字叫“Gobstopper”,灵感来自于一种叫做“Gobstopper”的多层糖果,所以它也可以被称为“糖果鞋”。 这个有趣的设计来自于一个屡次得罪Nike和V

    06-21

  • 实际控制人的认定是否准确?兆讯传媒回应创业板IPO问询

    实际控制人的认定是否准确?兆讯传媒回应创业板IPO问询

    兆讯传媒广告有限公司回应创业板IPO问询,涉及实际控制人、员工离职率、股东信息披露、净利率、应收账款、关联交易等六项问题。

    06-18

  • 零食店极致内卷,一个县开出数百家

    零食店极致内卷,一个县开出数百家

    小吃店参与度极高,一个县就开设了数百家小吃店。 下沉市场成为资本争夺的热点。 近两年,零食折扣店征服了县乡城镇,正在改写行业规则和居民消费习惯。 大年初三,湖南A县一家小吃店生意非常好,早早开门营业。 走进店里,首先映入眼帘的是一排低价饮品。 怡宝矿泉水每瓶仅需

    06-17

  • 曾因倒卖被娃哈哈开除,农夫山泉钟睒睒超越马化腾,成为新首富

    曾因倒卖被娃哈哈开除,农夫山泉钟睒睒超越马化腾,成为新首富

    神舟9月8日上午9时30分,农夫山泉(3、HK)在香港联交所正式挂牌上市。 香港上市首日,农夫山泉高开于每股39.8港元,涨幅85.12%,总市值达9200万港元。 据创头条统计,农夫山泉创始人钟睒睒超越马化腾,成为国内新首富。 目前,创始人钟睒睒通过旗下子公司持有84.4%的股份。

    06-18

  • 西安交大博士创立“奇点能源”,完成超7亿元B轮融资,VC-PE阵容豪华

    西安交大博士创立“奇点能源”,完成超7亿元B轮融资,VC-PE阵容豪华

    投资圈(ID:pedaily)5月18日讯,西安奇点能源有限公司奇点能源股份有限公司(以下简称“奇点能源”)近日宣布完成超7亿元B轮融资。 本轮融资由金石投资领投,金镒资本、高瓴创投、广发信德、黄河实业、华金资本、皖皖资本、朝熹资本、鑫商资本、科石资本、希高投资等跟投。

    06-18

  • 2019年一季度中国股权投资市场全景(100页PPT)

    2019年一季度中国股权投资市场全景(100页PPT)

    清科研究中心发布2019年一季度股权投资市场“百页PPT”:数据显示募资端一季度中国股权投资市场遇冷,孔夫子共募集新基金约2亿元人民币,同比下降25.9%;投资市场也持续降温,机构普遍谨慎。 共发生投资案例1起,金额1.76亿元,同比下降37.0%。 % 和 47.7%;退出方面,共有退

    06-18

  • 首次发布 -全球存储计算一体化芯片耀明智盾科技获近3亿元A轮融资

    首次发布 -全球存储计算一体化芯片耀明智盾科技获近3亿元A轮融资

    据6月10日消息,全球存储计算一体化芯片耀明智盾科技宣布完成1亿元A3轮融资。 本轮融资由飞图创投领投,万魔声学、科羽盛达、仁馨资本等跟投,老股东科讯创投、中芯聚源、普华资本、招商创投持续跟投,指数资本担任财务顾问专属。 融资资金将用于加大技术研发、产品线拓展和新

    06-17

  • 新闻 -同江投资集团投资杭州岸步网络科技Pre-A轮,共同打造“微车”品牌

    新闻 -同江投资集团投资杭州岸步网络科技Pre-A轮,共同打造“微车”品牌

    投资界消息,8月13日,同江投资集团与湖北高头产控投资有限公司共同设立同启高科股权投资基金,投资杭州岸步网络科技有限公司Pre-A轮融资数千万元,共同打造“微车”品牌,探索“新零售汽车分销”模式开拓新的汽车消费市场。 扩展能力。   随着新版本《汽车销售管理办法》的

    06-18

  • 汽车之家今日在香港联交所上市,是成人首只回港二次上市的中概股

    汽车之家今日在香港联交所上市,是成人首只回港二次上市的中概股

    今天上午,汽车之家在香港联交所正式挂牌上市。 股票代码为.HK,上市价格为HK$.3,在弱市中获得超额认购,是首支成年后重返香港第二上市的中概股。 对于本次IPO募资用途,汽车之家表示,公司将把本次投资募集资金净额的30%用于技术和产品开发; 30%将用于孵化新业务;剩余的4

    06-17