首页 > 技术迭代 > 内容

通义千问开源王炸,1100亿参数霸占开源榜,中国能力世界第一

发布于:2024-06-28 编辑:匿名 来源:网络

开源模式是否流行,看生态系统中的产品支持速度有多快就知道了。

4月26日,在与通义千意见不合后,再次开源,直接发布了一亿参数的王炸模型Qwen1.5-B,创下开源模型性能新高。

模型发布后不到24小时,Ollama迅速启动了对B的支持。

这意味着除了Magic Community和HuggingFace上的免费演示之外,您还可以在模型发布后立即将模型部署到自己的计算机上。

还有一些云部署平台如SkyPilot,也率先发推文乘势而上,搭上了Qwen 1.5的热度。

纵观大型模型开源社区,只有 Llama 是大家都想用的。

Qwen系列已经开源半年多了,在开源生态中的地位也逐渐开始接近Llama。

发布当天,Qwen1.5-B一度占据黑客新闻榜首。

上一次出现如此多的热度和讨论是在通义千去年 8 月首次宣布开源时。

然而,人们讨论的方向已经从“这是什么?”发生了转变。

认真讨论“这有多强?”随着Qwen实力的增强,质疑声也逐渐消散。

有网友对Qwen1.5-B的摘要生成和信息提取能力表示肯定,认为效果比Llama 3更好。

不过,也有网友表达喜欢的方式有些粗暴。

通义千此次发布的Qwen1.5-B开源模型是Qwen系列中第一个千亿参数的模型。

与同系列的72B型号相比,B的性能有了明显的提升。

通义千问72B一直是社区中最受欢迎的开源型号,说屡次高居榜首也不为过。

然而,在这个模型中,预训练方法并没有发生明显的改变,因此性能的提升主要来自于模型尺寸的增加。

Qwen1.5-B 与其他 Qwen1.5 模型类似,使用相同的 Transformer 解码器架构并使用 Group Query Attention (GQA)。

支持32K token的上下文长度,支持英语、中文、法语、西班牙语、德语、俄语、日语、韩语、越南语、阿拉伯语等多种语言。

跑分表现方面,大部分测试项目超越了Llama 3 70B:除了跑分之外,我们更好奇的是Qwen1.5-B的实际表现,与Llama 3-70B有何不同?接下来我们就来看看实际测试吧。

Qwen1.5-B VS Llama 3 70B 先来一些新鲜智障题:在没有任何个性化提示的情况下,Qwen1.5-B的语言更符合逻辑,信息更丰富,所有答案都正确。

而Llama 3的答案比弱智棒还要弱智一点。

不仅有1个半小时就是1.5小时这样的无稽之谈文献,还有电动车变三轮车的错觉。

也许对于弱智来说,这才是正确的答案?我们来看看它的中文理解能力: 这句话的正确答案应该是:我一口气抓住了“把手”/“车把”。

Qwen的答案是正确的,但缺乏握住车把的意义。

Llama 3 觉得这很搞笑。

另一轮后续问答:让Qwen再思考一下,基本回答正确。

《骆驼3》仍然很搞笑。

看到Llama 3的回答我真的笑了。

这是一道严重的数学题:王太太去市场卖鸡蛋。

第一个人买了篮子里的一半又一个鸡蛋,第二个人买了剩下的一半又一个鸡蛋。

这时,篮子里还剩下一颗鸡蛋。

王女士总共卖了多少个鸡蛋?他们的回答是:Qwen的思路很清晰,答案是正确的。

Llama 3 过程是正确的,但单变量线性方程的解是错误的。

而且从解题思路上来说,Qwen是逆向思维,非常巧妙。

骆驼是典型的小学生思维。

相信所有小学生看到Llama 3都会使用Llama 3来解决问题。

在不清除聊天记录的情况下用韩语交流时,Llama 3 会延续之前用中文接听的习惯。

Qwen 改为韩语答案。

在这些测试题中,Qwen1.5-B完全击败了Llama 3 70B。

并不是Llama 3不好,只是在中国地区,Qwen1.5-B是最强开源模型应该没有争议。

将开源进行到底 在Hugging Face上,Qwen系列机型几乎从开源以来就一直处于人气榜前列。

随着1.5版本的到来以及72B、B大参数车型的推出,它们一度成为了Llama旗下的车型之一。

世界上最耀眼的开源模型之一。

尤其是汉语这个母语领域,全网基本没有代餐。

从去年8月份开始,开源的步伐就一直没有停止过。

自2月初发布Qwen 1.5系列以来,三个月内已推出10个不同参数规格的开源模型,包括8个大语言模型、Code系列模型和MoE模型。

去年年底,通义千文还开源了两个多模态模型,视觉理解模型Qwen-VL和音频理解模型Qwen-Audio。

如果算上各种部署和调试版本,HuggingFace 上已经有 76 种不同型号的 Qwen 模型。

相比之下,Mistral 和 Llama 都只有个位数型号。

相比之下,Qwen简直就是开源界的模范工作者。

自然,努力就有回报。

近半年来,Qwen系列机型下载量已突破万次。

基于Qwen系列的模型和应用可以在HF和Magic上轻松找到。

对于大量开发者和企业来说,Qwen系列全覆盖5亿到1亿参数,提供了最理想的选型包。

通义千问开源王炸,1100亿参数霸占开源榜,中国能力世界第一

同益大模型近期频频公布客户合作信息,先后与中科院国家天文台、新东方、同程旅游、长安汽车等机构和企业对接。

中国科学院国家天文台在通义千问题开源模型的基础上,研制了新一代天文大模型“星语”。

“3.0”,这是中国大型模型首次“上天”并应用于天文观测领域。

近来,随着模型能力的逐步完善,开源与闭源的争论愈发激烈。

与追求自我闭环商业化的闭源模式相比,开源赛道展现出另一种“一切皆有可能”的想象,只有有人使用、有人使用,开源才有意义。

从这个角度来看,Qwen系列已经成为中国最成功的开源产品之一。

通义千问开源王炸,1100亿参数霸占开源榜,中国能力世界第一

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 深圳有一款游戏出现在98%的朋友圈里,你确定不想约会吗?

    深圳有一款游戏出现在98%的朋友圈里,你确定不想约会吗?

    生活中的种种诱惑,存在于每一句话中。 比如:有的人做的家常菜生动鲜美,有的人28天练出人鱼线,有的人一年加薪好几次,年纪轻轻年薪50万+。 有些人可以朝九晚五工作并环游世界。 过着耀眼而美好的生活……当你在生活中彷徨,陷入各种诱惑时,突然有一股力量从千里之外传来。

    06-18

  • 珠海市出台发展实体经济新规划,将设立超1000亿元的产业发展基金,

    珠海市出台发展实体经济新规划,将设立超1000亿元的产业发展基金,

    投资界8月4日消息,据南方日报报道,珠海市委、市政府联合发布《珠海市发展壮大实体经济实施方案》。 珠海将推出一系列更多举措促进实体经济发展。   规划提出了未来五年明确的发展目标:到2020年,全市经济总量进一步扩大,工业总产值达到1亿元,翻一番;形成百亿元以上龙

    06-17

  • 独家-深圳天使母基金二期增资50亿,总规模100亿

    独家-深圳天使母基金二期增资50亿,总规模100亿

    深圳天使母基金二期增资终于到位。 投资界7月20日获悉,深圳天使母基金已完成增资50亿元,基金规模由50亿元增至1亿元。 预计到年内,撬动社会资本形成总投资规模1亿元。 深圳天使母基金运营两年,撬动社会资本约70亿元。 政府引导基金作为政策性基金,难以市场化有效运作一直

    06-18

  • 北京:加强个人经营性贷款管理,防范信贷资金非法流入房地产市场

    北京:加强个人经营性贷款管理,防范信贷资金非法流入房地产市场

    今日,北京银保监局、中国人民银行营业管理部发布通知,加强个人经营性贷款管理管理个人经营性贷款,防止信贷资金非法流入房地产市场。 。 通知要求,加强客户资格和信用状况审核,关注客户取得经营性贷款借款人资格的时间,审慎发放仅以企业公民身份申请的个人经营性贷款。

    06-18

  • 病原微生物测序公司玉果生物获北极光创投近亿元投资

    病原微生物测序公司玉果生物获北极光创投近亿元投资

    据投资界2月25日消息,玉果生物科技(北京)有限公司(以下简称“玉果生物”) 》)于2020年8月获北极光创投首轮独家投资。 此后,产业基金和金融机构持续投资,融资总额近亿元。 本轮融资将用于进一步开拓和教育市场、扩大团队、申请检测试剂盒认证,并继续投入更多新产品的

    06-17

  • 格芯与高通签署先进5G射频前端产品交付协议

    格芯与高通签署先进5G射频前端产品交付协议

    ——格芯与高通合作打造先进的5G解决方案,带来突破性的覆盖范围和出色的移动性9月15日,全球领先的功能丰富的半导体制造商格芯和高通全球贸易 PTE。 Qualcomm Technologies 旗下子公司 Qualcomm Technologies 今日宣布,双方将延续双方在射频领域的成功合作,继续携手打造 5

    06-06

  • 2024年伊始,中概股活跃

    2024年伊始,中概股活跃

    1月2日,元旦假期后的第一个交易日,蜜雪冰城向港交所提交上市申请;同日,另一家新晋茶饮品牌古茗也向港交所提交正式公告,“下沉市场奶茶股”争夺战进入白热化阶段。 仅仅三天后,香港股市迎来了年度最成功的IPO——“激光雷达第一股”速腾钜创。 未来几年,大量独角兽企业

    06-18

  • 新手的母亲已经上网20多年,她下载了一些应用程序来欢迎她的孩子们,

    新手的母亲已经上网20多年,她下载了一些应用程序来欢迎她的孩子们,

    “请别哭。 ”黑眼圈、头发蓬松的我独自坐在床边,眼神空洞,默默地念叨着这句话。 无数次的哭泣、无数个不眠之夜、失去的时间……有多少妈妈是这样陪着新生儿度过的第一个月呢?我怀孕的时候没想过这个问题。 当我怀孕的时候,我很担心宝宝的健康。 我只是希望肚子里的宝宝能

    06-21

  • 台积电计划在中国台湾再建4座工厂,生产3纳米芯片

    台积电计划在中国台湾再建4座工厂,生产3纳米芯片

    TechWeb 6月20日消息,据外媒报道,台积电计划在中国台湾省台南市再建4座工厂,生产3纳米芯片。 据外媒报道,这四家工厂每家成本约为1亿美元。 据称,它们都配备了生产3纳米芯片的生产线。 他们生产的产品可能包括苹果芯片,比如苹果自研的硅芯片和A系列。 芯片。 去年12月,

    06-06

  • Ignatica获灵杰资本领投Pre-A轮融资

    Ignatica获灵杰资本领投Pre-A轮融资

    ”据4月23日消息,近日,为保险公司提供数字化自助服务和智能自动化解决方案的保险合同管理平台“Ignatica”宣布已获得完成1万美元Pre-A轮A轮融资,由灵杰资本领投,美国SOSV、澳大利亚Artesian、香港AFG等基金跟投。

    06-17

  • 江西省企业“上云用数据”服务协议

    江西省企业“上云用数据”服务协议

    江西省企业“上云用数据”服务协议 江西省企业“上云用数据”服务是阿里云和江西省政府重点关注本地专业、新型、优质科技企业提供的一揽子数字化服务。 符合一定条件的企业可以根据实际情况申请定制服务套餐,从而享受优惠的数字服务并参与支持数字赋能活动。 阿里云计算有限

    06-17

  • 库存-园区9月的精彩活动

    库存-园区9月的精彩活动

    9鏈堟闅忕潃绉嬮寰愬緪鑰屾潵锛?鏈堢殑瀛靛寲娲诲姩鏇存槸绮惧僵绾峰憟銆傝鎴戜滑涓?璧峰洖椤句竴涓嬨??2001骞粹?滃垱鏂板湪涓婃捣鈥濆浗闄呭垱鏂板垱涓氬ぇ璧涘叏鍥介?夋嫈璧涘墠璁粌娲诲姩杩戞棩涓捐銆傚敖绠$柅鎯呭弽澶嶏紝闃块噷浜戝垱鏂颁腑蹇冿紙涓婃捣寮犳

    06-17