深圳有一款游戏出现在98%的朋友圈里,你确定不想约会吗?
06-18
开源模式是否流行,看生态系统中的产品支持速度有多快就知道了。
4月26日,在与通义千意见不合后,再次开源,直接发布了一亿参数的王炸模型Qwen1.5-B,创下开源模型性能新高。
模型发布后不到24小时,Ollama迅速启动了对B的支持。
这意味着除了Magic Community和HuggingFace上的免费演示之外,您还可以在模型发布后立即将模型部署到自己的计算机上。
还有一些云部署平台如SkyPilot,也率先发推文乘势而上,搭上了Qwen 1.5的热度。
纵观大型模型开源社区,只有 Llama 是大家都想用的。
Qwen系列已经开源半年多了,在开源生态中的地位也逐渐开始接近Llama。
发布当天,Qwen1.5-B一度占据黑客新闻榜首。
上一次出现如此多的热度和讨论是在通义千去年 8 月首次宣布开源时。
然而,人们讨论的方向已经从“这是什么?”发生了转变。
认真讨论“这有多强?”随着Qwen实力的增强,质疑声也逐渐消散。
有网友对Qwen1.5-B的摘要生成和信息提取能力表示肯定,认为效果比Llama 3更好。
不过,也有网友表达喜欢的方式有些粗暴。
通义千此次发布的Qwen1.5-B开源模型是Qwen系列中第一个千亿参数的模型。
与同系列的72B型号相比,B的性能有了明显的提升。
通义千问72B一直是社区中最受欢迎的开源型号,说屡次高居榜首也不为过。
然而,在这个模型中,预训练方法并没有发生明显的改变,因此性能的提升主要来自于模型尺寸的增加。
Qwen1.5-B 与其他 Qwen1.5 模型类似,使用相同的 Transformer 解码器架构并使用 Group Query Attention (GQA)。
支持32K token的上下文长度,支持英语、中文、法语、西班牙语、德语、俄语、日语、韩语、越南语、阿拉伯语等多种语言。
跑分表现方面,大部分测试项目超越了Llama 3 70B:除了跑分之外,我们更好奇的是Qwen1.5-B的实际表现,与Llama 3-70B有何不同?接下来我们就来看看实际测试吧。
Qwen1.5-B VS Llama 3 70B 先来一些新鲜智障题:在没有任何个性化提示的情况下,Qwen1.5-B的语言更符合逻辑,信息更丰富,所有答案都正确。
而Llama 3的答案比弱智棒还要弱智一点。
不仅有1个半小时就是1.5小时这样的无稽之谈文献,还有电动车变三轮车的错觉。
也许对于弱智来说,这才是正确的答案?我们来看看它的中文理解能力: 这句话的正确答案应该是:我一口气抓住了“把手”/“车把”。
Qwen的答案是正确的,但缺乏握住车把的意义。
Llama 3 觉得这很搞笑。
另一轮后续问答:让Qwen再思考一下,基本回答正确。
《骆驼3》仍然很搞笑。
看到Llama 3的回答我真的笑了。
这是一道严重的数学题:王太太去市场卖鸡蛋。
第一个人买了篮子里的一半又一个鸡蛋,第二个人买了剩下的一半又一个鸡蛋。
这时,篮子里还剩下一颗鸡蛋。
王女士总共卖了多少个鸡蛋?他们的回答是:Qwen的思路很清晰,答案是正确的。
Llama 3 过程是正确的,但单变量线性方程的解是错误的。
而且从解题思路上来说,Qwen是逆向思维,非常巧妙。
骆驼是典型的小学生思维。
相信所有小学生看到Llama 3都会使用Llama 3来解决问题。
在不清除聊天记录的情况下用韩语交流时,Llama 3 会延续之前用中文接听的习惯。
Qwen 改为韩语答案。
在这些测试题中,Qwen1.5-B完全击败了Llama 3 70B。
并不是Llama 3不好,只是在中国地区,Qwen1.5-B是最强开源模型应该没有争议。
将开源进行到底 在Hugging Face上,Qwen系列机型几乎从开源以来就一直处于人气榜前列。
随着1.5版本的到来以及72B、B大参数车型的推出,它们一度成为了Llama旗下的车型之一。
世界上最耀眼的开源模型之一。
尤其是汉语这个母语领域,全网基本没有代餐。
从去年8月份开始,开源的步伐就一直没有停止过。
自2月初发布Qwen 1.5系列以来,三个月内已推出10个不同参数规格的开源模型,包括8个大语言模型、Code系列模型和MoE模型。
去年年底,通义千文还开源了两个多模态模型,视觉理解模型Qwen-VL和音频理解模型Qwen-Audio。
如果算上各种部署和调试版本,HuggingFace 上已经有 76 种不同型号的 Qwen 模型。
相比之下,Mistral 和 Llama 都只有个位数型号。
相比之下,Qwen简直就是开源界的模范工作者。
自然,努力就有回报。
近半年来,Qwen系列机型下载量已突破万次。
基于Qwen系列的模型和应用可以在HF和Magic上轻松找到。
对于大量开发者和企业来说,Qwen系列全覆盖5亿到1亿参数,提供了最理想的选型包。

同益大模型近期频频公布客户合作信息,先后与中科院国家天文台、新东方、同程旅游、长安汽车等机构和企业对接。
中国科学院国家天文台在通义千问题开源模型的基础上,研制了新一代天文大模型“星语”。
“3.0”,这是中国大型模型首次“上天”并应用于天文观测领域。
近来,随着模型能力的逐步完善,开源与闭源的争论愈发激烈。
与追求自我闭环商业化的闭源模式相比,开源赛道展现出另一种“一切皆有可能”的想象,只有有人使用、有人使用,开源才有意义。
从这个角度来看,Qwen系列已经成为中国最成功的开源产品之一。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-06
06-18
06-06
06-17
06-17
06-17
最新文章
首先告诉我什么是智能汽车!
盲盒明星卡的暴利与泡沫:2元卡卖700万,直播卖卡月入百万
黑色星期五轰轰烈烈地回来了,结果这些中国企业扛起了全场
锂电池隔膜疯狂扩产:兴源材料欲夺回C位?
当我考上缅语专业时:凌晨三点我还在走廊里背单词,毕业后,我不仅仅是一名翻译者
被遗弃,被收获?老年人上网到底有多难?
海外日报 -今年,我国自主研发游戏海外实际销售收入实现两位数增长;三星电子正式成立机器人业务团队36氪海外·15分钟前
腾讯音乐:爱、相信、坚持