首页 > 科技未来 > 内容

阿里云大模型Qwen2开源了!免费下载!

发布于:2024-06-17 编辑:匿名 来源:网络

阿里云大模型Qwen2开源了!免费下载! 创云帮 创云帮微信IDinvcloud关于特色 广东创云科技有限公司是国内领先的云计算和安全增值分发服务提供商,广东省计算机信息网络安全与人工智能行业协会会员。

自2016年成立以来,一直以“帮助企业在云端创造更大价值”为使命,专注于云计算增值服务和信息网络安全服务,为企业提供全栈混合云及安全解决方案。

06-07 14:45 比美国开源Llama3和中国闭源模型更强的广东Qwen2今天开源,可以免费下载!下载地址:终于迎来了Qwen系列机型从Qwen1.5到Qwen2的重大升级。

此次阿里云为大家带来:Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B、Qwen2-72B等5种尺寸的预训练和指令微调模型;在中文和英文的基础上,训练数据中添加了27种语言相关的高质量数据;在多项评估基准上表现领先;编码和数学能力得到显着提高;上下文长度支持已增加,最多 K 个标记(Qwen2-72B-Instruct)。

目前阿里云已同步开源Hugging Face和ModelScope。

期待听到您的反馈!模型基本信息 Qwen2系列包含5种尺寸的预训练和指令微调模型,包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B。

如下表所示: 在Qwen1.5系列中,只有32B和B型号使用了GQA。

这次,各种规模的模型都使用了GQA,让大家能够体验到GQA带来的推理加速和减少内存占用的优势。

对于小型模型,由于embedding参数较多,阿里云采用tie embedding方法,让输入层和输出层共享参数,增加非embedding参数的比例。

在上下文长度方面,所有预训练模型都在 32K 个 token 数据上进行训练,我们发现当使用 K 个 token 时,它们仍然可以在 PPL 评估中取得良好的性能。

然而,对于指令微调模型,除了PPL评估之外,还需要大海捞针等长序列理解实验。

在这个表中,阿里云根据大海捞针的实测结果,列出了各指令微调模型支持的最大上下文长度。

当使用 YARN 等方法时,Qwen2-7B-Instruct 和 Qwen2-72B-Instruct 都实现对最多 K 个令牌的上下文长度的支持。

阿里云投入了大量精力研究如何扩大多语言预训练和指令微调数据的规模和质量,从而提高模型的多语言能力。

虽然大语言模型本身具有一定的通用性,但阿里云还专门增强了除中文和英文之外的 27 种语言:此外,阿里云还专门优化了多语言场景下的通用语言转换(代码)。

switch)问题,目前模型中语言切换的概率大大降低。

阿里云对容易引发语言转换现象的提示词进行了测试,发现Qwen2系列模型在这方面的能力有明显提升。

模型评估与Qwen1.5相比,Qwen2在大规模模型上取得了非常显着的提升。

阿里云对Qwen2-72B进行了全面评测。

在预训练语言模型的评估中,与当前最好的开源模型相比,Qwen2-72B在自然语言理解、知识、代码、数学和多语言等多项能力上显着超越了当前领先的模型,例如Llama—— 3-70B和Qwen1.5最大的型号,Qwen1.5-B。

阿里云大模型Qwen2开源了!免费下载!

这得益于其预训练数据和训练方法的优化。

经过大规模的预训练,阿里云对模型进行微调,提高其智能性,使其性能更接近人类。

这个过程进一步提高了编码、数学、推理、指令跟随、多语言理解等能力。

此外,随着模型学会与人类价值观保持一致,它对人类变得更加有帮助、诚实和安全。

阿里云的微调过程遵循尽可能大规模的训练,同时尽可能减少人工标注的原则。

阿里云探索了如何使用各种自动化方法来获取高质量、可靠的创意指令和偏好数据,包括数学的拒绝采样、代码和指令遵循的代码执行反馈以及创意写作的反向翻译。

在训练方面,阿里云结合了监督微调、反馈模型训练、在线DPO等方法。

阿里云还使用在线模型合并来减少对齐税。

这些实践极大地提高了模型的基础能力和模型的智能水平。

阿里云在16项基准测试中综合评估了Qwen2-72B-Instruct的性能。

Qwen2-72B-Instruct在提高基础能力和符合人类价值观方面取得了很好的平衡。

与Qwen1.5的72B模型相比,Qwen2-72B-Instruct在所有评估中都大大超越了它,并取得了与Llama-3-70B-Instruct相当的性能。

就小型号而言,Qwen2系列型号基本可以超越同规模甚至更大型号的最佳开源型号。

与最近推出的最佳模型相比,Qwen2-7B-Instruct 在多项评估中仍能取得显着优势,尤其是在代码和中文理解方面。

亮点#代码和数学 阿里云持续投资提高 Qwen 的编码和数学能力。

在代码方面,阿里云成功将CodeQwen1.5的成功经验融入到Qwen2的开发中,实现了多种编程语言的显着提升。

在数学方面,大规模、高质量的数据帮助Qwen2-72B-Instruct数学解题能力得到了大幅提升。

#长文本处理 Qwen2 系列中的所有 Instruct 模型均在 32k 上下文长度上进行训练,并通过 YARN 或 Dual Chunk Attention 等技术扩展到更长的上下文长度。

下图展示了阿里云 on the Needle 在 Haystack 测试集上的结果。

值得注意的是,Qwen2-72B-Instruct可以完美处理k上下文长度内的信息提取任务。

结合其强大的性能,只要你有足够的计算能力,它一定会成为你处理长文本任务的首选!此外,Qwen2系列其他型号的表现也非常出色:Qwen2-7B-Instruct几乎完美地处理高达k的上下文; Qwen2-57B-A14B-Instruct可以处理64k的上下文长度;而该系列中的两个型号较小的型号支持 32k 的上下文长度。

除了长上下文模型之外,阿里云还开源了一个代理解决方案,用于高效处理万个代币级别的上下文。

有关更多详细信息,请参阅阿里云有关该主题的博客文章。

安全性 下表显示了在四种多语言不安全查询类别(非法活动、欺诈、色情、私人暴力)中生成有害响应的大型模型的比例。

测试数据来自Jailbreak,并被翻译成多种语言进行评估。

阿里云发现Llama-3在处理多语言提示方面表现较差,因此未将其纳入对比。

通过显着性检验(P值),阿里云发现Qwen2-72B-Instruct模型在安全性方面与GPT-4表现相当,并且明显优于Mixtral-8x22B模型。

使用 Qwen2,这些模型现已在 Hugging Face 和 ModelScope 上开源。

欢迎查阅模型卡了解具体的使用方法以及模型的更多信息,如特征、指标等。

长期以来,开源生态圈的朋友们一致支持Qwen的发展,包括微调(Axolotl、 LLaMA-Factory、Firefly、Swift、XTuner)、量化(AutoGPTQ、AutoAWQ、神经压缩器)和部署(vLLM、SGL、SkyPilot、TensorRT-LLM、OpenVINO、TGI)、本地运行(MLX、Llama.cpp、Ollama、 LM Studio)、Agent和RAG(检索增强生成)框架(LlamaIndex、CrewAI、OpenDevin)、评估(LMSys、OpenCompass、Open LLM Leaderboard)、模型二次开发(Dolphin、OpenBuddy)。

如果您想了解更多如何在第三方框架中使用Qwen,欢迎您阅读各项目官方文档以及阿里云官方文档来了解更多!当然,还有很多一直帮助我们的朋友,这里没有提及。

阿里云衷心感谢大家的支持,阿里云也希望社区的合作能够共同推动开源AI的发展。

模型许可证 阿里云此次使用了不同的模型许可证。

除Qwen2-72B仍使用之前的QwenWen License外,其他型号包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B和Qwen2-57B-A14B均使用Apache 2.0许可证。

阿里云希望这种开放性的增强能够加速Qwen2在全球的落地和商业应用。

Qwen2的下一步是什么?阿里云仍在训练更大的模型,并继续探索模型和数据的伸缩规律。

此外,阿里云还将Qwen2扩展为多模态模型,整合视觉和语音理解。

未来一段时间,阿里云将持续开源新的模型。

敬请关注!援引技术报道称,阿里云将在近期推出Qwen2。

欢迎报价! @article{qwen2, title={Qwen2技术报告},year={}}继同易千文主力机型降价97%之后,阿里云的云迁移优惠又来了!针对企业上云,阿里云补贴5亿元。

同时,阿里云还准备了优惠券。

所有用户均可登录阿里云官网领取。

优惠券可叠加享受热门产品、GPU云服务器等AI产品折扣。

算力和人工智能产品也是如此。

云迁移带来的福利不断增加。

阿里云大模型Qwen2开源了!免费下载!

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 新闻 -沃尔玛完成对印度Flipkart 160亿美元投资

    新闻 -沃尔玛完成对印度Flipkart 160亿美元投资

    据投资界消息,近日,沃尔玛完成对印度Flipkart 160亿美元投资。 据外媒报道,总裁兼沃尔玛国际首席执行官Judith姚(Judith Yao)表示:“沃尔玛和Flipkart之间的合作将超越我们各自所能完成的目标,创造一个由沃尔玛驱动的强大的本地业务。 ”   “ 通过为客户提供高质量、

    06-18

  • 逃离瑞幸! COO被停职后,董事辞职,CTO也离职,网友表示:灾难来袭,都飞了

    逃离瑞幸! COO被停职后,董事辞职,CTO也离职,网友表示:灾难来袭,都飞了

    瑞幸造假,风波不断。 4月底,中国证监会介入调查后,瑞幸向美国SEC提交文件称,由于疫情影响以及公司内部调查,公司无法在4月30日之前提交年报尚未得出结论——这些听证会并不都是好消息。 5月1日,坏消息再次传来:瑞幸CTO辞职。 何刚:瑞幸CTO,上任不到8个月。 这位刚刚离

    06-17

  • 棕榈大道获北极光数百万美元A轮投资,年轻人出国留学成新趋势!

    棕榈大道获北极光数百万美元A轮投资,年轻人出国留学成新趋势!

    据投资界7月25日消息,互联网留学公司棕榈大道今日宣布获得北极光创投数百万美元A轮融资。   此前,棕榈大道获得九合创投等投资的数千万Pre-A轮融资。   棕榈大道成立于2001年,是一家致力于利用P2P+互联网模式为用户提供海外导师一对一个性化咨询的留学服务机构。 其创始

    06-18

  • 飞吧商旅获近千万元Pre-A轮融资,商子诺携手武汉互娱投资

    飞吧商旅获近千万元Pre-A轮融资,商子诺携手武汉互娱投资

    据投资界8月4日消息,飞吧商旅近日宣布获得近千万元Pre-A轮融资。 投资方为商子诺资本和武汉互娱资本。    据悉,本轮融资完成后,飞吧商旅将在三个方面发力:1、继续了解浙江传统机票代理机构,拓展全国分散市场; 2、增加产业链产品线布局,优化服务流程和内容;第三,在

    06-17

  • 未来机器人完成1亿元B1轮融资,联想创投

    未来机器人完成1亿元B1轮融资,联想创投

    投资社区(微信ID:pedialy)消息,未来机器人完成1亿元B1轮融资,本轮融资由联想创投领投由联想创投、飞图创投跟投,老股东钟鼎资本继续跟投。 募集资金将用于工业无人车视觉控制与感知技术的持续研发、急需场景的突破以及规模化复制。 未来机器人(深圳)有限公司成立于200

    06-18

  • 广州带货网红主播可获最高50万元购房奖励; SpaceX可以使用回收火箭和龙飞船来搭载宇航员;谷歌浏览器将不再使用“黑名单”一词雷锋晨报

    广州带货网红主播可获最高50万元购房奖励; SpaceX可以使用回收火箭和龙飞船来搭载宇航员;谷歌浏览器将不再使用“黑名单”一词雷锋晨报

    广州:带货网红主播可获最高50万元购房奖励。 近日,广州市花都区出台《广州市花都区扶持直播电商发展办法 ()》,将大力实施直播电商带动网上零售“十万”倍增计划。 此外,花都还将启动千人(主播)千店成长计划。 据介绍,花都“四顶”企业年销售额过万、万、万元的优秀网

    06-18

  • -ST工信宣布退市,一年亏损20亿,近5万股东震惊

    -ST工信宣布退市,一年亏损20亿,近5万股东震惊

    创造头条新闻 3月5日收盘后,上市公司*ST工信(哈尔滨工业大学高新区)科技实业发展股份有限公司)发布公告称,因业绩连续大幅亏损,触发退市条件,公司被上海证券交易所终止上市。 公告显示,公司股票将于2019年3月15日开始进入退市整理期交易,退市整理期持续十个交易日。

    06-18

  • 瑞健生物完成天使轮融资,紫金港资本独家投资

    瑞健生物完成天使轮融资,紫金港资本独家投资

    投资界消息(ID:pedaily),近期重点关注“First-in-class”和“Best-in-class”的研发“神经和精神疾病。 企业瑞健生物完成天使轮融资。 紫金港资本独家完成本次融资,新增资金将用于管线研发和公司运营。 01、神经精神疾病领域新机制、新药研发难度大,临床需求巨大未满足

    06-17

  • 一起教育科技2023年第二季度财报:SaaS业务稳步推进,营收环比增长6.5倍

    一起教育科技2023年第二季度财报:SaaS业务稳步推进,营收环比增长6.5倍

    8月29日,一起教育科技(YQ.US)公布了今年第二季度财报:第二季度合力教育科技营收达到万元,环比增长6.5倍。 Non-GAAP下调整后净亏损为1万元,环比大幅收窄;公司毛利率提升至48.3%左右,恢复到历史正常水平。 截至6月30日,公司账面现金充裕,包括短期投资、定期存款在内的

    06-17

  • Playground Global完成第三期融资

    Playground Global完成第三期融资

    投资社区(ID:pedaily)1月5日消息,早期风投机构Playground Global完成第三期融资,募资金额4.1亿美元。 迄今为止,Playground Global管理的资产已超过12亿美元。 华港AI Fund of Funds参与认购Playground Global第三期基金。 Playground Global专注于人工智能、下一代计算

    06-18

  • 当中国药企进军非洲

    当中国药企进军非洲

    近日,疫苗产业链人士组织组织了几位生物制药的业内人士人士齐聚一堂,共同探讨当前的行业趋势。 大家感兴趣的话题有一个:看好非洲疫苗市场。 逻辑是这样的:整个非洲市场有10亿人口,相当于整个国内市场。 对于这些国家和地区的卫生部和政府官员来说,提高预期寿命最快最快

    06-18

  • 科大讯飞联合成立新公司,探索脑机协同在医疗、教育领域的应用和产业落地

    科大讯飞联合成立新公司,探索脑机协同在医疗、教育领域的应用和产业落地

    据雷锋网报道,科大讯飞2月25日晚间宣布,其全资子公司安徽讯飞云创公司与胡郁、李远清、广州华南理工大学资产管理有限公司签署合作协议,共同投资设立广州华南脑控智能科技有限公司科大讯飞发布公告 科大讯飞在公告中表示,脑机接口和脑机交互技术具有广阔的应用前景,目前

    06-17