首页 > 科技未来 > 内容

中国首个音乐SOTA模型「天工音乐大模型」今日公测

发布于:2024-06-18 编辑:匿名 来源:网络

中国首个音乐SOTA模式“天宫音乐模式”今日公测。

2020年4月17日,在“天宫”模型一周年之际,昆仑万维宣布“天宫3.0”基地大模型和“天宫SkyMusic”音乐模型正式开放公测! 一年前的今天,第一版天宫模型正式对外发布。

一年来,我们不断迭代模型,迭代应用产品。

模型和应用越来越好,回报广大用户的支持。

“天宫3.0”拥有1亿个参数,超过了Grok-1的1亿个参数,是全球最大的开源MoE模型。

“天宫3.0”在语义理解、逻辑推理、通用性、泛化??性、不确定性知识、学习能力等方面都有突破性的性能提升,数学/推理/编码/文创能力提升30%以上。

(天宫3.0模型参数超越Grok-1,成为全球最大的开源MoE 专家混合模型)强大的模型技术赋予了“天宫3.0”超强的性能。

在MMBench等多项权威多模态评测结果中,“天宫3.0”超越GPT-4V,取得全球领先。

(天宫3.0的多模态性能超越GPT-4V,领先全球。

)同时,“天宫3.0”下的“天宫SkyMusic”音乐模型也于今日向公众开放公开测试。

“天宫SkyMusic”是中国首个音乐SOTA模型,也是中国自主研发的大型模型技术首次在AIGC领域领先全球。

(天宫SkyMusic综合性能超越Suno V3,实现音乐大型机型SOTA,领先全球) 天宫SkyMusic:中国首款音乐AIGC SOTA机型。

此前,大模型已经在文字、图像等多个技术领域取得了突破,给行业带来了彻底的变革。

然而,在AI音乐生成领域,全世界都在等待一款产品来开启“Music ChatGPT时刻”。

这是因为AI音乐行业的大量研究一直集中在符号音乐生成的技术路线上,并且大多只能实现清音背景音乐(BGM)的生成。

音乐的品质、效果、审美都远远落后。

由于无法达到可用水平,该行业的爆炸速度很慢。

(“天宫天乐”自研AI音乐大模型技术架构) 与行业主流路径不同,“天宫天音乐”采用自研大模型音乐音频生成技术路线。

该路线直接利用大模型技术,实现乐器、人声、旋律、音量、音符的一体化端到端音乐生成。

这在技术上是极其困难的。

世界上只有包括昆仑万维在内的极少数顶级玩家参与其中。

在与海外顶级AI音乐模型Suno V3的横向评测中,《天宫天音乐》在人声及BGM音质、声音自然度、发音清晰度等方面均大幅领先对手,综合得分6.65分超越Suno V3并成为全球AI音乐SOTA典范。

此外,“天工天音乐”还具备原创参考音乐生成和方言歌曲生成功能。

参考音乐生成:用户可以上传自己的参考音乐,也可以选择“天工SkyMusic”数据库中现有的参考音乐来生成风格和人声相似的歌曲,进一步降低大音乐模型的使用门槛,让不熟悉的人也能使用有乐理知识的用户也能轻松演奏。

方言歌曲生成:“天宫天音乐”生成的音乐不仅在人声自然度、发声清晰度等方面表现出色,而且支持粤语、成都话、北京话等多种方言,让用户实现音乐变现更自由。

表达和传播方言文化。

“天宫SkyMusic”是中国首个公开的AI音乐生成模型,也是中国自主研发的大型模型技术首次在AIGC领域领先全球。

目前,在大文本模型领域,OpenAI受到全球关注;但在AI搜索、AI音乐生成等细分领域,中国玩家却勇往直前,通过自研技术不断在细分领域取得顶尖的SOTA表现。

,共同建设中国大模型产业,打造自主可控的大模型产业生态系统。

天宫3.0:1亿参数,全球最大的开源教育部大模型。

在上一代“天宫2.0”MoE大模型领先地位的基础上,“天宫3.0”实现了全面的性能升级,采用了亿级参数MoE混合专家模型。

该架构是目前全球模型参数最大、性能最强的开源MoE模型。

“天宫3.0”全面升级了逻辑推理能力、语义理解能力、复杂需求响应能力、内容创作能力,新增了多轮搜索和综合工具调用、图表绘制、研究模式、增强模式、图像修改和扩展。

等多项AI能力,为用户带来全新的AI体验。

多轮搜索和综合工具调用:“天宫3.0”对模型独立规划、调用、组合外部工具、整合信息的能力进行专题训练,使其能够独立生成和调用代码,完成行业研究和产品评论。

、信息分析、图片生成、图表绘制等复杂的用户需求。

同时,“天宫3.0”可以通过其强大的语义理解能力,将用户任务分解为细分环节,实时判断是否需要连接互联网或调用工具,进行单轮或多轮在线搜索和处理。

工具调用,完成多轮搜索、热点信息分析、图片生成等复杂的用户需求。

(查询:查询最新中国历史电影票房排行榜,图表展示)图表绘制:《天宫3.0》全面提升了逻辑推理能力和用户自然语言查询理解能力,使其能够更准确地判断用户需求,自主生成和查询调用代码根据文本需求实时进行内容分析和图表构建,为用户带来更直观、高效的对比结果。

(查询:北京、上海、重庆哪个好玩?)多轮搜索、综合工具调用、图表绘制等是“天宫3.0”独有的大型模型综合能力,打通了“天宫3.0”从底层开始AI搜索、AI对话、AI代码生成、AI图像识别、AI图像生成等底层能力由语义识别能力直接触发,为用户带来更加便捷高效的AI体验,成为真正的AI生产力工具。

此外,《天宫3.0》还增加了研究模式、增强模式、地图修改扩展等多项AI能力。

研究模式:在研究模式下,“天工3.0”可以围绕用户的简单指令延伸出相关问题,并自动生成研究提纲、地图、实践总结、思维导图,帮助用户快速、清晰地掌握核心内容。

完成用户复杂的研究需求。

(查询:康干盛世)增强模式:增强模式下,“天宫3.0”可以对用户复杂的查询进行拆解、提炼、提问、信息理解、补全,在语义理解上更加自然。

它在性能方面具有更强的性能,在面对不确定的知识时表现更好,能够更准确、更高效地满足用户需求。

(查询:2019春节档电影;“天宫3.0”了解用户需求,询问用户需求)换图放大图:“天宫3.0”多模态性能全面突破,超越GPT-4V,位居全球第一。

在强大的技术基础支撑下,“天宫3.0”的AI绘图能力新增了图像尺寸扩展、图像方向调整、垫图生成、垫图进化、垫图扩展等新功能。

(“天宫3.0”的AI图像修改、图像修图、图像扩展等功能)关于昆仑国际自去年4月17日正式推出“天宫”大模型以来,昆仑国际一直专注于“天宫”系列模型。

中国首个音乐SOTA模型「天工音乐大模型」今日公测

该模型构建了AI大模型、AI搜索、AI音乐、AI视频、AI社交、AI游戏等AI业务矩阵。

是国内模型技术和工程能力最强、布局最全面的人工智能科技公司之一。

这一年里,除了不断升级迭代“天宫”系列大基础模型外,昆仑万维还推出了全国首个AI搜索引擎“天宫AI搜索”,并开源了百亿级大语言模型“” “天宫Skywork-13B”,推出国内领先的AI Agent开发平台“天宫SkyAgents”等一系列前沿大模型产品。

目前,“天宫”系列大模型已经集成了AI音乐、AI搜索、AI写作、 AI长文阅读、AI绘图、AI语音合成、AI漫画创作、AI图像识别、AI代码编写、AI表格生成等能力,未来还将添加AI视频功能,对标“超级应用”,成为人工智能时代的“超级典范” 在“实现通用人工智能,让每个人更好地塑造和表达自己”的公司使命驱动下,昆仑万维将始终致力于人工智能技术和产品的创新与发展,不断提升AI产品的用户体验,并与用户、研究者和开发者紧密合作,共同创造国产大模型的未来。

雷锋网(公众号:雷锋网)雷锋网版权文章未经授权禁止转载。

详情请参见转载说明。

#阿里云#创新创业#创业支持#创业资讯我们关注国内外最热门的创新创业动态,提供一站式资讯服务,实时传递行业热点新闻、深度评论和前瞻观点帮助企业家掌握新兴技术。

趋势和行业变化,以及对未来技术趋势的洞察。

中国首个音乐SOTA模型「天工音乐大模型」今日公测

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 英飞凌科技选择 LTIMindtree

    英飞凌科技选择 LTIMindtree

    Silicon Semiconductor 作为 SAP 转型的战略合作伙伴。 LTIMindtree 已被英飞凌科技股份公司选为 SAP 服务的战略合作伙伴。 作为此次合作的一部分,LTIMindtree 将在支持英飞凌 SAP 转型方面发挥关键作用,同时实现卓越运营和流程效率。 在长期合作中,LTIMindtree深度参与推

    06-06

  • 基石资本公布2018年募资成绩单:5只新基金+双创债,总规模逾100亿元

    基石资本公布2018年募资成绩单:5只新基金+双创债,总规模逾100亿元

    基石资本公布2018年募资成绩单:5支新基金+双创债,总规模超100亿元。 年关即将过去,VC/PE机构迎来了一年的总结时刻。 12月14日,在新基金成立仪式上,基石资本正式宣布已完成每年总规模超1亿元的新基金募集,其中包括5支新基金:40亿元并购基金、 20亿元北城基石产业基金、

    06-18

  • 黄仁勋访华抚客

    黄仁勋访华抚客

    时隔数年,黄仁勋再次访问中国大陆。 1月20日晚,有媒体报道称,NVIDIA首席执行官黄仁勋本周参观了NVIDIA位于北京、上海和深圳的办公室,并出席了在中国举行的年会。 一位NVIDIA员工表示,“我在会上发言,还为员工抽奖。 ” 20日晚,社交媒体泄露了黄仁勋身穿东北大花棉袄马

    06-18

  • 生物科技公司迈科康完成数亿元A轮融资

    生物科技公司迈科康完成数亿元A轮融资

    投资界(ID:pedaily)据7月21日消息,成都迈科康生物科技有限公司(以下简称“迈科康”)宣布完成A 系列融资。 本轮由Pre-A轮领投方KIP资本投资,高瓴创投联合夏尔巴投资完成该项目,融资额达数亿元。 迈科康于今年10月开始正式运营,重点开展于先进疫苗技术和产品的自主研发

    06-18

  • 高海拔风电企业“临沂云川”获数千万元股权投资

    高海拔风电企业“临沂云川”获数千万元股权投资

    投资圈(ID:pedaily)据5月31日消息,北京临沂云川能源科技有限公司(以下简称“临沂云川”)临沂云川)获得深圳市华强新能源股份有限公司(以下简称:华强新能源)领投的数千万元股权融资。 公司成立于今年6月,以“创新绿色能源,推动高质量发展”为使命。 专注于高效能源

    06-18

  • 优客工场第四季度净亏损1.49亿元,租工收入大幅下降

    优客工场第四季度净亏损1.49亿元,租工收入大幅下降

    优客工场第四季度净亏损1.49亿元,租金收入大幅下降。 全年优客工场营收8.77亿元,同比下降24.8%,净亏损4.88亿元,同比下降38.3%。

    06-18

  • 东车日报 - AMG首款插电式混合动力四门跑车发布-蔚来“远程升级”停顿1小时-苹果传1.25亿美元收购测试赛道

    东车日报 - AMG首款插电式混合动力四门跑车发布-蔚来“远程升级”停顿1小时-苹果传1.25亿美元收购测试赛道

    简介广汽AION V PLUS官图发布,续航up kmAMG首款插电式混合动力四门跑车发布,0至100公里加速2.9秒。 宝马将推出X2 SUV Coupe特别版。 据传苹果将以 1.25 亿美元收购汽车测试网站 NIO。 车主“远程升级”汽车,在路上停了一个多小时。 特斯拉或获德国11.4亿欧元补贴打造吉利庞

    06-21

  • 主打高端市场的一加也想赢得大众市场

    主打高端市场的一加也想赢得大众市场

    历经八年,熬过品牌七年之痒,一加逐渐从“高端”转向“小众”产品定位并开始尝试在国内市场多元化,将产品推向大众市场。 ▲ 一加 9RT 和一加 9 Pro。 上半年的一加9R如此,刚刚发布的一加9RT也是如此。 它们的售价控制在1000元左右,属于更平民化的中高端系列。 过去,这个

    06-21

  • 保险科技平台元保宣布完成近10亿元C轮融资

    保险科技平台元保宣布完成近10亿元C轮融资

    日前,国内新兴互联网保险科技平台元保宣布完成近10亿元C轮融资。 一年之内,元保完成了从平台上线到C轮融资的过程,开创了互联网保险融资的新步伐。 本轮融资由源码资本领投,凯辉资本及现有股东山航资本、北极光创投、启明创投、SIG 跟投,元启资本独家跟投。

    06-18

  • 元电子获1亿元C轮融资,何普亭、鑫景奇达、汇富豪辰等跟投,

    元电子获1亿元C轮融资,何普亭、鑫景奇达、汇富豪辰等跟投,

    据投资界(ID:pedaily)11月24日消息,元电子近日宣布完成融资完成1亿元C轮融资。 本轮融资由普廷河、鑫景奇达、汇付昊辰等多家知名投资机构参与。 据悉,元电子成立于2018年12月,是一家由来自军工科研院所、部队、高校等行业的专家组成的核心团队创办的高科技公司。 元电

    06-18

  • 华英农业1月出口鸭苗数量大幅下降,鸭苗销量同比下降90%以上

    华英农业1月出口鸭苗数量大幅下降,鸭苗销量同比下降90%以上

    华英农业(21.SZ)1月销售鸭苗40.66万株,销售收入44.76万元,同比变动分别为-95.51%、-91.72%,环比变动分别为-27.71%、-36.85%。 听,中小企业反馈平台。 倾听用户需求,倾听创业者声音,解决中小企业痛点。 点击立即参与调查并获得礼物。

    06-17

  • 雷军对创业者:只有充满信心,才有机会战胜困难

    雷军对创业者:只有充满信心,才有机会战胜困难

    5月15日,小米集团创始人、董事长及CEO亮相首届“HICOOL全球创业者峰会暨创业大赛”启动仪式。 这是他三个月来的第一次。 我是第一次参加这样的活动,心里有些不舒服。 现场,雷军与奇绩创始人创始人、CEO陆奇、IDG资本创始人董事长、熊晓鸽进行峰会对话,重点探讨创业者如何

    06-17