首页 > 科技未来 > 内容

中国首个音乐SOTA模型「天工音乐大模型」今日公测

发布于:2024-06-18 编辑:匿名 来源:网络

中国首个音乐SOTA模式“天宫音乐模式”今日公测。

2020年4月17日,在“天宫”模型一周年之际,昆仑万维宣布“天宫3.0”基地大模型和“天宫SkyMusic”音乐模型正式开放公测! 一年前的今天,第一版天宫模型正式对外发布。

一年来,我们不断迭代模型,迭代应用产品。

模型和应用越来越好,回报广大用户的支持。

“天宫3.0”拥有1亿个参数,超过了Grok-1的1亿个参数,是全球最大的开源MoE模型。

“天宫3.0”在语义理解、逻辑推理、通用性、泛化??性、不确定性知识、学习能力等方面都有突破性的性能提升,数学/推理/编码/文创能力提升30%以上。

(天宫3.0模型参数超越Grok-1,成为全球最大的开源MoE 专家混合模型)强大的模型技术赋予了“天宫3.0”超强的性能。

在MMBench等多项权威多模态评测结果中,“天宫3.0”超越GPT-4V,取得全球领先。

(天宫3.0的多模态性能超越GPT-4V,领先全球。

)同时,“天宫3.0”下的“天宫SkyMusic”音乐模型也于今日向公众开放公开测试。

“天宫SkyMusic”是中国首个音乐SOTA模型,也是中国自主研发的大型模型技术首次在AIGC领域领先全球。

(天宫SkyMusic综合性能超越Suno V3,实现音乐大型机型SOTA,领先全球) 天宫SkyMusic:中国首款音乐AIGC SOTA机型。

此前,大模型已经在文字、图像等多个技术领域取得了突破,给行业带来了彻底的变革。

然而,在AI音乐生成领域,全世界都在等待一款产品来开启“Music ChatGPT时刻”。

这是因为AI音乐行业的大量研究一直集中在符号音乐生成的技术路线上,并且大多只能实现清音背景音乐(BGM)的生成。

音乐的品质、效果、审美都远远落后。

由于无法达到可用水平,该行业的爆炸速度很慢。

(“天宫天乐”自研AI音乐大模型技术架构) 与行业主流路径不同,“天宫天音乐”采用自研大模型音乐音频生成技术路线。

该路线直接利用大模型技术,实现乐器、人声、旋律、音量、音符的一体化端到端音乐生成。

这在技术上是极其困难的。

世界上只有包括昆仑万维在内的极少数顶级玩家参与其中。

在与海外顶级AI音乐模型Suno V3的横向评测中,《天宫天音乐》在人声及BGM音质、声音自然度、发音清晰度等方面均大幅领先对手,综合得分6.65分超越Suno V3并成为全球AI音乐SOTA典范。

此外,“天工天音乐”还具备原创参考音乐生成和方言歌曲生成功能。

参考音乐生成:用户可以上传自己的参考音乐,也可以选择“天工SkyMusic”数据库中现有的参考音乐来生成风格和人声相似的歌曲,进一步降低大音乐模型的使用门槛,让不熟悉的人也能使用有乐理知识的用户也能轻松演奏。

方言歌曲生成:“天宫天音乐”生成的音乐不仅在人声自然度、发声清晰度等方面表现出色,而且支持粤语、成都话、北京话等多种方言,让用户实现音乐变现更自由。

表达和传播方言文化。

“天宫SkyMusic”是中国首个公开的AI音乐生成模型,也是中国自主研发的大型模型技术首次在AIGC领域领先全球。

目前,在大文本模型领域,OpenAI受到全球关注;但在AI搜索、AI音乐生成等细分领域,中国玩家却勇往直前,通过自研技术不断在细分领域取得顶尖的SOTA表现。

,共同建设中国大模型产业,打造自主可控的大模型产业生态系统。

天宫3.0:1亿参数,全球最大的开源教育部大模型。

在上一代“天宫2.0”MoE大模型领先地位的基础上,“天宫3.0”实现了全面的性能升级,采用了亿级参数MoE混合专家模型。

该架构是目前全球模型参数最大、性能最强的开源MoE模型。

“天宫3.0”全面升级了逻辑推理能力、语义理解能力、复杂需求响应能力、内容创作能力,新增了多轮搜索和综合工具调用、图表绘制、研究模式、增强模式、图像修改和扩展。

等多项AI能力,为用户带来全新的AI体验。

多轮搜索和综合工具调用:“天宫3.0”对模型独立规划、调用、组合外部工具、整合信息的能力进行专题训练,使其能够独立生成和调用代码,完成行业研究和产品评论。

、信息分析、图片生成、图表绘制等复杂的用户需求。

同时,“天宫3.0”可以通过其强大的语义理解能力,将用户任务分解为细分环节,实时判断是否需要连接互联网或调用工具,进行单轮或多轮在线搜索和处理。

工具调用,完成多轮搜索、热点信息分析、图片生成等复杂的用户需求。

(查询:查询最新中国历史电影票房排行榜,图表展示)图表绘制:《天宫3.0》全面提升了逻辑推理能力和用户自然语言查询理解能力,使其能够更准确地判断用户需求,自主生成和查询调用代码根据文本需求实时进行内容分析和图表构建,为用户带来更直观、高效的对比结果。

(查询:北京、上海、重庆哪个好玩?)多轮搜索、综合工具调用、图表绘制等是“天宫3.0”独有的大型模型综合能力,打通了“天宫3.0”从底层开始AI搜索、AI对话、AI代码生成、AI图像识别、AI图像生成等底层能力由语义识别能力直接触发,为用户带来更加便捷高效的AI体验,成为真正的AI生产力工具。

此外,《天宫3.0》还增加了研究模式、增强模式、地图修改扩展等多项AI能力。

研究模式:在研究模式下,“天工3.0”可以围绕用户的简单指令延伸出相关问题,并自动生成研究提纲、地图、实践总结、思维导图,帮助用户快速、清晰地掌握核心内容。

完成用户复杂的研究需求。

(查询:康干盛世)增强模式:增强模式下,“天宫3.0”可以对用户复杂的查询进行拆解、提炼、提问、信息理解、补全,在语义理解上更加自然。

它在性能方面具有更强的性能,在面对不确定的知识时表现更好,能够更准确、更高效地满足用户需求。

(查询:2019春节档电影;“天宫3.0”了解用户需求,询问用户需求)换图放大图:“天宫3.0”多模态性能全面突破,超越GPT-4V,位居全球第一。

在强大的技术基础支撑下,“天宫3.0”的AI绘图能力新增了图像尺寸扩展、图像方向调整、垫图生成、垫图进化、垫图扩展等新功能。

(“天宫3.0”的AI图像修改、图像修图、图像扩展等功能)关于昆仑国际自去年4月17日正式推出“天宫”大模型以来,昆仑国际一直专注于“天宫”系列模型。

中国首个音乐SOTA模型「天工音乐大模型」今日公测

该模型构建了AI大模型、AI搜索、AI音乐、AI视频、AI社交、AI游戏等AI业务矩阵。

是国内模型技术和工程能力最强、布局最全面的人工智能科技公司之一。

这一年里,除了不断升级迭代“天宫”系列大基础模型外,昆仑万维还推出了全国首个AI搜索引擎“天宫AI搜索”,并开源了百亿级大语言模型“” “天宫Skywork-13B”,推出国内领先的AI Agent开发平台“天宫SkyAgents”等一系列前沿大模型产品。

目前,“天宫”系列大模型已经集成了AI音乐、AI搜索、AI写作、 AI长文阅读、AI绘图、AI语音合成、AI漫画创作、AI图像识别、AI代码编写、AI表格生成等能力,未来还将添加AI视频功能,对标“超级应用”,成为人工智能时代的“超级典范” 在“实现通用人工智能,让每个人更好地塑造和表达自己”的公司使命驱动下,昆仑万维将始终致力于人工智能技术和产品的创新与发展,不断提升AI产品的用户体验,并与用户、研究者和开发者紧密合作,共同创造国产大模型的未来。

雷锋网(公众号:雷锋网)雷锋网版权文章未经授权禁止转载。

详情请参见转载说明。

#阿里云#创新创业#创业支持#创业资讯我们关注国内外最热门的创新创业动态,提供一站式资讯服务,实时传递行业热点新闻、深度评论和前瞻观点帮助企业家掌握新兴技术。

趋势和行业变化,以及对未来技术趋势的洞察。

中国首个音乐SOTA模型「天工音乐大模型」今日公测

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 梵志医疗完成数千万元B1轮融资

    梵志医疗完成数千万元B1轮融资

    据12月4日消息,梵志医疗近日完成数千万元B1轮融资。 本轮融资由庆丰资本、天津科创投资。 本次募集资金将用于进一步推动创新集成全封闭检测芯片FireChip及POCT设备进入临床应用阶段,并推动企业供应链的并购延伸。 今年4月,梵志医疗还获得江苏新领资本、天津科创资本投资的

    06-18

  • 美国零售SaaS服务商Stackline获得1.3亿美元B轮融资

    美国零售SaaS服务商Stackline获得1.3亿美元B轮融资

    6月9日获悉,Stackline获得1.3亿美元B轮融资,由TA Associates投资。 Stackline 是一家美国零售 SaaS 服务提供商,通过结合来自购物者、营销、运营和竞争情报的实时数据,为品牌提供自动化和执行电子商务营销和运营的工具,以优化品牌和零售商的电子商务营销绩效。 。

    06-17

  • 速影科技获超千万天使轮融资,创新工场前沿科技基金投资

    速影科技获超千万天使轮融资,创新工场前沿科技基金投资

    据投资界(ID:pedaily)8月1日消息,近日,由前大疆云台算法负责人领投,聚焦专注于提供智能缝制的机器人解决方案公司深圳市速盈科技有限公司(以下简称“速盈科技”)已完成数千万元天使轮融资。 本轮投资方为创新工场前沿科技基金。 本轮融资将用于推动产品研发和客户验证

    06-18

  • e络盟及其社区赋能客户释放AI潜力

    e络盟及其社区赋能客户释放AI潜力

    element14 及其社区帮助客户释放人工智能的潜力。 2020 年 11 月 28 日 - 全球电子元件和开发服务分销商 element14 宣布将使用其工程师在线社区,element14 社区(也称为安富利社区)。 1)进一步拓展人工智能(AI)产品和资源,帮助工程师利用人工智能技术开发新的解决方案,

    06-06

  • 小马智行完成4.62亿美元B轮融资,估值超30亿美元

    小马智行完成4.62亿美元B轮融资,估值超30亿美元

    据投资界2月26日消息,小马智行(小马智行)正式宣布获得丰田汽车4亿美元融资深化和扩大两家公司在旅游领域的合作。 这是双方于2006年建立的业务合作伙伴关系的延伸。 在此基础上,两家公司将进一步加速自动驾驶的研发和商业应用,旨在打造造福所有人的产品和服务。 截至目前

    06-18

  • 科勒资本私募股权二级市场首期人民币基金已通过,15亿

    科勒资本私募股权二级市场首期人民币基金已通过,15亿

    据投资界(ID:pedaily)4月6日消息,科勒资本宣布已完成“科勒资本私募股权二级市场首期”人民币基金”(Coller Capital Secondaries RMB I Fund,简称“CCSRMB I”)首次募集。 该基金目标规模为15亿元人民币。 CCSRMB I是中国首只境外募集的人民币私募股权二级市场基金科勒

    06-17

  • AI数据服务公司“爱数智慧”完成数千万元B轮融资

    AI数据服务公司“爱数智慧”完成数千万元B轮融资

    4月12日消息,AI数据服务公司“爱数智慧”完成数千万元B轮融资年初。 本轮融资由泛创资本投资。 本轮募集资金将主要用于打造全球AI开源社区MagicHub、设计人工智能对话式AI的训练数据集产品以及开发数据采集和标注SaaS平台。

    06-18

  • 英特尔、海力士相继扭亏为盈,芯片企业的AI风潮来了吗?

    英特尔、海力士相继扭亏为盈,芯片企业的AI风潮来了吗?

    近一段时间,对于各家芯片企业来说可谓是月亮明晃晃的。 有的人高兴,有的人悲伤。 许多公司陷入困境。 一度陷入亏损,但近期英特尔、海力士等知名芯片公司已扭亏为盈。 人们不禁好奇,芯片企业的好日子是否又回来了? 1. Intel、Hynix扭亏为盈? 据环球网报道,英特尔发布了

    06-18

  • PPTV巨力陶闯:国内IPO制度将改革,不排除A股上市

    PPTV巨力陶闯:国内IPO制度将改革,不排除A股上市

    据投资界1月8日消息,PPTV巨力CEO陶闯今日在媒体推介会上表示,将联合与苏宁聚焦OTT业务,同时,随着国内A股对互联网企业的开放,PPTV不排除推出国内上市。   根据此前公告,苏宁宣布以2.5亿美元投资PPTV,占PPTV股份44%,成为第一大股东。 弘毅向PPTV投资1.7亿美元,占PPT

    06-18

  • 我们正在努力走向全球化,海外销售额占我们总销售额的近80%,

    我们正在努力走向全球化,海外销售额占我们总销售额的近80%,

    近日,总裁先生和严授在内部讲话中披露了商业全球化的进展,强调我们大部分业务都是全球性的、海外的。 成交额占全球总成交额近80%。 该数据不包括收购的沐瞳科技的营业额。

    06-18

  • 国家发展改革委:全面系统开展2022年公司债券本息兑付等风险排查

    国家发展改革委:全面系统开展2022年公司债券本息兑付等风险排查

    国家发展改革委印发关于开展年度公司债券本息兑付风险排查的通知存续期监管工作中,表示将全面系统地开展年度公司债券本息兑付等风险排查,巩固“五早”风险防控机制成果。 对发行的公司债券进行排查和专项检查,加强债券期限监管。

    06-18

  • 专注于AI解决方案的网文出海开放平台维文科技获1000万元Pre-A轮融资

    专注于AI解决方案的网文出海开放平台维文科技获1000万元Pre-A轮融资

    据投资界8月9日消息,网文出海开放平台36氪获悉专注AI解决方案的出海文章推文科技(funstory.ai)今年3月完成1万元Pre-A轮融资,由WiFi万能钥匙、联商文学领投,联想之星跟投。 本轮融资将主要用于AI机器生产集群的研发和升级,以及加速建立海外在线内容开放平台。 推特科技

    06-17