首页 > 科技未来 > 内容

AI音乐会诞生下一个“抖音”吗？

发布于：2024-06-18 编辑：匿名来源：网络

作者|连然编辑|郑玄AI音乐最近非常流行。

首先，3月下旬，美国AI初创公司Suno发布了V3音乐生成模型。

该模型可以根据输入的提示词在几秒钟内生成两分钟的高质量音频。

震撼的效果让业界相信AI音乐已经迎来了未来。

您自己的“ChatGPT 时刻”。

随后，一个月后，国内昆仑科技宣布推出“天宫SkyMusic”大型音乐生成模型。

其成绩超越Suno V3，成为最新的SOTA（State of the Art）AI音乐生成模型，指的是该领域的state of the art。

该指数位居世界第一）。

这引起了极客公园的好奇。

客观地说，当今中美在大型人工智能模型的基础研究和发展方面还存在一定差距。

即使在利基领域有垂直模式，也没有多少团队可以如此自信地宣称全球领导力。

此外，音乐作为多模态领域的重要组成部分，具有相当大的产业价值。

全球录制音乐市场每年总收入近亿美元，相关音乐会、BGM、KTV以及在线短视频、卡拉OK平台等每年都有数千亿美元的市场规模。

人工智能的介入必然带来生产端和消费端的全面创新，其潜在影响将不亚于数字音乐和流媒体的兴起。

因此，在4月17日《天宫天音乐》正式上线后，我们第一时间下载并体验了这款软件。

以下是我们对AI音乐未来发展的经验和思考。

01《天宫天乐》：一段歌词，几秒钟生成三首不同风格的歌曲。

从产品设计角度来看，“天宫天音”在很多方面与“Suno V3”相似，但在一些关键细节上还是存在一些差异。

明显区别。

使用“天宫SkyMusic”生成音乐，需要输入歌名和歌词，还可以通过添加段落信息进行微调，比如“主歌”、“副歌”、“前奏曲”等——这些与Suno的操作类似。

上半部分是Suno界面，下半部分是SkyMusic界面。

两者最大的区别在于Suno要求用户输入歌曲风格，例如流行、爵士或说唱；而“天宫天空音乐”则允许选择参考曲目，其他用户可以上传这些曲目。

歌曲也可以自己上传。

这个功能非常有用。

一方面，相比一般的“风格”，“曲目”提供了更精准的定位，更有利于生成自己想要的音乐。

从实际用户体验来看，没有专业的乐理训练，普通用户很难准确描述歌曲风格——想象一下，该用什么语言来形容《夜的第七章》？因此，像《天宫天音乐》一样，你可以在浏览和聆听原曲时找到与你的歌词相匹配的风格。

这比使用自然语言描述能够更好地表达音乐需求，更适合普通用户的音乐创作场景。

输入歌词、歌名和参考曲目后，可以直接生成音乐。

“天宫天音乐”会一次性生成三首风格和演唱风格略有不同的歌曲——这是一个非常实用的产品设计。

无论是“苏诺V3”还是“天宫SkyMusic”，虽然如今的AI音乐已经可以生成一定水平的音乐，但稳定性还有待提高。

往往三首歌只有一首还不错，而如果想要获得更多好的音乐，不仅需要歌词和切分的微调，还需要反复的尝试。

输入歌名《夏天的风》和第一句“我会永远记得夏天的风”，这首歌由“AI作词”创作｜视频来源：极客公园除了写歌词生成歌曲外，《天宫天音乐》也支持AI写词。

如上图，上面的歌曲《夏天的风》就是我们使用“AI写词”和“生成歌曲”创作的歌曲。

这首歌的旋律还不错，但是因为歌词没有分段，整首曲子缺乏一点调性变化，我尝试在苏轼的《水调歌头》上加段，这次生成的歌曲有明显的情感变化，尤其是唱“人有”这样的副歌高潮时。

悲欢离合，月有阴晴圆缺。

”具有感染力。

《水调歌头》Demo 如果生成了满意的歌曲，用户还可以选择“提交”将其发布到“天宫天音乐”平台，并支持分享到其他社交在首页上，我听了一些受到很多点赞的流行生成音乐，其中不乏一些高质量的作品。

乍一看，几乎无法看出它是由 AI 生成的——当然，如果你仔细辨别，还是可以看到处理中的一些细节。

与专业作品的差距。

事实上，很多专业音乐人也对“天宫天音”给予了很高的评价。

例如，B站UP主@Metalion，一位专业音乐人，尝试用自己的旧歌词生成并收听主页上其他人发布的流行AI歌曲。

他们中的一些人给出了“不错”，“就像一首完整的歌曲”。

这评价并不低。

B站UP主@Metalion发布的视频 |来源：B站截图整体体验后，感觉《天宫天空音乐》的音乐生成能力至少在音乐初学者之上，但生成速度与人类相差甚远，而且音乐作品数量庞大有很多优秀的作品是比较完整的，甚至是部分令人惊叹的。

AI音乐会诞生下一个“抖音”吗？

当然，目前AI音乐模型的能力还无法让整首歌曲从头到尾保持稳定的品质，也无法像真正的音乐家那样仔细打磨作品。

不过，就目前的技术水平而言，《天宫天音》已经是一款能够给用户带来实际价值的优秀产品。

通过降低音乐创作门槛，“模仿曲目”、“一次生成三首歌曲”、“选择性发布”等细节设计，大模型让普通人也能轻松享受创作的乐趣分享音乐，每个人都可以用歌曲来表达自己的志向。

随着大机型的不断迭代，产品和功能的不断丰富，未来一两年AI音乐将会有更多的可能性。

02 AI音乐将走向何方？说完产品体验，最后我们基于这次体验谈谈对AI音乐行业未来发展的一些观察。

在“天宫3.0”与“天宫天音乐”媒体沟通会上，昆仑万维董事长兼CEO方瀚在接受媒体采访时表示，他认为未来AI音乐创作工具将有两个分化：面向PGC和面向PGC对于 UGC 新手用户。

UGC基本都是一键生成，注重便捷性； PGC相对复杂，“天宫天音乐”未来还将增加调曲等更多专业音乐工具。

像《天宫天音》这样的产品对于今天的UGC和PGC来说都具有一定的价值，并且在可预见的未来，技术将会在两个不同的方向上不断迭代。

对于普通UGC用户来说，AI音乐生成主要提供娱乐价值。

音乐创作是一种情感表达形式，即使是非专业人士也有创作的需要。

过去，歌曲创作、乐理等技术障碍是主要障碍。

AI技术的引入，相当于为他们提供了强大的“音乐创作外骨骼”，让任何人都可以创作出自己想要的音乐，并通过社交媒体上的分享来传递。

当然，目前AI音乐平台的操作还是比较复杂的。

用户需要手动对歌词进行分段和微调，生成的音质不够稳定。

随着技术的不断迭代，相信这些问题很快就会得到解决。

就像微博和抖音在文章和视频创作领域引发的革命一样，去中心化的音乐创作平台可能会彻底改变人们创作和消费音乐的方式。

对于专业PGC用户来说，如今的AI音乐工具虽然不能完全取代人类的创造力，但已经开始成为有价值的辅助工具。

首先是创造性的激发。

目前大规模AI音乐模型创作的稳定性还不够，但速度很快。

对于陷入瓶颈的创业者来说，人工智能可以成为一个很好的创意灵感工具。

方瀚还举了一个技术团队与专业创作者交流的场景。

他们认为《天工天音乐》有一个特别可贵的方面：跨地域的风格灵感。

例如，中国音乐家通常对非洲和拉丁美洲音乐了解不多，但通过使用“SkyMusic”，他们可以轻松地探索和融合来自这些异国文化的曲调，从而在创作中获得新的灵感。

另一个有价值的场景在于演示中。

在商业创作的很多沟通场合，尤其是一些音乐人与非音乐人之间的沟通（比如制作广告BGM时，编曲者与广告商沟通），最大的麻烦在于如何协调双方对音乐的理解。

工作方向。

借助AI，可以轻松生成相对准确的原型，可以节省大量沟通时间，降低后续返工的风险。

从实践的角度来看，当今有很多行业需要使用音乐。

比较典型的是短视频、影视、游戏制作。

然而，传统音乐创作不仅成本高昂，而且费时费力。

将AI引入这些行业的音乐生产过程中，任何效率的提升都可能带来巨大的产业价值。

在内容创作领域，谁能最快适应技术变革，谁就有可能获得最大的利益。

这一点在短视频领域得到了验证。

随着手机摄像头、5G、视频编辑APP的兴起，视频拍摄和制作的门槛不断降低。

最终，随着抖音的全球流行，短视频曲目全面崛起，迎来了一个新时代。

如今，在AI Music乃至所有AIGC平台上，历史可能会再次重演。

*头图来源：天工AI#阿里云#创新创业#创业支持#创业资讯我们关注国内外最热门的创新创业动态，提供一站式资讯服务，传递行业热点新闻、深度评论和实时前瞻观点，帮助创业者把握新兴技术趋势和行业变化，洞察未来技术趋势。

站长声明

标签：

上一篇：Daniel·波维就是小米语音首席科学家，明天将亮相MIDC开发者大会

下一篇：熊子传媒获5000万元A轮融资，发展原创内容漫画、游戏等全产业链

天鲲教育完成数千万元A轮融资，由如心资本等机构投资

据投资界1月20日消息，职业教育产教一体化产业链服务集团“天鲲教育” ，宣布完成数千万元A轮投资，由如心资本等机构投资。据悉，本轮融资将用于职业教育产教融合领域的市场拓展和教育产品升级，加快团队和业务扩张，推动全产业链服务生态圈建设，逐步实现打造产教融合路由

06-18
原神，创造文化

位于上海国家会展中心附近的麦当劳（绿地控股全球商品交易港店）周期性繁忙。没有展览的时候，这里空无一人，但一旦展览开始，这里就会再次拥挤起来。 8月10日至13日，这里变成了临时化妆间，化妆师在这里等待来自全国各地的原神Cosplayer。这些Cosplayer们化好妆后，就会步

06-21
维达康完成近亿元A轮融资，由亿达资本

投资圈（ID：pedaily）领投据1月16日消息，河北维达康生物科技有限公司（以下简称“维达康”）完成融资近亿元A轮融资。本轮融资由亿达资本领投，华创亿达跟投。本轮融资将用于Vidacom在天然产物生物制造领域技术平台的持续创新、管道研发实施和全球业务拓展。维达康位于河

06-18
墨芯完成智能互联网产业基金战略融资

投资界（ID：pedaily）4月23日消息，墨芯人工智能科技（深圳）有限公司（以下简称墨芯）完成智能战略融资互联网产业基金。 AI芯片设计师墨芯独创的双稀疏算法技术重新定义了AI计算，为现有AI芯片架构带来颠覆性创新。自从业界普遍使用的密集矩阵计算方法发展至今，由于摩尔定

06-18
NXP发布跨界处理器新品

近日，NXP微控制器商业媒体交流会在北京召开。本次交流会上，恩智浦微控制器业务部总经理Geoff Lees及其团队出席会议，并详细介绍了恩智浦在微控制器领域的最新进展。 Geoff Lees表示，中国市场一直是恩智浦的战略重点。针对中国市场的产品定义、设计和制造一直是恩智浦过

06-06
苹果iOS的这次大更新终于让用户不再受到网络传单的骚扰

当一个品牌遇到生态系统时，我们通常会认为它终于有了成名的潜力。拥有一个生态系统就足以吸引更多的用户。但在向公众解释“生态”时，总是显得有些晦涩难懂。对于普通人来说，有没有生态系统并不重要。核心是产品系统是否好用。 ▲ 跨 macOS 和 iPadOS 的“通用控制”。

06-21
《江苏省促进中小企业特色产业集群发展管理办法》

来自投资界的消息（ID：pedaily），江苏省制定出台了《江苏省促进中小企业特色产业集群发展管理办法》。办法提出，“十四五”期间，全省培育认定一批特色产业集群，引导支持地方培育一批市级特色产业集群。该措施将于5月1日正式实施，办法明确。特色产业集群面积一般不超过

06-18
3700亿买了，年轻人迷恋彩票

你有没有幻想过一夜暴富？相信很多人都思考过这个问题，尤其是刚接触这个世界的年轻人。刚毕业找工作的时候，我常常躺在床上想象，如果余额宝突然多了两个零，我要怎么花？我想买一台顶级的电脑，建一个游戏室，安装各种炫酷的设备。然后继续幻想，如果还有多个0，怎么花

06-18
【全球财经24小时】2024年4月16日投融资事件汇总及详情

欢迎订阅《全球财经24小时》系列文章，动起你的小手指，帮助我们更好更快地获取资讯给你~ 点击此处输入表格摘要。今日全球市场共发生29起投资披露事件，其中境内18起，境外11起。其中，国内先进制造业7例，医疗健康行业2例，企业服务业2例，物流行业1例，汽车交通行业1例，

06-18
卓远半导体获孔岳豪2400万元战略投资

投资圈（ID：pedaily）据12月4日消息，江苏卓远半导体有限公司获得孔岳豪1万元财务投资。据悉，卓远半导体成立于2006年，主要从事碳化硅半导体设备的技术研究、生产和销售。公司产品涵盖第三代半导体“碳化硅（SiC）”和氮化镓（GaN）的整个应用范围。全产业链。【本文根

06-18
百度携手新思科技“让计算更智能”

——百度AI芯片“昆仑”采用新思科技全流程解决方案，实现算法和芯片的早期优化，缩短计算时间。新思科技宣布将继续深化与百度的合作，助力实现“让计算更智能”的愿景。百度人工智能芯片“昆仑”采用了新思科技的全流程解决方案。此前发布的百度AI芯片“昆仑”基于先进的

06-06
华海庆科CMP设备在中芯国际生产晶圆超百万片

7月30日，又一个好成绩来了。华海庆科的国产CMP设备为单一客户中芯国际生产了超过100万片晶圆。华海青科第一台设备于2018年8月4日进驻中芯国际，我们与中芯国际团队紧密合作，进行了深入交流。短短六个月的时间，我们就通过了审核，并迅速获得了多份CMP订单。 CMP工艺实现

06-06