SK集团旗下3家公司将筹集1万亿韩元投资半导体、Yuanverse等,
06-08
作者|连然编辑|郑玄AI音乐最近非常流行。
首先,3月下旬,美国AI初创公司Suno发布了V3音乐生成模型。
该模型可以根据输入的提示词在几秒钟内生成两分钟的高质量音频。
震撼的效果让业界相信AI音乐已经迎来了未来。
您自己的“ChatGPT 时刻”。
随后,一个月后,国内昆仑科技宣布推出“天宫SkyMusic”大型音乐生成模型。
其成绩超越Suno V3,成为最新的SOTA(State of the Art)AI音乐生成模型,指的是该领域的state of the art。
该指数位居世界第一)。
这引起了极客公园的好奇。
客观地说,当今中美在大型人工智能模型的基础研究和发展方面还存在一定差距。
即使在利基领域有垂直模式,也没有多少团队可以如此自信地宣称全球领导力。
此外,音乐作为多模态领域的重要组成部分,具有相当大的产业价值。
全球录制音乐市场每年总收入近亿美元,相关音乐会、BGM、KTV以及在线短视频、卡拉OK平台等每年都有数千亿美元的市场规模。
人工智能的介入必然带来生产端和消费端的全面创新,其潜在影响将不亚于数字音乐和流媒体的兴起。
因此,在4月17日《天宫天音乐》正式上线后,我们第一时间下载并体验了这款软件。
以下是我们对AI音乐未来发展的经验和思考。
01《天宫天乐》:一段歌词,几秒钟生成三首不同风格的歌曲。
从产品设计角度来看,“天宫天音”在很多方面与“Suno V3”相似,但在一些关键细节上还是存在一些差异。
明显区别。
使用“天宫SkyMusic”生成音乐,需要输入歌名和歌词,还可以通过添加段落信息进行微调,比如“主歌”、“副歌”、“前奏曲”等——这些与Suno的操作类似。
上半部分是Suno界面,下半部分是SkyMusic界面。
两者最大的区别在于Suno要求用户输入歌曲风格,例如流行、爵士或说唱;而“天宫天空音乐”则允许选择参考曲目,其他用户可以上传这些曲目。
歌曲也可以自己上传。
这个功能非常有用。
一方面,相比一般的“风格”,“曲目”提供了更精准的定位,更有利于生成自己想要的音乐。
从实际用户体验来看,没有专业的乐理训练,普通用户很难准确描述歌曲风格——想象一下,该用什么语言来形容《夜的第七章 》?因此,像《天宫天音乐》一样,你可以在浏览和聆听原曲时找到与你的歌词相匹配的风格。
这比使用自然语言描述能够更好地表达音乐需求,更适合普通用户的音乐创作场景。
输入歌词、歌名和参考曲目后,可以直接生成音乐。
“天宫天音乐”会一次性生成三首风格和演唱风格略有不同的歌曲——这是一个非常实用的产品设计。
无论是“苏诺V3”还是“天宫SkyMusic”,虽然如今的AI音乐已经可以生成一定水平的音乐,但稳定性还有待提高。
往往三首歌只有一首还不错,而如果想要获得更多好的音乐,不仅需要歌词和切分的微调,还需要反复的尝试。
输入歌名《夏天的风》和第一句“我会永远记得夏天的风”,这首歌由“AI作词”创作|视频来源:极客公园除了写歌词生成歌曲外, 《天宫天音乐》也支持AI写词。
如上图,上面的歌曲《夏天的风》就是我们使用“AI写词”和“生成歌曲”创作的歌曲。
这首歌的旋律还不错,但是因为歌词没有分段,整首曲子缺乏一点调性变化,我尝试在苏轼的《水调歌头》上加段,这次生成的歌曲有明显的情感变化,尤其是唱“人有”这样的副歌高潮时。
悲欢离合,月有阴晴圆缺。
”具有感染力。
《水调歌头》Demo 如果生成了满意的歌曲,用户还可以选择“提交”将其发布到“天宫天音乐”平台,并支持分享到其他社交在首页上,我听了一些受到很多点赞的流行生成音乐,其中不乏一些高质量的作品。
乍一看,几乎无法看出它是由 AI 生成的——当然,如果你仔细辨别,还是可以看到处理中的一些细节。
与专业作品的差距。
事实上,很多专业音乐人也对“天宫天音”给予了很高的评价。
例如,B站UP主@Metalion,一位专业音乐人,尝试用自己的旧歌词生成并收听主页上其他人发布的流行AI歌曲。
他们中的一些人给出了“不错”,“就像一首完整的歌曲”。
这评价并不低。
B站UP主@Metalion发布的视频 |来源:B站截图 整体体验后,感觉《天宫天空音乐》的音乐生成能力至少在音乐初学者之上,但生成速度与人类相差甚远,而且音乐作品数量庞大有很多优秀的作品是比较完整的,甚至是部分令人惊叹的。

当然,目前AI音乐模型的能力还无法让整首歌曲从头到尾保持稳定的品质,也无法像真正的音乐家那样仔细打磨作品。
不过,就目前的技术水平而言,《天宫天音》已经是一款能够给用户带来实际价值的优秀产品。
通过降低音乐创作门槛,“模仿曲目”、“一次生成三首歌曲”、“选择性发布”等细节设计,大模型让普通人也能轻松享受创作的乐趣分享音乐,每个人都可以用歌曲来表达自己的志向。
随着大机型的不断迭代,产品和功能的不断丰富,未来一两年AI音乐将会有更多的可能性。
02 AI音乐将走向何方?说完产品体验,最后我们基于这次体验谈谈对AI音乐行业未来发展的一些观察。
在“天宫3.0”与“天宫天音乐”媒体沟通会上,昆仑万维董事长兼CEO方瀚在接受媒体采访时表示,他认为未来AI音乐创作工具将有两个分化:面向PGC和面向PGC对于 UGC 新手用户。
UGC基本都是一键生成,注重便捷性; PGC相对复杂,“天宫天音乐”未来还将增加调曲等更多专业音乐工具。
像《天宫天音》这样的产品对于今天的UGC和PGC来说都具有一定的价值,并且在可预见的未来,技术将会在两个不同的方向上不断迭代。
对于普通UGC用户来说,AI音乐生成主要提供娱乐价值。
音乐创作是一种情感表达形式,即使是非专业人士也有创作的需要。
过去,歌曲创作、乐理等技术障碍是主要障碍。
AI技术的引入,相当于为他们提供了强大的“音乐创作外骨骼”,让任何人都可以创作出自己想要的音乐,并通过社交媒体上的分享来传递。
当然,目前AI音乐平台的操作还是比较复杂的。
用户需要手动对歌词进行分段和微调,生成的音质不够稳定。
随着技术的不断迭代,相信这些问题很快就会得到解决。
就像微博和抖音在文章和视频创作领域引发的革命一样,去中心化的音乐创作平台可能会彻底改变人们创作和消费音乐的方式。
对于专业PGC用户来说,如今的AI音乐工具虽然不能完全取代人类的创造力,但已经开始成为有价值的辅助工具。
首先是创造性的激发。
目前大规模AI音乐模型创作的稳定性还不够,但速度很快。
对于陷入瓶颈的创业者来说,人工智能可以成为一个很好的创意灵感工具。
方瀚还举了一个技术团队与专业创作者交流的场景。
他们认为《天工天音乐》有一个特别可贵的方面:跨地域的风格灵感。
例如,中国音乐家通常对非洲和拉丁美洲音乐了解不多,但通过使用“SkyMusic”,他们可以轻松地探索和融合来自这些异国文化的曲调,从而在创作中获得新的灵感。
另一个有价值的场景在于演示中。
在商业创作的很多沟通场合,尤其是一些音乐人与非音乐人之间的沟通(比如制作广告BGM时,编曲者与广告商沟通),最大的麻烦在于如何协调双方对音乐的理解。
工作方向。
借助AI,可以轻松生成相对准确的原型,可以节省大量沟通时间,降低后续返工的风险。
从实践的角度来看,当今有很多行业需要使用音乐。
比较典型的是短视频、影视、游戏制作。
然而,传统音乐创作不仅成本高昂,而且费时费力。
将AI引入这些行业的音乐生产过程中,任何效率的提升都可能带来巨大的产业价值。
在内容创作领域,谁能最快适应技术变革,谁就有可能获得最大的利益。
这一点在短视频领域得到了验证。
随着手机摄像头、5G、视频编辑APP的兴起,视频拍摄和制作的门槛不断降低。
最终,随着抖音的全球流行,短视频曲目全面崛起,迎来了一个新时代。
如今,在AI Music乃至所有AIGC平台上,历史可能会再次重演。
*头图来源:天工AI#阿里云#创新创业#创业支持#创业资讯我们关注国内外最热门的创新创业动态,提供一站式资讯服务,传递行业热点新闻、深度评论和实时前瞻观点,帮助创业者把握新兴技术趋势和行业变化,洞察未来技术趋势。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-18
06-17
06-18
06-06
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态