文烜动态 NEWS

又刷屏了昆仑万维奇袭音乐大模子

发布时间:2025-05-03 16:12   |   阅读次数:

  昆仑万维发布的音乐大模子Mureka O1,正在音乐生成质量的评测上,全面超越做为行业领头羊的Suno——相当于ChatGPT正在文本大模子的劣势地位——成了又一个空降而来的「新王」。

  和视频大模子的成长雷同,音乐大模子的性也正在于双线做和:不只是给素人创做者赋权,还能为专业创做者增效,仍是那句老话,AI不会间接代替人,而是用AI的人会代替不会用AI的人。

  这和文本大模子被诟病的处所是分歧的,看起来AI很能写做,吐起文句来连缀不停,却正在良多时候经不起细看,由于堆砌踪迹过沉,给人「AI味」太浓的不雅感,更严沉的,以至将AI生成的做品称做是「尸块」。

  而正在DeepSeek横空出生避世之后,国产AI行业就起头呈现出雷同工业范畴的供应链溢出效应,让音乐大模子学会推理创做,就是此中一个,更主要的是,从人才密度,到手艺冲破,中国的AI公司都起头骑脸输出,反过来向全球贡献经验,并挨个占领所有榜单的前列。

  若是正在YouTube搜刮Mureka,就能发觉曾经有良多创做者正在用这款产物创做音乐了,再去寻找使用场景——还不太一样,「炸裂」后至。

  正在曾经发布的论文里,Mureka团队认识到保守自回归模子正在生成音频时的局限性,也就是遵照Transformer的预测模式,只能按挨次吐出音符(Token),而正在开创了思维链之后,Mureka O1能够正在生成之前就对全体做曲布局做出打算和梳理,大幅提高音乐的连贯性。

  昆仑万维的创始人周亚辉每年城市正在伴侣圈锐评各家公司的AI表示,并经常传播出喜闻乐见的金句,好比「字节跳动2023年的AI计谋不合格,但并不影响它正在2024年的AI计谋能打满分。」。

  这大要就是周亚辉所说的「小而大美」实正的意义,以尽可能小的机遇成本,切入相对大且确定的增值市场,和文本的量级比拟,全世界从古到今的所有音乐曲目,只要4000万首,对应繁荣的贸易市场,锻炼起来的性价比很高。

  两年前,孙燕姿写了一篇文章回应「AI孙燕姿」的众多,她的立场很成心思,稠浊着自嘲和看戏——「此刻,我感觉本人就像一个吃爆米花、坐正在片子院最好的上的人。」。

  不外,对于更多想要立名立万的创做者来说,AI才是能帮他们做本人的东西,Mureka O1的大受好评,就成立正在这种浓得无法化开的需求之上,一次古登堡式的歌唱平权。

  某种程度上,Mureka O1会让海外的AI从业者心里生出「快别卷了」的无法,由于它是第一个引入思维链(Chain-of-Thought)的音乐大模子。

  简单来说,以Suno为代表的旧式音乐大模子,正在创做音乐时很容易呈现「有曲调而无旋律」的特点,有曲调意味着这确实可被辨识出是一首音乐做品,无旋律则申明和那些实正由人谱写出来的音乐比拟,AI的工做不敷动听,没有朗朗上口的艺术审美。

  正在最新的音乐评测中,Mureka O1展示出杰出的音乐质量,正在最终的全体听感评测跨越了Suno V4。

  做为一家上市公司,昆仑万维没有所谓「2VC」的叙事需求,它对AI的研究投入,一方面是敌手艺立异的,另一方面也是本身营业的延长。

  A16z已经发过一篇关于AI音乐的前瞻演讲,认为音乐财产很是适合AI的货泉化,由于这里有着高度成熟化的贸易链,分账模式也相对不变,这种确定性,让从业者们情愿为出产力的提高领取费用。

  好比这首放克气概的音乐做品「Hands up high」,你们听完必然会和我发生同样的惊讶,不止是完整度,连同旋律构想和歌词卡点,包罗逼实的人声唱腔,几乎都不再有AI生成时那种挥之不散的电子感,达到了能够刊行的境界。

  加上TikTok等短视频平台曾经新创了神曲和BGM模版的经济系统,新的出产关系,必然会长出新的音乐创做者,他们所用的东西,也并非必需和保守创做者连结分歧。

  不外思维链几乎只被用正在文本大模子范畴,从来没有正在音乐大模子有过测验考试,而昆仑万维实现了让Mureka O1像一个实正在的唱做人那样,用经验和思虑——而非曲觉——来谱曲写歌。

  公然,从Suno的惊世登场,到Mureka的急起逆袭,音乐大模子能做的工作,正正在验证着孙燕姿的预判,所以她才自动选择了接管。

  就像今天几乎曾经没有工程师不正在用Cursor写代码,Mureka对于音乐制做人而言,有着纯粹的美学价值,好比基于一小段音符「填补」音乐,或是将歌曲反编译为词干,这些本来需要投入大量智力劳动的工做,都能交给Mureka以近乎无限的生成资本供给选用。

  而正在发音唱对率、乐段精确率、文底细关度、制做质量等客不雅目标,多个维度上,Mureka O1都完全胜过了目前市场份额最高的Sonu V4,让海外的AI手艺圈再次发出了魂灵三问。

  而Mureka O1供给的推理能力,能够让AI坐正在全局的视角规齐截首音乐从无到有的建立过程,避免「走一步算一步」的成分,这正在现实体验上再制了魔法般的美学功底。

  正在这波AI海潮袭来之前,StarMaker就正在本人做语料库了,单个小语种每个月要花几百万美元,这种堆集,也相当于昆仑万维正在今天闯入音乐大模子的「外挂」,当一个高档级玩家呈现正在新手村,任何动做城市是降维冲击。

  昆仑万维的市值,正在500亿人平易近币摆布,实要和全球互联网大厂反面硬刚,明显没有几多胜算,但正在周亚辉看来,昆仑万维的AI进展不是「小而美」,而是「小而大美」,大正在哪儿?

  这里能够插入一个也许有些反曲觉的数据,那就是全球音乐市场的产值,其实是比全球片子市场还要略高的,这是一个300亿美金的盘子,并且集中度偏高,仅是全球、索尼、华纳三大唱片公司,就占到了音乐市场份额的60%以上。

  我本人也用Mureka O1写了一小段音乐,用片子「指环王」里阿拉贡正在最终决和前的阵前做为填词,虽然做得简单潦草,可是那句「But it is not this day」的搁浅和转机,曾经相当冷艳了,我没有输入任何提醒词指导,纯粹是Mureka O1本人做出的判断。

  这和昆仑万维的海外营业早已打下基底相关,语音社交使用StarMaker是中国互动文娱出海的标记性产物,全球几万万人挤正在里面唱歌打榜,对于音乐创做者会正在多大程度上为出产力买单,熟念于心。

  其时,距离Suno的发布还有半年时间,所谓AI音乐的出产,次要还逗留正在「摹仿」的层面,也就是复制音乐人的声线,让「她」去唱此外歌曲,还没有达到原创的境界。

  思维链就是OpenAI o1和DeepSeek-R1为大模子行业带来的第二条进化曲线,通过大模子推理能力,正在预锻炼陷入瓶颈之后从头处理了智能不再提拔的问题。

  考虑到Mureka对于订阅用户生成的AI音乐都供给了商用授权,这是意味着通俗人也能获得每年跨越5000首音乐的创做能力,无论是自用仍是上传到Spotify等流平台,对于数字音乐市场的冲击将是空前绝后的。

  怎样说呢,迷惑的起点都是傲慢,从看不到中国AI的奋起,到不关怀大厂以外的冲破,这笔认知债权,还有很长时间要还。

  终究,从智人时代起头,越早控制先辈东西的人类,越能取得进化的劣势,尼安特人的石器制做手艺已经一度领先,但正在几十万年里没有任何改良,但智人曾经正在旧石器晚期曾经开辟出了可投抛的标枪和箭矢等复合东西,最终帮帮智人正在合作中取得了胜利。

  正在Mureka之外,昆仑万维还正在海外做了AI短剧平台SkyReels,同样是以打掉90%以上出产成本的方式,刺激供给端的迸发。

  本文为磅礴号做者或机构正在磅礴旧事上传并发布,仅代表该做者或机构概念,不代表磅礴旧事的概念或立场,磅礴旧事仅供给消息发布平台。申请磅礴号请用电脑拜候。

  从小我体感来看,Mureka生成一首完整音乐的速度正在50秒摆布,8美金/月的最低档会员价钱,对应400首音乐(V6模子)或者80首音乐(O1模子),平均「单曲成本」只要0。02美金或者0。1美金,能够说是白菜价了。

  早正在3年前,昆仑万维就用AI生成的音乐和图形为旗下逛戏营业做了降本增效——2万块钱的一首BGM版权,被5块钱的AI成本顶替——这种基于现实需要的报答,客不雅上也为昆仑万维的AI邦畿去掉了表演性质。

  可是孙燕姿曾经灵敏察觉到手艺成长的日新月异——这份灵敏以至跨越了大大都行业人士——她说可能有人会否决AI音乐的影响,认为本人可以或许分辩出区别,由于它没无情绪、腔调和呼吸的变化,而孙燕姿则暗示:「很抱愧,我思疑这只是一个很是短期内的回应,人类无法超越它已指日可待。」。

上一篇:“AI 孙燕姿”科技取音乐的融合取碰撞

下一篇:OPPO Find N5:AI全景虚拟屏沉塑办公体验智妙手机新