5月20日,AI初创公司StabilityAI宣布推出StabilityAudio3.0音频生成模型家族,其中包括四款不同规格的模型。顶级版本能够生成长达六分钟以上的专业级音乐。两款小型模型专注于设备端运行,可本地生成两分钟以内的声音与音乐;而中型和大型模型则能创作长达6分钟20秒的完整乐曲,并精准维持音乐结构与旋律基调。
StabilityAI此次将小型SFX、小型及中型模型开源,公众可以自由下载并修改权重。最顶尖的大型模型则通过API与付费托管服务提供,年营收超过100万美元的企业必须购买商业授权。公司已与华纳音乐集团、环球音乐集团达成合作,确保音频模型基于合法授权的数据集训练。
StabilityAI正在为专业音乐人打造全新产品线,具体功能细节尚未公布。伊桑·卡普兰,曾担任环球音频与芬达首席数字官,已加盟StabilityAI,负责领衔专业音乐产品业务。

