Meta发布了开源AI工具AudioCraft,用户可以通过文本提示创建音乐和音频

干货分享7个月前发布 Youzhizhan
1,380 0


今年6月,Meta开源了AI语言模型MusicGen,该模型基于Google在2017.As 该模型的名称显示,MusicGen主要用于音乐生成,它可以将文本和现有的旋律转换为完整的音乐。

Meta发布了开源AI工具AudioCraft,用户可以通过文本提示创建音乐和音频

8月3日消息,美国东部时间8月2日,Meta开源了AudioCraft,这是一款生成型AI工具,可以帮助用户通过文本提示创建音乐和音频。

Meta发布了开源AI工具AudioCraft,用户可以通过文本提示创建音乐和音频图片3

根据官方Meta介绍,AudioCraft包含三个核心组件:

  • 音乐根:使用元拥有/特别授权的音乐进行培训,并根据文本提示生成音乐。
  • [医]听力原:使用公共声音效果进行训练以生成音频或扩展现有音频,然后生成环境声音效果(例如狗叫,汽车哨声和木地板上的脚步声)。
  • EnCodec(改进版):基于神经网络的音频压缩解码器可以生成更高质量的音乐并减少人为痕迹,或对音频文件进行无损压缩。

Meta发布了开源AI工具AudioCraft,用户可以通过文本提示创建音乐和音频流程图展示MusicGen和AudioGen的工作原理

该工具开源后,相关研究人员和从业者可以使用自己的数据集来训练模型。官方声称AudioCraft系列机型可以长时间稳定产生高质量音频,使用方便。 它可以为音乐家和音响设计师”提供灵感”,帮助他们快速集思广益,并以新的方式”迭代他们的作品。”

根据IT之家此前的报道,Meta在今年6月开源了AI语言模型MusicGen,该模型基于Google在2017.As 该模型的名称显示,MusicGen主要用于音乐生成,它可以将文本和现有的旋律转换为完整的音乐。

AudioCraft项目地址:点击这里进入

[ad]
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...