会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 开源音频模型Stable Audio Open,文本生成47秒高清音效!

开源音频模型Stable Audio Open,文本生成47秒高清音效

时间:2024-07-02 03:49:42 来源:带水拖泥网 作者:深度 阅读:345次

开源音频模型Stable Audio Open,文本生成47秒高清音效

声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),开源作者:AIGC开放社区,音频音效授权CSS站长资源转载发布。模型

6月6日,本生著名开源大模型平台Stability.ai在官网宣布,成秒开源最新文生音频模型Stable Audio Open。高清

用户通过文本就能生成最多47秒,开源钢琴、音频音效笛子、模型鼓点、本生模拟人声等不同类型的成秒44.1kHz音效。

值得一提的高清是,Stable Audio Open支持数据微调,开源歌手、音频音效音乐人可以让其生成基于自己的模型音乐数据,例如,架子鼓手可以根据自己的鼓点来进行微调。

开源地址:https://huggingface.co/stabilityai/stable-audio-open-1.0

在线demo:https://huggingface.co/spaces/artificialguybr/Stable-Audio-Open-Zero

根据Stability.ai介绍,Stable Audio Open使用了486,492个录音训练数据,其中472,618个来自Freesound,13874个来自免费音乐档案馆,并且所有音频文件均根据 CC0、CC BY或CC Sampling+获得了商业许可。

就是说通过Stable Audio Open生成的音效无需担心商业化问题,不会受到法律方面的追究。

「AIGC开放社区」根据其提供的在线demo体验了一下,在文本语义理解、生成音效等方面还是相当优秀。

需要注意的是,目前只支持英文提示词,其他任何语言都不行,即便你使用了识别效果也是相当的差。

在生成的过程中,用户可以对时间、扩散步数和CFG进行详细控制,以达到更好的效果。例如,一首非常舒适抒情的钢琴曲。

此外,Stable Audio Open目前只能用于学术研究,还无法商业化。

(责任编辑:资讯)

相关内容
  • 1TB都不够用!微信安装包突破700MB 首版仅457KB:网友吐槽98%文件是垃圾
  • 39元瑞士卷被黄牛炒到120元:出餐效率低等问题导致
  • L系列宣布改名!理想汽车涨超6%
  • 西安通报男子隧道内开车门恶意别车:未成年无证驾驶 已作出处罚
  • 时隔两年 华为重夺中国手机市场销量
  • 超越小米SU7!极狐阿尔法S5风阻系数公布:全球量产车
  • 医师劝阻100斤要做减重手术的人:并非人人适宜
  • become-image官网体验入口 图像处理AI模型在线使用地址
推荐内容
  • BiTA:创新AI方法加速大型语言模型生成
  • 葫芦娃AI体验入口 AI写作、绘画、自媒体教程免费学习教程指南
  • GPT-4.5 Turbo意外曝光 最快明天发布!OpenAI将再次引领AI行业
  • MDTv2开源,Sora 核心组件 DiT 训练提速 10 倍
  • 2B小钢炮碾压Mistral-7B,旗舰级端侧模型炸场开年黑马!1080Ti可训,170万tokens成本仅1元
  • B站UP主借AI识别情绪玩法整活《亮剑》名场面播放量186万