Skip to content

Latest commit

 

History

History
23 lines (21 loc) · 1.42 KB

audiogpt:理解和生成语音、音乐、声音和说话.md

File metadata and controls

23 lines (21 loc) · 1.42 KB
title description author date tags categories series website_link color thumb_image cover_image
AudioGPT:理解和生成语音、音乐、声音和说话
生成音乐 🎶 – 背景音效 🎵 – 音频生成字幕 🎤 – 文字生成音频 🗣 – 文字生成音频并模拟声音 📢 –
瑞东
2023-03-30
人脸照片合成视频
单声道变双声道
去除噪音
抽取声音
文字生成音频
文字生成音频并模拟声音
音频生成字幕
音频处理
application
#00CC8E
/img/cd81ff1f5242eeae105c649a5ef5e7fa.png
/img/cd81ff1f5242eeae105c649a5ef5e7fa.png

生成音乐 🎶 – 背景音效 🎵 – 音频生成字幕 🎤 – 文字生成音频 🗣 – 文字生成音频并模拟声音 📢 – 根据图片生成音频 🖼🎶 – 对音频进行inpaint(局部屏蔽)🔇 – 根据音频和人脸照片合成视频 🎥🎵 – 检测音频中的事件,以及开始和结束时间 ⏰🔊 – 单声道变双声道 🔊➡🔊🔊 – 通过文本描述检测特定声音发生的时间 📝🔊⏰ – 抽取某种声音 🔊🔎 – 去除背景噪音 🚫🔊 多人混合声分离出单人声音 🔊👥➡🔊👤 语音翻译 🗣🌐 项目:https://github.com/AIGC-Audio/AudioGPT 演示:https://huggingface.co/spaces/AIGC-Audio/AudioGPT 论文:https://arxiv.org/abs/2304.12995