🎤 RIFT-SVC 歌声音色转换 (七海Nanami demo)

使用 RIFT-SVC 模型将歌声或语音转换为七海Nanami的音色

🔗 想要微调自己的说话人? 请访问 RIFT-SVC GitHub 仓库 获取完整的训练和微调指南。

🎤 数据来源说明: 该demo数据来源为b站上快速爬取的约30分钟七海唱歌片段,直接分离人声后进行训练,没有额外筛选。

📝 注意: 为获得最佳效果,请使用背景噪音较少的干净音频。最大音频长度为5分钟。建议用较短的音频测试避免平台意外中断任务。

📥 输入

目标说话人
-12 12
8 64
音高滤波

0=无,1=轻度过滤,2=强力过滤(有助于解决断音/破音问题)

0 1
0 2
0 1
0 1
用于反向引导的内容向量下采样率

更高的值(可能)可以提高内容清晰度。

-60 -20
1000 10000
10 500
1 20
10 1000

📤 输出

✅ 模型加载成功!可用说话人: 七海

🔍 快速提示

  • 音调调整: 以半音为单位上调或下调音高。
  • 推理步骤: 步骤越多 = 质量越好但速度越慢。
  • 音高滤波: 有助于提高具有挑战性的音频中的音高稳定性。
  • CFG参数: 调整转换质量和音色。