Skip to content

Latest commit

 

History

History
35 lines (27 loc) · 771 Bytes

README.md

File metadata and controls

35 lines (27 loc) · 771 Bytes

RMVPE

1. 训练

数据集是我处理过的 mir1k 和 ptdb 混合数据集, 外加 m4singer 声码器合成数据,统一精度到 10ms 一帧

训练集放到Hybrid/train目录下

测试集放到Hybrid/test目录下

其中wav文件和pv文件同目录

执行训练

python train.py 

训练参数在文件里自己改

2. 可视化

tensorboard --logdir=runs

3. 测试

# 查看使用方法
python main.py -h 

4. 导出

将模型导出到 ONNX 格式需要使用 PyTorch nightly (>=2.1.0),否则将无法导出 aten::stft 算子

同时,由于 PyTorch 目前的限制,hop_length 参数只能为静态,即一个 ONNX 模型只能有一个 hop_length

# 查看使用方法
python export.py -h