流式输出声音有杂音[ISSUE] #98

huai-ying · 2024-07-11T10:18:44Z

阅读 README.md 和 dependencies.md

我已经阅读过 README.md 和 dependencies.md 文件

检索 issue 和 discussion

我已经确认之前没有 issue 或 discussion 涉及此 BUG

检查 Forge 版本

我已经确认问题发生在最新代码或稳定版本中

请确认是否与 API 无关？

我已经确认问题与 API 无关

请确认是否与 WebUI 无关？

我已经确认问题与 WebUI 无关

请确认是否与 Fintune 无关？

我已经确认问题与 Fintune 无关

你的issues

流式输出声音有杂音

zhzLuke96 · 2024-07-12T08:41:23Z

这个问题，官方库正在排查 2noise/ChatTTS#521

zhzLuke96 · 2024-07-14T12:10:43Z

大pr #102 里面重构了流式生成，应该可以解决一部分杂音问题
这个 issue 标记已修复，如果还有问题可以继续提供详细信息

wenyangchou · 2024-08-31T09:55:29Z

大pr #102 里面重构了流式生成，应该可以解决一部分杂音问题这个 issue 标记已修复，如果还有问题可以继续提供详细信息

这个原因是啥，修复逻辑是什么？我这边基于之前的版本集成了vllm，并且支持了流式；但是复用的之前的chunk切割逻辑，所以这块逻辑是有啥问题？

zhzLuke96 · 2024-08-31T11:07:28Z

大pr #102 里面重构了流式生成，应该可以解决一部分杂音问题这个 issue 标记已修复，如果还有问题可以继续提供详细信息

这个原因是啥，修复逻辑是什么？我这边基于之前的版本集成了vllm，并且支持了流式；但是复用的之前的chunk切割逻辑，所以这块逻辑是有啥问题？

不是 chunker 的问题，当时定位的问题有两个

vocos 模型解码短序列容易出错
音频编码器代码有bug

vocos 这个模型对于短序列解码有问题，可能是模型没训练过短序列也可能是架构就不支持短序列
所以解决方法也很简单，当时增加了一个参数 stream_chunk_size 默认值从 24 增大设置为 96，之后官方仓库也增加了类似参数 stream_batch
（官方还增加了 pass_first_n_batches 好像也是解决流式质量差的问题的）

wenyangchou · 2024-09-02T01:52:03Z

感觉不全是这个问题。序列无论怎么切割还是会有碎片问题；在非流场景，短文本也没怎么遇到过噪音问题

zhzLuke96 added bug Something isn't working upstream Dependency on upstream fixes quick_fix Fixed but needs further follow-up labels Jul 12, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

流式输出声音有杂音[ISSUE] #98

流式输出声音有杂音[ISSUE] #98

huai-ying commented Jul 11, 2024

zhzLuke96 commented Jul 12, 2024

zhzLuke96 commented Jul 14, 2024

wenyangchou commented Aug 31, 2024

zhzLuke96 commented Aug 31, 2024

wenyangchou commented Sep 2, 2024

流式输出声音有杂音[ISSUE] #98

流式输出声音有杂音[ISSUE] #98

Comments

huai-ying commented Jul 11, 2024

阅读 README.md 和 dependencies.md

检索 issue 和 discussion

检查 Forge 版本

请确认是否与 API 无关？

请确认是否与 WebUI 无关？

请确认是否与 Fintune 无关？

你的issues

zhzLuke96 commented Jul 12, 2024

zhzLuke96 commented Jul 14, 2024

wenyangchou commented Aug 31, 2024

zhzLuke96 commented Aug 31, 2024

wenyangchou commented Sep 2, 2024