We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
流式输出声音有杂音
The text was updated successfully, but these errors were encountered:
这个问题,官方库正在排查 2noise/ChatTTS#521
Sorry, something went wrong.
大pr #102 里面重构了流式生成,应该可以解决一部分杂音问题 这个 issue 标记已修复,如果还有问题可以继续提供详细信息
这个原因是啥,修复逻辑是什么?我这边基于之前的版本集成了vllm,并且支持了流式;但是复用的之前的chunk切割逻辑,所以这块逻辑是有啥问题?
大pr #102 里面重构了流式生成,应该可以解决一部分杂音问题 这个 issue 标记已修复,如果还有问题可以继续提供详细信息 这个原因是啥,修复逻辑是什么?我这边基于之前的版本集成了vllm,并且支持了流式;但是复用的之前的chunk切割逻辑,所以这块逻辑是有啥问题?
不是 chunker 的问题,当时定位的问题有两个
vocos 这个模型对于短序列解码有问题,可能是模型没训练过短序列也可能是架构就不支持短序列 所以解决方法也很简单,当时 增加了一个参数 stream_chunk_size 默认值从 24 增大设置为 96,之后官方仓库也增加了类似参数 stream_batch (官方还增加了 pass_first_n_batches 好像也是解决流式质量差的问题的)
感觉不全是这个问题。序列无论怎么切割还是会有碎片问题;在非流场景,短文本也没怎么遇到过噪音问题
No branches or pull requests
阅读 README.md 和 dependencies.md
检索 issue 和 discussion
检查 Forge 版本
请确认是否与 API 无关?
请确认是否与 WebUI 无关?
请确认是否与 Fintune 无关?
你的issues
流式输出声音有杂音
The text was updated successfully, but these errors were encountered: