知识库检索速度很慢，是不是向量和重拍没有使用GPU #561

myboyliu2025 · 2024-10-29T08:47:27Z

知识库检索速度很慢，大概每次20s,是不是向量和重排没有使用GPU

myboyliu2025 · 2024-10-29T09:08:53Z

注：preprocess: 0.02s + condense_q_chain: 0.00s + retriever_search: 0.29s + web_search: 0.00s + rerank: 20.81s + reprocess: 0.01s + llm_first_return: 2.89s = first_return: 24.14s + llm_completed：2.18s + obtain_images_time: 1.09s = chat_completed：27.41s

myboyliu2025 · 2024-10-29T09:09:43Z

rerank: 20.81s 这个模型耗时最长。

zihan987 · 2024-10-29T18:01:13Z

我用的是deepseek的api，然后用的是openai gpu的那个脚本。以为是gpu上做检索，结果发现没啥区别。。。。

zhanglt · 2024-11-06T13:33:40Z

你去看看你的pytorch版本是不是GPU版本

prettyprettyboy · 2024-11-09T07:50:44Z

感觉将环境的onnx runtime改为onnx runtime-gpu后将这两个模型的启动方式都改成gpu，就可以在gpu上运行了。这两个模型的异步运行后端代码是不是可以直接用

gjfmlj · 2024-11-11T09:15:31Z

老版本跑在gpu上没有问题，2.0只能运行在cpu上慢的要死，怀疑是故意这样设定，非常恶心

prettyprettyboy · 2024-11-11T09:40:47Z

尝试了，在原有镜像上添加CUDA和cudnn后，用他那个异步的embedding和rerank代码就很快，并发也不错。感觉就是故意的哈哈哈哈

EurekaTesla · 2024-11-13T07:27:49Z

尝试了，在原有镜像上添加CUDA和cudnn后，用他那个异步的embedding和rerank代码就很快，并发也不错。感觉就是故意的哈哈哈哈

我最近也在研究这个，能向您请教一下具体实现的步骤和设置吗？

liuwuwei · 2024-11-29T08:20:12Z

尝试了，在原有镜像上添加CUDA和cudnn后，用他那个异步的embedding和rerank代码就很快，并发也不错。感觉就是故意的哈哈哈哈

你好，能请教下怎么做的吗

zhuorongyang · 2024-12-11T17:16:13Z

尝试了，在原有镜像上添加CUDA和cudnn后，用他那个异步的embedding和rerank代码就很快，并发也不错。感觉就是故意的哈哈哈哈

请教下这个具体是怎么修改设置？

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

知识库检索速度很慢，是不是向量和重拍没有使用GPU #561

知识库检索速度很慢，是不是向量和重拍没有使用GPU #561

myboyliu2025 commented Oct 29, 2024 •

edited

Loading

myboyliu2025 commented Oct 29, 2024

myboyliu2025 commented Oct 29, 2024

zihan987 commented Oct 29, 2024

zhanglt commented Nov 6, 2024

prettyprettyboy commented Nov 9, 2024

gjfmlj commented Nov 11, 2024

prettyprettyboy commented Nov 11, 2024

EurekaTesla commented Nov 13, 2024

liuwuwei commented Nov 29, 2024

zhuorongyang commented Dec 11, 2024

知识库检索速度很慢，是不是向量和重拍没有使用GPU #561

知识库检索速度很慢，是不是向量和重拍没有使用GPU #561

Comments

myboyliu2025 commented Oct 29, 2024 • edited Loading

myboyliu2025 commented Oct 29, 2024

myboyliu2025 commented Oct 29, 2024

zihan987 commented Oct 29, 2024

zhanglt commented Nov 6, 2024

prettyprettyboy commented Nov 9, 2024

gjfmlj commented Nov 11, 2024

prettyprettyboy commented Nov 11, 2024

EurekaTesla commented Nov 13, 2024

liuwuwei commented Nov 29, 2024

zhuorongyang commented Dec 11, 2024

myboyliu2025 commented Oct 29, 2024 •

edited

Loading