Does ctransformers boost the inference speed in llm inference? #202

pradeepdev-1995 · 2024-02-15T13:26:33Z

I have converted my finetuned hugging face model to .gguf format and triggered the inference with ctransformers.
I am using a CUDA GPU machine.
But i did not observe any kind of inference speed improvement after the inference by ctransformers. Observing the same latency in transformer based infernce and ctransformer based inference.

pradeepdev-1995 changed the title ~~is ctransformers boost the inference speed in llm inference?~~ Does ctransformers boost the inference speed in llm inference? Feb 15, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Does ctransformers boost the inference speed in llm inference? #202

Does ctransformers boost the inference speed in llm inference? #202

pradeepdev-1995 commented Feb 15, 2024

Does ctransformers boost the inference speed in llm inference? #202

Does ctransformers boost the inference speed in llm inference? #202

Comments

pradeepdev-1995 commented Feb 15, 2024