256k大概需要多少显存才可以支持？

by chaochaoli - opened Jan 18, 2024

如题

XVERSE Technology org Jan 18, 2024

用tensorRT的话，八卡能跑256k

用tensorRT的话，八卡能跑256k

你好，请问是什么样的显卡配置，谢谢

XVERSE Technology org Jan 19, 2024

我们用的h800或者a800，单卡80G

13b 模型需要这么大的显存吗？640GB？！我运行Vicuna 13b 16k 未量化只需要30多GB啊。

我查看了65B模型的介绍页，硬件需求如下：
XVERSE-65B Inference BF16/FP16 500GB 2*A800 80G

65B模型推理只需要2张A800，为什么13B需要更多显存呢？

XVERSE Technology org Jan 25, 2024

13b 模型需要这么大的显存吗？640GB？！我运行Vicuna 13b 16k 未量化只需要30多GB啊。

跑16K不用那么多显存，跑256K需要8卡。因为显存随着序列长度成平方倍增长

XVERSE Technology org Jan 25, 2024

我查看了65B模型的介绍页，硬件需求如下：
XVERSE-65B Inference BF16/FP16 500GB 2*A800 80G

65B模型推理只需要2张A800，为什么13B需要更多显存呢？

跑256K需要8卡，因为显存随着序列长度成平方倍增长

我查看了65B模型的介绍页，硬件需求如下：
XVERSE-65B Inference BF16/FP16 500GB 2*A800 80G

65B模型推理只需要2张A800，为什么13B需要更多显存呢？

跑256K需要8卡，因为显存随着序列长度成平方倍增长

是的，非常对

chaochaoli changed discussion status to closed Feb 22, 2024

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment