出个int4 怎么样
#1
by
ZKong
- opened
现在comfyui那边流行int4与fp4,既快又好
FP8还是超过了24GB,大部分休闲玩家用不了@@
等等稳定的GGUF吧,这个模型测试了一下cpu推理都能做到11token一秒
等等稳定的GGUF吧,这个模型测试了一下cpu推理都能做到11token一秒
GGUF没办法推理视频=-=
现在comfyui那边流行int4与fp4,既快又好
FP8还是超过了24GB,大部分休闲玩家用不了@@
等等稳定的GGUF吧,这个模型测试了一下cpu推理都能做到11token一秒
等等稳定的GGUF吧,这个模型测试了一下cpu推理都能做到11token一秒
GGUF没办法推理视频=-=