模型量化部署（GPTQ/AWQ）

Name: 模型量化部署（GPTQ/AWQ）
Price: 9 CNY

TotalClaw自研闭源作者 TotalClaw v1.5.2

使用GPTQ或AWQ算法对大语言模型进行权重量化，并部署至推理后端（如vLLM、TGI、TensorRT-LLM），以降低显存占用和推理延迟。

购买与使用

该项目为 TotalClaw 自营收费内容，暂未开放线上自助购买。请联系销售开通：13141015749

🔒 收费内容 · 该项目为 TotalClaw 自营收费内容，暂未开放线上自助购买，请联系销售开通。