Tora Blog//tags/quantize

llm-jpのggufをつくってquantizeしてllama.cppで動かす

まず、https://huggingface.co/llm-jp/llm-jp-3-13b-instruct3 を全体cloneする。(git-lfsをいれておくように)

cd …
»

Tags: [ gptq, llm-jp, quantize, ]
5月 22日, 2025 / 最終更新 5月 22日, 2025
Page 1 of 1
Tora Blog ここでの投稿はすべてCC0にします。All posts are licensed under CC0.
Powered by HUGO / Modified from hugo-theme-casper (c) 2015 Valere JEANTET / Using katex (c) 2013-2019 Khan Academy and other contributors