Репозиторий содержит код и примеры консольных команд для выполнения квантизации LLM методоми GPTQ, Quik и спарсификации методами SparseGPT, Wanda.
Описание репозитория:
notebooks
содержит jupyter notebook со скриптами для выполнения квантизации и спарсификации.quik
содержит код для квантизации LLM методом Quiksparsegpt
содержит код для спарсификации LLM методом SparseGPT и квантизации методом GPTQwanda
содержит код для спарсификации LLM метод Wandallama7b_weights
содержит файлы с весами линейных слоев для 20-ого блока трансформера модели LLaMA2llama7b_act_scales
содержит словарь с активациями для каждого слоя модели LLaMA2