完成lora合并后,会生成一部分上述文件特别是pytorch_model.bin和pytorch_model.bin.index.json 一定不能传进去,合并后进行chatqptq量化,不需要
pytorch_model.bin,且会生成合并后的pytorch_model.bin.index.json
若将pytorch_model.bin传进去,量化时(chatqptq)avg loss会变成nan, 给了gptq多余的bin,造成混乱。
完成lora合并后,会生成一部分上述文件特别是pytorch_model.bin和pytorch_model.bin.index.json 一定不能传进去,合并后进行chatqptq量化,不需要
pytorch_model.bin,且会生成合并后的pytorch_model.bin.index.json
若将pytorch_model.bin传进去,量化时(chatqptq)avg loss会变成nan, 给了gptq多余的bin,造成混乱。