微调的两种范式
增量预训练微调
使用场景:让基座模型学习一些新的知识,如垂直类型领域的知识
指令跟随微调
使用场景:让模型学会对话模板根据人类的指令进行对话
训练数据:高质量的对话,问答数据
一条数据的一生:
微调算法的种类
FULL FineTuning LoRA QLoRA
微调的两种范式
增量预训练微调
使用场景:让基座模型学习一些新的知识,如垂直类型领域的知识
指令跟随微调
使用场景:让模型学会对话模板根据人类的指令进行对话
训练数据:高质量的对话,问答数据
一条数据的一生:
微调算法的种类
FULL FineTuning LoRA QLoRA