01 前言
LLaMA(Large Language Model Meta AI)是由Meta AI 发布的一个开放且高效的大型基础语言模型。为什么突然讲这个模型,主要LLaMA 已经成为了最受欢迎的开源大语言模型之一,LLaMA 系列模型在学术界和工业界引起了广泛的 关注,对于推动大语言模型技术的开源发展做出了重要贡献。
第一,开源,去了解其内部模型具有可行性。第二,它很受欢迎,说明在LLM界还是具有很强代表性,了解它内部结构有助于深入理解LLM发展路径。第三,众多 研究人员纷纷通过指令微调或继续预训练等方法来进一步扩展 LLaMA 模型的功 能和应用范围。其中,指令微调由于相对较低的计算成本,已成为开发定制化或专业化模型的首选方法,也因此出现了庞大的 LLaMA 家族。可以说LLaMA成为现在大部分互联网拥抱的对象,了解它,有助于拿下好offer。
总之,LLaMA 将有助于使 LLM 的使用和研究平民化,是一个深度学习LLM好切入口。同时,LLaMA已在教育、法律、医疗等专业领域有重要的应用场景,这对于构建大模型生态有先天的优势。
02 LLaMA架构