
AI
文章平均质量分 64
cpuCode
站在巨人的肩上行走 https://github.com/CPU-Code
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
AI 导航
写该文档,实际我对大模型也有了初步了解了,理论知识学了一段时间了,大模型像极了耗费大量资源得到的现在的结果,很粗暴的样子,疯狂塞数据,什么都会,又什么都不会,需要微调做垂直领域才行,做Prompt 和外挂 DAG库做精细化控制。今年感觉全公司都在 all in ai , 无处不在,公司也买的很多的卡,听说花了不少钱,因为之前学过机器学习,和NLP 一些知识点,但对大模型一直不了解,我准备在今年好好学学大模型,解密大模型的面纱。公司的业绩不好,裁员到处纷飞,大环境如此,就好好提升自己,不畏未来。原创 2025-01-16 12:11:06 · 286 阅读 · 0 评论 -
LLaMA
LLaMA (Large Language Model Meta AI) :模型特点 :LLaMA 模型 是 Decoder-only 架构 , 架构改进:LLaMA 7B :硬件要求 :LLaMA2 (Open Foundation and Fine-Tuned Chat Models) :改进点原创 2021-11-29 18:19:43 · 133 阅读 · 0 评论 -
ChatGLM
ChatGLM-6B : 清华大学的一个开源、支持中英双语的对话语言模型,基于 General Language Model(GLM)架构,具有 62 亿参数。原创 2025-02-18 23:09:58 · 644 阅读 · 0 评论 -
ChatGPT
强化学习 (Reinforcement Learning, RL) : 描述和解决智能体 (agent) 在交互中通过学习策略 , 达到回报最大化或 实现该问题。强化学习的三个步骤 : 步骤一只进行一次, 而步骤二 , 三重复进行。原创 2025-02-18 22:58:30 · 558 阅读 · 0 评论 -
GTP3 大模型
【代码】GTP3 大模型。原创 2025-02-18 22:52:52 · 493 阅读 · 0 评论 -
GPT-2 大模型
【代码】GPT-2 大模型。原创 2025-02-18 22:49:51 · 382 阅读 · 0 评论 -
GPT1 大模型
GPT-1 :数据集 :模型特点 :语言模型的对比架构 :GPT-1模型架构 :训练的两阶段过程 :原创 2025-02-18 22:47:59 · 566 阅读 · 0 评论 -
T5 大模型
T5 架构:与 Transformer 一致 , 改进点 :预训练任务:特点 :原创 2025-02-18 22:34:45 · 263 阅读 · 0 评论 -
BERT 大模型
NextSentencePrediction(下一句话预测任务)MaskedLM(带 mask 的语言模型训练)原创 2025-02-18 22:27:08 · 500 阅读 · 0 评论 -
LLM 架构
序列到序列模型 (Sequence to Sequence Model)自回归模型 (Autoregressive model , AR)自编码模型 (AutoEncoder model , AE)原创 2025-02-18 22:22:12 · 202 阅读 · 0 评论 -
LLM 概述
大语言模型 (Large Language Model , LLM) : 一种人工智能模型, 并理解和生成人类语言10B 参数的语言模型。原创 2025-02-18 22:16:36 · 1019 阅读 · 0 评论