五一节前吹的牛,五一期间没完成,今天忙里偷闲,给完成了。
那就是初步拟定了一个《Transformer最后一公里》的写作大纲。
之前一直想写一系列Transformer架构的算法解析文章,但因为一直在忙(虽然不知道在忙啥),总是被耽搁。
今天终于算是启动了。
巧的是,下班路上刚手敲完大纲,晚上一个小伙伴来咨询学习LLM的事情,问我之前写的《AI视觉入门专栏》是否适合LLM的入门。
我就顺便给这位小伙伴安利了一下正在做的这个专栏,虽然还未开始写。
这个专栏是什么?
Transformer架构相比很多小伙伴都不陌生了,说它是目前最火的AI模型架构也不为过。
现在很多主流的大语言模型,比如chatGPT都是基于该架构进行的模型设