CM莫问-CSDN博客

原创＜论文＞（微软）WINA：用于加速大语言模型推理的权重感知神经元激活

本文介绍了论文《WINA: Weight Informed Neuron Activation for Accelerating Large Language Model Inference》的核心创新点。

2025-06-05 09:44:02 1051

原创推荐模型之Wide&Deep

本文详细介绍了Wide&Deep算法的概念、原理和python实现。

2025-05-28 13:10:33 711

原创推荐模型之协同过滤

本文详细介绍了推荐系统中的经典算法——协同过滤算法的概念、原理，并给出了python示例。

2025-05-21 09:39:13 1009

原创＜论文＞（微软）避免推荐域外物品：基于LLM的受限生成式推荐

本文介绍了论文《Avoid Recommending Out-of-Domain Items: Constrained Generative Recommendation with LLMs》的主要研究内容。

2025-05-14 10:14:11 1288

原创＜论文＞（字节跳动）使用大语言模型进行时间序列理解和推理

本文介绍了论文《ChatTS: Aligning Time Series with LLMs via Synthetic Data for Enhanced Understanding and Reasoning》的主要内容。

2025-05-06 09:14:25 1223

原创 PEFT实战（三）——IA3参数高效微调

本文基于HuggingFace教程详细介绍了IA3参数高效微调方法的概念、原理及python实现。

2025-04-30 16:35:12 792

原创＜论文＞（亚马逊）Rec-R1：通过强化学习连接大模型与推荐系统

本文介绍了论文《Rec-R1: Bridging Generative Large Language Models and User-Centric Recommendation Systems via Reinforcement Learning》的主要内容。

2025-04-30 09:09:37 1185

原创＜论文＞（谷歌）用于时序链接预测的迁移学习

本文介绍了谷歌牵头于2025年4月发表的论文《Transfer Learning for Temporal Link Prediction》的主要内容。

2025-04-25 17:06:30 932

原创＜论文＞EasyEdit2：高效控制大模型行为

本文介绍了论文《EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models》的核心创新点。

2025-04-25 09:12:12 962

原创什么是MMOE？

本文详细介绍了MMOE的概念、原理及其网络架构的python实现。

2025-04-18 16:58:54 778

原创＜论文＞让RAG变得高效且简单：LightRAG

本文介绍了论文《LightRAG: Simple and Fast Retrieval-Augmented Generation》的核心创新点。

2025-04-18 09:47:49 1029

原创 PEFT实战（二）——基于Prompt的参数高效微调

本文介绍了基于prompt的参数高效微调方法，并进行了P-tuning的python实战。

2025-04-11 09:20:36 468

原创什么是PID控制？

本文详细介绍了工业场景中常用的PID控制算法的概念、原理及其python实现。

2025-04-02 21:59:13 681

原创 PEFT实战（一）——LoRA

本文基于PEFT库，展示了如何使用LoRA进行大模型的参数高效微调策略。

2025-04-02 11:12:44 1259

原创 CPU跑大模型怎么加速?

本文介绍了HuggingFace官方教程中的CPU大模型推理加速方案。

2025-03-26 17:59:27 1153

原创什么是FP-growth频繁项集挖掘？

本文详细介绍了FP-Growth频繁项集挖掘算法的概念、原理以及python实现。

2025-03-26 15:53:16 512

原创什么是Apriori关联分析？

本文详细介绍了Apriori关联规则挖掘算法的概念、原理及具体的python实现方式。

2025-03-20 19:15:46 981

原创谷歌最新发布Gemma3大模型：小规模高性能

本文介绍了谷歌发布的Gemma 3系列大模型的技术要点。

2025-03-20 14:24:08 351

原创什么是关系抽取？

本文详细介绍了关系抽取的概念及原理，并给出了基于规则匹配的关系抽取python实例。

2025-03-15 14:37:17 536

原创＜论文＞MiniCPM：利用可扩展训练策略揭示小型语言模型的潜力

本文介绍了论文《MiniCPM: Unveiling the Potential of Small Language Models with Scalable Training Strategies》的主要研究内容。

2025-03-09 23:41:48 585 1

原创机器学习模型可解释性工具——SHAP

本文介绍了机器学习可解释性工具SHAP的原理、概念及python用法。

2025-02-28 10:05:47 1256

原创 SMOTE过采样算法

本文详细介绍了SMOTE过采样的概念、原理及python实现。

2025-02-20 17:02:58 706

原创数据结构中的邻接表

本文详细介绍了邻接表的概念、原理及python实现。

2025-02-17 16:55:43 1059

原创 python实战（十七）——基于对比学习的跨语言文本对齐

本文基于kaggle的开源数据集进行了跨语言文本对齐的python实践。

2025-02-17 14:59:55 706

原创什么是元学习？

本文详细介绍了元学习的概念、原理。

2025-02-15 12:17:23 1153

原创数据结构中的邻接矩阵

本文详细介绍了邻接矩阵的概念、原理及python实现方式。

2025-02-13 16:28:50 1149

原创＜论文＞通过频率分解MoE来增强时序预测能力

本文详细介绍了论文《FreqMoE: Enhancing Time Series Forecasting through Frequency Decomposition Mixture of Experts》的研究内容及核心创新点。

2025-02-13 09:51:05 1435

原创 python实战（十六）——基于LSTM的股价预测

本文基于特斯拉股价数据集展示了使用LSTM进行时序预测的python建模过程。

2025-02-09 09:33:49 1585

原创＜论文＞DeepSeek-R1：通过强化学习激励大语言模型的推理能力（深度思考）

本文详细介绍了论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning | Papers With Code》的主要研究内容及创新点。

2025-02-07 18:30:48 3137 2

原创 DeepSeek中用到的Grouped-Query Attention技术是什么来头？

本文详细介绍了Grouped-Query Attention的概念、原理以及python实现。

2025-02-07 13:54:22 924

原创 DeepSeek中的Multi-head Latent Attention技术

本文详细介绍了DeepSeek大模型所用到的多头隐注意力机制的概念、核心原理及python实现。

2025-02-06 14:27:22 2964

原创什么是图神经网络？

本文详细介绍了图神经网络GNN的概念及python实现。

2025-02-06 13:13:43 1546

原创什么是门控循环单元？

本文详细介绍了门控循环单元GRU的基本概念及核心算法，并给出了python实现的示例。

2025-02-01 10:30:50 1860

原创什么是长短期记忆网络？

本文详细介绍了LSTM的概念、原理及python实现。

2025-01-29 18:01:38 1229

原创什么是循环神经网络？

本文详细介绍了RNN的概念、原理及python实现方式。

2025-01-28 13:04:59 748

原创什么是卷积神经网络？

本文详细介绍了卷积神经网络的概念、原理及python实现。

2025-01-27 11:30:01 1632

原创算法中的时间复杂度和空间复杂度

本文详细介绍了时间复杂度和空间复杂度的概念及常见类型。

2025-01-23 18:07:24 1133

原创＜论文＞大模型可以在手机上运行？

本文介绍了论文《MiniCPM-V: A GPT-4V Level MLLM on Your Phone》的核心内容。

2025-01-23 16:11:05 913

原创 python实战（十五）——中文手写体数字图像CNN分类

本文基于汉字手写体数字图像进行了CNN分类实战。

2025-01-22 20:07:24 938 6

原创＜论文＞用于大语言模型去偏的因果奖励机制

本文介绍了论文《Beyond Reward Hacking: Causal Rewards for Large Language Model Alignment》的主要研究内容。

2025-01-22 17:50:07 1330

空空如也

空空如也