自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(144)
  • 收藏
  • 关注

原创 <论文>(微软)WINA:用于加速大语言模型推理的权重感知神经元激活

本文介绍了论文​《WINA: Weight Informed Neuron Activation for Accelerating Large Language Model Inference》的核心创新点。

2025-06-05 09:44:02 1051

原创 推荐模型之Wide&Deep

本文详细介绍了Wide&Deep算法的概念、原理和python实现。

2025-05-28 13:10:33 711

原创 推荐模型之协同过滤

本文详细介绍了推荐系统中的经典算法——协同过滤算法的概念、原理,并给出了python示例。

2025-05-21 09:39:13 1009

原创 <论文>(微软)避免推荐域外物品:基于LLM的受限生成式推荐

本文介绍了论文​《Avoid Recommending Out-of-Domain Items: Constrained Generative Recommendation with LLMs》的主要研究内容。

2025-05-14 10:14:11 1288

原创 <论文>(字节跳动)使用大语言模型进行时间序列理解和推理

本文介绍了论文​《ChatTS: Aligning Time Series with LLMs via Synthetic Data for Enhanced Understanding and Reasoning》的主要内容。

2025-05-06 09:14:25 1223

原创 PEFT实战(三)——IA3参数高效微调

本文基于HuggingFace教程详细介绍了IA3参数高效微调方法的概念、原理及python实现。

2025-04-30 16:35:12 792

原创 <论文>(亚马逊)Rec-R1:通过强化学习连接大模型与推荐系统

本文介绍了论文《Rec-R1: Bridging Generative Large Language Models and User-Centric Recommendation Systems via Reinforcement Learning》的主要内容。

2025-04-30 09:09:37 1185

原创 <论文>(谷歌)用于时序链接预测的迁移学习

本文介绍了谷歌牵头于2025年4月发表的论文​《Transfer Learning for Temporal Link Prediction》的主要内容。

2025-04-25 17:06:30 932

原创 <论文>EasyEdit2:高效控制大模型行为

本文介绍了论文​《EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models》的核心创新点。

2025-04-25 09:12:12 962

原创 什么是MMOE?

本文详细介绍了MMOE的概念、原理及其网络架构的python实现。

2025-04-18 16:58:54 778

原创 <论文>让RAG变得高效且简单:LightRAG

本文介绍了论文​《LightRAG: Simple and Fast Retrieval-Augmented Generation》的核心创新点。

2025-04-18 09:47:49 1029

原创 PEFT实战(二)——基于Prompt的参数高效微调

本文介绍了基于prompt的参数高效微调方法,并进行了P-tuning的python实战。

2025-04-11 09:20:36 468

原创 什么是PID控制?

本文详细介绍了工业场景中常用的PID控制算法的概念、原理及其python实现。

2025-04-02 21:59:13 681

原创 PEFT实战(一)——LoRA

本文基于PEFT库,展示了如何使用LoRA进行大模型的参数高效微调策略。

2025-04-02 11:12:44 1259

原创 CPU跑大模型怎么加速?

本文介绍了HuggingFace官方教程中的CPU大模型推理加速方案。

2025-03-26 17:59:27 1153

原创 什么是FP-growth频繁项集挖掘?

本文详细介绍了FP-Growth频繁项集挖掘算法的概念、原理以及python实现。

2025-03-26 15:53:16 512

原创 什么是Apriori关联分析?

本文详细介绍了Apriori关联规则挖掘算法的概念、原理及具体的python实现方式。

2025-03-20 19:15:46 981

原创 谷歌最新发布Gemma3大模型:小规模高性能

本文介绍了谷歌发布的Gemma 3系列大模型的技术要点。

2025-03-20 14:24:08 351

原创 什么是关系抽取?

本文详细介绍了关系抽取的概念及原理,并给出了基于规则匹配的关系抽取python实例。

2025-03-15 14:37:17 536

原创 <论文>MiniCPM:利用可扩展训练策略揭示小型语言模型的潜力

本文介绍了论文​《MiniCPM: Unveiling the Potential of Small Language Models with Scalable Training Strategies》的主要研究内容。

2025-03-09 23:41:48 585 1

原创 机器学习模型可解释性工具——SHAP

本文介绍了机器学习可解释性工具SHAP的原理、概念及python用法。

2025-02-28 10:05:47 1256

原创 SMOTE过采样算法

本文详细介绍了SMOTE过采样的概念、原理及python实现。

2025-02-20 17:02:58 706

原创 数据结构中的邻接表

本文详细介绍了邻接表的概念、原理及python实现。

2025-02-17 16:55:43 1059

原创 python实战(十七)——基于对比学习的跨语言文本对齐

本文基于kaggle的开源数据集进行了跨语言文本对齐的python实践。

2025-02-17 14:59:55 706

原创 什么是元学习?

本文详细介绍了元学习的概念、原理。

2025-02-15 12:17:23 1153

原创 数据结构中的邻接矩阵

本文详细介绍了邻接矩阵的概念、原理及python实现方式。

2025-02-13 16:28:50 1149

原创 <论文>通过频率分解MoE来增强时序预测能力

本文详细介绍了论文《FreqMoE: Enhancing Time Series Forecasting through Frequency Decomposition Mixture of Experts》的研究内容及核心创新点。

2025-02-13 09:51:05 1435

原创 python实战(十六)——基于LSTM的股价预测

本文基于特斯拉股价数据集展示了使用LSTM进行时序预测的python建模过程。

2025-02-09 09:33:49 1585

原创 <论文>DeepSeek-R1:通过强化学习激励大语言模型的推理能力(深度思考)

本文详细介绍了论文​《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning | Papers With Code》的主要研究内容及创新点。

2025-02-07 18:30:48 3137 2

原创 DeepSeek中用到的Grouped-Query Attention技术是什么来头?

本文详细介绍了Grouped-Query Attention的概念、原理以及python实现。

2025-02-07 13:54:22 924

原创 DeepSeek中的Multi-head Latent Attention技术

本文详细介绍了DeepSeek大模型所用到的多头隐注意力机制的概念、核心原理及python实现。

2025-02-06 14:27:22 2964

原创 什么是图神经网络?

本文详细介绍了图神经网络GNN的概念及python实现。

2025-02-06 13:13:43 1546

原创 什么是门控循环单元?

本文详细介绍了门控循环单元GRU的基本概念及核心算法,并给出了python实现的示例。

2025-02-01 10:30:50 1860

原创 什么是长短期记忆网络?

本文详细介绍了LSTM的概念、原理及python实现。

2025-01-29 18:01:38 1229

原创 什么是循环神经网络?

本文详细介绍了RNN的概念、原理及python实现方式。

2025-01-28 13:04:59 748

原创 什么是卷积神经网络?

本文详细介绍了卷积神经网络的概念、原理及python实现。

2025-01-27 11:30:01 1632

原创 算法中的时间复杂度和空间复杂度

本文详细介绍了时间复杂度和空间复杂度的概念及常见类型。

2025-01-23 18:07:24 1133

原创 <论文>大模型可以在手机上运行?

本文介绍了论文​《MiniCPM-V: A GPT-4V Level MLLM on Your Phone》的核心内容。

2025-01-23 16:11:05 913

原创 python实战(十五)——中文手写体数字图像CNN分类

本文基于汉字手写体数字图像进行了CNN分类实战。

2025-01-22 20:07:24 938 6

原创 <论文>用于大语言模型去偏的因果奖励机制

本文介绍了论文​《Beyond Reward Hacking: Causal Rewards for Large Language Model Alignment》的主要研究内容。

2025-01-22 17:50:07 1330

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除