- 博客(144)
- 收藏
- 关注
原创 <论文>(微软)WINA:用于加速大语言模型推理的权重感知神经元激活
本文介绍了论文《WINA: Weight Informed Neuron Activation for Accelerating Large Language Model Inference》的核心创新点。
2025-06-05 09:44:02
1051
原创 <论文>(微软)避免推荐域外物品:基于LLM的受限生成式推荐
本文介绍了论文《Avoid Recommending Out-of-Domain Items: Constrained Generative Recommendation with LLMs》的主要研究内容。
2025-05-14 10:14:11
1288
原创 <论文>(字节跳动)使用大语言模型进行时间序列理解和推理
本文介绍了论文《ChatTS: Aligning Time Series with LLMs via Synthetic Data for Enhanced Understanding and Reasoning》的主要内容。
2025-05-06 09:14:25
1223
原创 <论文>(亚马逊)Rec-R1:通过强化学习连接大模型与推荐系统
本文介绍了论文《Rec-R1: Bridging Generative Large Language Models and User-Centric Recommendation Systems via Reinforcement Learning》的主要内容。
2025-04-30 09:09:37
1185
原创 <论文>(谷歌)用于时序链接预测的迁移学习
本文介绍了谷歌牵头于2025年4月发表的论文《Transfer Learning for Temporal Link Prediction》的主要内容。
2025-04-25 17:06:30
932
原创 <论文>EasyEdit2:高效控制大模型行为
本文介绍了论文《EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models》的核心创新点。
2025-04-25 09:12:12
962
原创 <论文>让RAG变得高效且简单:LightRAG
本文介绍了论文《LightRAG: Simple and Fast Retrieval-Augmented Generation》的核心创新点。
2025-04-18 09:47:49
1029
原创 <论文>MiniCPM:利用可扩展训练策略揭示小型语言模型的潜力
本文介绍了论文《MiniCPM: Unveiling the Potential of Small Language Models with Scalable Training Strategies》的主要研究内容。
2025-03-09 23:41:48
585
1
原创 <论文>通过频率分解MoE来增强时序预测能力
本文详细介绍了论文《FreqMoE: Enhancing Time Series Forecasting through Frequency Decomposition Mixture of Experts》的研究内容及核心创新点。
2025-02-13 09:51:05
1435
原创 <论文>DeepSeek-R1:通过强化学习激励大语言模型的推理能力(深度思考)
本文详细介绍了论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning | Papers With Code》的主要研究内容及创新点。
2025-02-07 18:30:48
3137
2
原创 DeepSeek中用到的Grouped-Query Attention技术是什么来头?
本文详细介绍了Grouped-Query Attention的概念、原理以及python实现。
2025-02-07 13:54:22
924
原创 DeepSeek中的Multi-head Latent Attention技术
本文详细介绍了DeepSeek大模型所用到的多头隐注意力机制的概念、核心原理及python实现。
2025-02-06 14:27:22
2964
原创 <论文>大模型可以在手机上运行?
本文介绍了论文《MiniCPM-V: A GPT-4V Level MLLM on Your Phone》的核心内容。
2025-01-23 16:11:05
913
原创 <论文>用于大语言模型去偏的因果奖励机制
本文介绍了论文《Beyond Reward Hacking: Causal Rewards for Large Language Model Alignment》的主要研究内容。
2025-01-22 17:50:07
1330
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人