- 博客(13)
- 收藏
- 关注
原创 大模型低秩微调技术 LoRA 深度解析与实践
探讨了参数高效微调(PEFT)技术中的LoRA方法,针对大模型微调面临的资源挑战,提出通过低秩矩阵分解实现高效适配
2025-06-06 11:28:47
670
原创 大模型:从基座构建到应用落地--预训练与后训练及个人解析-2025.6
探讨大模型预训练与后训练(包括微调和各类应用策略)的原理、成本、技术挑战与优势,为读者构建一个尽量全面的技术图景,结合当前行业趋势,为读者提供一个参考。
2025-06-03 21:06:04
1246
1
原创 大模型的分词器——算法及示例
分词是自然语言处理的基础技术,将文本分割为离散单元(如单词、子词或字符)。主流方法包括词级、字符级和子词分词,其中子词分词(如BPE、WordPiece)通过拆分单词平衡了词汇表大小与序列长度。BPE通过频次合并字符对构建词汇表,WordPiece则基于互信息分数优化合并策略。这些方法解决了未知词汇问题,提升了模型效率,广泛应用于GPT、BERT等大型语言模型。分词器的选择需考虑任务需求(单语言/多语言)和文本特性。
2025-06-03 15:30:59
998
原创 从C:\到/:Windows用户极速通关Ubuntu Linux的航海万字指南
本篇博客将作为您的罗盘和海图,引导您从Windows的舒适区出发,以最直观、最易懂的方式——对比学习——深入探索Ubuntu Linux的奥秘。
2025-05-30 15:38:04
1322
原创 GraphRAG: 解锁大模型对叙述性私有数据的检索能力
微软最新开源的GraphRAG确实能补上传统RAG的短板,显著提升精确度。但是速度慢、成本高是当前最大问题。
2025-05-30 14:51:43
954
原创 Lerobot框架使用(含本地数据训练)
本文详细的介绍了使用lerobot框架在so-arm100机械臂上复现相关robot learning算法详细流程(含本地数据训练和错误排查)。
2025-05-29 17:39:21
823
2
原创 Graph Structure Learning for Robust GNNs
关于图结构学习在增强图神经网络在对抗环境下的鲁棒性。提出了pro-GNN的新框架。
2024-09-12 16:55:09
1007
原创 联邦学习研究方向及论文推荐(一)
关于联邦学习的概念在网上资源丰富,但是考虑到有些同学在接触时缺少对研究方向细致了解而困恼,根据一些综述论文博客等资料为大家做个易于理解的详细介绍。由于内容较多且分为两部分。
2024-06-03 19:39:09
6450
4
关于语音交互领域机器人的相关文档调研
2025-05-30
MIT Cheetah Software开源项目
2024-09-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人