自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

XuanyuXiang

自律

  • 博客(53)
  • 收藏
  • 关注

原创 mmdetection 操作记录

或者可以把 mmengine 和 mmdet 的 github 源码下载到 project 文件夹下,这样不需要指令和。个人更建议源码方式,因为方便修改 mmengine 和 mmdet 下的代码。否则是按照 pip 包方式调用,不好修改其中的代码。

2025-12-29 12:05:51 199

原创 git 常用操作

【代码】git 常用操作。

2025-11-13 09:24:19 114

原创 Faster RCNN - RPN作用原理

以mmdet中的mmdet/configs/_base_/models/faster_rcnn_r50_fpn.py实现为参考,介绍其中RPN的工作原理。RPN的网络结构:shared conv * 1 + 2 conv heads 相当于对feat map的每个位置进行了cls和bbox预测。

2025-10-05 11:48:50 801

原创 coco&voc数据格式和工具使用

coco是一种常见的目标检测标注格式,按该格式进行标注后可以直接调用pycocotools库进行读取和指标计算,十分方便。

2025-09-02 10:06:37 251

原创 QLoRA操作记录

对于VLM,在vpm(视觉特征提取器)和llm之间会有resampler,一些resampler使用了nn.MultiheadAttention。如果要再加载save_path中的模型参数并进行训练,可以将save_path下的内容复制到base_model文件夹中(该文件夹下包含模型构建代码),再使用上述FM9GV.from_pretrained加载。中加入"resampler",代表不对模型中的self.resampler进行量化。同理,测试发现"lm_head"也不能量化,否则报错。

2025-07-03 21:16:42 246

原创 更新ubuntu软件源遇到GPG error

执行。

2025-05-21 19:46:45 1029

原创 目标检测指标计算

假设我们有一个简单的例子,包含以下数据:这5个点可以组成PR曲线。

2025-05-16 15:35:03 1322

原创 ubuntu安装/更新nvidia显卡驱动

建议采用ubuntu自带的软件管理程序进行在线安装和更新,而不是采用离线安装包等方式。

2025-05-16 10:54:05 2032

原创 ubuntu使用Postfix外部SMTP代理发送邮件

ubuntu使用指令发送邮件。普通的mail指令通常被识别为垃圾邮件,且由于ubuntu主机邮箱地址不正规,执行指令几次后常被鉴定为风险地址从而禁止。对此,使用外部SMTP代理,驱动正规地址(例如qq邮箱)向指定邮箱发送。

2025-05-11 21:40:20 676

原创 配置PaddleOCR环境

安装PaddleOCR环境

2025-03-27 11:12:20 570

原创 调试pytorch DDP训练代码

Pytorch提供了Distributed Data Parallel (DDP)工具以便在多机多卡上并行训练,并提供了torchrun指令来启动。然而,torchrun指令启动不便于debug。可以通过修改成等价mp.spawn启动方式先debug,完成后再转回torchrun指令启动正式训练。

2024-12-31 10:33:05 746

原创 配置deepspeed环境

【代码】配置deepspeed环境。

2024-12-12 16:22:57 456

原创 huggingface数据&模型加载

以为例,使用huggingface-cli工具下载该数据集到本地。

2024-11-11 14:44:06 1712

原创 【代码模板】Pytorch混合精度训练

当使用AMP混合精度训练时,可以提升训练速度,并降低对显存的占用。下面提供一个使用AMP训练的代码demo。

2024-10-14 21:14:55 649 2

原创 【代码模板】参数配置库 - Hydra

编码项目代码时,往往涉及到很多的超参数。Hydra可以帮助整理这些超参数,使实验过程中的参数设置更清晰。

2024-10-06 16:17:35 821

原创 【代码模板】统计数据集的均值和标准差

在数据预处理时,通常会对样本进行标准化操作,使样本的均值为0,标准差为1,从而提高训练的稳定性。进行标准化操作时,需要预先统计数据集的均值和标准差。下面的demo展示了如何实现这个操作。

2024-10-06 10:33:13 394

原创 【代码模板】Shell

【代码】【代码模板】Shell。

2024-09-28 09:22:51 326

原创 【代码模板】Python Decorator / 装饰器

在 python 里面,函数是一个对象,但是是 callable 的对象,因此后面可以接 () 传入参数。这也说明函数可以被当作参数传入其他的函数里面,同时函数也可以作为返回值。

2024-09-28 09:20:58 533

原创 【SOP】Windows下安装Neo4j流程

Neo4j 是一个基于图形结构的 NoSQL 数据库,专门用于存储和管理图数据。与传统的关系型数据库不同,Neo4j 使用 图(graph)的形式来表示数据,其中数据点(称为 节点)通过 边(relationships)相互连接。Neo4j使用Java语言开发。

2024-09-22 21:01:46 2967 2

原创 Linux常用指令

linux常用指令。

2024-09-19 16:15:19 295

原创 【代码模板】可视化

代码模板:可视化。

2024-09-13 21:59:15 504

原创 Word使用手册

WORD使用手册。

2024-09-13 21:34:34 1121

原创 【代码模板】张量操作,文件读写

这里实现了一个功能 demo,输入array 是 (13, 17, 2) float32,代表某一帧的所有人体关键点识别结果,该帧有13个人,每个人识别17个关键点,每个点用 x,y 坐标表示。现在希望根据每个人关键点重心的 x 坐标值,按从小到大的规则,沿第一维对 array 重新排序。

2024-09-12 16:45:39 271

原创 【安装环境】配置MMTracking环境

numpy 的版本不能太高,否则后面安装时会发生冲突。先安装 numpy,因为 pytorch 的安装会自动配置高版本 numpy。mmtracking 支持的 torch 版本有限,需要找到合适的。

2024-09-12 09:11:57 837

原创 【SOP】使用MMDeploy将MMAction2的模型转换为TensorRT

就是转换好的 TensorRT 文件。

2024-09-11 20:39:55 992

原创 C盘太大怎么办

C:\Windows\Installer是一个很大的文件夹,可以移动到其他盘减少C盘负担。第一次寻找 C:\Windows\Installer 可能发现没有该可视化文件夹。如果要恢复该文件夹的位置,删除 symbolic link。

2024-09-11 19:19:49 5720

原创 Pycharm使用手册

默认的debugger不显示torch.Tensor的shape,导致debug效率较低。

2024-09-09 10:11:25 807 1

原创 配置MMAction2环境

安装MMAction2环境流程。

2024-09-09 10:06:09 646

原创 配置TensorRT环境

配置TensorRT环境的流程。

2024-09-08 21:06:11 1095

原创 安装CUDA,cuDNN,NCCL

cuda,cudnn,nccl的安装方法

2024-09-06 15:18:57 3611 3

原创 从PPT中导出高质量的PDF图片

选项 -> 高级 -> 图像大小和质量 -> 不压缩。

2024-09-04 23:05:01 4296

原创 Docker常用指令和操作

记录docker使用过程中的常用操作和指令。

2024-09-04 22:47:01 877

原创 Obsidian使用手册

记录Obsidian使用过程中的常用操作。

2024-09-04 15:02:06 476

原创 Mamba方法精读

Mamba论文精读笔记,持续更新

2024-08-25 20:58:58 1447

原创 理解 Progressive GAN

介绍模型 Progressive GAN,PGGAN, 论文《PROGRESSIVE GROWING OF GANS FOR IMPROVEDQUALITY, STABILITY, AND VARIATION》。

2023-01-20 17:28:45 1328

原创 理解 Swin Transformer

介绍了 Swin Transformer 的设计动机和工作原理。

2022-11-26 21:15:11 2731

原创 理解 Vision Transformer - ViT

本文介绍了 Vision Transformer 的提出背景,动机和实现原理。

2022-11-22 22:19:29 1093

原创 linux 根目录结构

所有 linux 目录相关知识记录,会随着自己的学习逐渐更新。

2022-11-09 19:45:11 648

原创 VisualStudio 各目录含义

总结了 VS 各目录和文件的功能。

2022-11-08 21:42:51 1674

原创 理解 Inception Networks

本文按时间顺序介绍 Inception modules 的进化过程

2022-11-06 11:06:51 1858 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除