自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(253)
  • 收藏
  • 关注

原创 base64形式的图片数据保存方法

Pillow是一个强大的图像处理库,可以方便地读取、处理和保存图像。

2025-05-13 15:59:50 210

原创 通过共享盘路径查看共享盘所在位置

sss。

2025-05-13 15:53:00 111

原创 ubuntu下复制文件夹,除去某个文件夹

【代码】ubuntu下复制文件夹,除去某个文件夹。

2025-05-13 10:31:22 127

原创 pool层种类

output_size 的形状为 (H, W),H 和 W 可以不同,如果 output_size 是一个整数,将被转换为 (int, int)。输入应为:(N, C, H_in, W_in) 或 (C, H_in W_in)。输出 = (N, C, S_0, S_1) 或 (C, S_0, S_1)。torch.Size([10, 40, 3, 6])参考:Understand torch.nn.AdaptiveAvgPool2d() with Examples - PyTorch Tutorial。

2025-04-16 21:44:36 299

原创 腾讯云账号获取SecretId和SecretKey及混元模型调用

调用示例可以看到传参是什么,立即体验中提供了怎么请求的代码。中找到自己需要的模型,分别点。这里是多模态的传参示例。

2025-03-05 16:32:25 1080

原创 PIL画图 透明色的圆、框,虚线

PIL

2025-02-27 11:16:11 159

原创 在windows系统上访问ubunutu系统的文件夹

在smb.conf文件中添加下面部分,共享ubuntu系统中的/data1,表明这个文件夹在windows下不仅仅只是可读,还可以被写和执行2. 重启smb服务。

2024-12-02 11:04:29 954

原创 npy文件中字典形式的np.object数据,怎么读取

numpy数据保存在npy文件中,通过np.load()加载,打印出来,跟字典形式一样。打印数据类型是np.object。想要和字典一样读取key,value。

2024-11-22 16:41:31 293

原创 ubuntu安装openvino

按图片上的选择,按步骤执行。

2024-10-31 15:41:18 304

原创 matplotlib.pyplot plt 画图时速度过慢的解决方案

通过opencv读四张图,然后用matplotlib画图,然后保存。耗时0.6s左右,感觉这个耗时太长。的耗时为0.3s左右。

2024-10-26 16:13:08 484

原创 读取视频指定帧的方式

速度为读取一帧图像耗时。

2024-10-23 13:52:21 563

原创 一些漂亮的颜色

【代码】一些漂亮的颜色。

2024-08-20 14:19:42 296

原创 多进程 读取图片shape

【代码】多进程 读取图片shape。

2024-08-13 13:51:51 122

原创 torch.split与torch.chunk的用法及区别

当split_size_or_sections 为list时,那么tensor结构会一共切分成len(list)这么多的小块,每个小块中的大小按照list中的大小决定,其中list中的数字总和应等于该维度的大小,否则会报错(,正好匹配,那么ouput就是大小相同的块结构。dim上数据的长度不能被。:切分后块结构 <class ‘tuple’>:需要切分的大小(int or list )为int时,tenor结构和。整除,余下的部分会少一些。作用将tensor按照。:input,待分输入。

2024-08-01 09:32:39 258

原创 使用python推理tflight(包括int8)模型

【代码】使用python推理tflight(包括int8)模型。

2024-07-29 17:51:50 223

原创 使用gradio搭建服务(三)--多轮对话

对象保存每轮对话中用户的提问和大语言模型的回复。

2024-07-24 16:49:56 758

原创 使用gradio搭建服务(二)--逐步执行

这里通过设置两个按钮,来分布执行不同的功能。使用gradio搭建逐步执行的服务。

2024-06-16 15:55:36 312

原创 文本读取时的乱码/报错

一批txt文档,有多种编码方式,怎么读取呢?

2024-04-16 15:10:22 224

原创 pytorch训练模型时加log

中添加需要跟踪的变量的值,这里的。

2024-04-15 14:48:05 367

原创 jsonl文件介绍

要将数据保存为 .jsonl 格式的文件,你需要确保每条数据都是一个有效的 JSON 对象,并且将每个对象转换为 JSON 字符串后逐行写入文件。在 .jsonl 文件中,每一行包含一个完整的 JSON 对象,这些对象之间通过新行(换行符)分隔。.jsonl每一行都是一个独立的 JSON 对象,可以单独解析。这种格式特别适合日志数据、大型数据集、流数据处理以及需要增量加载或存储的场景。jsonl 文件格式是 JSON Lines 的缩写,它是一种文本格式,用于存储结构化数据,类似于 JSON。

2024-03-11 11:31:28 5013

原创 通过base64,实现图片与字符串的互相转换

【代码】通过base64,实现图片与字符串的互换。

2024-03-04 17:01:54 473

原创 re-captioning技术是什么

模型对图片进行caption操作时,输出的标题一般描述图片中的主体,而。

2024-02-17 17:56:12 843

原创 多输入的pytorch模型转成onnx模型,及多输入的onnx模型推理

pytorch模型使用3种分辨率的输入图片,输入图片的分辨率分别为。

2024-01-31 10:25:53 806

原创 转yolov5模型时,不转后处理部分

由于部署在硬件上的时候,后处理部分硬件处理不支持,需要挪到cpu上处理。320的,检测头删掉了40。将坐标变换部分跳过,不执行。

2024-01-26 11:19:33 618

原创 Eyes Wide Shut? Exploring the Visual Shortcomings of Multimodal LLMs

论文中指出,上面这些VQA问题,人类可以瞬间给出正确的答案,但是多模态给出的结果却是错误的。是哪个环节出了问题呢?还是视觉特征与语言模型间的特征没有对齐?作者将上述问题分成了9个类别(通过将涉及的问题和选项提供chatgpt,让chatgpt将这些问题归类)上图种左边是目前的多模态结构,中间部分是两部分特征线性相加,右边是交错混合的方式。为了评价多模态模型在这些任务上的表现,建立了MMVP-VLM的测试集。探索多模态模型种视觉编码器的缺陷。通过增加自监督特征,多模态模型的能力有了提升。

2024-01-20 16:32:52 965

原创 labelme读取文件顺序

labelme的目录结构。

2024-01-03 10:34:32 653

原创 多进程读取图片

多进程读取图片,查看图片的尺寸h,w是否为(1080,1920)

2023-12-21 10:22:00 459

原创 tmux+conda环境配置不对问题解决

参考。

2023-12-20 19:10:09 707

原创 shell中的sort和uniq命令

的文本,当重复的行并不相邻时,uniq 命令是不起作用的。先对文本进行排序,然后执行。统计每行文本出现的次数。uniq的操作对象是。

2023-12-18 15:45:33 537

原创 网页中的json文档,怎么保存到本地

点击右边的三条横线——>另存页面为。

2023-12-01 11:35:28 5965

原创 使用tensorflow2.15.0版跑bert模型遇到的问题记录

函数),遇到的一些问题记录。使用官方的bert模型。

2023-11-30 09:35:38 1040

原创 pandas(八)--实战一下

收到一批数据,数据形式。采集数据的间隔时间是10分钟,全天采集数据,每天的数据量是144条。

2023-11-28 11:49:03 531

原创 时间数据与字符串间相互转换

【代码】时间数据与字符串间相互转换。

2023-11-28 10:32:59 547

原创 多模态模型的语言幻觉和视觉幻觉

语言幻觉”是一种不基于感官输入的感知,而“视觉幻觉”是对正确感官输入的误解文章中设计了一系列的能表现语言幻觉和视觉幻觉的实验,共200对图像-问题-答案对。包括表格、地图、海报、视频帧等,以及修改后的图片,这些修改的图片只有小幅的修改,但是对于同一问题的答案是完全不同的。这些实验分为两大类视觉依赖型和视觉辅助型。视觉依赖型的问题的答案与图片的内容强相关(比如:图片的左上角是什么?)视觉补充型是一些常识型的问题(比如:提供一张中国地图,问上海和北京两个城市的面积,哪个更大 )

2023-11-02 17:02:36 589

原创 torch.distributed.elastic.multiprocessing.api: [ERROR] failed (exitcode: -7)

在docker中运行时,由于配置的共享内存不足导致。新建docker时,

2023-10-31 14:39:49 2327

原创 新建包含cuda和cudnn的docker

背景:服务器的cudnn版本太低了,没有权限去修改。故新建包含cuda和cudnn的docker步骤。

2023-10-31 11:17:23 1346 4

原创 在pycharm中创建python模板文件

在文本框中输入模板内容。

2023-10-23 16:16:34 1465

原创 混淆矩阵绘制

【代码】混淆矩阵绘制。

2023-10-20 18:30:20 629

原创 BLIP2模型加载在不同设备上

现在大语言模型越来越大,占用的内存越来越多,这导致内存较小的设备无法体验大模型的效果。放在0号显卡上,其余模型放在cpu上。模型的名称在模型的index文件中。提供了将一个大模型分别加载在gpu和cpu上的方法。

2023-10-08 17:35:10 1166

原创 关于睡眠的知识

白天活跃的突触比较多,晚上的少一些。晚上相当于是在“洗脑”。白天一直活跃的突触好比一直在运行的电脑,如果一直不睡觉,内存会满溢,晚上休息相当于是清理内存。

2023-09-19 09:24:38 190

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除