- 博客(34)
- 收藏
- 关注
原创 近日部署跑通的若干多模态模型总结与论文概述
videochat-flash模型是由上海AI lab研究人员等开发的一款MLLM模型,以往模型的难点在于如何处理长时间的视频。该模型的创新点在于:1.片段级压缩:将视频分割为片段,通过时空注意力(UMT-L编码器)和相似令牌合并(ToMe),将每帧压缩至16个令牌(压缩比1/50)。2.视频级压缩:在LLM推理时渐进丢弃冗余令牌(浅层均匀丢弃,深层基于文本引导的注意力选择),减少计算量且提升性能。LongVid数据集。
2025-05-10 22:48:45
1034
原创 近几日碰见的钉子和摔的跤
然后就是吃了wsl的亏,我的wsl下面的ubuntu22.04是装在c盘的,这下给我坑大了,稍稍在wsl里面扒了个环境的镜像安装,就给我c盘爆红了,悲愤交加之下怒卸ubuntu子系统。首先我就犯了个大错误,我刚刚开始是用win系统部署的,这个其实有些唐,由于刚刚入行,对行内不甚了解,原来设计人工智能开发与部署是基本不用win系统的,这个给我卡懵了。这下可苦了我啊,环境配置是集大成之学,难度比较高,我作为一个本科大三的学生实在是拿捏不了这种复杂项目的本地部署和测试。
2025-02-26 14:15:59
220
2
原创 verilog测试平台设计与verilog的synthesis
verilog模块代码在写好后,还需要进行调试和仿真,这有些类似于hspice中的测试文件,也要包括声明,激励定义,结果处理。Testbench(测试平台)是数字电路设计验证中的核心工具,用于模拟和验证硬件设计(DUT, Design Under Test)的功能正确性。其核心原理是通过仿真环境生成输入激励、监测输出响应,并与预期结果对比。
2025-02-23 22:20:45
1057
原创 在wsl环境中配置和开发verilog(一种比较新颖的verilog开发指南)
WSL是windows中自带的linux子系统,笔者在若干月前首次接触其便爱不释手,verilog作为一种硬件解释语言,可否像c语言那样被游刃有余的编译和运行呢,笔者这次大胆的尝试在WSL环境+VSCODE+Iverilog开发verilog。上面的文件命名为my_testbench.v,是测试代码,有点类似于嵌入式开发中的main.c,在其中实例化我们写的加法器模块。my_module.vcd是在my_testbench.v中规定的生成波形文件,要用vvp来加工生成的.out文件来生成波形文件。
2025-02-21 23:24:14
704
1
原创 ROS2学习笔记(基于幻尔公司mentorpi相关文档)
采用ROS2的树莓派通常应当是被当作上位机使用的,树莓派本身的引脚是根本不够去驱动四个编码电机的,因此往往还需要与其连接一个下位机(通常是stm32开发板),上位机和下位机之间通过串口通信来进行,全栈式开发机器人,从树莓派ROS2开发包到stm32开发包到基础电机控制,PCB板绘制是很困难的。树莓派ROS2是作为机器人学的上层建筑的,而市面上的大多数机器人都是采用ROS2系统来控制的,这是因为该系统的模块化程度很高。
2025-02-11 12:05:37
1190
原创 难道他真的是装环境的天才(双系统ubuntu24.04+cuda+pytorch+cudnn安装)
难道他真的是装环境的天才(双系统ubuntu24.04+cuda+pytorch+cudnn安装)
2025-01-31 15:41:47
625
原创 vscode+WSL2(ubuntu22.04)+pytorch+conda+cuda+cudnn安装系列
环境配置是电信技术中的集大成者,我本人也不是很懂,经常失败是很正常的。但是千万记得,不要直接去下载国外网站大文件,否则下载失败再重来会是很痛苦的。
2025-01-30 19:38:47
1952
原创 我的创作纪念日
到2023年开学我加入了一个机器人社团,后面顺利通过了选拔获得了竞赛名额,2024年寒假我在学习HAL库和stm32深度的内容。最早的是2024年4月末的电赛瑞萨杯省赛,结果是省一,5月15日是机创省赛,也拿了省一,在24年的暑假7月19日去武汉打机创决赛,拿了国家一等奖,回西安后又准备电赛TI杯,在8月5号的省赛拿了省二,后面我又去打robocup了,备赛时间很漫长,有三个月,到24年11月1号在西安国际会展中心正式上场,历经艰辛,拿了国家一等奖。在CSDN上面创造其实已经成为我学习的一个动力来源了。
2025-01-23 18:53:41
451
原创 区分32位系统,64位系统,x86,ARM
所谓32位和64位就很好理解了,也就是CPU一次可以处理多少位的数据,最早是16位,后来是32位,现在是64位,因此CPU可以支持的最大内存也不断增加,到64位的时候已经可以支持极大的内存了,32位系统最大支持4GB,64位可以支持16GB,32GB的DRAM.x86架构和ARM架构并列,x86其实指的是复杂的指令集,所谓8086汇编语言就是指的是在x86架构下的汇编指令集。首先x86和32位与64位是不同的概念,x86指的是在intel公司开发的8086处理器及其衍生产品,后来x86变成了通用术语。
2025-01-20 23:49:32
463
原创 AUGUST的深度学习笔记三(八,十二)
对隐状态使用循环计算的神经网络称为循环神经网络。循环神经网络的隐状态可以捕获直到当前时间步序列的历史信息,且循环神经网络模型的参数数量不会随着时间步的增加而增加。因此可以使用循环神经网络来创建字符级语言模型,且可以应用困惑度来评价语言模型的质量。困惑度的最好的理解是“下一个词元的实际选择数的调和平均数”,在最好的情况下,困惑度为1,预测出来的词是合情合理的且该概率为100%,在最坏的情况下困惑度达到正无穷。
2025-01-20 20:00:08
970
原创 CMD与POWER SHELL的区别
CMD是windows系统的古老遗留物,十分的呆,而且仅仅能作为命令行交互操作,但power shell就不一样了,其是建立在cmdlet编程语言基础之上的,或者说power shell其中可以执行编程功能,而且power shell对部分linux命令也支持,功能比cmd更为强大,cmd能干的它能干,cmd不能干部的它也能干。那么问题来了,power shell这么强大,为什么没有完全代替cmd呢,这是因为很多老程序员已经熟悉cmd了,不愿意改用power shell。
2025-01-14 11:46:08
348
原创 tb6600与步进电机的常见接线法
总的来说,tb6600是驱动步进电机的最常用的驱动器,其接线情况大概有两种。根据步进电机的引出来的线来确定。注意:通常来说,ENA端的正负都不用接。步进电机的电压驱动建议在12-24v之间。
2024-05-13 08:58:21
615
原创 机创赛经验
机创赛对于机械的要求比较高,而对于电控的要求不高。像弄什么微信小程序,弄什么智能ai语音识别,弄什么自动路线规划,弄什么雷达避障探测之类的是没啥帮助的。把机械结构做的有创新,做的高大上才是最关键的。评委老师面对千篇一律的机械结构,能让他眼前一亮的就是不一样的。让本科生自己独立设计高级机械结构很困难,那么解决办法是把别的领域的机械结构移植到赛题领域,这也是一种创新。打机创赛一定要提前规划好,否则机械占用的时间太长了,电控时间不够,功能实现不了也基本是白搭。比如,做机械的要给做电控的留够时间。
2024-05-12 22:37:35
696
原创 机器人电源模块经验
以一个普通的扭矩为20kg*cm的舵机来说,其启动电流可能达到将近两安培,工作电流也大于一安培,而常见的电压转化模块(将12v转化为5v,3.3v等)的额定电流是两安培,其装有可恢复保险丝,一旦电路超过两安培就会自动断电。这是一个大坑,很不容易发现。最近打比赛的时候发现,舵机的特点是工作电流大,工作电压小,普通直流电机,编码电机和步进电机的工作特点是工作电压大,但是工作电流小。而要驱动多个舵机的话,建议方法是换额定电流比较大的稳压降压模块(额定电流是5A)。
2024-05-12 15:33:52
426
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人