<?xml version="1.0" encoding="utf-8" ?><rss version="2.0"><channel><title><![CDATA[bug404]]></title><description><![CDATA[知乎：https://www.zhihu.com/people/bug-404，古月居：https://www.guyuehome.com/author/611ca8f30d7f8，GitHub：https://github.com/borninfreed]]></description><link>https://blog.csdn.net/bornfree5511</link><language>zh-cn</language><generator>https://blog.csdn.net/</generator><copyright><![CDATA[Copyright &copy; bornfree5511]]></copyright><item><title><![CDATA[Qwen3.5 A100部署]]></title><link>https://blog.csdn.net/bornfree5511/article/details/158621782</link><guid>https://blog.csdn.net/bornfree5511/article/details/158621782</guid><author>bornfree5511</author><pubDate>Tue, 03 Mar 2026 21:08:33 +0800</pubDate><description><![CDATA[首 token 延迟（TTFT, Time To First Token）完成时延（E2E Latency）吞吐（tokens/s）错误率（HTTP 非 2xx + 超时）Throughput∑i1NoutputtokensiTotalTimeThroughputTotalTime∑i1N​outputtokensi​​Latencyav。]]></description><category></category></item><item><title><![CDATA[jetson orin nano super AI模型部署之路（十）使用frp配置内网穿透，随时随地ssh到机器]]></title><link>https://blog.csdn.net/bornfree5511/article/details/147857093</link><guid>https://blog.csdn.net/bornfree5511/article/details/147857093</guid><author>bornfree5511</author><pubDate>Sat, 10 May 2025 18:12:13 +0800</pubDate><description><![CDATA[frp 采用 Golang 编写，支持跨平台，仅需下载对应平台的二进制文件即可执行，没有额外依赖。frp 是一个专注于内网穿透的高性能的反向代理应用，支持 TCP、UDP、HTTP、HTTPS 等多种协议。可以将内网服务以安全、便捷的方式通过具有公网 IP 节点的中转暴露到公网。市面上一些主流的内网穿透工具有：Ngrok，Natapp，花生壳，Ssh、autossh，Frp，Lanproxy，Spike。使用frp只需要自己有一台公网IP的云主机即可，成本相对很低。]]></description><category></category></item><item><title><![CDATA[jetson orin nano super AI模型部署之路（八）tensorrt C++ api介绍]]></title><link>https://blog.csdn.net/bornfree5511/article/details/147705277</link><guid>https://blog.csdn.net/bornfree5511/article/details/147705277</guid><author>bornfree5511</author><pubDate>Sun, 04 May 2025 23:17:13 +0800</pubDate><description><![CDATA[我们基于tensorrt-cpp-api这个仓库介绍。这个仓库的代码是一个非常不错的tensorrt的cpp api实现，可基于此开发自己的项目。我们从src/main.cpp开始按顺序说明。
这里Options是在src/engine.h中声明的一个结构体
二、构建tensorrt推理的engine

这里Engine是一个模板类，继承字IEngine类。IEngine 是一个抽象接口类，定义了 TensorRT 推理引擎的核心功能。
它包括构建和加载网络、运行推理、获取输入和输出张量维度等功能。
通过模]]></description><category></category></item><item><title><![CDATA[jetson orin nano super AI模型部署之路（七）yolov10 tensorrt usb cam模型部署]]></title><link>https://blog.csdn.net/bornfree5511/article/details/147291146</link><guid>https://blog.csdn.net/bornfree5511/article/details/147291146</guid><author>bornfree5511</author><pubDate>Thu, 17 Apr 2025 07:03:57 +0800</pubDate><description><![CDATA[推理逻辑: 处理图像和视频的推理函数。界面逻辑: 使用 Gradio 构建多选项卡界面，支持多种输入类型。模型管理: 支持动态加载和切换 YOLOv10 模型。实时功能: 支持实时视频流推理和帧率显示。这段代码的目标是提供一个用户友好的界面，方便用户在不同输入类型（图像、视频、实时流）上运行 YOLOv10 模型进行目标检测。该命令用于启动一个基于 YOLOv10 的 Docker 容器，支持 GPU 加速、USB 摄像头输入以及图形界面显示，适合在主机上运行实时目标检测应用。]]></description><category></category></item><item><title><![CDATA[jetson orin nano super AI模型部署之路（六）docker内使用usb摄像头]]></title><link>https://blog.csdn.net/bornfree5511/article/details/147291049</link><guid>https://blog.csdn.net/bornfree5511/article/details/147291049</guid><author>bornfree5511</author><pubDate>Thu, 17 Apr 2025 07:02:57 +0800</pubDate><description><![CDATA[第一件任务就是要判断摄像头的种类与数量，用最简单的 “ls /dev/video*” 指令并不能分辨其种类，因此最好的方法还是使用 v4l2 工具。]]></description><category></category></item><item><title><![CDATA[jetson orin nano super AI模型部署之路（五）VNC配置和USB摄像头测试]]></title><link>https://blog.csdn.net/bornfree5511/article/details/147290927</link><guid>https://blog.csdn.net/bornfree5511/article/details/147290927</guid><author>bornfree5511</author><pubDate>Thu, 17 Apr 2025 07:02:19 +0800</pubDate><description><![CDATA[我们使用jetson一般就是通过ssh连接，但是有些场景还是有桌面环境比较方便，比如摄像头相关的，这时候使用VNC就比较方便。]]></description><category></category></item><item><title><![CDATA[GPT-4o图像生成system card解读]]></title><link>https://blog.csdn.net/bornfree5511/article/details/146763691</link><guid>https://blog.csdn.net/bornfree5511/article/details/146763691</guid><author>bornfree5511</author><pubDate>Sun, 30 Mar 2025 13:54:22 +0800</pubDate><description><![CDATA[4o图像生成是一种全新的图像生成方式，其能力显著强于我们早期的DALL·E系列模型。它能够生成逼真的图像输出。它可以将图像作为输入并对其进行变换。它能够遵循详细的指令，包括可靠地将文本融入图像中。而且由于它原生嵌入到我们的多模态GPT-4o模型架构的深层，4o图像生成可以利用它所掌握的一切知识，以微妙且富有表现力的方式运用这些能力，生成不仅美观而且实用的图像。4o图像生成受益于我们现有的安全基础设施，以及我们在部署DALL·E和Sora过程中所吸取的经验教训。与此同时，这些新能力也带来了一些新的风险。]]></description><category></category></item><item><title><![CDATA[jetson orin nano super AI模型部署之路（三）stable diffusion部署]]></title><link>https://blog.csdn.net/bornfree5511/article/details/146715516</link><guid>https://blog.csdn.net/bornfree5511/article/details/146715516</guid><author>bornfree5511</author><pubDate>Sat, 29 Mar 2025 22:23:17 +0800</pubDate><description><![CDATA[先看一下部署后的界面和生成的图片。在jetson orin nano super上部署stable diffusion比较简单，有现成的docker image和代码可用。]]></description><category></category></item><item><title><![CDATA[jetson orin nano super AI模型部署之路（二）保姆级最好用AI环境配置]]></title><link>https://blog.csdn.net/bornfree5511/article/details/146492924</link><guid>https://blog.csdn.net/bornfree5511/article/details/146492924</guid><author>bornfree5511</author><pubDate>Tue, 25 Mar 2025 08:42:35 +0800</pubDate><description><![CDATA[对于产品发布来说，最合适的环境配置方式是使用docker，产品和环境可以一起发布，用户会得到最好的使用体验。jetson orin nano super 的AI docker环境配置有两个难点：（1）CPU是arm架构（2）super要使用jetpack 6.2[L4T 36.4.3]版本，因为版本太新，这个版本很多开源项目还没有发布对应的docker image，大部分的docker image都是基于jetpack 5.x构建的。]]></description><category></category></item><item><title><![CDATA[终于在MacBook m3上配置好了stm32的开发环境]]></title><link>https://blog.csdn.net/bornfree5511/article/details/146313336</link><guid>https://blog.csdn.net/bornfree5511/article/details/146313336</guid><author>bornfree5511</author><pubDate>Mon, 17 Mar 2025 13:47:18 +0800</pubDate><description><![CDATA[手册地址：https://www.st.com/resource/en/user_manual/um2407-stm32h7-nucleo144-boards-mb1364-stmicroelectronics.pdf。]]></description><category></category></item><item><title><![CDATA[cvpr2025知识蒸馏论文Attention Distillation: A Unified Approach to Visual Characteristics Transfer解读]]></title><link>https://blog.csdn.net/bornfree5511/article/details/146169156</link><guid>https://blog.csdn.net/bornfree5511/article/details/146169156</guid><author>bornfree5511</author><pubDate>Tue, 11 Mar 2025 08:35:46 +0800</pubDate><description><![CDATA[生成式扩散模型的最新进展显示出其对图像风格和语义有着显著的内在理解。在本文中，我们利用预训练扩散网络中的自注意力特征，将参考图像的视觉特征迁移到生成的图像上。与之前将这些特征用作即插即用属性的工作不同，我们提出了一种新颖的注意力蒸馏损失，该损失通过计算理想的风格化结果和当前风格化结果之间的差异得到。基于此，我们在隐空间中通过反向传播来优化合成图像。接下来，我们提出了一种改进的分类器引导方法，将注意力蒸馏损失整合到去噪采样过程中，进一步加快了合成速度，并适用于广泛的图像生成应用。]]></description><category></category></item><item><title><![CDATA[知识蒸馏综述Knowledge Distillation: A Survey解读]]></title><link>https://blog.csdn.net/bornfree5511/article/details/146138513</link><guid>https://blog.csdn.net/bornfree5511/article/details/146138513</guid><author>bornfree5511</author><pubDate>Sun, 09 Mar 2025 20:59:54 +0800</pubDate><description><![CDATA[近年来，深度神经网络在工业界和学术界都取得了成功，尤其是在计算机视觉任务方面。深度学习的巨大成功主要归功于它能够扩展以对大规模数据进行编码，并且能够处理数十亿的模型参数。然而，在资源有限的设备（如手机和嵌入式设备）上部署这些复杂的深度模型是一项挑战，这不仅是因为其计算复杂度高，还因为其对存储空间的要求大。为此，已经开发出了各种各样的模型压缩和加速技术。作为模型压缩和加速的一种代表性类型，知识蒸馏有效地从一个大型教师模型中学习到一个小型学生模型。它受到了学术界越来越多的关注。]]></description><category></category></item><item><title><![CDATA[分布式大语言模型服务引擎vLLM论文解读]]></title><link>https://blog.csdn.net/bornfree5511/article/details/145720022</link><guid>https://blog.csdn.net/bornfree5511/article/details/145720022</guid><author>bornfree5511</author><pubDate>Wed, 19 Feb 2025 08:49:14 +0800</pubDate><description><![CDATA[大语言模型（LLMs）的高吞吐量服务需要一次对足够多的请求进行批处理。然而，现有系统面临困境，因为每个请求的键值缓存（KV缓存）内存占用巨大，且会动态增长和收缩。若管理效率低下，内存会因碎片化和冗余重复而被大量浪费，从而限制批处理规模。为解决这一问题，我们提出了分页注意力（PagedAttention），这是一种受操作系统中经典虚拟内存和分页技术启发的注意力算法。在此基础上，我们构建了vLLM，这是一个大语言模型服务系统，它实现了：（1）将KV缓存内存浪费降至几乎为零；]]></description><category></category></item><item><title><![CDATA[jetson orin nano super AI模型部署之路（一）deepseek r1模型部署]]></title><link>https://blog.csdn.net/bornfree5511/article/details/145692892</link><guid>https://blog.csdn.net/bornfree5511/article/details/145692892</guid><author>bornfree5511</author><pubDate>Mon, 17 Feb 2025 22:10:09 +0800</pubDate><description><![CDATA[先看一下部署完成后的效果。可以直接在手机上访问jetson，有web界面供使用。也可以直接在电脑上访问。我这个是8GB 128-bit LPDDR5 102GB/s版本，256g硬盘。先看一下基本参数。从算力和价格的比较看，jetson orin nano super 8g版本的性价比还是很高的，在较低的价格上，仍然有67TOPS（INT8）的算力。而且使用的是较新的ampere架构。CPU使用6核 ARM Cortex- A78AE，频率可达1.7GHz。]]></description><category></category></item><item><title><![CDATA[苹果ELEGNT台灯AI机器人paper解读]]></title><link>https://blog.csdn.net/bornfree5511/article/details/145656643</link><guid>https://blog.csdn.net/bornfree5511/article/details/145656643</guid><author>bornfree5511</author><pubDate>Sat, 15 Feb 2025 20:59:29 +0800</pubDate><description><![CDATA[在人类互动中，姿势、手势和眼神等非语言行为对于有意识和无意识地传达内心状态至关重要。为了让机器人与人类更自然地互动，机器人的运动设计同样应在满足任务完成、空间限制和时间效率等传统功能考量的同时，融入诸如意图、注意力和情感等表达性元素。在本文中，我们介绍了一款灯状机器人的设计与原型制作，该机器人探索了运动设计中功能性与表达性目标之间的相互作用。我们采用设计即研究的方法，记录硬件设计过程，定义表达性运动基元，并勾勒出一系列交互场景故事板。]]></description><category></category></item><item><title><![CDATA[AI领域紧跟最新研究趋势和内容的相关网站推荐]]></title><link>https://blog.csdn.net/bornfree5511/article/details/145649730</link><guid>https://blog.csdn.net/bornfree5511/article/details/145649730</guid><author>bornfree5511</author><pubDate>Sat, 15 Feb 2025 13:27:51 +0800</pubDate><description><![CDATA[cv相关顶会有cvpr、iccv、eccv、NeurIPS、iclr、AAAI、siggraph等。Paper Digest：Paper Digest团队会分析各大顶会如cvpr、AAAI、arxiv、iccv等历年发表的所有论文，依据研究论文和授权专利的引用情况，呈现每年最具影响力的论文。（5）高通AI research：高通主要专注于移动 AI、低功耗计算机视觉、神经网络加速、边缘计算（Edge AI） 方面的研究，发表的论文也很多见于 CVPR、ICLR、NeurIPS 等顶会。]]></description><category></category></item><item><title><![CDATA[AI领域紧跟最新研究趋势和内容的相关网站推荐]]></title><link>https://blog.csdn.net/bornfree5511/article/details/145513690</link><guid>https://blog.csdn.net/bornfree5511/article/details/145513690</guid><author>bornfree5511</author><pubDate>Sat, 08 Feb 2025 13:18:11 +0800</pubDate><description><![CDATA[cv相关顶会有cvpr、iccv、eccv、NeurIPS、iclr、AAAI、siggraph等。Paper Digest：Paper Digest团队会分析各大顶会如cvpr、AAAI、arxiv、iccv等历年发表的所有论文，依据研究论文和授权专利的引用情况，呈现每年最具影响力的论文。（5）高通AI research：高通主要专注于移动 AI、低功耗计算机视觉、神经网络加速、边缘计算（Edge AI） 方面的研究，发表的论文也很多见于 CVPR、ICLR、NeurIPS 等顶会。]]></description><category></category></item><item><title><![CDATA[部署夜景增强模型Learning to See in the Dark以及gradio UI编程方法]]></title><link>https://blog.csdn.net/bornfree5511/article/details/145502018</link><guid>https://blog.csdn.net/bornfree5511/article/details/145502018</guid><author>bornfree5511</author><pubDate>Fri, 07 Feb 2025 20:30:46 +0800</pubDate><description><![CDATA[在SeeInDark网络的最后一层使用了进行分辨率增强（Super-Resolution），这是一个合理且高效的设计选择。相比于转置卷积（ConvTranspose2d）或插值（Interpolation）输入通道数 = (目标通道数 × upscale_factor²)通道信息转换为空间信息，从而提高分辨率。输入：12 通道（C=12）× H × W输出：3 通道（C=3）× 2H × 2W（RGB 三通道图像）12 通道的输入被重新排列为个像素块。]]></description><category></category></item><item><title><![CDATA[本地部署DeepSeek方法]]></title><link>https://blog.csdn.net/bornfree5511/article/details/145417965</link><guid>https://blog.csdn.net/bornfree5511/article/details/145417965</guid><author>bornfree5511</author><pubDate>Sun, 02 Feb 2025 09:53:01 +0800</pubDate><description><![CDATA[本地部署：专注于在本地机器上便捷部署和运行大型语言模型，用户可在自己设备上运行模型，保护数据隐私，无需担心数据发送到云端的安全风险。多系统支持：支持Mac、Linux和Windows等多种操作系统，用户在不同平台上都能方便地安装使用。多模型支持：支持Deepseek-r1、Llama、Falcon、Qwen2、Phi3、Gemma2等多种流行的LLM模型，用户可按需选择，一键运行。易于使用：提供直观的命令行界面，操作简单，上手容易，降低了使用门槛。可扩展性。]]></description><category></category></item><item><title><![CDATA[AI-ISP论文Learning to See in the Dark解读]]></title><link>https://blog.csdn.net/bornfree5511/article/details/145415244</link><guid>https://blog.csdn.net/bornfree5511/article/details/145415244</guid><author>bornfree5511</author><pubDate>Sat, 01 Feb 2025 21:39:27 +0800</pubDate><description><![CDATA[由于光子数量少和信噪比低，低光照成像颇具挑战性。短曝光图像存在噪声问题，而长曝光会导致图像模糊，且往往不切实际。人们已经提出了各种去噪、去模糊和增强技术，但在诸如夜间视频帧率成像等极端条件下，它们的效果有限。为推动基于学习的低光照图像处理流程的发展，我们引入了一个原始短曝光低光照图像数据集，以及相应的长曝光参考图像。利用这个数据集，我们基于全卷积网络的端到端训练，开发了一个处理低光照图像的流程。该网络直接对原始传感器数据进行处理，取代了许多传统的图像处理流程，而传统流程在处理此类数据时往往效果不佳。]]></description><category></category></item></channel></rss>