- 博客(342)
- 收藏
- 关注
原创 Apollo平台下相机和激光雷达手眼联合标定
Apollo平台下相机与激光雷达联合标定指南 摘要:本文介绍Apollo自动驾驶平台中相机与激光雷达联合标定的关键技术。通过建立坐标系转换关系(包含内参矩阵K和外参矩阵[R|t]),实现多传感器数据精确对齐。标定过程包括:1)数据采集(同步记录图像和点云数据);2)预处理(提取传感器数据);3)数学模型求解(通过标定板建立相机与激光雷达的变换链T_c←l = T_c←w * inv(T_l←w))。文章详细推导了投影方程和刚体变换方程,并提供了Apollo平台下的实际操作命令和Python代码示例,帮助开发
2025-08-11 08:09:40
443
原创 使用Blender可视化多传感器坐标系转换
文章摘要: 本文介绍了如何利用Blender可视化多传感器(如激光雷达与摄像头)的坐标系转换,解决自动驾驶系统中数据融合的关键问题。通过Blender精确建模车辆及传感器位置,创建代表坐标系的标记物并调整其方向,可直观获取相机到激光雷达的变换矩阵(含四元数旋转与平移向量)。核心步骤包括:1)统一世界坐标系;2)创建并对齐相机坐标系标记;3)读取位置与四元数参数。该方法避免了欧拉角的万向节死锁问题,为多传感器标定提供了高效、直观的可视化验证方案。(150字)
2025-08-10 18:30:16
736
1
原创 阿里云ECS云服务器临时升级带宽方法
阿里云ECS服务器临时升级带宽方法:通过创建弹性网卡(ENI)和绑定弹性公网IP(EIP),实现服务器带宽的临时提升。具体步骤包括:1)创建并绑定弹性网卡;2)申请按流量计费的EIP并绑定到网卡;3)通过修改服务器路由表将公网流量切换至新网卡;4)执行高带宽任务后切换回原网卡;5)释放EIP以停止计费。该方法适用于临时大文件传输、流量高峰等场景,比永久升级带宽更经济高效。
2025-08-10 18:05:03
554
原创 基于Web的交互式坐标系变换矩阵计算工具
本文介绍了一个基于Web的交互式坐标系变换矩阵计算工具。该工具通过可视化界面解决三维空间中坐标系转换的复杂计算问题,支持实时调整参数并自动生成变换矩阵。主要功能包括:1)定义基坐标系和相机坐标系;2)交互式控制位置和旋转参数;3)自动计算4×4变换矩阵和四元数表示。该工具特别适用于计算机视觉、机器人学等领域,能直观展示坐标系变换关系,简化外参标定等计算流程。用户可通过调整欧拉角和平移向量,实时观察变换效果并获得对应的数学表示。
2025-08-08 20:33:43
1096
原创 Apollo激光雷达感知全流程解析:从原始点云到障碍物追踪
本文解析了Apollo自动驾驶平台中激光雷达感知的全流程处理,从原始点云数据到最终的障碍物追踪输出。主要模块包括:点云预处理(清洗无效数据)、基于高精地图的ROI区域过滤、地面点分割、3D物体检测(支持多种算法)、物体属性过滤、障碍物追踪(ID分配与运动预测)以及数据输出。每个模块通过特定话题传递处理结果,最终输出统一格式的障碍物信息供规划控制模块使用。系统可通过单个DAG文件或launch文件启动全部处理流程,实现从原始点云到环境感知的端到端转换。
2025-08-08 09:35:18
956
原创 相机坐标系与世界坐标系的点相互转换:原理、可视化与实践
摘要 本文介绍了相机坐标系与世界坐标系之间的转换原理及其在自动驾驶等领域的应用。主要内容包括:1) 坐标系转换的数学基础,重点解析了外参(旋转矩阵R和平移向量t)在C2W和W2C变换中的作用;2) 不同坐标系(相机、激光雷达、车辆)的定义差异;3) 通过NuScenes数据集的实际案例,展示了如何利用四元数和旋转矩阵实现坐标系转换及可视化验证。文章提供了详细的公式推导和Python代码示例,帮助读者理解外参验证的关键技术。
2025-08-08 09:05:41
1092
原创 Apollo中三种相机外参的可视化分析
本文分析了自动驾驶系统中相机外参的可视化方法,对比了三种来源的外参数据(NuScenes数据集、Apollo BEV模型和Apollo园区版)。通过代码示例展示了从NuScenes数据集提取相机外参(位置和旋转四元数)的详细过程,并实现了外参数据的3D可视化。该方法可帮助验证标定质量、检测标定错误、理解感知系统覆盖范围以及确保多传感器融合的空间对齐关系。文章提供了完整的Python实现,包括环境准备、数据提取和可视化步骤。
2025-08-06 20:00:22
995
原创 调用向日葵REST-API动态获取识别码的完整指南
本文介绍了如何通过向日葵REST API动态获取设备识别码的解决方案。传统手动查询方式效率低且易出错,尤其在设备重启导致识别码变化时更为不便。文章详细讲解了使用向日葵API实现自动化认证(HMAC-SHA256签名)、设备查询和结果分享的完整流程,包括API凭证获取、请求签名方法和关键代码实现。通过该方案,用户可自动获取最新识别码并直接分享URL,显著提升远程设备管理的效率和便利性。
2025-08-05 09:06:29
661
原创 如何用VSCode调试Apollo园区版:从零开始完整指南
本文详细介绍了使用VSCode调试Apollo 9.0园区版camera_detection_bev模块的完整流程。主要内容包括:1)环境准备,需使用VSCode v1.85版本以兼容Ubuntu 18.04的glibc 2.27;2)通过捕获完整编译命令生成compile_commands.json文件,确保代码智能跳转和补全功能;3)配置SSH远程调试通道,实现本地VSCode调试容器内程序;4)搭建运行时环境,通过符号链接解决开发与运行环境路径不一致问题。该指南涵盖了从编译数据库生成到远程调试配置的全
2025-08-05 09:00:27
814
原创 Flask搭建HTML文档服务器-轻松共享和浏览文档
本文介绍如何使用Flask框架搭建HTML文档服务器,实现团队文档的便捷共享。相比PDF,HTML文档具有无缝阅读、响应式设计、加载快速等优势。服务器提供目录浏览、文档预览、智能排序和面包屑导航功能,支持多终端访问。搭建步骤包括创建Flask应用核心代码,设置环境变量指定HTML目录,实现路径安全检查,并自动按数字排序文件。系统还包含响应式界面设计,确保在各类设备上都能获得良好浏览体验。该方案适合团队集中管理技术文档、产品手册等HTML内容。
2025-08-04 11:14:18
1019
原创 让Markdown文档也能“知道“谁在阅读:HTML嵌入阅读跟踪指南
本文介绍了如何为Markdown生成的HTML文档添加阅读跟踪功能,帮助了解文档的实际使用情况。方案包含三个核心部分:1)客户端HTML文档通过JavaScript收集阅读信息;2)转换工具将图片转为Base64并插入跟踪脚本;3)服务器端接收和分析数据。关键组件包括图片转换工具(convert.bat)、跟踪脚本嵌入工具(emb.py)和服务器接收程序(main.py)。该技术特别适合知识交付和远程协作场景,能跟踪文档打开时间、设备等关键信息,且通过Base64编码确保文档完整性。
2025-08-04 09:31:55
876
原创 手把手教你为Apollo自动驾驶系统配置多摄像头系统
本文详细介绍了如何为Apollo自动驾驶系统手动配置多摄像头系统(6路环视)。首先分析了摄像头驱动的技术原理,包括v4l2框架和Apollo的CameraComponent模块。然后通过v4l2命令识别摄像头硬件设备,并验证各摄像头功能。重点讲解了如何进入Apollo容器环境,分析原始配置,包括DAG文件和相机参数配置文件。配置过程涉及设备路径映射、数据通道定义等关键参数设置。该手动配置方法能深入理解Apollo摄像头驱动架构,灵活应对特殊硬件组合需求,为后续标定和感知模块开发奠定基础,适用于需要定制化摄像
2025-08-03 21:36:59
939
原创 主机序列号的修改方法与原理
摘要:主机序列号是设备的唯一硬件ID,存储在BIOS/UEFI芯片、设备树文件或DMI信息表中。修改序列号可用于隐私保护、软件授权等场景,但需注意法律风险。本文介绍两种方法:1)用户空间拦截read函数,通过LD_PRELOAD加载自定义库动态修改返回值,操作简单但仅对特定程序有效;2)内核驱动直接修改DMI内存区域,需编译加载内核模块,效果更彻底但风险较高。两种方法均提供了详细的操作步骤和原理说明,适用于不同技术需求的用户。 (149字)
2025-08-03 14:22:30
667
原创 基于FRP + ttyd 的远程Web终端控制:无SSH环境下的救急方案
摘要:无SSH环境下的远程Web终端控制方案 当SSH服务不可用且无法安装图形化工具时,本文提出了一种基于FRP内网穿透和ttyd Web终端的应急远程控制方案。该方案通过在受控服务器本地运行ttyd创建Web终端,利用FRP的STCP模式建立安全隧道,使控制端通过浏览器即可访问服务器命令行界面。方案具有轻量级、无需复杂依赖、绕过SSH限制等特点,特别适合紧急恢复场景。文章详细介绍了FRP服务器配置、ttyd安装、安全密钥设置等关键步骤,并强调了双因素认证等安全措施。
2025-07-31 12:03:22
1098
原创 一次“非法指令”(SIGILL)问题的完整调试过程:CPU指令集兼容性探秘
摘要: 在运行Apollo自动驾驶程序时遇到"非法指令(SIGILL)"崩溃,经排查发现程序库libchassis_command_processor.so使用了AVX512指令集,而测试环境的CPU(包括Ubuntu 22.04宿主机和18.04虚拟机)均不支持该指令集。通过搭建KVM虚拟化环境、反汇编二进制文件,确认了指令集不兼容是根本原因。解决方法包括:更换支持AVX512的硬件、重新编译程序禁用高级指令集,或确保虚拟机正确透传宿主CPU指令集。该案例揭示了二进制兼容性问题中CPU
2025-07-25 20:57:27
723
原创 Apollo9.0园区版:自定义保存与可视化control/planning字段指南
Apollo 9.0园区版自定义数据可视化指南:针对系统自带工具无法提取自定义字段的问题,本文提出基于Protobuf反射机制的解决方案。通过递归遍历消息树结构,动态提取所有叶子节点数据并生成唯一路径标识(如debug.simple_lon_debug.acceleration_cmd),实现control和planning模块任意字段的保存与分析。操作步骤包含:1)创建动态字段提取脚本;2)分别保存control和planning模块数据到指定目录;3)支持数值型与文本型字段的自适应处理。该方法突破了原生
2025-07-25 11:51:36
891
原创 支持OCR和AI解释的Web PDF阅读器:解决大文档阅读难题
摘要:本文介绍了一款支持OCR和AI解释的Web版PDF阅读器,专为解决移动设备阅读扫描版PDF的痛点而设计。该工具具备区域选择OCR、文字编辑和AI智能解释功能,通过服务端处理突破移动设备性能限制。技术实现采用PDF.js前端渲染+百度OCR API+DeepSeek大模型的架构,提供智能区域选择、阅读记忆等特色功能,并详细说明了环境配置和界面实现代码。该方案显著提升了长文档的阅读效率和理解深度。
2025-07-24 20:46:41
363
原创 MinIO部署及使用指南:轻松搭建企业级对象存储
《MinIO部署及使用指南:快速搭建企业级对象存储》 本文详细介绍了高性能开源对象存储MinIO的部署与使用方法。MinIO凭借其S3兼容性、轻量级架构和卓越性能,成为云原生存储的热门选择。指南通过Docker Compose方式演示部署流程,包括创建存储目录、配置容器、启动服务等关键步骤,并介绍了Web控制台和命令行客户端(mc)的基本操作。文章还涵盖了文件上传下载、密码修改等实用功能,帮助用户快速掌握MinIO的核心功能。该解决方案适用于从开发测试到生产环境的各种存储需求,具备易用性和可扩展性特点。
2025-07-21 10:17:18
836
原创 GitLab企业版部署与许可证生成完整指南
GitLab作为业界领先的DevOps平台,为企业提供了从代码管理到CI/CD的完整解决方案。然而,GitLab企业版需要有效的许可证才能解锁全部功能。本文将详细介绍如何通过Docker部署GitLab企业版,并生成永久许可证的完整过程。
2025-07-19 00:51:23
976
原创 基于ROS2进行相机标定,并通过测试相机到棋盘格之间的距离进行验证
在视觉系统中,**相机标定**是获取准确空间信息的关键步骤。本文介绍基于Docker创建**可移植、可复现**的ROS2相机标定环境,并通过测试相机到棋盘格之间的距离进行验证。也可用于某些场景下的**单目测距离**。
2025-07-18 14:27:21
1385
原创 macOS 12.7.6部署Ollama+Dify避坑指南
本文介绍了在macOS 12.7.6系统下部署Ollama和Dify的详细步骤及避坑指南。主要内容包括:1)关闭系统完整性保护(SIP)以允许修改系统目录;2)安装特定版本的Docker(2.1.0.5)和docker-compose(v2.38.2)以避免兼容性问题;3)配置Ollama服务并下载nomic-embed-text和deepseek-r1:7b模型;4)针对macOS调整Dify的docker配置文件,包括延长超时时间、修改存储路径、增加资源限制等关键设置。文中提供了完整的命令操作步骤和配置
2025-07-17 17:26:37
1123
原创 演示扩展卡尔曼滤波在无人驾驶多传感器融合中的应用
摘要 本文提出了一种基于扩展卡尔曼滤波(EKF)的无人驾驶多传感器融合方法,用于提高车辆状态估计精度。系统整合GPS(1Hz)、IMU(20Hz)和LiDAR(10Hz)数据,通过非线性运动模型预测和传感器观测更新两个阶段实现状态融合。EKF使用雅可比矩阵处理非线性系统,并针对不同传感器特性(如GPS易受遮挡、IMU存在累积误差)设计噪声模型。实验验证了该方法能有效克服单一传感器局限,提供更鲁棒的车辆位置、速度和航向角估计。完整实现包括运动模型仿真、传感器噪声建模、EKF算法和可视化模块。
2025-07-15 15:52:43
303
原创 目录差异比较工具:智能忽略空格变化的文本分析
本文介绍了一款智能忽略空格变化的文本分析工具,该工具主要用于比较代码库或文档目录的差异。其主要功能包括:智能识别文本/二进制文件、忽略无关空格差异、生成Markdown格式报告,并提供文件树导航。 核心算法通过检测空字符区分文件类型,对文本文件采用逐行比较并归一化处理空格,二进制文件则直接比对内容。差异报告采用优化策略,保留原始格式但过滤无意义差异,输出紧凑易读的结果。 工具还实现了完整的目录结构对比功能,支持文件树导航和锚点跳转,帮助开发者更高效地识别代码变更中的实质性差异。
2025-07-15 15:11:41
300
原创 基于Elasticsearch的代码检索及解释系统
本文提出基于Elasticsearch的代码检索系统,解决传统工具在大型代码库中的搜索局限性。系统采用Elasticsearch 9.x构建索引,支持跨文件检索、智能上下文展示和自然语言查询。核心架构包括代码索引、Flask查询接口和LLM总结功能,关键技术涉及正则表达式查询、自定义字段映射(区分索引与存储字段)和上下文智能处理(动态合并匹配项、高亮展示)。实现步骤涵盖环境配置(Docker部署ES)、索引创建(优化映射参数)和查询服务开发(支持批量结果获取和上下文截取)。该系统能显著提升代码定位和理解效率
2025-07-14 13:29:28
874
原创 自动化导出微信聊天记录的技术方案:基于Python的屏幕操作与剪贴板监控
本文提出一种基于Python的自动化方案,通过屏幕操作和剪贴板监控实现微信聊天记录导出。针对工作群消息过载问题,该技术采用pyautogui模拟用户操作,结合坐标定位工具获取消息位置,自动执行双击、复制、保存等操作。系统包含重复检测机制,通过哈希值比对避免重复存储,当连续30次重复时自动停止。实现步骤包括:1)使用热键Alt+9捕获屏幕坐标并复制;2)运行自动化脚本导出聊天记录至Markdown文件;3)后续可结合大语言模型生成摘要。该方法无需微信API,仅需标准Python库,有效解决非工作时间消息干扰问
2025-07-13 07:15:30
431
原创 用 clang.cindex 自动提取 C/C++ 函数体,通过 API 入 Dify-Ollama-Xinference 构建的知识库,之后用 REST API 访问 Dify 聊天机器人
本文提出一种自动化方案,通过clang.cindex提取C/C++函数体,构建智能知识库系统。系统分为三层架构:数据采集层使用Clang AST解析源码;AI服务层整合Ollama提供LLM能力、Xinference实现语义重排序;应用层采用Dify管理知识库并提供REST API接口。详细部署步骤包括:配置Ollama加载32B参数模型,启动Xinference重排序服务,搭建Dify知识库平台,并通过Python脚本精准提取函数实现。该方案有效解决了大型C++项目中函数定位困难、知识碎片化等问题,实现自
2025-07-11 10:30:34
1341
原创 自动化Trae Apollo参数解释的批量获取
本文介绍了一种自动化获取百度Apollo自动驾驶平台参数解释的方法。针对Trae工具缺乏API接口和手动查询效率低的问题,设计了一个Python脚本,通过模拟人工操作实现参数解释的批量获取。脚本采用图像识别技术定位界面元素,建立"输入-查询-复制-保存"的自动化流程,并通过OpenCV检测按钮状态确保操作准确性。该方法解决了Apollo 9.0版本2000多个参数的手动查询难题,显著提升研究效率。实现步骤包括环境配置、界面坐标获取、参数列表设置和自动化执行,最终将所有参数解释按章节保存为
2025-07-09 20:56:06
893
原创 基于clangd和LSP协议生成Apollo9.0工程函数调用关系图
本文提出了一种基于clangd和LSP协议的Apollo9.0工程函数调用关系图生成方法。针对大型C++项目代码维护的挑战,该方法通过clangd语言服务器解析代码,利用LSP协议获取函数调用层次信息,构建完整的调用关系树。系统采用客户端-服务端架构,使用Redis实现进程间通信,支持跨文件分析和深层递归调用链可视化。文中详细介绍了实现方案,包括调用关系生成算法、LSP请求流程,以及包含GLIBC升级、clangd编译等关键步骤的环境配置说明。该方法为Apollo等大型C++工程提供了有效的代码理解工具。
2025-07-09 18:19:39
970
原创 Apollo 9.0组件创建:管理配置、集成第三方库、订阅消息
本文介绍了在Apollo 9.0中创建自定义组件的完整流程。主要内容包括:组件在自动驾驶系统中的重要作用(功能扩展、模块化开发等);使用buildtool工具创建名为"candy"的空组件;配置组件参数和消息格式;以及编译流程。操作步骤详细展示了从命令行创建组件骨架、定义proto消息格式到最终编译的全过程,为开发者提供了扩展Apollo系统的实用指南。
2025-07-07 18:13:47
583
原创 VScode分析Apollo 9.0工程:实现灵活代码跳转的完整指南
《VSCode配置实现Apollo 9.0代码灵活跳转指南》 本文详细介绍了如何配置VSCode实现Apollo 9.0自动驾驶平台的代码跳转功能。关键步骤包括:使用VSCode v1.85确保兼容性、单线程编译Apollo工程、解析构建日志生成compile_commands.json跳转数据库,以及配置clangd语言服务器。通过SSH远程连接容器环境,禁用内置C++扩展,最终实现精准的代码导航功能(Ctrl+点击跳转定义、Alt+点击快速参考等)。该方案解决了大型C++项目代码阅读效率低下的问题,特别
2025-07-05 08:46:50
831
原创 使用Apollo AEM工具编译调试感知模块与场景模拟实战
本文介绍了如何使用Apollo环境管理工具(AEM)进行自动驾驶感知模块的开发调试与场景模拟。主要内容包括:1)AEM工具安装与环境配置,支持GPU加速和模块化编译;2)数据包与感知模型的获取安装方法;3)感知模块的源码修改、编译与调试流程;4)通过Dreamview平台进行可视化测试和场景模拟。文章提供了详细的命令行操作步骤,帮助开发者快速搭建开发环境,实现感知模块的高效调试与验证,适用于自动驾驶技术开发者和研究人员。
2025-07-03 10:23:04
1329
原创 在Ubuntu上多网卡配置HTTP-HTTPS代理服务器
当服务器多个网卡,有的通外网,有的通局域网,有的是专线。如何在这样的服务器上搭建一个HTTP/HTTPS代理服务器,并指定流量出口。
2025-07-02 09:17:30
818
原创 Python实现NuScenes数据集可视化:从3D边界框到2D图像的投影原理与实践
本文介绍了使用Python实现NuScenes数据集3D边界框到2D图像投影可视化的方法。NuScenes作为自动驾驶领域的重要数据集,包含多传感器数据和3D物体标注。文章详细解析了从世界坐标系到图像坐标系的转换流程,包括车辆位姿、相机标定等关键步骤,并提供了完整的Python实现代码。通过3D到2D投影公式(X/Z,Y/Z)和相机内参矩阵,可将物体3D位置准确映射到图像上,为自动驾驶算法开发和数据分析提供可视化基础。文中还包含数据集下载、环境配置和技术实现细节,帮助读者快速掌握这一关键技术。
2025-07-01 13:51:36
752
原创 从Apollo record文件中提取坐标信息绘制地图轨迹
摘要: 本文介绍从Apollo自动驾驶记录文件中提取车辆轨迹坐标的方法。首先下载并解压Apollo平台提供的record文件,通过命令行工具查看文件包含的定位信息通道。关键步骤是通过Python脚本解析定位数据,将UTM坐标系转换为WGS84经纬度,并使用folium库绘制地图轨迹。该方法可实现自动驾驶测试路线的可视化,便于分析定位精度和复现测试场景。(150字)
2025-06-30 16:08:20
926
原创 使用Apollo Cyber RT Python API处理图像消息
Apollo Cyber RT图像处理指南:本文介绍使用Apollo Cyber RT的Python API处理自动驾驶图像数据。主要内容包括:1)从record文件中提取图像数据并解析protobuf消息;2)构建图像发布节点,将图像转换为protobuf格式并持续发布;3)关键步骤详解,包括二进制数据转换、消息头设置和颜色空间处理。这些方法适用于自动驾驶系统的离线数据分析和实时消息处理场景,为感知算法开发和调试提供基础支持。代码示例展示了完整的图像提取和发布流程。
2025-06-30 10:19:14
909
原创 自动微信聊天:ADB+LLM+OCR实现消息自动回复
摘要:本文介绍了一个基于ADB+LLM+OCR的微信自动回复工具,旨在替代低效监工角色。该工具通过ADB连接安卓模拟器,截取微信聊天界面,使用OpenCV检测画面变化,EasyOCR进行文字识别,并实现自动回复功能。核心流程包括设备连接检测、智能截屏监控、OCR文字识别和ADB模拟操作,技术要点涉及图像差异计算、多语言OCR和ADB命令控制。文章还提供了详细的环境配置、坐标校准方法和回复逻辑定制建议,可扩展集成LLM实现智能意图分析。
2025-06-28 10:29:48
806
原创 Apollo v9.0.0-rc-r10 基础测试
本文记录了Apollo v9.0.0-rc-r10基础测试的完整流程。主要内容包括:参考文档链接、常见问题解决方法(如编译段错误和显示问题)、详细操作步骤(环境准备、源码下载与修改、Docker容器创建、模型安装与管理)。测试环境为Ubuntu 20.04系统,使用NVIDIA驱动和Docker容器。重点解决了编译过程中遇到的Eigen段错误问题,并通过amodel工具成功安装了多种感知模型。文档提供了从环境搭建到模型验证的全流程指导,对Apollo 9.0版本的使用具有实用参考价值。
2025-06-27 21:00:32
975
原创 x86-64安装编译Apollo 9.0 aarch64版本
本文详细介绍了在x86-64架构主机上编译Apollo 9.0 aarch64版本的方法。通过Docker容器提供隔离环境,并借助QEMU实现ARM指令集模拟,解决了跨架构编译的兼容性问题。文章提供了完整的操作流程,包括Docker多架构配置、QEMU模拟器安装、Apollo源码获取与编译环境准备等步骤,特别针对PCL库检测逻辑缺陷和GPU平台识别等常见问题给出了解决方案。该方案不仅适用于Apollo项目,也可推广到其他复杂项目的跨架构构建场景,有效提升了开发效率。
2025-06-25 20:10:02
735
原创 微信小程序自动截图: 轻松保存答题进度
摘要:本文介绍一种解决答题类微信小程序无法跳页和进度丢失问题的自动化方案。通过ADB工具和安卓模拟器实现自动截图和翻页功能,使用Python脚本控制流程,包含智能停止机制。操作步骤包括环境配置、脚本运行和效果查看,适用于驾考题库等场景,可大幅节省手动操作时间。进阶技巧还涉及PDF生成和OCR识别。该方法简单易行,适合技术小白掌握使用。
2025-06-17 20:35:15
904
原创 用bilibili一个讲座视频,生成一本科普书籍
本文介绍了一种将B站讲座视频自动转化为科普书籍的系统方案。该方案通过智能文本处理、知识提炼与结构化、专业知识普及和自动化书籍生成四大功能模块,解决了原始讲座内容冗长、术语难懂、知识点分散等问题。系统采用64K上下文管理、批量处理优化等先进技术,支持从视频下载到Markdown书籍生成的全流程自动化处理,效率比人工整理提升10倍以上。应用场景涵盖教育、研究、内容创作和企业培训等多个领域,能够将专业讲座快速转化为大众可理解的知识产品,推动知识民主化。系统部署基于Ollama模型服务和whisper等开源工具,提
2025-06-14 19:59:57
1242
linux基于LD-PRELOAD机器的内存泄露检测工具
2024-05-17
ffmpeg 异步推理filter源码
2024-03-21
grpc v1.62.0
2024-03-19
C#实现的键盘记录后台程序,可运行在win10/win11系统.能记录各种键盘按键,并将字符保存到文件中
2024-02-20
Aleo网络的一些疑问
2024-09-14
怎么能把CSDN上的博文自动生成短视频呢
2024-02-25
TA创建的收藏夹 TA关注的收藏夹
TA关注的人