博世&清华 | CVPR2025端到端第二名DiffVLA：VLM+扩散+混合感知，解锁自动驾驶决策新范式

最新推荐文章于 2025-06-27 16:25:16 发布

3Ｄ视觉工坊

最新推荐文章于 2025-06-27 16:25:16 发布

阅读量11

点赞数

CC 4.0 BY-SA版权

文章标签：自动驾驶人工智能机器学习

原文链接：https://mp.weixin.qq.com/s?__biz=MzU1MjY4MTA1MQ==&mid=2247730104&idx=2&sn=b09311dccaed7cda32fac90d5de53007&chksm=fadb806e6f6412876eb6373cbe28de04cee37b66ad697dcb1de7af35e1c2cde7c69ce1d38a77&scene=126&sessionid=0

点击下方卡片，关注「3D视觉工坊」公众号
选择星标，干货第一时间送达

3D视觉工坊很荣幸邀请到博世中央研究院高级研究员高煜，为大家着重分享他们团队的工作：DiffVLA：在CVPR 2025的NAVSIM v2 End-to-End Driving Challenge赛道中，该技术方案以45.0 EPDMS的优异成绩排在第二位。如果您有相关工作需要分享，欢迎文末联系我们。

DiffVLA: Vision-Language Guided Diffusion Planning for Autonomous Driving
论文链接：https://arxiv.org/pdf/2505.19381

直播信息

时间

2025年06月27日(周五)19：00

主题

博世 X 清华 | CVPR2025端到端第二名DiffVLA

直播平台

3D视觉工坊哔哩哔哩

扫码观看直播，或前往B站搜索3D视觉工坊观看直播

3D视觉工坊视频号也将同步直播

主讲嘉宾

高煜
博世中央研究院高级研究员

计算机视觉领域10+年工作经验，现为博世中央研究院（Bosch Corporate Research）高级研究员，自动驾驶感知技术专家，在环境感知与驾驶决策领域具备深厚技术积累。曾参与/主导多代智驾系统的核心算法研发，包括：

近期：端到端智能驾驶模型的架构设计与开发
中期：雷达与前视一体机的核心算法研发
早期：周视感知系统的核心算法开发

直播大纲

博世中国研究院与清华大学AIR团队联合发布突破性研究成果DiffVLA，成功实现通用机器人控制框架π0的VLA范式在动态交通场景中的创新应用。该研究通过深度改造"视觉-语言-动作"范式，攻克了传统端到端方法在自动驾驶领域的多种难题。在CVPR 2025的NAVSIM v2 End-to-End Driving Challenge赛道中，该技术方案以45.0 EPDMS的优异成绩排在第二位。

1.开场与简介

自我介绍
公司介绍
Diff-VLA方法简介

2.端到端模型中的挑战

可解释性限制
监督的限制
生成模型的限制

3.Diff-VLA框架详解

VLA指导模块
混合感知模块
基于扩散的规划模块
轨迹后处理

4.实验结果与性能评估

NAVSIMv2的实验设置
关键性能指标（EPDMS）解读
实验结果展示与讨论

5.结论与未来工作

Diff-VLA方法的主要发现与成就
讨论当前方法的限制
对未来研究方向的展望

6.Q&A环节

开放提问时间，解答参与者疑问

参与方式

注：3D视觉工坊很荣幸邀请到博世中央研究院高级研究员高煜，为大家着重分享他们团队的工作：DiffVLA。如果您有相关工作需要分享，欢迎联系微信：cv3d009 请备注：直播宣传，则不予通过。