点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达
3D视觉工坊很荣幸邀请到博世中央研究院高级研究员高煜,为大家着重分享他们团队的工作:DiffVLA
:在CVPR 2025的NAVSIM v2 End-to-End Driving Challenge赛道中,该技术方案以45.0 EPDMS的优异成绩排在第二位。如果您有相关工作需要分享,欢迎文末联系我们。
DiffVLA: Vision-Language Guided Diffusion Planning for Autonomous Driving
论文链接:https://arxiv.org/pdf/2505.19381
直播信息
时间
2025年06月27日(周五)19:00
主题
博世 X 清华 | CVPR2025端到端第二名DiffVLA
直播平台
3D视觉工坊哔哩哔哩
扫码观看直播,或前往B站搜索3D视觉工坊观看直播

3D视觉工坊视频号也将同步直播
主讲嘉宾
高煜
博世中央研究院高级研究员
计算机视觉领域10+年工作经验,现为博世中央研究院(Bosch Corporate Research)高级研究员,自动驾驶感知技术专家,在环境感知与驾驶决策领域具备深厚技术积累。曾参与/主导多代智驾系统的核心算法研发,包括:
近期:端到端智能驾驶模型的架构设计与开发
中期:雷达与前视一体机的核心算法研发
早期:周视感知系统的核心算法开发
直播大纲
博世中国研究院与清华大学AIR团队联合发布突破性研究成果DiffVLA,成功实现通用机器人控制框架π0的VLA范式在动态交通场景中的创新应用。该研究通过深度改造"视觉-语言-动作"范式,攻克了传统端到端方法在自动驾驶领域的多种难题。在CVPR 2025的NAVSIM v2 End-to-End Driving Challenge赛道中,该技术方案以45.0 EPDMS的优异成绩排在第二位。
1.开场与简介
自我介绍
公司介绍
Diff-VLA方法简介
2.端到端模型中的挑战
可解释性限制
监督的限制
生成模型的限制
3.Diff-VLA框架详解
VLA指导模块
混合感知模块
基于扩散的规划模块
轨迹后处理
4.实验结果与性能评估
NAVSIMv2的实验设置
关键性能指标(EPDMS)解读
实验结果展示与讨论
5.结论与未来工作
Diff-VLA方法的主要发现与成就
讨论当前方法的限制
对未来研究方向的展望
6.Q&A环节
开放提问时间,解答参与者疑问
参与方式

注:3D视觉工坊很荣幸邀请到博世中央研究院高级研究员高煜,为大家着重分享他们团队的工作:
DiffVLA
。如果您有相关工作需要分享,欢迎联系微信:cv3d009 请备注:直播宣传,则不予通过。