博世&清华 | CVPR2025端到端第二名DiffVLA:VLM+扩散+混合感知,解锁自动驾驶决策新范式

点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达

3D视觉工坊很荣幸邀请到博世中央研究院高级研究员高煜,为大家着重分享他们团队的工作:DiffVLA在CVPR 2025的NAVSIM v2 End-to-End Driving Challenge赛道中,该技术方案以45.0 EPDMS的优异成绩排在第二位。如果您有相关工作需要分享,欢迎文末联系我们。

DiffVLA: Vision-Language Guided Diffusion Planning for Autonomous Driving
论文链接https://arxiv.org/pdf/2505.19381

直播信息

时间

2025年06月27日(周五)19:00

主题

博世 X 清华 | CVPR2025端到端第二名DiffVLA

直播平台

3D视觉工坊哔哩哔哩

扫码观看直播,或前往B站搜索3D视觉工坊观看直播

3D视觉工坊视频号也将同步直播

主讲嘉宾

高煜
博世中央研究院高级研究员

计算机视觉领域10+年工作经验,现为博世中央研究院(Bosch Corporate Research)高级研究员,自动驾驶感知技术专家,在环境感知与驾驶决策领域具备深厚技术积累。曾参与/主导多代智驾系统的核心算法研发,包括:

  • 近期:端到端智能驾驶模型的架构设计与开发

  • 中期:雷达与前视一体机的核心算法研发

  • 早期:周视感知系统的核心算法开发

直播大纲

博世中国研究院与清华大学AIR团队联合发布突破性研究成果DiffVLA,成功实现通用机器人控制框架π0的VLA范式在动态交通场景中的创新应用。该研究通过深度改造"视觉-语言-动作"范式,攻克了传统端到端方法在自动驾驶领域的多种难题。在CVPR 2025的NAVSIM v2 End-to-End Driving Challenge赛道中,该技术方案以45.0 EPDMS的优异成绩排在第二位

1.开场与简介

  • 自我介绍

  • 公司介绍

  • Diff-VLA方法简介

2.端到端模型中的挑战

  • 可解释性限制

  • 监督的限制

  • 生成模型的限制

3.Diff-VLA框架详解

  • VLA指导模块

  • 混合感知模块

  • 基于扩散的规划模块

  • 轨迹后处理

4.实验结果与性能评估

  • NAVSIMv2的实验设置

  • 关键性能指标(EPDMS)解读

  • 实验结果展示与讨论

5.结论与未来工作

  • Diff-VLA方法的主要发现与成就

  • 讨论当前方法的限制

  • 对未来研究方向的展望

6.Q&A环节

  • 开放提问时间,解答参与者疑问

参与方式

:3D视觉工坊很荣幸邀请到博世中央研究院高级研究员高煜,为大家着重分享他们团队的工作:DiffVLA。如果您有相关工作需要分享,欢迎联系微信:cv3d009 请备注:直播宣传,则不予通过。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值