参考:张伟男(哈尔滨工业大学):具身大模型关键技术与应用
1 构建智能机器人
2 具身智能
2.1 具身感知
重点需要感知能力的机器人:服务机器人、人机协作场景下机器人、社交导航机器人、环境探索机器人
2.1.1 物体感知
物体感知:
PointNet、MeshNet、VoxelNet、DeepSDF、Occupancy Networks
几何形状感知的下游任务:物体位姿估计
构建同类别物体统一坐标空间
物体抓取
传统的物体抓取、基于深度学习的物体抓取、CoPA:结合大模型物体感知的抓取
2.1.2 场景感知
定义:场景感知是通过实现与场景的交互来理解现实世界场景
意义:赋予机器人理解周围环境并与之交互的能力
具体形式:点云、地标、拓扑图、场景图、隐表示