CVPR2018 Oral论文深度解析:人工智能与机器学习的前沿探索

下载需积分: 49 | RAR格式 | 149.91MB | 更新于2025-02-21 | 65 浏览量 | 2 下载量 举报
1 收藏
标题中的"CVPR2018_Oral_论文合集_人工智能_机器学习"提示我们这是一个关于计算机视觉和模式识别会议(Computer Vision and Pattern Recognition Conference,简称CVPR)2018年oral论文的集合。CVPR是由IEEE举办的关于计算机视觉和模式识别领域的顶级学术会议之一,oral论文代表着会议中选定的高质量、创新性较强的研究成果。因此,这本论文合集代表了当时计算机视觉和机器学习领域的最新前沿研究。 描述中列出的各个论文标题,为我们揭示了当前研究的热点主题和方法论。以下是对每篇论文标题所蕴含的知识点进行解释和概述: 1. A Certifiably Globally Optimal Solution to the Non-Minimal Relative Pose Problem.pdf 这篇论文可能提供了非最小相对姿态问题的一个可验证的全局最优解法。在计算机视觉中,相对姿态估计是一个基础问题,涉及到图像之间的几何关系。"非最小"指的是考虑的特征点数量超过了解决问题所需的最小数量。 2. Accurate and Diverse Sampling of Sequences based on a “Best of Many” Sample Objective.pdf 论文研究了如何从多个潜在样本中选取最好的样本以实现准确和多样化的序列采样。这可能与生成模型、强化学习中的策略优化有关。 3. Actor and Action Video Segmentation from a Sentence.pdf 这篇论文关注的是如何根据一句话的描述对视频进行主体和动作的分割。这项工作将自然语言处理与计算机视觉相结合,实现了基于文本的视频内容理解和操作。 4. An Analysis of Scale Invariance in Object Detection - SNIP.pdf 研究了目标检测中尺度不变性的机制,分析了尺度不变性在目标检测中的作用。 5. Analytic Expressions for Probabilistic Moments of PL-DNN with Gaussian Input.pdf 提供了一种用于具有高斯输入的概率深度神经网络的解析表达式。这可能与深度学习中网络权重的概率分析有关。 6. Are You Talking to Me_ Reasoned Visual Dialog Generation through Adversarial Learning.pdf 探讨了通过对抗学习来进行有根据的视觉对话生成。这是视觉问答和自然语言处理的交叉领域。 7. Augmented Skeleton Space Transfer for Depth-based Hand Pose Estimation.pdf 论文可能提出了一种基于深度学习的增强骨架空间转换方法用于基于深度信息的手势姿态估计。 8. Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering.pdf 探讨了图像字幕生成和视觉问答中基于自底向上和自顶下注意机制的使用。 9. CodeSLAM — Learning a Compact, Optimisable Representation for Dense Visual SLAM.pdf 研究了一种名为CodeSLAM的学习方法,旨在为密集视觉SLAM(同步定位与地图构建)学习一个紧凑且可优化的表示。 10. Context Contrasted Feature and Gated Multi-scale Aggregation for Scene Segmentation.pdf 提出了一种基于上下文对比特征和门控多尺度聚合的场景分割方法。 11. Context Encoding for Semantic Segmentation.pdf 探讨了上下文编码在语义分割中的应用,是一种提取与上下文相关特征以增强分割性能的方法。 12. Convolutional Neural Networks with Alternately Updated Clique.pdf 介绍了一种具有交替更新团的卷积神经网络,可能是一种新的网络结构设计。 13. Deep Layer Aggregation.pdf 这篇论文可能详细介绍了深度层次聚合的概念和应用。 14. Deep Learning of Graph Matching.pdf 研究了深度学习在图匹配问题中的应用,图匹配是计算机视觉中的一个重要问题。 15. DensePose Multi-Person Dense Human Pose Estimation In The Wild.pdf 可能提出了一种用于野外环境中多人密集人体姿态估计的DensePose方法。 16. Density Adaptive Point Set Registration.pdf 研究了密度自适应点集配准的方法,这在三维扫描和点云处理中十分重要。 17. Detail-Preserving Pooling in Deep Networks.pdf 介绍了在深度网络中保持细节信息的池化方法,有助于提升图像处理的效果。 18. Direction-aware Spatial Context Features for Shadow Detection.pdf 探讨了具有方向感知的空间上下文特征在阴影检测中的应用。 19. Discriminative Learning of Latent Features for Zero-Shot Recognition.pdf 提出了一种区分性学习潜在特征的方法以支持零样本识别。 20. DoubleFusion_Real-time Capture of Human Performance with Inner Body Shape from a Single Depth Sensor.pdf 可能提供了一种实时捕捉人的表演,包括内部身体形状的技术,该技术利用单一深度传感器。 21. Efficient Optimization for Rank-based Loss Functions.pdf 探讨了针对基于排名的损失函数的优化方法。 22. Egocentric Activity Recognition on a Budget.pdf 研究了如何在资源有限的情况下进行自我中心化活动识别。 23. Fast and Furious_Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net.pdf 这篇论文介绍了一种端到端的实时三维检测、跟踪和运动预测方法,全部通过单一卷积网络实现。 24. Feature Space Transfer for Data Augmentation.pdf 提出了一种用于数据增强的特征空间转换方法。 25. Finding It”_ Weakly-Supervised Reference-Aware Visual Grounding in Instructional Video” .pdf 研究了在教学视频中进行弱监督参考感知视觉定位。 26. Finding Tiny Faces in the Wild with Generative Adversarial Network.pdf 提出了一种基于生成对抗网络的野生环境中微小人脸检测方法。 27. FlipDial_A Generative Model for Two-Way Visual Dialogue .pdf 研究了一种生成模型,用于双向视觉对话。 28. Group Consistent Similarity Learning via Deep CRFs for Person Re-Identification.pdf 探讨了使用深度条件随机场(CRFs)学习组一致性相似度,以实现人员再识别。 29. High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs.pdf 介绍了使用条件生成对抗网络进行高分辨率图像合成和语义操纵。 30. Hybrid Camera Pose Estimation.pdf 研究了一种混合方法来估计相机姿态。 31. Illuminant Spectra-based Source Separation Using Flash Photography.pdf 提出了一种基于光源光谱的源分离方法,使用闪光摄影。 32. Im2Flow_Motion Hallucination from Static Images for Action Recognition.pdf 研究了从静态图片中"幻化"出动作,用于动作识别的方法。 33. Im2Pano3D_Extrapolating 360 Structure and Semantics Beyond the Field of View .pdf 提出了一种方法来推断超出视野范围的360度结构和语义信息。 34. Improved Fusion of Visual and Language Representations by Dense Symmetric Co-Attention for Visual Question Answering.pdf 探讨了通过密集对称共注意力机制改善视觉和语言表示融合,用于视觉问答。 35. Learning Face Age Progression_A Pyramid Architecture of GANs .pdf 研究了基于生成对抗网络金字塔架构的脸部老化进展学习。 36. Learning to Find Good Correspondences .pdf 探讨了如何学习找到好的对应关系,这是计算机视觉中的一个基础问题。 37. Left-Right Comparative Recurrent Model for Stereo Matching.pdf 研究了左右比较递归模型在立体匹配中的应用。 38. MapNet_An Allocentric Spatial Memory for Mapping Environments.pdf 提出了一种用于映射环境的非自传性空间记忆模型MapNet。 39. Maximum Classifier Discrepancy for Unsupervised Domain Adaptation.pdf 探讨了最大分类器差异用于无监督领域自适应的方法。 40. Neural Kinematic Networks for Unsupervised Motion Retargetting.pdf 研究了基于神经运动学网络的无监督运动重定向方法。 这40篇论文覆盖了计算机视觉和机器学习的多个子领域,包括但不限于:姿态估计、目标检测、序列采样、视觉对话、图像字幕、深度学习、图匹配、语义分割、注意力机制、视觉问答、GANs、3D检测与跟踪、数据增强、视觉SLAM等。这些研究成果代表了人工智能和机器学习领域的最新进展,并为相关领域的研究者提供了宝贵的学习和参考资源。

相关推荐

知无已以
  • 粉丝: 0
上传资源 快速赚钱