活动介绍

计算机视觉期末大作业1

preview
需积分: 0 25 下载量 116 浏览量 更新于2022-08-03 收藏 200KB PDF 举报
【计算机视觉期末大作业1】是一份以Python编程为基础的计算机视觉作业,要求学生综合运用图像处理、图像分割和机器学习技术。以下是作业的具体内容详解: 1. **Seam Carving for Foreground-Preserving Image Resizing (30分)** 这一题目涉及到图像缩放中的Seam Carving算法,特别是"Forward Seam Removing"机制。学生需要实现一个程序,能够在保持前景区域不变的情况下,对图像进行缩放。缩放比例要根据前景区域面积与整个图像面积的比例来确定,一般接近1减去前景区域面积除以两倍的图像面积。每名学生需从他们的测试子集中选择两张代表性的图像,记录Seam Removing的删除过程,并制作成GIF动画提交。测试子集的其他图像需要展示压缩后的结果。 2. **Graph-Based Image Segmentation (20分)** 此部分要求学生应用基于图的图像分割方法,参考Felzenszwalb和Huttenlocher的论文,实现将图像分割为50到70个区域的算法。区域数量必须满足最小50个像素的条件。同时,根据提供的前景mask,将每个区域标记为前景或背景。前景是像素值在mask中超过50%为255的区域,反之为背景。学生需要计算生成的前景mask与GT前景mask的IoU(Intersection over Union)比例。 3. **Visual Bag of Words for Region Classification (50分)** 题目首先要求学生从训练集中选取200张图像,提取归一化的RGB颜色直方图作为特征。接着,对每张图像进行问题2中描述的图像分割,为每个分割区域提取归一化的颜色直方图,并计算区域与全局直方图的对比度特征,形成1024维特征向量。然后,通过PCA降维保留前20维特征。接着,利用这200张图像的区域特征建立一个50维的visual bag of words字典,每个区域的特征表示为与visual word特征的点积相似性。选择一种分类算法(如SVM、Softmax、随机森林、KNN等)训练模型,对测试集上的每个区域进行分类,并根据GT分析预测的准确性。 **评分标准**: - 算法实现的准确性(50%) - 实验报告的规范性(30%) - 代码规范性(20%) **提交截止日期**:2021年7月13日24:00,逾期一天扣5分。 这份作业涵盖了计算机视觉领域中的关键概念,包括图像缩放、图像分割、特征提取、降维以及分类,旨在让学生深入理解和应用这些技术。学生需要具备扎实的Python编程基础,熟悉OpenCV或其他图像处理库,以及理解机器学习中的特征表示和分类算法。
身份认证 购VIP最低享 7 折!
30元优惠券