计算机视觉期末大作业1
需积分: 0 116 浏览量
更新于2022-08-03
收藏 200KB PDF 举报
【计算机视觉期末大作业1】是一份以Python编程为基础的计算机视觉作业,要求学生综合运用图像处理、图像分割和机器学习技术。以下是作业的具体内容详解:
1. **Seam Carving for Foreground-Preserving Image Resizing (30分)**
这一题目涉及到图像缩放中的Seam Carving算法,特别是"Forward Seam Removing"机制。学生需要实现一个程序,能够在保持前景区域不变的情况下,对图像进行缩放。缩放比例要根据前景区域面积与整个图像面积的比例来确定,一般接近1减去前景区域面积除以两倍的图像面积。每名学生需从他们的测试子集中选择两张代表性的图像,记录Seam Removing的删除过程,并制作成GIF动画提交。测试子集的其他图像需要展示压缩后的结果。
2. **Graph-Based Image Segmentation (20分)**
此部分要求学生应用基于图的图像分割方法,参考Felzenszwalb和Huttenlocher的论文,实现将图像分割为50到70个区域的算法。区域数量必须满足最小50个像素的条件。同时,根据提供的前景mask,将每个区域标记为前景或背景。前景是像素值在mask中超过50%为255的区域,反之为背景。学生需要计算生成的前景mask与GT前景mask的IoU(Intersection over Union)比例。
3. **Visual Bag of Words for Region Classification (50分)**
题目首先要求学生从训练集中选取200张图像,提取归一化的RGB颜色直方图作为特征。接着,对每张图像进行问题2中描述的图像分割,为每个分割区域提取归一化的颜色直方图,并计算区域与全局直方图的对比度特征,形成1024维特征向量。然后,通过PCA降维保留前20维特征。接着,利用这200张图像的区域特征建立一个50维的visual bag of words字典,每个区域的特征表示为与visual word特征的点积相似性。选择一种分类算法(如SVM、Softmax、随机森林、KNN等)训练模型,对测试集上的每个区域进行分类,并根据GT分析预测的准确性。
**评分标准**:
- 算法实现的准确性(50%)
- 实验报告的规范性(30%)
- 代码规范性(20%)
**提交截止日期**:2021年7月13日24:00,逾期一天扣5分。
这份作业涵盖了计算机视觉领域中的关键概念,包括图像缩放、图像分割、特征提取、降维以及分类,旨在让学生深入理解和应用这些技术。学生需要具备扎实的Python编程基础,熟悉OpenCV或其他图像处理库,以及理解机器学习中的特征表示和分类算法。

李诗旸
- 粉丝: 34
最新资源
- 上海市建设工程建筑渣土承运合同.doc
- 办公大楼综合布线系统设计方案二.doc
- GMP培训教材-提取车间安全生产操作知识解释问答.doc
- 普外科出科考试试题.doc
- 广东高速公路桥梁墩柱施工技术交底.doc
- 财务工资管理系统解决方案.doc
- VDA6.3-提问表(潜在供方分析P1).docx
- 华为技术有限公司是一家生产销售通信设备的民营通信科技公司.doc
- 中石化物流培训方案-3-16.doc
- 土石方开挖放坡系数计算法.doc
- 磨床砂轮主轴热处理工艺设计周延源.docx
- 2023年云计算云服务考试试题答案解析试题库完整.doc
- -培训与开发(习题).doc
- HR试题新版.docx
- 如何提高物流配送水平精.doc
- 软件著作权申请截图完整的要求.pdf