人像抠图学习笔记

原创已于 2023-11-18 02:11:52 修改 · 5.2k 阅读

文章标签：

#深度学习 #神经网络 #自动驾驶

于 2020-12-06 21:46:56 首次发布

深度学习宝典同时被 2 个专栏收录

1097 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

人脸识别

95 篇文章

订阅专栏

本文介绍了MODNet，一种由香港城市大学和商汤提出的新型人像抠图方法，仅需单张RGB图像，无需绿幕，即可实现实时人像抠图。MODNet将任务分解为语义估计、细节预测和语义-细节融合三个子任务，通过自监督策略减少伪影并提高泛化能力。相比于其他trimap-free方法，MODNet在速度和效果上表现出色，尤其在处理空心结构和头发细节方面。

RobustVideoMatting 实时视频抠图

RobustVideoMatting 实时视频抠图

Modnet 预测脚本

Modnet 效果有时比RobustVideoMatting好，在衣服分割时，

backbone 是mobile v2

gpu 512*512 速度22ms。

import os
import sys
import argparse
import time

import numpy as np
from PIL import Image

import torch
import torch.nn as nn
import torch.nn.functional as F
import torchvision.transforms as transforms

from src.models.modnet import MODNet


if __name__ == '__main__':
    # define cmd arguments
    parser = argparse.ArgumentParser()
    parser.add_argument('--input-path', type=str,default=r'C:\Users\Administrator\Pictures\mm\pics', help='path of input images')
    parser.add_argument('--output-path', type=str,default='out'

了解本专栏