目录
RobustVideoMatting 实时视频抠图
Modnet 预测脚本
Modnet 效果有时比RobustVideoMatting好,在衣服分割时,
backbone 是mobile v2
gpu 512*512 速度22ms。
import os
import sys
import argparse
import time
import numpy as np
from PIL import Image
import torch
import torch.nn as nn
import torch.nn.functional as F
import torchvision.transforms as transforms
from src.models.modnet import MODNet
if __name__ == '__main__':
# define cmd arguments
parser = argparse.ArgumentParser()
parser.add_argument('--input-path', type=str,default=r'C:\Users\Administrator\Pictures\mm\pics', help='path of input images')
parser.add_argument('--output-path', type=str,default='out'

本文介绍了MODNet,一种由香港城市大学和商汤提出的新型人像抠图方法,仅需单张RGB图像,无需绿幕,即可实现实时人像抠图。MODNet将任务分解为语义估计、细节预测和语义-细节融合三个子任务,通过自监督策略减少伪影并提高泛化能力。相比于其他trimap-free方法,MODNet在速度和效果上表现出色,尤其在处理空心结构和头发细节方面。
订阅专栏 解锁全文
2941

被折叠的 条评论
为什么被折叠?



