Prática de ML: classificação de imagens

Teste seu conhecimento: convolução

Um filtro convolucional bidimensional 3x3 é aplicado a um mapa de recursos de entrada bidimensional 4x4 (sem adição de padding):

Qual é o formato do mapa de recursos de saída?
2x2
À medida que o filtro 3x3 desliza sobre o mapa de recursos 4x4, há quatro locais exclusivos em que ele pode ser colocado, o que resulta em um mapa de recursos de saída 2x2: Animação mostrando um filtro convolucional 3x3 deslizando sobre um mapa de recursos 4x4.
           Há quatro posições exclusivas em que o filtro 3x3 pode ser colocado, cada uma correspondendo a um dos quatro elementos no mapa de recursos de saída 2x2.
3x3
Embora o filtro seja 3x3, o mapa de recursos de saída é menor porque há menos de 9 (3 vezes 3) locais possíveis em que o filtro pode ser colocado no mapa de recursos de entrada 4x4.
4x4
Para gerar um mapa de recursos de saída com as mesmas dimensões do mapa de recursos de entrada sem padding, o filtro convolucional precisa ter o formato 1x1. Um filtro maior que 1x1 produz um mapa de recursos de saída menor que o mapa de recursos de entrada. Como nosso filtro é 3x3, o mapa de recursos de saída precisa ser menor que 4x4.