Page 28 - Revista 2021 - 2022
P. 28
Revista de la Facultad de Ingeniería, Año 7, Número 1
Padding
El padding (relleno) es el marco que se agrega en la imagen por fuera de los límites
de esta, su función principal es poder recorrer toda la imagen sin perder la
información que puede existir en los extremos de la matriz (ver Figura 3). El padding
se encuentra estrechamente relacionado con la matriz convolucional resultante y la
información que esta captura, en una matriz de 5x5 y un padding de 1, al aplicar un
filtro de 3x3 genera una matriz resultante de 5x5; mientras que un padding de 0
genera una matriz de 3x3. Esta diferencia en la dimensión de la matriz significa que
esta última captura menos información en la matriz convolucional (ver Figura 4).
Capa convolucional y filtros
Como se dijo anteriormente, el filtro es una matriz de NxN cuyo objetivo es obtener
las características que se correlacionan con distintos patrones (como ser líneas
rectas, ángulos, contornos, etc.) y para ello, el filtro recorre la matriz que representa
la imagen utilizando el stride para determinar cuántos movimientos debe hacer en
cada paso y el padding para determinar los bordes de la matriz. A medida que el
filtro se aplica a cada sección de la matriz (imagen), se genera la matriz
convolucional. En el ejemplo presentado en la Figura 4, se presenta la imagen
original representada en una matriz de 5x5 (color verde/oscuro), un filtro de 3x3
(color amarillo/claro) donde el número grande representa el valor en la matriz
original (verde/oscuro) y el número pequeño el valor en el filtro (amarillo/claro), por
último, se presenta una matriz convolucional resultante al aplicar el filtro. Esta matriz
será el input de la siguiente capa.
0*1+1*0+1*1+0*0+1*1+1*0+1*1+1*0+0*1 = 3
Figura 4: Aplicación del Filtro de 3x3 en una imagen de 5x5 y la matriz resultante de
3x3
Nota: Fuente: Elaboración propia
Es importante destacar que la capa convolucional es el lugar donde se extraen las
características relevantes que se encuentran en los datos que se están procesando,
estas características se representan jerárquicamente donde las primeras capas
reconocen patrones muy simples y las siguientes reconocen patrones más complejos
en base a los elementos simples de las capas anteriores.
27