Page 28 - Revista 2021 - 2022
P. 28

Revista de la Facultad de Ingeniería, Año 7, Número 1
                  Padding

                  El padding (relleno) es el marco que se agrega en la imagen por fuera de los límites
                  de  esta,  su  función  principal  es  poder  recorrer  toda  la  imagen  sin  perder  la
                  información que puede existir en los extremos de la matriz (ver Figura 3). El padding
                  se encuentra estrechamente relacionado con la matriz convolucional resultante y la
                  información que esta captura, en una matriz de 5x5 y un padding de 1, al aplicar un
                  filtro  de  3x3  genera  una  matriz  resultante  de  5x5;  mientras  que  un  padding  de  0
                  genera una matriz de 3x3. Esta diferencia en la dimensión de la matriz significa que
                  esta última captura menos información en la matriz convolucional (ver Figura 4).


                  Capa convolucional y filtros
                  Como se dijo anteriormente, el filtro es una matriz de NxN cuyo objetivo es obtener
                  las  características  que  se  correlacionan  con  distintos  patrones  (como  ser  líneas
                  rectas, ángulos, contornos, etc.) y para ello, el filtro recorre la matriz que representa
                  la  imagen  utilizando  el  stride  para  determinar  cuántos  movimientos  debe  hacer  en
                  cada  paso  y  el  padding  para  determinar  los  bordes  de  la  matriz.  A  medida  que  el
                  filtro  se  aplica  a  cada  sección  de  la  matriz  (imagen),  se  genera  la  matriz
                  convolucional.  En  el  ejemplo  presentado  en  la  Figura  4,  se  presenta  la  imagen
                  original  representada  en  una  matriz  de  5x5  (color  verde/oscuro),  un  filtro  de  3x3
                  (color  amarillo/claro)  donde  el  número  grande  representa  el  valor  en  la  matriz
                  original (verde/oscuro) y el número pequeño el valor en el filtro (amarillo/claro), por
                  último, se presenta una matriz convolucional resultante al aplicar el filtro. Esta matriz
                  será el input de la siguiente capa.


















                                     0*1+1*0+1*1+0*0+1*1+1*0+1*1+1*0+0*1 = 3


                   Figura 4: Aplicación del Filtro de 3x3 en una imagen de 5x5 y la matriz resultante de

                                                              3x3
                                              Nota: Fuente: Elaboración propia

                  Es  importante  destacar  que  la  capa  convolucional  es  el  lugar  donde  se  extraen  las
                  características relevantes que se encuentran en los datos que se están procesando,
                  estas  características  se  representan  jerárquicamente  donde  las  primeras  capas
                  reconocen patrones muy simples y las siguientes reconocen patrones más complejos
                  en base a los elementos simples de las capas anteriores.










                                                                                                            27
   23   24   25   26   27   28   29   30   31   32   33