Page 26 - Revista 2021 - 2022
P. 26

Revista de la Facultad de Ingeniería, Año 7, Número 1


























                            Figura 1: Arquitectura completa de una red neuronal convolucional
                                 Nota: Fuente: Elaboración propia con base en Saha, (2018)

                  Las redes neuronales convolucionales se basan en las redes de aprendizaje profundo
                  por  lo  que  los  conceptos  como  funciones  de  activación,  pesos,  factor  de
                  entrenamiento,  epochs,  capas  ocultas,  etc.  son  de  uso  frecuente  en  este  tipo  de
                  redes.  Sin  embargo,  las  redes  convolucionales  introducen  un  conjunto  nuevo  de
                  conceptos que serán introducidos y explicados a lo largo de este artículo. Dentro de
                  estos conceptos podemos destacar la dimensionalidad de las imágenes, los filtros, el
                  stride (paso), el padding (relleno) entre otros.

                  Ahora comencemos a desglosar y analizar los componentes principales que hacen a
                  una red neuronal convolucional.

                  Dimensionalidad
                  El  primer  concepto  que  debemos  comprender  es  lo  que  se  conoce  como  la
                  dimensionalidad  de  una  imagen  y  para  ello,  debemos  visualizar  una  imagen  como
                  una matriz de N filas y M columnas, donde cada celda representa 1 píxel. Sin entrar
                  en  mayores  detalles,  cuando  hablamos  de  una  imagen  en  blanco  y  negro  estamos
                  haciendo referencia a una matriz de 2 dimensiones (N x M), donde N es el alto y M el
                  ancho y cada posición de la matriz contiene un valor entre 0 y 255 que representa la
                  opacidad de esa celda (donde 0 es blanco y 255 es negro, resultando en una escala
                  de grises) (ver Figura 2 (a)).
                  Al aplicar esta representación en una imagen color se introduce una nueva dimensión
                  para representare color. Es importante recordar que las imágenes color pueden ser
                  representadas  en  el  formato  RGB  (Red,  Green  y  Blue),  por  este  motivo  la  nueva
                  dimensión  corresponde  a  representar  estos  3  colores,  quedando  de  esta  forma  en
                  una matriz de 3 dimensiones: N x M x Y, donde N es el alto, M el ancho e Y la capa de
                  color  en  RBG.  En  este  caso,  la  celda  en  cada  dimensión  de  color  representa  la
                  intensidad del color (ver Figura 2 (b)).















                                                                                                            25
   21   22   23   24   25   26   27   28   29   30   31