Page 26 - Revista 2021 - 2022
P. 26
Revista de la Facultad de Ingeniería, Año 7, Número 1
Figura 1: Arquitectura completa de una red neuronal convolucional
Nota: Fuente: Elaboración propia con base en Saha, (2018)
Las redes neuronales convolucionales se basan en las redes de aprendizaje profundo
por lo que los conceptos como funciones de activación, pesos, factor de
entrenamiento, epochs, capas ocultas, etc. son de uso frecuente en este tipo de
redes. Sin embargo, las redes convolucionales introducen un conjunto nuevo de
conceptos que serán introducidos y explicados a lo largo de este artículo. Dentro de
estos conceptos podemos destacar la dimensionalidad de las imágenes, los filtros, el
stride (paso), el padding (relleno) entre otros.
Ahora comencemos a desglosar y analizar los componentes principales que hacen a
una red neuronal convolucional.
Dimensionalidad
El primer concepto que debemos comprender es lo que se conoce como la
dimensionalidad de una imagen y para ello, debemos visualizar una imagen como
una matriz de N filas y M columnas, donde cada celda representa 1 píxel. Sin entrar
en mayores detalles, cuando hablamos de una imagen en blanco y negro estamos
haciendo referencia a una matriz de 2 dimensiones (N x M), donde N es el alto y M el
ancho y cada posición de la matriz contiene un valor entre 0 y 255 que representa la
opacidad de esa celda (donde 0 es blanco y 255 es negro, resultando en una escala
de grises) (ver Figura 2 (a)).
Al aplicar esta representación en una imagen color se introduce una nueva dimensión
para representare color. Es importante recordar que las imágenes color pueden ser
representadas en el formato RGB (Red, Green y Blue), por este motivo la nueva
dimensión corresponde a representar estos 3 colores, quedando de esta forma en
una matriz de 3 dimensiones: N x M x Y, donde N es el alto, M el ancho e Y la capa de
color en RBG. En este caso, la celda en cada dimensión de color representa la
intensidad del color (ver Figura 2 (b)).
25