Page 31 - revista 2019
P. 31
Revista de la Facultad de Ingeniería, Año 6, Número 1
Logistic classifier
El Logistic classifier, también conocido como Logistic Regression (de ahora en
más LC) es un algoritmo de inteligencia artificial que, si bien no es considerado como
algoritmo de Deep learning se considera el “Hello, world” en aprendizaje automático.
Debido a su simplicidad es un buen mecanismo para comprender el funcionamiento
básico de los algoritmos de aprendizaje automático y luego extender dichos
conceptos con el fin de aplicarlos a algoritmos de Deep learning más complejos,
como ser el Multi Layer Perception o MLP.
El algoritmo de LC dispone únicamente de 2 capas, donde la primera de ella es
la capa de entrada (input) y la segunda es la capa de salida (output). Cada neurona de
la capa de entrada se puede decir que se correlaciona directamente con la capa de
salida mediante los pesos (w i).
Su simpleza hace que el modelo tenga poco poder de entrenamiento ya que
dispone de un único nivel entrenable que se encuentra determinado por los pesos
(w i). El proceso de aprendizaje se realiza al calcular la mejor combinación de pesos
posibles en función de los datos de entrenamiento (input); y para que se logre este
cometido se calcula la combinación de pesos que más adecuada que acerca los
outputs predichos a los valores reales.
Los datos de la capa de salida se convierten en probabilidades utilizando la
función softmax, por último, se utiliza la función de pérdida(o Loss Function) para
todas las combinaciones obtenidas y de esa forma optimizar el algoritmo al
seleccionar la mejor combinación de pesos donde la distancia del resultado predicho
al valor real sea la menor posible para los datos utilizados en el entrenamiento.
Recordemos que la función Softmax convierte un vector de valores no normalizados
en una función probabilística (cada valor cuando es sumado da 100%) y la función de
pérdida es la función utilizada para calcular el error (o distancia) entre el valor de
salida predicho por nuestro algoritmo y el valor real.
Ilustración 5: Función de pérdida o Loss function
La salida de una red neuronal es un vector sin significado semántico y es
proporcional al nro. de clases que tenemos en el problema, utilizando la función
softmax se transforma en una probabilidad. Utilizando esta función podemos obtener
resultados que se pueden interpretar de la siguiente manera: El texto ingresado para
analizar tiene 90% de porcentaje de ser un texto con sentimiento categorizado en
“tristeza”
30