Page 34 - revista 2019
P. 34
Revista de la Facultad de Ingeniería, Año 6, Número 1
Ilustración 8: Modelo/Algoritmo Long Short Term Memory
Mecanismos para medir los algoritmos de IA
El mecanismo para medir la performance de los algoritmos o modelos de
Inteligencia artificial (Machine Learning o Deep Learning) se realiza utilizando las
métricas de precisión (Precisión), accuracy (exactitud), recall (sensibilidad), F1 y la
matriz de confusión, estos conceptos son presentados en mayor detalle por Gibson,
A. & Patterson, J. (2017) y Chollet, F (2018). Para comprender estas métricas es
necesario recordar las siguientes variables básicas:
True Positive o TP: Elemento verdaderamente positivo que se predijo como Positivo.
True Negative o TN: Elemento verdaderamente negativo que se predijo como
Negativo.
False Positive o FP: Elemento verdaderamente negativo que se predijo como Positivo
(Falsa alarma o Error tipo 1)
False Negative o FN: Elemento verdaderamente positivo que se predijo como Negativo
(Error tipo 2)
A continuación, presentaremos brevemente las métricas utilizadas para evaluar
la performance de los algoritmos de Deep Learning
Precisión (Precision): Es la forma más intuitiva para medir los algoritmos y consiste en
la cantidad de predicciones positivas correctas (TP) dentro del conjunto positivo
(verdaderos y falsos) retornado (TP+FP).
Exactitud: Representa el rendimiento del algoritmo (clasificaciones exitosas) y
consiste en la cantidad de predicciones correctas (TP+TN) sobre la cantidad total de
elementos (TP+TN+FP+FN)
Recall (Sensibilidad): Es la forma de medir el porcentaje de clasificaciones positivas
(TP) sobre el total de casos positivos en el conjunto de clasificación (TP+FN)
F1: Es la media armónica entre precision y recall, siendo un indicador compuesto
capaz de relacionarlos indicadores de precision y recall.F1 alcanza su mejor valor en
1, cuando la predicción es perfecta (precision y recall perfectos) y su peor valor en 0
en el caso opuesto.
33