Page 33 - Revista FIUDE 2018
P. 33
Revista de la Facultad de Ingeniería, Año 5, Número 1
Gráfica
3:
Curva
esperada
Gráfica 4: Curva comparativacomparativa
.
G
Gráfico 5: Gráfico comparativo de dos algoritmos de clasificaciónráfico 5: Gráfico comparativo de dos algoritmos de clasificación
(Rudin & Elston, 2018)
P P
Podemos comparar visualmente la performance de dos modelos (o algoritmos) de odemos comparar visualmente la performance de dos modelos (o algoritmos) de odemos comparar visualmente la performance de dos modelos (o algoritmos) de
c
clasificación al superponer las dos curvas ROC obtenidas. lasificación al superponer las dos curvas ROC obtenidas. A continuaciónA continuación, se
p
presenta una gráfica comparativa de dos tiporesenta una gráfica comparativa de dos tipos de algoritmos de clasificación. s de algoritmos de clasificación.
Para evaluar los resultados, se debe considerar que cuanto más alta yse debe considerar que cuanto más alta yse debe considerar que cuanto más alta y curva es la
l l línea (tendiendo al resultado perfecto), mejor es el rendimiento del modelo; ínea (tendiendo al resultado perfecto), mejor es el rendimiento del modelo; ínea (tendiendo al resultado perfecto), mejor es el rendimiento del modelo; si la
curva supera la diagonal, el modelo ya es mejor que el “el modelo ya es mejor que el “elección al azar”.elección al azar”. En la
gráfica que se presenta en el gráfico 5ráfica que se presenta en el gráfico 5, se puede visualizar fácilmente que el se puede visualizar fácilmente que el
g
modelo representado por la línea roja es de mejor performance que el modelo odelo representado por la línea roja es de mejor performance que el modelo odelo representado por la línea roja es de mejor performance que el modelo
m m
representado por la línea azul.epresentado por la línea azul.
r
Por último, la curva ROC se puede utilizaror último, la curva ROC se puede utilizar para generar valores estadísticos que para generar valores estadísticos que
P
resuman el rendimiento o la efectividad del clasificador.esuman el rendimiento o la efectividad del clasificador.
r
AUC o Area Under the Curve
Si se desea utilizar un valor numérico para comparar modelos, el índice más i se desea utilizar un valor numérico para comparar modelos, el índice más i se desea utilizar un valor numérico para comparar modelos, el índice más
S S
utilizado es el área bajo la curva ROC o AUC (Areatilizado es el área bajo la curva ROC o AUC (Area Under the Curve). the Curve). Se interpreta
u
c c
como la probabilidad que un clasificador puntuará un valor positivo (elegido omo la probabilidad que un clasificador puntuará un valor positivo (elegido omo la probabilidad que un clasificador puntuará un valor positivo (elegido
aleatoriamente), más alto que un negativo.más alto que un negativo.
32