Page 26 - Revista FIUDE 2018
P. 26
Revista de la Facultad de Ingeniería, Año 5, Número 1
resultado, es capaz que predecir si un correo es spam o no. Este mismo ejemplo
demuestra que la confiabilidad de los algoritmos nunca es perfecta.
Para comprender cómo evolucionó la definición de machine learning, nos gustaría
hacer referencia a dos definiciones; las mismas fueron planteadas con 40 años de
separación. La primera de ellas es una definición general, que no ahonda en mucho
detalle; fue propuesta por Arthur Samuel en 1959 y dice: “Machine Learning: Field of
study that gives computers the ability to learn without being explicitly
programmed.”
Por otro lado, en 1998, Tom Mitchell propone una nueva y moderna definición que
dice lo siguiente: “A computer program is said to learn from experience E with
respect to some task T and some performance measure P, if its performance on T,
as measured by P, improves with experience E.”. Se puede ver que la definición es
más precisa e incluye los elementos que se tienen en cuenta a la hora de hablar de
machine learning. (Ng, 2018)
Aplicando la definición de Mitchell para el ejemplo de los servidores de correo
electrónico, podemos identificar T, P y E de la siguiente manera:
● T: Clasificar los emails.
● E: Observar cómo el usuario marca los emails como “spam”.
● P: El número de emails correctamente clasificados.
Los algoritmos (o modelos) de machine learning se clasifican según la taxonomía de
salida o, en otras palabras, la información que devuelven. Dicho esto, existen, al
menos, cuatro tipos de algoritmos:
● Supervisado
● No supervisado
● Semi supervisado
● Refuerzo
Nos centraremos exclusivamente en el modelo Supervisado, también conocido como
aprendizaje automático supervisado.
Es importante destacar que el aprendizaje automático requiere disponer de un
conjunto de datos amplio; en ocasiones, miles de datos de información válida sobre
lo que se quiere que el sistema aprenda. Por este motivo, la inteligencia artificial
está muy emparentada con el concepto de Big Data al cual no entraremos.
Machine Learning Supervisado. El enfoque desde la Clasificación
En el modelo de machine learning supervisado se requiere que el algoritmo reciba el
conjunto de datos observado, del cual conocemos el resultado (denominado
“etiqueta”). Estos datos son introducidos al algoritmo con la finalidad de enseñarle
en base a datos conocidos lo que debe aprender.
Un conjunto de datos típico de entrada para el modelo supervisado es:
[x x x ] [y ]
1, 2,.., n 1
[x x x ] [y ]
1, 2,.., n 2
[x x x ] [y ]
1, 2,.., n 3
…. …
[x x x ] [y ]
1, 2,.., n n
25