Page 26 - Revista FIUDE 2018
P. 26

Revista de la Facultad de Ingeniería, Año 5, Número 1

                  resultado, es capaz que predecir si un correo es spam o no.  Este mismo ejemplo
                  demuestra que la confiabilidad de los algoritmos nunca es perfecta.

                  Para comprender cómo evolucionó la definición de machine learning, nos gustaría
                  hacer referencia a dos definiciones; las mismas fueron planteadas con 40 años de
                  separación.  La primera de ellas es una definición general, que no ahonda en mucho
                  detalle; fue propuesta por Arthur Samuel en 1959 y dice: “Machine Learning: Field of
                  study  that  gives  computers  the  ability  to  learn  without  being  explicitly
                  programmed.”
                  Por otro lado, en 1998, Tom Mitchell propone una nueva y moderna definición que
                  dice  lo  siguiente:  “A  computer  program  is  said  to  learn  from  experience  E  with
                  respect to some task T and some performance measure P, if its performance on T,
                  as measured by P, improves with experience E.”.  Se puede ver que la definición es
                  más precisa e incluye los elementos que se tienen en cuenta a la hora de hablar de
                  machine learning. (Ng, 2018)
                  Aplicando  la  definición  de  Mitchell  para  el  ejemplo  de  los  servidores  de  correo
                  electrónico, podemos identificar T, P y E de la siguiente manera:
                      ●  T: Clasificar los emails.
                      ●  E: Observar cómo el usuario marca los emails como “spam”.
                      ●  P: El número de emails correctamente clasificados.

                  Los algoritmos (o modelos) de machine learning se clasifican según la taxonomía de
                  salida o, en otras palabras, la información que devuelven.  Dicho esto, existen, al
                  menos, cuatro tipos de algoritmos:
                      ●  Supervisado
                      ●  No supervisado
                      ●  Semi supervisado
                      ●  Refuerzo

                  Nos centraremos exclusivamente en el modelo Supervisado, también conocido como
                  aprendizaje automático supervisado.

                  Es  importante  destacar  que  el  aprendizaje  automático  requiere  disponer  de  un
                  conjunto de datos amplio; en ocasiones, miles de datos de información válida sobre
                  lo que se quiere que el sistema aprenda.  Por este motivo, la inteligencia artificial
                  está muy emparentada con el concepto de Big Data al cual no entraremos.

                  Machine Learning Supervisado.  El enfoque desde la Clasificación

                  En el modelo de machine learning supervisado se requiere que el algoritmo reciba el
                  conjunto  de  datos  observado,  del  cual  conocemos  el  resultado  (denominado
                  “etiqueta”).  Estos datos son introducidos al algoritmo con la finalidad de enseñarle
                  en base a datos conocidos lo que debe aprender.

                  Un conjunto de datos típico de entrada para el modelo supervisado es:


                                                     [x x x ]         [y ]
                                                       1,  2,..,  n     1
                                                     [x x x ]         [y ]
                                                       1,  2,..,  n     2
                                                     [x x x ]         [y ]
                                                       1,  2,..,  n     3
                                                        ….             …
                                                     [x x x ]         [y ]
                                                       1,  2,..,  n     n




                                                                                                           25
   21   22   23   24   25   26   27   28   29   30   31