Page 1 - Aprendizaje No Supervisado
P. 1

Laboraatorio Innteligenncia Arttificial ee

                                             Interneet de lass Cosass


                                       Aprrendizajje No Supervissado


                                          D Dr.Miguel Roojas – mrojaas@ude.edu..uy
                                       A/S DDiego Noguueira –dnoguueira@ude.eedu.uy


                  El Apprendizaje noo supervisado es otra ramma   alggoritmos dee agrupamiennto como  ser el
                  del  aprendizaje  automáticoo donde  el       jerárquicos o DDBSCAN.
                  aprenndizaje se reaaliza con conjjuntos de dattos   A A continuaciión, profunddizaremos  een el
                  NO eetiquetados.                              alggoritmo de KK-means debiido a que es ssimple
                                                                y eficiente.
                  Al iguual que en ell aprendizaje supervisado,, el
                  algoriitmo busca  een los datos patrones  paara   K K-Means
                  poderr aprender,  sin embargoo, no  existe  un   El algoritmoo de K-mmeans generra K
                  conoccimiento prrevio que  indique  qque      aggrupaciones     (clusteers)   distintas
                  signifficado existee en los daatos. Por este   reepresentados  por la meddia (mean)  dde los
                  motivvo, los algoritmos sonn capaces  de      puuntos, que  dda el nombbre al métoddo (k-
                  detectar elementoos, segmenttar datos,  eetc.   m means o k-meedias). Para loograr este objetivo,
                  pero  sin poder darle un valorr semántico. A   el  algoritmo  intenta miniimizar la vaarianza
                  estos  datos se  lees denominaa conjunto  de   inntra-agrupacióón y, por otrro lado, maximizar
                  datos NO etiquetaados.                        la  varianza innter-agrupaciión haciendoo que
                                                                caada grupo tennga elementoos lo más parecidos
                  Los pproyectos de aprendizaje nno supervisaado   poosible entre eellos.
                  se divviden en al mmenos siete ppasos, donde en
                  cada  una de  estos se  rrealizan tareeas     Cada grupo  ddispone de  un centroide que
                  especcíficas:                                 reepresenta el  centro del  grupo a  los que
                      1.  Recolecciión de datos                 peertenecen loos elementoss. La cantidaad de
                      2 2.  Limpieza  y pre-proccesamiento  de   aggrupaciones ddebe ser eleggida por el uusuario
                         datos                                  dee forma tall que cada  grupo brinnde la
                      3 3.  Preparacióón de datos               innformación  ssuficiente y  abarcativa  pposible
                      4 4.  Selección y aplicación del modelo   sinn llegar a ser minimalista. Para determinar el
                      5 5.  Entrenammiento del moodelo          núúmero correccto de grupoos existen téécnicas
                      6 6.  Interpretaación de resuultados      coomo ser el méétodo del coddo.
                      7 7.  Evaluacióón del modeloo
                                                                A Agrupamientto Jerárquicoo
                  Algunnos de los alggoritmos de aprendizaje no   A Al algoritmo  de agrupamiiento  jerárquuico se
                  superrvisado se preesentan a conntinuación:   suustenta en  los denddogramas  yy su
                                                                coonstrucción ees muy similaar a un árbol qque se
                  Algorritmos de aggrupamientoo (Clusteringg)   vaa dividiendoo en  base  aa la secuenccia de
                  En  el aprendizzaje no suppervisado,  llos    elementos. La principal differencia con el K-
                  algoriitmos de  cclustering son la  pieddra   m means es quee no es neccesario conoocer la
                  fundaamental. Esstos algoritmmos permitten    caantidad de grupos ya que la profundiddad del
                  brinddar informacción sin  la  necesidad  de   deendograma ddetermina la ccantidad de ggrupos
                  etiqueetas previaas. Los  aalgoritmos  de     quue se pueden crear.
                  agruppamiento perrmiten segmeentar los dattos
                  en grrupos similarres, donde  eesta división  se   Existen  doss  diferentees  agrupammiento
                  realiza sin neccesidad de  indicar  las       jerárquico:
                  caractterísticas de ccada grupo.
                  Existee una gran  variedad de  algoritmos  de     Aglomerattivo: Tambbién denomminado
                                                                                                 g grupos
                                                                                           con
                                                                    buttom-upp,
                                                                                comienzza
                  agruppamiento basaados en K-mmeans como sser:     pequeños y los hace crecer hasta fformar
                  K-meeans, Lloyd’s k-means, Ellkan’s k-meanns,
                  Fuzzyy  k-means enntre muchos otros,  y otrros    grupos de mayor tamañño.
                                                                   Divisorio:  Conocido  ccomo top-doown, y
                                                                    es el proceso inversoo al aglomerrativo,
   1   2