Page 1 - Aprendizaje No Supervisado
P. 1
Laboraatorio Innteligenncia Arttificial ee
Interneet de lass Cosass
Aprrendizajje No Supervissado
D Dr.Miguel Roojas – mrojaas@ude.edu..uy
A/S DDiego Noguueira –dnoguueira@ude.eedu.uy
El Apprendizaje noo supervisado es otra ramma alggoritmos dee agrupamiennto como ser el
del aprendizaje automáticoo donde el jerárquicos o DDBSCAN.
aprenndizaje se reaaliza con conjjuntos de dattos A A continuaciión, profunddizaremos een el
NO eetiquetados. alggoritmo de KK-means debiido a que es ssimple
y eficiente.
Al iguual que en ell aprendizaje supervisado,, el
algoriitmo busca een los datos patrones paara K K-Means
poderr aprender, sin embargoo, no existe un El algoritmoo de K-mmeans generra K
conoccimiento prrevio que indique qque aggrupaciones (clusteers) distintas
signifficado existee en los daatos. Por este reepresentados por la meddia (mean) dde los
motivvo, los algoritmos sonn capaces de puuntos, que dda el nombbre al métoddo (k-
detectar elementoos, segmenttar datos, eetc. m means o k-meedias). Para loograr este objetivo,
pero sin poder darle un valorr semántico. A el algoritmo intenta miniimizar la vaarianza
estos datos se lees denominaa conjunto de inntra-agrupacióón y, por otrro lado, maximizar
datos NO etiquetaados. la varianza innter-agrupaciión haciendoo que
caada grupo tennga elementoos lo más parecidos
Los pproyectos de aprendizaje nno supervisaado poosible entre eellos.
se divviden en al mmenos siete ppasos, donde en
cada una de estos se rrealizan tareeas Cada grupo ddispone de un centroide que
especcíficas: reepresenta el centro del grupo a los que
1. Recolecciión de datos peertenecen loos elementoss. La cantidaad de
2 2. Limpieza y pre-proccesamiento de aggrupaciones ddebe ser eleggida por el uusuario
datos dee forma tall que cada grupo brinnde la
3 3. Preparacióón de datos innformación ssuficiente y abarcativa pposible
4 4. Selección y aplicación del modelo sinn llegar a ser minimalista. Para determinar el
5 5. Entrenammiento del moodelo núúmero correccto de grupoos existen téécnicas
6 6. Interpretaación de resuultados coomo ser el méétodo del coddo.
7 7. Evaluacióón del modeloo
A Agrupamientto Jerárquicoo
Algunnos de los alggoritmos de aprendizaje no A Al algoritmo de agrupamiiento jerárquuico se
superrvisado se preesentan a conntinuación: suustenta en los denddogramas yy su
coonstrucción ees muy similaar a un árbol qque se
Algorritmos de aggrupamientoo (Clusteringg) vaa dividiendoo en base aa la secuenccia de
En el aprendizzaje no suppervisado, llos elementos. La principal differencia con el K-
algoriitmos de cclustering son la pieddra m means es quee no es neccesario conoocer la
fundaamental. Esstos algoritmmos permitten caantidad de grupos ya que la profundiddad del
brinddar informacción sin la necesidad de deendograma ddetermina la ccantidad de ggrupos
etiqueetas previaas. Los aalgoritmos de quue se pueden crear.
agruppamiento perrmiten segmeentar los dattos
en grrupos similarres, donde eesta división se Existen doss diferentees agrupammiento
realiza sin neccesidad de indicar las jerárquico:
caractterísticas de ccada grupo.
Existee una gran variedad de algoritmos de Aglomerattivo: Tambbién denomminado
g grupos
con
buttom-upp,
comienzza
agruppamiento basaados en K-mmeans como sser: pequeños y los hace crecer hasta fformar
K-meeans, Lloyd’s k-means, Ellkan’s k-meanns,
Fuzzyy k-means enntre muchos otros, y otrros grupos de mayor tamañño.
Divisorio: Conocido ccomo top-doown, y
es el proceso inversoo al aglomerrativo,