Page 1 - Retrieval-Augmented Generation - RAG ¿Como Funciona?
P. 1

Laboraatorio Innteligenncia Arttificial ee

                                             Interneet de lass Cosass


                     R Retrievaal Augmmented GGenerattion - ¿CCómo fuuncionaa?

                                          D Dr.Miguel Roojas – mrojaas@ude.edu..uy
                                       A/S DDiego Noguueira –dnoguueira@ude.eedu.uy

               Funcionnamiento dde los Sistemmas RAG               palabras   y    conceptos,   faacilitando
               Los sisttemas RAGG funcionann mediante  la          búsquedass basadas enn significado.
               combinaación de  dos cappacidades:  la
               recuperaación de  iinformaciónn de fuenttes      4..  Almacenammiento en  Bases dee Datos
               externass y la geeneración  dde respuesttas         Vectorialees
               utilizanddo modelos generativos.                  Bases dee datos  eespecializadaas: Los
                                                                   embeddinggs generadoos se almaccenan en
               Arquiteectura y Commponentess Principalees          bases de ddatos vectoriiales optimizzadas.
               Un RAG consiste  de  varios  componenttes
               que traabajan junntos para  proporcionnar        5..  Procesamiiento de Connsultas
               respuesttas precisas yy contextuallizadas:        Vectorizacción de la coonsulta: La pregunta
                                                                   del usuarioo se convieerte en un vvector de
               1.  Ingesstión de Documentos                        embeddingg utilizandoo el mismo  modelo
                 Fuenntes de datoos: El proceso comiennza         que se usóó para los doocumentos.
                  con  lla recopilación de datoos de diverssas    Búsqueda de similituud: Se commpara el
                  fuenttes.                                        vector de  la consultta con los  vectores
                 Cargaa de documentos:  Se utilizan               almacenaddos en la basse de datos vectorial
                  distinntos cargadoores de doccumentos paara      para locaalizar los  documentos más
                  impoortar datos  de diferentees formatoss y      relevantes.
                  fuenttes.                                      Recuperacción de conttexto: Se seleccionan
                 Frecuuencia: Se  define la  ffrecuencia  de      los docummentos o fraggmentos simmilares.
                  cargaa con el  fin de  mantener  la            Generacióón de respuuesta: El moodelo de
                  inforrmación actuualizada.                       lenguaje  ggenera una  respuesta  uutilizando
                                                                   tanto la  cconsulta origginal, el contexto y
               2.  Pre pprocesamiennto de Docuumentos              los docummentos recupperados.
                 Divissión de texxto: Los doocumentos  se
                  dividden en seggmentos  mmás pequeñños        Flujo de Traabajo Comppleto
                  (chunnks) para addaptarse a laas limitacionnes   E El flujo de  ttrabajo de  uun sistema  RAG se
                  de loos modelos dde embeddinngs.              puuede dividir en dos fasees principales:
                 Limppieza de datoos: Se eliminnan elementtos
                  inneccesarios, se  normaliza  yy se preparran   Prreparación de Datos (Fase Offline)
                  los datos para suu procesamieento.
                 Orgaanización: See organizan los datos paara    Ingesta dee documentoos
                  facilitar su recupperación.                    Pre processamiento
                                                                 Generacióón de embedddings
               3.  Geneeración de EEmbeddings                    Almacenammiento
                 Vectoorización: LLos segmenttos de texto se
                  convvierten en veectores (embbeddings) qque   R Respuesta a Coonsultas (Fase e Online)
                  repreesentan el siggnificado seemántico.         Recepciónn de la consuulta del usuaario
                 Modelos de  eembeddings: Se utilizan           Transformmación de laa consulta een vector
                  modeelos específficos para  generar esttas       de embeddding
                  repreesentacioness.                            Búsqueda de los docuumentos
                 Preseervación semmántica: Los embeddinngs
                  captuuran las relaaciones semmánticas enttre    Recuperacción de los ddocumentos
   1   2