Page 1 - Retrieval-Augmented Generation - RAG ¿Como Funciona?
P. 1
Laboraatorio Innteligenncia Arttificial ee
Interneet de lass Cosass
R Retrievaal Augmmented GGenerattion - ¿CCómo fuuncionaa?
D Dr.Miguel Roojas – mrojaas@ude.edu..uy
A/S DDiego Noguueira –dnoguueira@ude.eedu.uy
Funcionnamiento dde los Sistemmas RAG palabras y conceptos, faacilitando
Los sisttemas RAGG funcionann mediante la búsquedass basadas enn significado.
combinaación de dos cappacidades: la
recuperaación de iinformaciónn de fuenttes 4.. Almacenammiento en Bases dee Datos
externass y la geeneración dde respuesttas Vectorialees
utilizanddo modelos generativos. Bases dee datos eespecializadaas: Los
embeddinggs generadoos se almaccenan en
Arquiteectura y Commponentess Principalees bases de ddatos vectoriiales optimizzadas.
Un RAG consiste de varios componenttes
que traabajan junntos para proporcionnar 5.. Procesamiiento de Connsultas
respuesttas precisas yy contextuallizadas: Vectorizacción de la coonsulta: La pregunta
del usuarioo se convieerte en un vvector de
1. Ingesstión de Documentos embeddingg utilizandoo el mismo modelo
Fuenntes de datoos: El proceso comiennza que se usóó para los doocumentos.
con lla recopilación de datoos de diverssas Búsqueda de similituud: Se commpara el
fuenttes. vector de la consultta con los vectores
Cargaa de documentos: Se utilizan almacenaddos en la basse de datos vectorial
distinntos cargadoores de doccumentos paara para locaalizar los documentos más
impoortar datos de diferentees formatoss y relevantes.
fuenttes. Recuperacción de conttexto: Se seleccionan
Frecuuencia: Se define la ffrecuencia de los docummentos o fraggmentos simmilares.
cargaa con el fin de mantener la Generacióón de respuuesta: El moodelo de
inforrmación actuualizada. lenguaje ggenera una respuesta uutilizando
tanto la cconsulta origginal, el contexto y
2. Pre pprocesamiennto de Docuumentos los docummentos recupperados.
Divissión de texxto: Los doocumentos se
dividden en seggmentos mmás pequeñños Flujo de Traabajo Comppleto
(chunnks) para addaptarse a laas limitacionnes E El flujo de ttrabajo de uun sistema RAG se
de loos modelos dde embeddinngs. puuede dividir en dos fasees principales:
Limppieza de datoos: Se eliminnan elementtos
inneccesarios, se normaliza yy se preparran Prreparación de Datos (Fase Offline)
los datos para suu procesamieento.
Orgaanización: See organizan los datos paara Ingesta dee documentoos
facilitar su recupperación. Pre processamiento
Generacióón de embedddings
3. Geneeración de EEmbeddings Almacenammiento
Vectoorización: LLos segmenttos de texto se
convvierten en veectores (embbeddings) qque R Respuesta a Coonsultas (Fase e Online)
repreesentan el siggnificado seemántico. Recepciónn de la consuulta del usuaario
Modelos de eembeddings: Se utilizan Transformmación de laa consulta een vector
modeelos específficos para generar esttas de embeddding
repreesentacioness. Búsqueda de los docuumentos
Preseervación semmántica: Los embeddinngs
captuuran las relaaciones semmánticas enttre Recuperacción de los ddocumentos