Es una Red Neuronal. Se puede entender como un modelo matemático que se ha entrenado con conjuntos de datos masivos.
Hay dos tipos de LLM’s [1]
En un RAG, busca la información que requiere para luego generar un prompt aumentado y enviarlo al LLM. Para eello tiene dos procesos:
Retrieval (Recuperación), quer permite buscar la información, para realizar esto tiene dos enfoques:
Cada uno de los mètodos puede devolver una lista de los posibles documentos que pueden funcionar, y luego por medio de la metada de los documentos, la lista es filtrada para obtener una lista con los documentos más relevantes, que son enviados al modelo como parte del prompt aumentado.
el proceso de razonar sobre esa información y responder se denomina Generación.
flowchart LR
A["Recuperación - Retriever <br>Recopilar información"]
B["Generación<br>Razonar y responder"]
A --> B
Para el proceso de