Es una Red Neuronal. Se puede entender como un modelo matemático que se ha entrenado con conjuntos de datos masivos.

Hay dos tipos de LLM’s [1]

Base LLM. Predice la siguiente palabra, basados en el texto de entrenamiento.
Instruction Tuned LLM. Intenta seguir instrucciones, Fine-tune, Refina una instrucción e intenta realizar buenos intentos para lograr el objetivo.

RAG - Retrieval Augmented Generation

En un RAG, busca la información que requiere para luego generar un prompt aumentado y enviarlo al LLM. Para eello tiene dos procesos:

Retrieval (Recuperación), quer permite buscar la información, para realizar esto tiene dos enfoques:
1. Keyword Search. Busca en los documentos las palabra exacta encontradas en el prompt. Dentro de las técnias se encuentra:
  1. Búsqueda por palabras claves, realiza la búsqueda si comparten palabras en común en el mensaje, en este caso, es importante ingresar tecnicas de normalización para evitar que existe un alto scoring en la búsqueda solo por que el texto es largo, adicional se requiere poner a las palabras un sistema de peso o relevancia como el IDF.
2. Semantic Search. Busca documentos que tenga un significado parecido del prompt.
Cada uno de los mètodos puede devolver una lista de los posibles documentos que pueden funcionar, y luego por medio de la metada de los documentos, la lista es filtrada para obtener una lista con los documentos más relevantes, que son enviados al modelo como parte del prompt aumentado.
el proceso de razonar sobre esa información y responder se denomina Generación.

flowchart LR
    A["Recuperación - Retriever <br>Recopilar información"]
    B["Generación<br>Razonar y responder"]
  A --> B

Para el proceso de