PRODUCTO INSIGNIA

GiperMEMORY: Customer Vector Search

Sistema RAG híbrido de nivel de producción con Knowledge Graph. Memoria mixta multifuncional para agentes. La base de cualquier servicio de IA.

Documentación API

Arquitectura del Sistema

Stack Tecnológico v3.0

Frontend

React 18 + TS + Vite + shadcn/ui

Backend

FastAPI + Pydantic v2

Task Queue

Celery + Redis

Database

PostgreSQL 17 + pgvector

OCR

Docling (IBM)

LLM

OpenRouter / OpenAI / Anthropic

Características Clave

Capacidades del Sistema

Structured OCR

Docling extrae texto, tablas, jerarquía de encabezados y bbox.

Hybrid Chunking

División inteligente en fragmentos con límites semánticos.

LLM Enrichment

MetadataAgent y EntityExtractor enriquecen cada fragmento con contexto.

Knowledge Graph

Las entidades y relaciones se guardan en una estructura de grafo.

Vector Search

pgvector para búsqueda semántica rápida sobre embeddings.

Async Processing

Workers de Celery para procesamiento en segundo plano de documentos de cualquier tamaño.

Pipeline de Procesamiento

Docling-native Pipeline v3.0

Carga

STEP 01

Carga del documento, verificación de estado y selección de plantilla.

Plantilla

STEP 02

Configuración del proveedor LLM y parámetros de fragmentación.

OCR (Docling)

STEP 03

Structured OCR: extracción de texto, tablas y estructura.

Configuración LLM

STEP 04

Inicialización de agentes y servicios de embedding.

Resumen

STEP 05

Generación de resumen del documento para contexto.

Enriquecimiento

STEP 06

Extracción paralela de metadatos y entidades.

Agregación

STEP 07

Deduplicación de entidades y relaciones (Knowledge Graph).

Embedding

STEP 08

Vectorización del contenido de los fragmentos.

Guardado

STEP 09

Guardado de fragmentos y grafo en PostgreSQL.

Finalización

STEP 10

Finalización de tarea y actualización de estado.

Esquema de Base de Datos

PostgreSQL 17 + pgvector

cvs.chunks
content TEXT
embedding vector(1536)
heading_hierarchy TEXT[]
relevance_tags TEXT[]
bbox JSONB
cvs.kg_nodes & edges
node_type person/company...
name TEXT
embedding vector(1536)
edge_type works_at/part_of...

Integración

REST API Reference

POST/api/documents/upload
{
  "id": "upload-abc123...",
  "filename": "contract.pdf",
  "status": "pending"
}
GET/api/documents/{doc_id}/progress
data: {
  "status": "PROGRESS",
  "step": "enrichment",
  "progress": 65,
  "step_label": "Enriquecimiento de metadatos"
}

Despliegue

Docker Compose y Entorno

Services

  • • cvs-backend (FastAPI)
  • • cvs-frontend (React)
  • • cvs-worker (Celery)
  • • cvs-docling (OCR Service)
  • • supabase-db (PostgreSQL)
  • • queue-redis (Redis)

Build Commands

docker compose up -d