КОРПОРАТИВНАЯ ПАМЯТЬ

GiperMEMORY: Ваша база знаний обретает память

Больше никакой амнезии и слепоты к таблицам. Система, которая понимает контекст, видит картинки и работает полностью на ваших серверах.

Читать статью

Архитектура Системы

Полный стек технологий v3.0

Frontend

React 18 + TS + Vite + shadcn/ui

Backend

FastAPI + Pydantic v2

Task Queue

Celery + Redis

Database

PostgreSQL 17 + pgvector

OCR

Docling (IBM)

LLM

OpenRouter / OpenAI / Anthropic

Ключевые особенности

Почему GiperMEMORY умнее обычного RAG

OCR нового поколения

Идеально читает многоколоночные PDF, восстанавливает структуру таблиц и работает с плохими сканами.

Семантический чанкинг

Разбивает текст по смыслу, а не по символам. Обогащает каждый фрагмент метаданными.

Vision-модели

Превращает графики, схемы и чертежи в подробные текстовые описания для поиска.

Темпоральный граф

Помнит историю изменений. Знает, кто был директором в 2023 году, а кто сейчас.

Гибридный поиск

Сочетает векторный поиск (по смыслу) и полнотекстовый (по ключевым словам) для точности 94%.

100% On-Premise

Полная изоляция данных. Ни один байт не покидает ваш контур. Соответствие 152-ФЗ.

Pipeline обработки

Как мы превращаем файлы в знания

Загрузка

STEP 01

Поддержка PDF, DOCX, XLSX, Images. Drag-and-drop интерфейс.

OCR & Layout

STEP 02

Распознавание структуры документа, таблиц и форм.

Vision Analysis

STEP 03

Генерация описаний для изображений и диаграмм.

Chunking

STEP 04

Умное разбиение на смысловые блоки.

Enrichment

STEP 05

Добавление метаданных: даты, авторы, темы.

Embedding

STEP 06

Векторизация текста для семантического поиска.

Graph Build

STEP 07

Создание связей между сущностями в графе.

Indexing

STEP 08

Сохранение в векторную базу (pgvector).

Reasoning

STEP 09

Подготовка данных для аналитических запросов.

Ready

STEP 10

Данные доступны для мгновенного поиска.

Структура данных

PostgreSQL 17 + pgvector

cvs.chunks
content TEXT
embedding vector(1536)
heading_hierarchy TEXT[]
relevance_tags TEXT[]
bbox JSONB
cvs.kg_nodes & edges
node_type person/company...
name TEXT
embedding vector(1536)
edge_type works_at/part_of...

API Интеграция

Простой REST API для ваших приложений

POST/api/documents/upload
{
  "id": "upload-abc123...",
  "filename": "contract.pdf",
  "status": "pending"
}
GET/api/documents/{doc_id}/progress
data: {
  "status": "PROGRESS",
  "step": "enrichment",
  "progress": 65,
  "step_label": "Обогащение метаданными"
}

Развертывание

Docker Compose & Environment

Services

  • • cvs-backend (FastAPI)
  • • cvs-frontend (React)
  • • cvs-worker (Celery)
  • • cvs-docling (OCR Service)
  • • supabase-db (PostgreSQL)
  • • queue-redis (Redis)

Build Commands

docker compose up -d