Перейти к содержанию

LYUMI Private AI — Техническая архитектура

Три стадии развития от прототипа до полностью автономного продукта.

Связано: [[freelance/private_ai_assistant_concept]] — бизнес-концепт

Stage 0 — Prototype (сейчас — Q3 2026)

Цель: вылизать UX на себе, доказать методологию.

Инфраструктура: Hetzner VPS CX31 (~€30/мес)

Стек

  • Client: Telegram Bot (aiogram 3), Claude.ai Mobile (Wiki MCP OAuth), Cowork Desktop
  • Ingestion: Whisper API (голос), Opus Vision API (фото), regex+NLP (расходы, даты)
  • Knowledge: Wiki (markdown, доменная структура), JSONL expenses, ChromaDB (вектор)
  • Integrations: Google Calendar, Gmail, Google Drive, Kiwi.com — через MCP коннекторы
  • Infra: Ubuntu 22.04, systemd, WireGuard VPN, Let's Encrypt

Задачи этапа

  • Ежедневное использование 24/7, сбор всех edge cases
  • Доказать цикл Capture → Process → Access
  • Стабилизировать бота (конкурентность, rate limits, timezone)
  • Накопить базу знаний как демо для клиентов

Stage 1 — Production (Q4 2026 — Q1 2027)

Цель: 3-5 платящих клиентов, изоляция данных, мониторинг.

Инфраструктура: Dedicated server (~€300-500/мес)

Стек

  • Client: Персональный Telegram Bot на клиента + PWA Web App (React)
  • Gateway: NGINX reverse proxy, rate limiting, TLS, client.lyumi.ai/*
  • Orchestrator: FastAPI router, Redis/Celery queue, JWT + OAuth 2.1 auth
  • AI Engine: Whisper (API → self-hosted), LLM Router (Ollama + API fallback), LLaVA vision, BGE embeddings local
  • Per-Client: Docker namespace, PostgreSQL (отдельная БД), Qdrant/Chroma (персональный вектор), LUKS encrypted FS
  • Ops: Grafana + Prometheus, Loki logs, Restic + B2 backups, Admin Dashboard

Изоляция клиентов

Каждый клиент — отдельный Docker namespace: своя БД, свой вектор-стор, свой конфиг. Данные на зашифрованном разделе. Автоматический onboarding скриптом (~1 час). GDPR-ready: полный экспорт данных по запросу.

Задачи этапа

  • Docker-контейнеризация с изоляцией
  • PWA web-клиент (работает как приложение)
  • Гибридный AI: простое — локально, сложное — API
  • Onboarding скрипт для новых клиентов
  • Encrypted backups (Restic → B2)
  • Admin dashboard (usage, MRR, uptime)

Stage 2 — Sovereign AI (Q2 2027+)

Цель: 20+ клиентов, полная автономность, нулевая зависимость от облаков.

Инфраструктура: Dedicated GPU server 2×A100 80GB (~€2-5K/мес)

Стек

  • Client: Native iOS (Swift), Native Android (Kotlin), Desktop (Tauri), Voice Interface, Telegram legacy
  • Edge: WireGuard VPN per client, mTLS Gateway, WebSocket Hub (real-time)
  • AI Cluster: Llama 3.1 405B (vLLM, 4-bit), Whisper Large V3 local (<500ms), LLaVA-Next 34B, Bark/XTTS (TTS с клонированным голосом), BGE-M3 embeddings
  • Reasoning: Agent Framework (multi-step planning), RAG Pipeline (hybrid search + reranking), Memory Engine (long-term + episodic), Action Executor (calendar, email, payments)
  • Per-Client: K8s namespace, PostgreSQL + pgvector (encrypted), MinIO object storage, Neo4j knowledge graph
  • Security: E2E encryption (client-side keys), immutable audit trail, data sovereignty (export/delete anytime), quarterly pen testing

4 кольца безопасности

  1. Network — WireGuard VPN tunnel per client, mTLS, no public endpoints
  2. Infrastructure — K8s namespace isolation, LUKS disk, network policies
  3. Application — E2E encryption, client-held keys, zero-knowledge
  4. Legal — NDA, right to audit, data export, full deletion

WOW-факторы

  • Голосовой диалог в реальном времени с клонированным голосом
  • Персональный Knowledge Graph со связями между людьми/проектами/документами
  • Proactive помощник: готовит сводки к встречам без запроса
  • Zero-Knowledge: даже администратор не видит данные клиента
  • Multi-modal: текст, голос, фото, документы, геолокация
  • Действия: бронирует, платит, отправляет — с подтверждением

Дорожная карта

  • 2026 H1-H2: Stage 0 — обкатка на себе
  • 2026 Q4: Stage 1 — Docker, первые клиенты
  • 2027 Q1: Stage 1 — PWA, гибридный AI
  • 2027 Q2+: Stage 2 — GPU сервер, полная автономность
  • 2027 H2: Stage 2 — native apps, voice, knowledge graph