Перейти к содержанию

Люми — Roadmap и стоимость фич

Текущее состояние (15 апреля 2026)

  • 62 пользователя, 612 запросов, 172 подписчика канала
  • Инфраструктура: $97/мес (Hetzner $50, OpenRouter $47, Cohere $3)
  • Сервер: CPX52 (12 vCPU, 24GB RAM) — загружен на 15-20%
  • Breakeven: 12 платящих по 3500₸ или 14 по 3000₸

Модель монетизации

Фримиум: 3-5 бесплатных запросов/мес, дальше подписка. Цель — минимум чтобы проект сам себя кормил + покрывал OpenRouter для других ботов.

Прогноз расходов при росте

Сценарий Hetzner OpenRouter Cohere Итого
Сейчас (62 юзера, бета) $50 $45 $3 ~$97
15 платящих $50 $55-65 $3 ~$115
30 платящих $50 $100-130 $5 ~$170
50 платящих + голос $50 $150-200 $8 ~$230

Фичи и стоимость

$0 сверху (только код)

  • Генерация .docx/.pdf — python-docx, отправка файлом в Telegram. Готовые документы с шапкой и структурой
  • Мониторинг Әділет — cron скрипт, парсинг новых приказов МТСЗН/МЧС/МЗ, автодобавление в базу
  • Фримиум — изменение логики rate limiter в bot.py
  • Fine-tune embeddings — sentence-transformers, датасет из 612 реальных запросов
  • Self-learning wiki — Люми запоминает поправки пользователей, новые НПА, частые вопросы. ChromaDB уже стоит
  • NPA Checker — автоматическая проверка качества (уже сделан, на сервере)
  • Post-processing RU→KZ — автозамена российских терминов (уже сделан)

+$2-3/мес

  • Голосовые сообщения (вход) — Whisper через OpenRouter, ~$0.006/мин. HSE-шник на площадке диктует вместо печатания

+$5-10/мес (при росте юзеров)

  • Web search (Sonar) — уже работает, расход растёт с запросами

Будущее ($0 доп. инфраструктуры)

  • TTS (озвучка ответов) — если добавлять, через API
  • Видео-анализ — извлечение кадров + Vision API
  • Кастомизация под компанию — отдельная коллекция в ChromaDB с внутренними процедурами клиента. B2B за 500K-1M₸/мес

Tier 4 идеи (после observation week + Tier 3)

Добавлены 4 мая 2026 по итогам разговора с Claude. Рассматривать не раньше июня-июля, после закрытия Sprint Truth Tier 3 (#74 integration, photo Citations, #73 per-claim).

1. Map-mode «что у тебя по теме X»

Приоритет: средний-высокий. Новый режим работы бота.

Суть: вместо query → top-K → синтезquery → коарсе-кластеризация → таксономия → выбор → детальный ответ.

Пример взаимодействия: - Пользователь: «что у тебя по HOP?» - Бот (intent detector ловит «что у тебя / расскажи / что знаешь»): «У меня в базе по HOP есть: Conklin (5 принципов, книга), Hollnagel (Safety-II), IOGP 622, кейсы. Что углубить?» - Пользователь: «IOGP 622» - Бот → обычный RAG-ответ

Почему умнее обычного RAG: - Снижает галлюцинации — бот не синтезирует «универсальный ответ», показывает реальный inventory - Учит пользователя — он видит структуру предметной области через призму базы - Даёт контроль — пользователь сам решает что читать - Формально это decompose_query наоборот (ср. #74)

Нужно: - intent detector (регекс «что у тебя / расскажи про / что знаешь») - расширенный retrieval (top-30/50) - группировка по источнику/типу/аспекту - multi-turn dialog с памятью первого запроса - routing: широкий запрос → map, узкий → обычный RAG

Косвенный эффект: это хорошая «входная» фича для новых пользователей — они не знают что спросить, а с map-mode легко «что у тебя по работам на высоте / по PtW / по LOTO». Снижает cold-start barrier.

2. Заполнить дыры в базе — HOP

Приоритет: средний. Обнаружено в разговоре 4 мая.

Контекст: Human and Organizational Performance — современная парадигма HSE, растущее направление в международной нефтянке (ТШО, Chevron, Shell, BP). Основные источники: - Todd Conklin — Pre-Accident Investigations, The 5 Principles of Human Performance - Erik Hollnagel — Safety-II vs Safety-I - IOGP Report 622 (Demystifying Human Factors) — открытый доступ - Energy Institute — HOP guidance

Проверка 4 мая: wiki_search «HOP» выдал всего 53% релевантность на топ-результате — то есть темы как отдельного корпуса в базе нет. Бот на вопрос про HOP ответит из training data Sonnet — без NPA citation, без verbatim, слабо.

Связь с Investigation Module: HOP даёт другой framework расследования (learning teams вместо «найти виновного»), прямо связан с [[lyumi/modules/investigation]].

Нужно: индексация IOGP 622 + Conklin + Hollnagel в ChromaDB с правильными metadata (тип, источник, язык). ~30 мин работы на один источник.

3. Связка с «Кастомизацией под компанию» (B2B SKU)

Приоритет: высокий для бизнес-модели. Уже обозначено в «Будущее» — но стоит обосновать жестче.

Позиционирование: Люми не конкурирует с Microsoft Copilot на работе — Copilot индексирует внутреннюю базу КОМПАНИИ, Люми даёт внешний регуляторный контекст РК + международные стандарты. Microsoft никогда не построит базу казахстанской HSE-нормативки с 80% NPA citation — рынок слишком узкий для них.

Киллер-сценарий: HSE-инженер в ТШО спрашивает Люми: «как у нас регламентирован LOTO и каким требованиям РК это должно соответствовать» — бот использует и внутреннюю процедуру клиента (TCO procedure 4.3.7), и гос. нормативку (ТК РК + Приказ 1019). Copilot это не сможет — у него нет нормативки РК в нужной глубине.

Pre-flight перед стройкой: спросить 5–10 активных юзеров (из 48), кто из них просил загружать свои документы. Если никто — гипотеза, не боль. Если хотя бы 2-3 — сигнал строить.

Нужно: - multi-tenant архитектура ChromaDB (отдельные collections per client) - изоляция данных, GDPR-вопросы - аудит доступа - pricing model (~500K-1M₸/мес = $1000-2000/мес за клиента)

Ключевой вывод

Весь roadmap до мая — $97-110/мес. Те же деньги что сейчас. Всё тяжёлое (LLM, Whisper, Reranker) работает через API. Сервер загружен на 15-20%, потолок — 200-300 одновременных пользователей. Крутой бот ≠ дорогой бот.

Связанные

  • [[lyumi/bot_v3]] — техническая карта
  • [[lyumi/brand]] — бренд
  • [[lyumi/modules/investigation]] — модуль расследований (связь с HOP)
  • [[upravlenie/blockers]] — проблемы