Люми — Roadmap и стоимость фич
Текущее состояние (15 апреля 2026)
- 62 пользователя, 612 запросов, 172 подписчика канала
- Инфраструктура: $97/мес (Hetzner $50, OpenRouter $47, Cohere $3)
- Сервер: CPX52 (12 vCPU, 24GB RAM) — загружен на 15-20%
- Breakeven: 12 платящих по 3500₸ или 14 по 3000₸
Модель монетизации
Фримиум: 3-5 бесплатных запросов/мес, дальше подписка. Цель — минимум чтобы проект сам себя кормил + покрывал OpenRouter для других ботов.
Прогноз расходов при росте
| Сценарий | Hetzner | OpenRouter | Cohere | Итого |
|---|---|---|---|---|
| Сейчас (62 юзера, бета) | $50 | $45 | $3 | ~$97 |
| 15 платящих | $50 | $55-65 | $3 | ~$115 |
| 30 платящих | $50 | $100-130 | $5 | ~$170 |
| 50 платящих + голос | $50 | $150-200 | $8 | ~$230 |
Фичи и стоимость
$0 сверху (только код)
- Генерация .docx/.pdf — python-docx, отправка файлом в Telegram. Готовые документы с шапкой и структурой
- Мониторинг Әділет — cron скрипт, парсинг новых приказов МТСЗН/МЧС/МЗ, автодобавление в базу
- Фримиум — изменение логики rate limiter в bot.py
- Fine-tune embeddings — sentence-transformers, датасет из 612 реальных запросов
- Self-learning wiki — Люми запоминает поправки пользователей, новые НПА, частые вопросы. ChromaDB уже стоит
- NPA Checker — автоматическая проверка качества (уже сделан, на сервере)
- Post-processing RU→KZ — автозамена российских терминов (уже сделан)
+$2-3/мес
- Голосовые сообщения (вход) — Whisper через OpenRouter, ~$0.006/мин. HSE-шник на площадке диктует вместо печатания
+$5-10/мес (при росте юзеров)
- Web search (Sonar) — уже работает, расход растёт с запросами
Будущее ($0 доп. инфраструктуры)
- TTS (озвучка ответов) — если добавлять, через API
- Видео-анализ — извлечение кадров + Vision API
- Кастомизация под компанию — отдельная коллекция в ChromaDB с внутренними процедурами клиента. B2B за 500K-1M₸/мес
Tier 4 идеи (после observation week + Tier 3)
Добавлены 4 мая 2026 по итогам разговора с Claude. Рассматривать не раньше июня-июля, после закрытия Sprint Truth Tier 3 (#74 integration, photo Citations, #73 per-claim).
1. Map-mode «что у тебя по теме X»
Приоритет: средний-высокий. Новый режим работы бота.
Суть: вместо query → top-K → синтез — query → коарсе-кластеризация → таксономия → выбор → детальный ответ.
Пример взаимодействия: - Пользователь: «что у тебя по HOP?» - Бот (intent detector ловит «что у тебя / расскажи / что знаешь»): «У меня в базе по HOP есть: Conklin (5 принципов, книга), Hollnagel (Safety-II), IOGP 622, кейсы. Что углубить?» - Пользователь: «IOGP 622» - Бот → обычный RAG-ответ
Почему умнее обычного RAG: - Снижает галлюцинации — бот не синтезирует «универсальный ответ», показывает реальный inventory - Учит пользователя — он видит структуру предметной области через призму базы - Даёт контроль — пользователь сам решает что читать - Формально это decompose_query наоборот (ср. #74)
Нужно: - intent detector (регекс «что у тебя / расскажи про / что знаешь») - расширенный retrieval (top-30/50) - группировка по источнику/типу/аспекту - multi-turn dialog с памятью первого запроса - routing: широкий запрос → map, узкий → обычный RAG
Косвенный эффект: это хорошая «входная» фича для новых пользователей — они не знают что спросить, а с map-mode легко «что у тебя по работам на высоте / по PtW / по LOTO». Снижает cold-start barrier.
2. Заполнить дыры в базе — HOP
Приоритет: средний. Обнаружено в разговоре 4 мая.
Контекст: Human and Organizational Performance — современная парадигма HSE, растущее направление в международной нефтянке (ТШО, Chevron, Shell, BP). Основные источники: - Todd Conklin — Pre-Accident Investigations, The 5 Principles of Human Performance - Erik Hollnagel — Safety-II vs Safety-I - IOGP Report 622 (Demystifying Human Factors) — открытый доступ - Energy Institute — HOP guidance
Проверка 4 мая: wiki_search «HOP» выдал всего 53% релевантность на топ-результате — то есть темы как отдельного корпуса в базе нет. Бот на вопрос про HOP ответит из training data Sonnet — без NPA citation, без verbatim, слабо.
Связь с Investigation Module: HOP даёт другой framework расследования (learning teams вместо «найти виновного»), прямо связан с [[lyumi/modules/investigation]].
Нужно: индексация IOGP 622 + Conklin + Hollnagel в ChromaDB с правильными metadata (тип, источник, язык). ~30 мин работы на один источник.
3. Связка с «Кастомизацией под компанию» (B2B SKU)
Приоритет: высокий для бизнес-модели. Уже обозначено в «Будущее» — но стоит обосновать жестче.
Позиционирование: Люми не конкурирует с Microsoft Copilot на работе — Copilot индексирует внутреннюю базу КОМПАНИИ, Люми даёт внешний регуляторный контекст РК + международные стандарты. Microsoft никогда не построит базу казахстанской HSE-нормативки с 80% NPA citation — рынок слишком узкий для них.
Киллер-сценарий: HSE-инженер в ТШО спрашивает Люми: «как у нас регламентирован LOTO и каким требованиям РК это должно соответствовать» — бот использует и внутреннюю процедуру клиента (TCO procedure 4.3.7), и гос. нормативку (ТК РК + Приказ 1019). Copilot это не сможет — у него нет нормативки РК в нужной глубине.
Pre-flight перед стройкой: спросить 5–10 активных юзеров (из 48), кто из них просил загружать свои документы. Если никто — гипотеза, не боль. Если хотя бы 2-3 — сигнал строить.
Нужно: - multi-tenant архитектура ChromaDB (отдельные collections per client) - изоляция данных, GDPR-вопросы - аудит доступа - pricing model (~500K-1M₸/мес = $1000-2000/мес за клиента)
Ключевой вывод
Весь roadmap до мая — $97-110/мес. Те же деньги что сейчас. Всё тяжёлое (LLM, Whisper, Reranker) работает через API. Сервер загружен на 15-20%, потолок — 200-300 одновременных пользователей. Крутой бот ≠ дорогой бот.
Связанные
- [[lyumi/bot_v3]] — техническая карта
- [[lyumi/brand]] — бренд
- [[lyumi/modules/investigation]] — модуль расследований (связь с HOP)
- [[upravlenie/blockers]] — проблемы