Стратегия Lyumi 2026 — полный план года
Собрано 18 апреля 2026. Обновлено 21 апреля: монетизация через подписку отменена окончательно — бот полностью бесплатный, единственный источник дохода = консалтинг. Обновлено 24 апреля (два этапа за день): утренний заход — 6 архитектурных улучшений, вечерний — session preferences (sticky instructions) + photo Opus 4.7 hardcoded (Bshopanov-driven). Обновлено 29 апреля: PTW + Checklist + Method Statement structured все в проде, осталось только tool calling rewrite + eval pipeline + выходные обновления НПА. Ревью раз в квартал.
Позиционирование
«Люми — HSE-ассистент для всех отраслей Казахстана. Флагман — нефтегаз».
Рефрейм 24 апреля: бот не SaaS для массового рынка, это Google для HSE-специалиста КЗ-нефтегаза. Узкая ниша, ценная для тех кто в ней. Для такого продукта retention не ключевая метрика (не соцсеть) — важна полнота и точность базы.
Архитектура мультиотраслевая by design: - НПА РК универсальны (ТК РК, КоАП, приказы МТСЗН/МЧС/МЗ на все отрасли) - Soft-контент (DuPont, HOP, Bradley, ISO 45001) не привязан к отрасли - Технические темы (ЛОТО, высота, ОЗП, огневые, СИЗ) — кросс-отраслевые
Бизнес-модель (обновлено 21 апреля)
Платформа — лидмагнит и витрина экспертизы под консалтинг, не SaaS-продукт.
Воронка: канал @LyumiHSEDigest (бесплатно) → чат-бот (бесплатно) → консалтинг 200-300K₸/день.
- Чат-бот: полностью бесплатный. Rate limit 30 запросов/день — только техническая защита.
- Консалтинг: цель 2026 — 5-7M₸. 2027 — 15-25M₸.
- Коробочная версия: 5-15M₸/год, только по B2B-запросу.
- Training-симулятор: 3000₸/человек, апсейл к консалтингу.
Затраты: ~$141/мес + «микро-надбавка» от Opus на фото (~+$3/мес при текущем volume).
Бюджет времени: 15-20 часов/неделю при 6 месяцах на ТШО.
Анализ активности на 24 апреля
Цифры за 7 дней: 147 запросов от 15 юзеров. Из 95 всего подписавшихся реально активны в последнее время 2-3 человека.
Hard-core юзер: Bshopanov — независимый HSE-аудитор, 42 запроса за 7 дней. Использует бот как ко-пилота для составления отчёта HSE-аудита производства ЖБИ. 4-часовая сессия итеративного диалога: фото чек-листа → рецензия → аудит проведён → пункт за пунктом наполняет отчёт. Это killer use case — HSE-аудиторы (внешние + внутренние) как потенциальная под-ниша.
Pain'ы Bshopanov'а из логов — драйверы вечернего этапа 24 апреля: - «Ты забываешься опять» (риски → потенциальные последствия) → session preferences - «не ставь пожалуйста звёздочки» → markdown-off режим + /plain - «аттестация рабочих мест» не ретривит ТК РК ст. 182 → синонимы АРМ/медосмотр/производственный контроль - Производственный контроль отдельно от ОТ — gap в базе, обновляем в выходные
Анализ one-shot юзеров (25 чел): - Категория A (~60%) — получили качественный ответ и ушли довольные. Для справочника — норма. - Категория B (~30%) — перегруз на первом контакте (LOTO/RCA одним словом → лекция в 6 шагов). Но для HSE-экспертов длинные ответы = сила продукта. - Категория C — Namor_romaN: запрос про требования о службе ПК отдельно от инженера ОТ — Люми честно сказала «не нашла», а требование есть. Gap в базе, обновляем в выходные.
Технический контекст: где сейчас (по состоянию на 29 апреля)
Архитектурно — «продвинутый RAG 2024 + agentic-зачатки»: hybrid search + rerank + agentic retry + streaming + grounding + reflection + prompt caching + fuzzy semantic cache + session preferences + 5 structured pipelines. За горизонтом — полный agentic AI 2025-2026 через tool calling rewrite.
Сделано в Q2 (к 29 апреля):
Раньше за неделю: - ✅ Семантический кеш + first-token streaming (18 апр) - ✅ Prompt caching (21 апр + Sprint 2 29 апр) — ~60% экономии на input, hit rate 70% на Sonnet, 66% на structured - ✅ Reflection / self-critique (21 апр) — async Haiku fact-check - ✅ Антигаллюц-пакет (21 апр): multi-industry, фантомные документы, контекст собеседника - ✅ Structured Output для всех 5 док-типов: TBT + JSA + PTW + Checklist + MS (21-29 апр) - ✅ Synonym expansion v1.2 (24 апр утро) — гибрид тезаурус 310 терминов + Haiku fallback + round-robin + приоритизация JSON. Вечером добавлены АРМ / аттестация рабочих мест / медосмотр / производственный контроль - ✅ Confidence notes жёстче на НИЗКОЙ (24 апр утро) — обязательный маркер ⚠️ - ✅ Semantic cache fuzzy matching (24 апр, threshold 0.92) — боевой hit 0.942 за 250мс - ✅ Extended thinking для Opus 4.7 (24 апр) — 8000 токенов на текст, 6000 на фото - ✅ KZ retrieval (24 апр) — Haiku-перевод казахского в русский перед RAG - ✅ Photo v2 enriched caption (24 апр) - ✅ Opus-триггеры расширены (24 апр) - ✅ Photo = всегда Opus 4.7 + thinking(6000) (24 апр) - ✅ Message split на 4000 символов - ✅ Session preferences (sticky instructions) (24 апр вечер) - ✅ Cleanup RU rudiments (28 апр) — −2,206 чанков - ✅ Cleanup KZ corporate (28 апр) — −638 чанков - ✅ KB API HTTP bridge (28 апр) — для Pushkin'а - ✅ cleanup_titles in-place (29 апр) — 69,292 чанков починены без re-embed
Осталось до потолка фазы «бесплатная модель» (обновлено 29 апр):
- Выходные 2-3 мая — миграция AX41 + bge-m3 fine-tune + re-extract с фиксом title + multi-mode embeddings
- Обновление НПА + gap по службе ПК (воскресенье) — Namor_romaN-кейс
- Tool calling rewrite (2-3 недели) — архитектурный фундамент agentic-фазы. Делаем когда данных хватит на валидацию.
- Eval pipeline c golden dataset — требует 100-150 Q+A, накапливаются через 👍/👎 и reflections_*.jsonl
После этих четырёх — data wall. Fine-tune, Industry Network, Proactive, dashboard — всё требует объёма пользователей.
Новые кандидаты в roadmap (выведены 29 апр): - Document upload (PDF/DOCX анализ) — расширение photo upload на инцидент-отчёты/акты расследования. Прямое продолжение Bshopanov-кейса. Усиливает Ставку №7 (HSE-аудитор). 3-4 дня работы. Оценить после tool calling. - Knowledge graph (entities + relations) — long-shot для Q3-Q4. Связан со Ставкой №2 Industry Network. 1-2 недели работы.
Стратегические ставки на 2026
Ставка №1: Proactive Люми — ежедневный напарник
Люми первой пишет юзеру раз в неделю по его профилю. Retention x3, viral x5. Работы — 2-3 недели.
Ставка №2: Industry Knowledge Network — панорама отрасли
Анонимизированная аналитика из 500+ юзеров. Unfair advantage для канала и консалтинга.
Ставка №3: Reasoning-модели и Multi-agent
Opus 4.7 + thinking (24 апр задеплоено). Multi-agent «Знайка-режим» — месяц-два.
Ставка №4: Training-симулятор
DuoLingo для HSE. MVP — месяц.
Ставка №5: Fine-tune собственной модели
10-15K Q+A → fine-tune Haiku. Стоимость ↓ в 10-20 раз.
Ставка №6: MCP-server (опциональная)
Только по B2B-запросу.
Ставка №7 (выявлена 24 апреля через Bshopanov-кейс): HSE-аудитор как ключевая под-ниша. Document upload — прямое усиление этой ставки (выведено 29 апр).
Календарь 2026
Q2 (апрель–июнь) — Фундамент + отрыв по восприятию
Главная ставка: сделать бота ощутимо быстрым и надёжным. Техническая часть выполнена к 29 апреля (остались только выходные обновления и tool calling rewrite).
Продукт: - Онбоардинг: проактивный первый вопрос после /start - Канал: 2 поста/неделю + 1 глубокая аналитика/2 недели - Bshopanov-взаимодействие: 15-минутный звонок даст roadmap от реального пользователя
Бизнес: - Бот бесплатный, без подписки - 2-3 консалтинг-разговора/месяц - 1-2 консалтинг-дня/квартал закрыто
Измеримый сигнал Q2: 50+ активных юзеров (≥10 запросов/мес) + 1 закрытый консалтинг-день.
Q3 (июль–сентябрь) — Proactive + Reasoning
Технически: - Proactive messaging: еженедельные апдейты - Multi-agent orchestration: агент-критик для /jsa, /ptw, /pack - User profile memory - Document upload (PDF/DOCX анализ) — усиление Ставки №7
Продукт: - Training MVP — 10 сценариев - ~~Voice reply~~ — ОТМЕНЕНО 21 апреля
Бизнес: 120+ активных, 3-4M₸ консалтинга, 1 корп.пилот.
Измеримый сигнал Q3: первый B2B-разговор + 3M₸ консалтинга.
Q4 (октябрь–декабрь) — Industry Network + B2B
Технически: - Industry knowledge graph или entity layer - Fine-tune Haiku - Dashboard
Продукт: Коробочная версия, 500+ подписчиков канала, митап.
Бизнес: 250+ активных, 1 контракт, годовая цель 5-7M₸.
Измеримый сигнал Q4: 1 корп.пилот + 250 активных + 5-7M₸ закрыто.
Антипаттерны (чего НЕ делаем)
- Отдельные «вертикали» под каждую отрасль — платформа уже универсальна
- Автоматизация НПА-сбора — 2-4 часа руками выгоднее месяца разработки
- Подписка на бота / платные тарифы — отменено 21 апреля
- Voice reply TTS — отменено 21 апреля, HSE-контент для глаз а не для слуха
- Использование внутренних форм операторов (ТШО/КТК/КПО/НКОК/КМГ/Chevron/Shell) — жёсткое правило (memory
feedback_no_company_names) - Гонка за 500 платящих — модель «лидмагнит»
- Рассылка неактивным юзерам — качественные идут через канал + LinkedIn
- Mobile app — Telegram покрывает 95%
- Комментарии на канале — некому модерировать
- Мини-апп на lyumihse.kz
- Видео-анализ — технология сырая
- Своя векторная БД — ChromaDB достаточно
- Рынок СНГ / глобал — моат в КЗ-нефтегазе
Постоянные ритуалы (каждые 2 недели)
- Обновление НПА с Әділет/МЧС/МТСЗН (3-4 часа, суббота)
- 1 пост-анализ в канале
- Замер feedback за 2 недели, фикс топ-3 болей
- Анализ логов one-shot юзеров для поиска gap'ов в базе (подход обновлен 24 апреля)
Итог года
K концу 2026 Lyumi — HSE Intelligence Platform с 3 линейками: 1. Чат-бот (бесплатный, лидмагнит) 2. Training-симулятор (платный) 3. B2B-коробка
Консалтинг 5-7M₸ (2026) → 15-25M₸ (2027).
Главный инсайт: уйти на опережение = скорость feedback loop.
Второй инсайт (21 апреля): fine-tune собственной Haiku критично ради экономики бесплатной модели.
Третий инсайт (24 апреля утро): тех-долг закрывается быстрее чем приходят пользователи. Следующий этап — воронка, не код.
Четвёртый инсайт (24 апреля вечер): анализ логов конкретного hard-core юзера даёт больше roadmap'а чем метрики из 95 юзеров.
Пятый инсайт (29 апреля): все 5 structured pipelines в проде — тех-долга в писании форматированных документов больше нет. Остаётся только архитектурный сдвиг (tool calling) + выходные обновления НПА.
Reference-документы
- Technical snapshot Apr 18 — до 24 апр улучшений
- Bot v3 overview — основная страница бота
- Work log apr28-29 — журнал двух дней перед миграцией
- Migration AX41 — план инфраструктурного переезда
- Memory
project_tech_sprint_apr24— детальный разбор утренних 6 + вечерних session prefs улучшений - Memory
feedback_no_company_names— правило про ТШО/КТК/КПО - PDF-версия в
uploads/Развитие Lyumi HSE помощник.pdf