Стратегия Lyumi 2026 — полный план года

Собрано 18 апреля 2026. Обновлено 21 апреля: монетизация через подписку отменена окончательно — бот полностью бесплатный, единственный источник дохода = консалтинг. Обновлено 24 апреля (два этапа за день): утренний заход — 6 архитектурных улучшений, вечерний — session preferences (sticky instructions) + photo Opus 4.7 hardcoded (Bshopanov-driven). Обновлено 29 апреля: PTW + Checklist + Method Statement structured все в проде, осталось только tool calling rewrite + eval pipeline + выходные обновления НПА. Ревью раз в квартал.

Позиционирование

«Люми — HSE-ассистент для всех отраслей Казахстана. Флагман — нефтегаз».

Рефрейм 24 апреля: бот не SaaS для массового рынка, это Google для HSE-специалиста КЗ-нефтегаза. Узкая ниша, ценная для тех кто в ней. Для такого продукта retention не ключевая метрика (не соцсеть) — важна полнота и точность базы.

Архитектура мультиотраслевая by design: - НПА РК универсальны (ТК РК, КоАП, приказы МТСЗН/МЧС/МЗ на все отрасли) - Soft-контент (DuPont, HOP, Bradley, ISO 45001) не привязан к отрасли - Технические темы (ЛОТО, высота, ОЗП, огневые, СИЗ) — кросс-отраслевые

Бизнес-модель (обновлено 21 апреля)

Платформа — лидмагнит и витрина экспертизы под консалтинг, не SaaS-продукт.

Воронка: канал @LyumiHSEDigest (бесплатно) → чат-бот (бесплатно) → консалтинг 200-300K₸/день.

Чат-бот: полностью бесплатный. Rate limit 30 запросов/день — только техническая защита.
Консалтинг: цель 2026 — 5-7M₸. 2027 — 15-25M₸.
Коробочная версия: 5-15M₸/год, только по B2B-запросу.
Training-симулятор: 3000₸/человек, апсейл к консалтингу.

Затраты: ~$141/мес + «микро-надбавка» от Opus на фото (~+$3/мес при текущем volume).

Бюджет времени: 15-20 часов/неделю при 6 месяцах на ТШО.

Анализ активности на 24 апреля

Цифры за 7 дней: 147 запросов от 15 юзеров. Из 95 всего подписавшихся реально активны в последнее время 2-3 человека.

Hard-core юзер: Bshopanov — независимый HSE-аудитор, 42 запроса за 7 дней. Использует бот как ко-пилота для составления отчёта HSE-аудита производства ЖБИ. 4-часовая сессия итеративного диалога: фото чек-листа → рецензия → аудит проведён → пункт за пунктом наполняет отчёт. Это killer use case — HSE-аудиторы (внешние + внутренние) как потенциальная под-ниша.

Pain'ы Bshopanov'а из логов — драйверы вечернего этапа 24 апреля: - «Ты забываешься опять» (риски → потенциальные последствия) → session preferences - «не ставь пожалуйста звёздочки» → markdown-off режим + /plain - «аттестация рабочих мест» не ретривит ТК РК ст. 182 → синонимы АРМ/медосмотр/производственный контроль - Производственный контроль отдельно от ОТ — gap в базе, обновляем в выходные

Анализ one-shot юзеров (25 чел): - Категория A (~60%) — получили качественный ответ и ушли довольные. Для справочника — норма. - Категория B (~30%) — перегруз на первом контакте (LOTO/RCA одним словом → лекция в 6 шагов). Но для HSE-экспертов длинные ответы = сила продукта. - Категория C — Namor_romaN: запрос про требования о службе ПК отдельно от инженера ОТ — Люми честно сказала «не нашла», а требование есть. Gap в базе, обновляем в выходные.

Технический контекст: где сейчас (по состоянию на 29 апреля)

Архитектурно — «продвинутый RAG 2024 + agentic-зачатки»: hybrid search + rerank + agentic retry + streaming + grounding + reflection + prompt caching + fuzzy semantic cache + session preferences + 5 structured pipelines. За горизонтом — полный agentic AI 2025-2026 через tool calling rewrite.

Сделано в Q2 (к 29 апреля):

Раньше за неделю: - ✅ Семантический кеш + first-token streaming (18 апр) - ✅ Prompt caching (21 апр + Sprint 2 29 апр) — ~60% экономии на input, hit rate 70% на Sonnet, 66% на structured - ✅ Reflection / self-critique (21 апр) — async Haiku fact-check - ✅ Антигаллюц-пакет (21 апр): multi-industry, фантомные документы, контекст собеседника - ✅ Structured Output для всех 5 док-типов: TBT + JSA + PTW + Checklist + MS (21-29 апр) - ✅ Synonym expansion v1.2 (24 апр утро) — гибрид тезаурус 310 терминов + Haiku fallback + round-robin + приоритизация JSON. Вечером добавлены АРМ / аттестация рабочих мест / медосмотр / производственный контроль - ✅ Confidence notes жёстче на НИЗКОЙ (24 апр утро) — обязательный маркер ⚠️ - ✅ Semantic cache fuzzy matching (24 апр, threshold 0.92) — боевой hit 0.942 за 250мс - ✅ Extended thinking для Opus 4.7 (24 апр) — 8000 токенов на текст, 6000 на фото - ✅ KZ retrieval (24 апр) — Haiku-перевод казахского в русский перед RAG - ✅ Photo v2 enriched caption (24 апр) - ✅ Opus-триггеры расширены (24 апр) - ✅ Photo = всегда Opus 4.7 + thinking(6000) (24 апр) - ✅ Message split на 4000 символов - ✅ Session preferences (sticky instructions) (24 апр вечер) - ✅ Cleanup RU rudiments (28 апр) — −2,206 чанков - ✅ Cleanup KZ corporate (28 апр) — −638 чанков - ✅ KB API HTTP bridge (28 апр) — для Pushkin'а - ✅ cleanup_titles in-place (29 апр) — 69,292 чанков починены без re-embed

Осталось до потолка фазы «бесплатная модель» (обновлено 29 апр):

Выходные 2-3 мая — миграция AX41 + bge-m3 fine-tune + re-extract с фиксом title + multi-mode embeddings
Обновление НПА + gap по службе ПК (воскресенье) — Namor_romaN-кейс
Tool calling rewrite (2-3 недели) — архитектурный фундамент agentic-фазы. Делаем когда данных хватит на валидацию.
Eval pipeline c golden dataset — требует 100-150 Q+A, накапливаются через 👍/👎 и reflections_*.jsonl

После этих четырёх — data wall. Fine-tune, Industry Network, Proactive, dashboard — всё требует объёма пользователей.

Новые кандидаты в roadmap (выведены 29 апр): - Document upload (PDF/DOCX анализ) — расширение photo upload на инцидент-отчёты/акты расследования. Прямое продолжение Bshopanov-кейса. Усиливает Ставку №7 (HSE-аудитор). 3-4 дня работы. Оценить после tool calling. - Knowledge graph (entities + relations) — long-shot для Q3-Q4. Связан со Ставкой №2 Industry Network. 1-2 недели работы.

Стратегические ставки на 2026

Ставка №1: Proactive Люми — ежедневный напарник

Люми первой пишет юзеру раз в неделю по его профилю. Retention x3, viral x5. Работы — 2-3 недели.

Ставка №2: Industry Knowledge Network — панорама отрасли

Анонимизированная аналитика из 500+ юзеров. Unfair advantage для канала и консалтинга.

Ставка №3: Reasoning-модели и Multi-agent

Opus 4.7 + thinking (24 апр задеплоено). Multi-agent «Знайка-режим» — месяц-два.

Ставка №4: Training-симулятор

DuoLingo для HSE. MVP — месяц.

Ставка №5: Fine-tune собственной модели

10-15K Q+A → fine-tune Haiku. Стоимость ↓ в 10-20 раз.

Ставка №6: MCP-server (опциональная)

Только по B2B-запросу.

Ставка №7 (выявлена 24 апреля через Bshopanov-кейс): HSE-аудитор как ключевая под-ниша. Document upload — прямое усиление этой ставки (выведено 29 апр).

Календарь 2026

Q2 (апрель–июнь) — Фундамент + отрыв по восприятию

Главная ставка: сделать бота ощутимо быстрым и надёжным. Техническая часть выполнена к 29 апреля (остались только выходные обновления и tool calling rewrite).

Продукт: - Онбоардинг: проактивный первый вопрос после /start - Канал: 2 поста/неделю + 1 глубокая аналитика/2 недели - Bshopanov-взаимодействие: 15-минутный звонок даст roadmap от реального пользователя

Бизнес: - Бот бесплатный, без подписки - 2-3 консалтинг-разговора/месяц - 1-2 консалтинг-дня/квартал закрыто

Измеримый сигнал Q2: 50+ активных юзеров (≥10 запросов/мес) + 1 закрытый консалтинг-день.

Q3 (июль–сентябрь) — Proactive + Reasoning

Технически: - Proactive messaging: еженедельные апдейты - Multi-agent orchestration: агент-критик для /jsa, /ptw, /pack - User profile memory - Document upload (PDF/DOCX анализ) — усиление Ставки №7

Продукт: - Training MVP — 10 сценариев - ~~Voice reply~~ — ОТМЕНЕНО 21 апреля

Бизнес: 120+ активных, 3-4M₸ консалтинга, 1 корп.пилот.

Измеримый сигнал Q3: первый B2B-разговор + 3M₸ консалтинга.

Q4 (октябрь–декабрь) — Industry Network + B2B

Технически: - Industry knowledge graph или entity layer - Fine-tune Haiku - Dashboard

Продукт: Коробочная версия, 500+ подписчиков канала, митап.

Бизнес: 250+ активных, 1 контракт, годовая цель 5-7M₸.

Измеримый сигнал Q4: 1 корп.пилот + 250 активных + 5-7M₸ закрыто.

Антипаттерны (чего НЕ делаем)

Отдельные «вертикали» под каждую отрасль — платформа уже универсальна
Автоматизация НПА-сбора — 2-4 часа руками выгоднее месяца разработки
Подписка на бота / платные тарифы — отменено 21 апреля
Voice reply TTS — отменено 21 апреля, HSE-контент для глаз а не для слуха
Использование внутренних форм операторов (ТШО/КТК/КПО/НКОК/КМГ/Chevron/Shell) — жёсткое правило (memory feedback_no_company_names)
Гонка за 500 платящих — модель «лидмагнит»
Рассылка неактивным юзерам — качественные идут через канал + LinkedIn
Mobile app — Telegram покрывает 95%
Комментарии на канале — некому модерировать
Мини-апп на lyumihse.kz
Видео-анализ — технология сырая
Своя векторная БД — ChromaDB достаточно
Рынок СНГ / глобал — моат в КЗ-нефтегазе

Постоянные ритуалы (каждые 2 недели)

Обновление НПА с Әділет/МЧС/МТСЗН (3-4 часа, суббота)
1 пост-анализ в канале
Замер feedback за 2 недели, фикс топ-3 болей
Анализ логов one-shot юзеров для поиска gap'ов в базе (подход обновлен 24 апреля)

Итог года

K концу 2026 Lyumi — HSE Intelligence Platform с 3 линейками: 1. Чат-бот (бесплатный, лидмагнит) 2. Training-симулятор (платный) 3. B2B-коробка

Консалтинг 5-7M₸ (2026) → 15-25M₸ (2027).

Главный инсайт: уйти на опережение = скорость feedback loop.

Второй инсайт (21 апреля): fine-tune собственной Haiku критично ради экономики бесплатной модели.

Третий инсайт (24 апреля утро): тех-долг закрывается быстрее чем приходят пользователи. Следующий этап — воронка, не код.

Четвёртый инсайт (24 апреля вечер): анализ логов конкретного hard-core юзера даёт больше roadmap'а чем метрики из 95 юзеров.

Пятый инсайт (29 апреля): все 5 structured pipelines в проде — тех-долга в писании форматированных документов больше нет. Остаётся только архитектурный сдвиг (tool calling) + выходные обновления НПА.

Reference-документы

Technical snapshot Apr 18 — до 24 апр улучшений
Bot v3 overview — основная страница бота
Work log apr28-29 — журнал двух дней перед миграцией
Migration AX41 — план инфраструктурного переезда
Memory project_tech_sprint_apr24 — детальный разбор утренних 6 + вечерних session prefs улучшений
Memory feedback_no_company_names — правило про ТШО/КТК/КПО
PDF-версия в uploads/Развитие Lyumi HSE помощник.pdf