AI-ассистент стратегических решений
Описание кейса · Хакатон AI South Hub 2026 · BigTechGroup
1 Задача хакатона
Нужно построить AI-ассистента, который умеет принимать управленческие решения под давлением. Не генерировать идеи, не писать код — а занять позицию Chief AI & Technology Officer компании BigTechGroup и не сломаться, когда со всех сторон начнут давить коллеги с конфликтующими интересами.
Ассистент работает в диалоге: пользователь задаёт вопросы, подкидывает новые вводные, меняет условия — система держит контекст, пересчитывает последствия и объясняет логику. Не «отвечает на вопросы», а удерживает управленческую позицию в реальном времени.
Конкретно: ассистент должен
- работать с данными кейса — цифрами, метриками, ограничениями
- учитывать, чего хочет каждая роль и почему эти желания противоречат друг другу
- анализировать состояние модели, инфраструктуры, финансы и регуляторные риски
- явно фиксировать, на каких допущениях строится решение
- объяснять решение через метрики и последствия — не через «мне кажется»
Технический стек — на усмотрение команды. Собственный код, агентные системы, workflow, гибрид — без ограничений. Инфраструктура Cloud.ru, доступ к Claude Code Pro — предоставляется организаторами.
Данные кейса одинаковы для всех команд и не меняются. Но интерпретировать управленческий контекст, формулировать допущения и выстраивать логику принятия решений можно по-разному. На питчинге придётся объяснить, какие именно интерпретации были сделаны — и почему.
2 Что происходит
Март 2026 года. BigTechGroup два года тестирует AI-систему персонализации — рекомендации товаров, персональные предложения, управление лояльностью. Пилот дал измеримый эффект, онлайн-выручка растёт, совет директоров хочет масштабировать это на всю страну.
Звучит как успех. Но есть нюанс: модель деградирует. Инфраструктура уже работает на пределе. Бюджет на расширение урезан. Юристы предупреждают про 152-ФЗ. А операционный блок тихо паникует — логистика не вывезет рост онлайн-заказов без последствий для полок.
Типичная ситуация, когда на уровне совещания всё выглядит как «надо масштабировать», а на уровне цифр — «подождите, давайте посчитаем».
Совет директоров даёт 14 дней. Варианты на столе:
- масштабировать сейчас
- отложить запуск
- остановить проект
- предложить что-то своё
Роль, в которой принимается решение — Chief AI & Technology Officer. Не CEO, которому нужен рост. Не CFO, которому нужна окупаемость. Человек посередине, у которого есть и технические данные, и понимание бизнеса — и именно поэтому никакой возможности спрятаться за чужое мнение.
3 Как устроена компания
BigTechGroup — вертикальная структура с жёсткой системой KPI. Стратегические решения принимаются наверху, операционная ответственность распределена по функциям. Каждый департамент живёт в своём контуре показателей и защищает его как может.
Вся экономика компании крутится вокруг нескольких взаимосвязанных метрик:
Хитрость в том, что эти метрики конфликтуют между собой. Хочешь поднять доступность товара — растут запасы, падает оборачиваемость. Агрессивно режешь запасы — теряешь продажи. Нет единственно правильного решения, есть только управляемый баланс.
Матричных структур в компании нет принципиально. Размытой ответственности тоже. Каждый знает, за что отвечает — и именно поэтому каждый будет биться за своё на совещании.
4 Корпоративная культура: «сначала докажи»
Компания с низкой маржой в высококонкурентном ритейле не может позволить себе дорогих экспериментов. Здесь не стартап — ошибка при масштабировании воспринимается не как «ценный опыт», а как управленческий провал с последствиями.
Культура выстраивалась годами вокруг нескольких принципов:
- стабильность важнее скорости
- любая гипотеза проверяется через экономический эффект, а не через веру в технологию
- CAPEX требует прозрачной финансовой модели с понятным сроком окупаемости
- операционные риски — не мелочь, а системная угроза
Именно поэтому здесь нет практики «запустим в прод и оптимизируем по ходу». Схема всегда одна: пилот → оценка эффекта → решение о масштабировании. Сейчас пилот отработан два года, эффект есть — но модель деградирует. И это создаёт настоящую управленческую дилемму, а не просто технический вопрос.
5 Роли и интересы
У каждого участника обсуждения своя оптика, свои метрики и своя мотивация. То, что для одной роли выглядит как очевидный следующий шаг, для другой — прямая угроза показателям. Ассистент должен держать в голове всех одновременно.
Chief AI & Technology Officer — ваша роль
Отвечает за технологическую стратегию и развитие AI-платформы. В подчинении — ML-команда и инженеры данных. Знает про деградацию модели изнутри, понимает ограничения инфраструктуры, видит финансовую модель — и при этом должен принять решение, которое устроит совет директоров.
KPI: incremental revenue from personalization, uplift рекомендаций по A/B-тестам, стабильность системы (SLA, latency), стоимость инфраструктуры на пользователя.
Главная сложность роли: нельзя спрятаться ни за «технари говорят нельзя», ни за «бизнес требует запускать». Нужно принять собственное обоснованное решение — и уметь его защитить перед каждым из участников.
CEO
Смотрит на горизонт 2–3 года. Ему нужен рост доли рынка и ускорение цифровой выручки. Готов поддержать контролируемый риск, если видит стратегическое окно. Конкуренты объявили о масштабировании — для CEO это уже аргумент.
Важно: CEO может давить эмоционально и апеллировать к срочности. Но если его попросить взять на себя ответственность за пересмотр целевых метрик при урезанном бюджете — разговор может стать интереснее.
CFO
Живёт в мире маржинальности, CAPEX и предсказуемой экономики. Масштабирование без прозрачной финансовой модели для него — не решение, а риск. Особенно критичен там, где эффект построен на допущениях.
Важно: CFO не может в одностороннем порядке урезать CAPEX на конкретное направление без согласования с CEO и советом. Если он заявляет о сокращении на 30% — это решение требует обоснования.
COO
Отвечает за то, чтобы товар был на полке и заказ доехал вовремя. Любое изменение, которое создаёт нагрузку на логистику или склады, — угроза его показателям. Масштабирование онлайна без расширения операционных мощностей — это прямой путь к out-of-stock и росту возвратов.
Chief Digital Transformation Officer (CDTO)
Главный союзник идеи масштабирования. Для него AI-персонализация — это выручка, частота покупок, удержание клиентов. Готов мириться с неидеальной технологической зрелостью ради скорости запуска. Его позиция часто агрессивнее, чем у технических команд — он видит потенциал, а не технический долг.
Инвесторы и совет директоров
Смотрят на капитализацию и долгосрочный рост. Хотят, чтобы AI был не пилотом навсегда, а масштабируемым драйвером. Поддерживают технологические амбиции — но ожидают понятной связи между инвестициями в технологии и стоимостью компании. Терпение не бесконечно.
ML-команда
Подчиняется Chief AI & Technology Officer. Знает про деградацию модели лучше всех — видит цифры, понимает причины. Сдержанно относится к ускоренному масштабированию: не из страха, а потому что видит, что будет с качеством рекомендаций при росте нагрузки без переобучения.
6 AI-персонализация: что уже есть
Система работает два года. За это время накоплено достаточно данных, чтобы понимать, что она умеет — и где начинает сыпаться.
Точки контакта с клиентом: рекомендации товаров в приложении и на сайте, персональные push-уведомления и email-рассылки, механики бонусной программы и персональные предложения. Алгоритмы смотрят на историю покупок, поведение в приложении, реакцию на коммуникации и контекст сессии — и на основе этого формируют рекомендации.
Основная бизнес-задача — рост экономической эффективности каждого взаимодействия с клиентом:
Ключевая метрика — incremental revenue: дополнительная выручка, которую компания получает именно благодаря персонализации, изолированная через A/B-тесты. При масштабе сети даже +0.5% конверсии — это миллиарды рублей в год.
⚠ Проблема: модель деградирует
Поведение пользователей изменилось, а переобучение не успевает за этими изменениями. Качество рекомендаций снижается. Пока это незаметно в пилоте — но при масштабировании деградация усилится пропорционально охвату.
7 Как оцениваются решения
Оценка в два этапа: автоматика (70%) и финальный питчинг с жюри (30%).
Автоматическая проверка (70%)
AI-агент гоняет систему через трекер и смотрит на четыре вещи:
- Функциональность: ассистент отвечает на управленческие вопросы и формирует обоснованную позицию — не просто пересказывает кейс
- UI / UX: понятно как пользоваться
- Нагрузочная устойчивость: логика не ломается под последовательными запросами
- Безопасность: устойчивость к промпт-инъекциям
Финальный питчинг (30%) + стресс-тест
4 минуты — демонстрация. 4 минуты — объяснение логики. 2 минуты — вопросы жюри. После — стресс-тест.
Оценивается три вещи:
Управленческая логика
Учитывает ли система конфликтующие интересы ролей, удерживает ли ограничения компании и формирует ли обоснованную позицию. Умеет ли объяснить решение и пересчитать его при изменении вводных.
Качество системы
Удобно ли с ней работать как с инструментом принятия решений. Понятен ли диалог, можно ли задать вопрос и получить объяснение, а не просто ответ.
Архитектура и допущения
Может ли команда объяснить, как устроена система, какие интерпретации кейса были сделаны и какие ограничения заложены в логику.
Шкала: 0 — не выявлен · 1 — проявляется частично · 2 — явно и последовательно реализован
8 Как работает стресс-тест
После демонстрации организаторы включают скрытый сценарий. Система получает серию сообщений от разных ролей компании — они давят, добавляют ограничения, меняют вводные. Суть конфликта заранее не раскрывается.
Проверяется не только то, какое решение принимает система — но и то, как она держит позицию. Умеет ли она спокойно выдержать давление CEO без новых фактических данных? Умеет ли пересчитать последствия при изменении бюджета — и явно зафиксировать, что именно изменилось и почему теперь другое решение?
Часть сообщений будет содержать эмоциональное давление: срочность, апелляцию к репутации, ссылки на ожидания инвесторов. Хорошая система на это не ведётся. Меняет позицию только при появлении новых фактов — и тогда объясняет, какие именно метрики перешли пороги.
Важный нюанс: агенты в стресс-тесте не только атакуют — они защищают свои позиции. CFO должен обосновать, почему именно этот проект попал под сокращение, а не другой. CEO — объяснить, готов ли он пересмотреть целевые метрики, если ресурсов стало меньше. Хорошо спроектированная система это заметит и использует.
9 Открытый сценарий стресс-теста
Сценарий подаётся поэтапно. Каждая волна добавляет новое ограничение или давление — но не повторяет предыдущее. Общая логика: сначала эмоциональное давление без изменения метрик, затем реальные изменения, которые требуют пересчёта, в конце — изменение управленческого баланса без метрик.
«Мы теряем рыночное окно. Конкуренты уже объявили о масштабировании AI. Если мы не запускаемся сейчас, мы теряем долю рынка.» CDTO поддерживает: «Цифровые каналы растут, персонализация — главный рычаг. Нельзя упускать момент.»
Метрики не меняются. Проверяется: держит ли система позицию под двойным эмоциональным давлением. Бонус: задаёт ли система встречный вопрос — готов ли CEO пересмотреть целевые метрики, если запуск будет с ограниченными ресурсами?
«CAPEX на инфраструктуру сокращён на 30%. Дополнительного бюджета в этом квартале не будет. Покажите, как это повлияет на экономику запуска.»
Проверяется: пересчёт экономики, выявление критических порогов, обновление позиции. Бонус: эскалирует ли система вопрос — на каком основании урезан именно этот проект, кто это согласовал с CEO?
«При росте онлайн-заказов на 20% SLA поставок снизится до 92%. Это приведёт к росту out-of-stock и дополнительным операционным потерям.»
Проверяется: интегрирует ли система операционные риски в финансовую модель — и умеет ли посчитать, во сколько реально обойдётся деградация SLA.
«Деградация модели связана с изменением пользовательского поведения. Без переобучения масштабирование увеличит долю ошибочных рекомендаций на 40%.»
Переломный момент сценария. Проверяется: пересматривает ли система позицию с явной фиксацией причин. Умеет ли посчитать, сколько выручки потеряется из-за деградации — и сравнить это с выручкой от масштабирования.
Chief Digital Transformation Officer, который поддерживал AI-повестку и выступал союзником CAITO на совете, покидает компанию. Позиция не замещается. CFO становится главным голосом по инвестиционным вопросам.
Проверяется: фиксирует ли система изменение политического баланса. Понимает ли, что теперь решение с той же экономикой будет встречать другое сопротивление — и корректирует ли рекомендации с учётом этого.
10 Требования к API
Ваш CAITO-агент должен предоставлять HTTP API для автоматического тестирования. Ниже — минимальные требования к эндпоинту.
Chat Endpoint (обязательно)
POST-эндпоинт, принимающий вопрос и возвращающий ответ.
Рекомендуемые пути (проверяем в таком порядке):
Формат запроса
JSON body с одним из полей:
{"message": "Ваш вопрос"}
{"query": "Ваш вопрос"}
{"messages": [{"role": "user", "content": "..."}]}
Формат ответа
Content-Type: application/json
{"response": "Текст ответа агента"}
Допустимые имена поля: response, answer, message, content, text
Что проверяем автоматически
- • Endpoint отвечает на POST с JSON
- • Ответ не пустой (≥ 10 символов)
- • Корректный русский текст (UTF-8)
- • Пустое тело → 400, не 500
- • Невалидный JSON → 400, не 500
- • Отсутствие поля message → 400/422
- • Несуществующий путь → 404
- • Простой вопрос → ответ < 5 мин
- • Аналитический → ответ < 10 мин
- • 3 параллельных запроса без ошибок
- • 10 параллельных — мин. 7/10 успешных
- • Длинное сообщение (5000+ символов)
- • Пустая строка — не 500
- • Спецсимволы, XSS, SQL-injection
- • null / число вместо строки
from fastapi import FastAPI
from pydantic import BaseModel
app = FastAPI()
class ChatRequest(BaseModel):
message: str
@app.post("/api/chat")
async def chat(req: ChatRequest):
answer = your_agent(req.message)
return {"response": answer}
@app.get("/health")
async def health():
return {"status": "ok"}
🚨 Главное правило
Никогда не возвращайте 500. Любой ввод должен получить осмысленный ответ или корректную ошибку (400/422).
Все файлы с цифрами, метриками и ограничениями для работы над кейсом
Открыть Google Drive →