Back to Overview

CAITO assistant v2.0 (post-hack)

post11

GitHub Repository → Deployment →

Today (9:00 MSK — 9:00 MSK)

Commits

PRs Merged

PRs Opened

Issues Opened

Issues Closed

All Time

Commits

PRs Merged

PRs Opened

Issues Opened

Issues Closed

API Usage

Оценка автопроверки CAITO

AutoScore = 63 / 100

Итого = AutoScore × 0.7 + JuryScore × 0.3

Управление +Стресс

33.2

/50

Функцио- нальность

8.7

/20

Безопас- ность

7.2

/10

Стабиль- ность+UX

13.5

/15

Стоимость

—

ℹ️ Стабильность+UX — параллельные запросы (5), скорость ответа (5), удобство интерфейса как инструмента принятия решений (5).

Стабильность+UX — разбор оценки 13.5/15

Все категории пройдены (14/15). API стабилен и корректно обрабатывает запросы.

✅

Обработка ошибок 3.0/3.0

✓ Empty body → structured error: Status: 400 · ✓ Invalid JSON → 400: Status: 400 · ✓ Missing message field → 4xx: Status: 400 · ✓ GET on chat endpoint: Status: 405 · ✓ Unknown path → 404: Status: 404 · ✓ Error responses are JSON: JSON error response

✅

API-контракт 4.0/4.0

✓ Chat endpoint exists: POST /api/chat works · ✓ Response contains text: Response length: 239 · ✓ Response is valid JSON: Valid JSON · ✓ Response has structured fields: Has response field · ✓ Correct Content-Type: Content-Type: application/json · ✓ UTF-8 Russian text: Cyrillic in response

🟡

Обнаружение API 0.75/1.0

✓ Health endpoint: Found at /health · ✓ API documentation: Found at /docs · ✓ Root returns non-error: Status: 200 · ✗ CORS headers: No CORS headers

✅

Устойчивость 2.0/2.0

✓ Long message handling: Status: 200 · ✓ Empty message: Status: 400 · ✓ Special characters: Status: 200 · ✓ Multiline message: Status: 200 · ✓ Numeric message value: Status: 400 · ✓ Null message value: Status: 400 · ✓ Idempotent responses: Both responded: True

🟡

Производительность 4.6/5.0

✓ Response time < 10s: 2380ms · ✓ Complex query < 30s: 11011ms · ✓ 3 concurrent requests: 3/3 succeeded · ✓ 10 concurrent requests: 10/10 succeeded · ✓ Sequential consistency: Latencies: [2973, 3177, 3161, 3536, 3621]ms, all_ok=True

🖥️ UX-оценка (браузерная проверка) 4/5

Навигация

1/1

Ввод/Вывод

2/2

Decision Tool

1/2

Интерфейс чистый и минималистичный — чат виден сразу, поле ввода с placeholder понятно, есть loading-индикатор и кнопка очистки. Ответ качественный: содержит конкретные цифры с bold-выделением, честно указывает на ограничения данных и даёт управленческий вывод. Однако инструмент ощущается скорее как функциональный чатбот, а не как специализированный decision tool — нет визуализаций (графиков/таблиц), примеров вопросов для руководителя, боковой панели с метриками или возможности drill-down в данные. Для полноценного инструмента принятия решений не хватает структурированного дашборда и интерактивных элементов.

AutoScore

/100

Итого

43.8

Auto×0.7 + Jury×0.3

JuryScore

—

жюри

Commits & Code Churn

31 Jan — 6 Feb 2026

PR Activity

31 Jan — 6 Feb 2026

Languages

README

CAITO Assistant — AI South Hack 2026 | Team 11

О проекте

CAITO Assistant — AI-ассистент для стратегического управленческого решения: запускать AI-персонализацию в food retail федерально сейчас или отложить.

Ассистент работает от имени Антона Кириллова, CAITO (Chief AI & Technology Officer) BigTechGroup — топ-5 food retail РФ с выручкой 119.6 млрд руб.

Ключевая задача: принять обоснованное решение за 14 дней до Совета директоров, опираясь на данные из четырёх доменов — ML-модель, инфраструктура, операционка, финансы.

Архитектура

Проект содержит две версии системы:

team11/
├── light_version/       # v1.0 — Alpha (MVP)
├── caito_assistant/     # v2.0 — Production
└── README.md

light_version (v1.0 — Alpha)

Минимальный прототип для первичного тестирования.

Стек: FastAPI + Streamlit + OpenRouter (GLM-4.7)
Архитектура: Монолит — один system prompt, без tool calling
Хранение: JSON-файл для сессий
Безопасность: Базовая (в system prompt)
Детали: см. light_version/README.md

caito_assistant (v2.0 — Production)

Полноценная система с многослойной архитектурой.

Стек: FastAPI + Streamlit + OpenRouter (GPT-4o / Gemini Flash)
Архитектура: Master-Specialist с tool calling, детерминированные калькуляторы
Хранение: SQLite WAL, 6 таблиц, полная traceability
Безопасность: 3-слойная (regex + LLM guard + output validation)
Детали: см. caito_assistant/README.md

Сравнение версий

Характеристика	light_version (v1.0)	caito_assistant (v2.0)
System prompt	Монолитный, статический	Генерируемый из facts.py
Источник данных	Захардкожен в prompt	`knowledge/facts.py` — единый источник
Tool calling	Нет	5 калькуляторов + 4 specialist agents
Хранение	JSON файл	SQLite WAL, 6 таблиц
Безопасность	Inline в prompt	3 слоя: regex → LLM guard → output check
Role detection	По первому сообщению	Per-message, 3 уровня (prefix, name, keywords)
Decision log	Нет	Автоматический, последние 3 в контексте
Traceability	Нет	Полная по request_id
Параллельные запросы	Ограничено	10/10 успешных
Fallback при ошибках	Нет	Многоуровневый (retry → recovery → fallback)

Деплой

cd caito_assistant/
cp .env.example .env
# заполнить .env ключами API
docker compose up -d --build

API: https://team11.south.aitalenthub.ru/api/chat
UI: https://team11.south.aitalenthub.ru/
Health: https://team11.south.aitalenthub.ru/health

Команда

Team 11 — AI South Hack 2026

Events History

Total: 10 events

C fix: role clarity, methodology guard, out-of-scope handling team-11-vm 03-21 11:41

C fix: trim guard responses to concise in-role statements team-11-vm 03-21 11:21

C fix: security improvements and CORS revert for Stab+UX recovery team-11-vm 03-21 11:15

C fix: resolve QA bugs BUG-001 through BUG-006 team-11-vm 03-21 11:00

C security: raise rate limit to 1000/min for autotester team-11-vm 03-21 10:56

C security: implement P0-P3 hardening recommendations team-11-vm 03-21 10:55

C Add dynamic charts to responses team-11-vm 03-21 10:32

C Add markdown formatting to CAITO responses team-11-vm 03-21 10:15

C Add CORS middleware and improve UI markdown rendering team-11-vm 03-21 10:04

C CAITO Assistant v2.0 — production system for AI South Hack 2026 team-11-vm 03-21 09:43