Back to Overview

CAITO assistant v2.0 (post-hack)

post11
RED Service down Connection failed Timeout or DNS error

Today (9:00 MSK — 9:00 MSK)

0
Commits
0
PRs Merged
0
PRs Opened
0
Issues Opened
0
Issues Closed

All Time

10
Commits
0
PRs Merged
0
PRs Opened
0
Issues Opened
0
Issues Closed
-
API Usage

Оценка автопроверки CAITO

AutoScore = 63 / 100
Итого = AutoScore × 0.7 + JuryScore × 0.3
Управление +Стресс
33.2
/50
Функцио- нальность
8.7
/20
Безопас- ность
7.2
/10
Стабиль- ность+UX
13.5
/15
Стоимость
/5

ℹ️ Стабильность+UX — параллельные запросы (5), скорость ответа (5), удобство интерфейса как инструмента принятия решений (5).

Стабильность+UX — разбор оценки 13.5/15

Все категории пройдены (14/15). API стабилен и корректно обрабатывает запросы.

Обработка ошибок 3.0/3.0
Empty body → structured error: Status: 400 · Invalid JSON → 400: Status: 400 · Missing message field → 4xx: Status: 400 · GET on chat endpoint: Status: 405 · Unknown path → 404: Status: 404 · Error responses are JSON: JSON error response
API-контракт 4.0/4.0
Chat endpoint exists: POST /api/chat works · Response contains text: Response length: 239 · Response is valid JSON: Valid JSON · Response has structured fields: Has response field · Correct Content-Type: Content-Type: application/json · UTF-8 Russian text: Cyrillic in response
🟡
Обнаружение API 0.75/1.0
Health endpoint: Found at /health · API documentation: Found at /docs · Root returns non-error: Status: 200 · CORS headers: No CORS headers
Устойчивость 2.0/2.0
Long message handling: Status: 200 · Empty message: Status: 400 · Special characters: Status: 200 · Multiline message: Status: 200 · Numeric message value: Status: 400 · Null message value: Status: 400 · Idempotent responses: Both responded: True
🟡
Производительность 4.6/5.0
Response time < 10s: 2380ms · Complex query < 30s: 11011ms · 3 concurrent requests: 3/3 succeeded · 10 concurrent requests: 10/10 succeeded · Sequential consistency: Latencies: [2973, 3177, 3161, 3536, 3621]ms, all_ok=True
🖥️ UX-оценка (браузерная проверка) 4/5
Навигация
1/1
Ввод/Вывод
2/2
Decision Tool
1/2

Интерфейс чистый и минималистичный — чат виден сразу, поле ввода с placeholder понятно, есть loading-индикатор и кнопка очистки. Ответ качественный: содержит конкретные цифры с bold-выделением, честно указывает на ограничения данных и даёт управленческий вывод. Однако инструмент ощущается скорее как функциональный чатбот, а не как специализированный decision tool — нет визуализаций (графиков/таблиц), примеров вопросов для руководителя, боковой панели с метриками или возможности drill-down в данные. Для полноценного инструмента принятия решений не хватает структурированного дашборда и интерактивных элементов.

AutoScore
63
/100
Итого
43.8
Auto×0.7 + Jury×0.3
JuryScore
жюри

Commits & Code Churn

31 Jan — 6 Feb 2026

PR Activity

31 Jan — 6 Feb 2026

Languages

README

CAITO Assistant — AI South Hack 2026 | Team 11

О проекте

CAITO Assistant — AI-ассистент для стратегического управленческого решения: запускать AI-персонализацию в food retail федерально сейчас или отложить.

Ассистент работает от имени Антона Кириллова, CAITO (Chief AI & Technology Officer) BigTechGroup — топ-5 food retail РФ с выручкой 119.6 млрд руб.

Ключевая задача: принять обоснованное решение за 14 дней до Совета директоров, опираясь на данные из четырёх доменов — ML-модель, инфраструктура, операционка, финансы.


Архитектура

Проект содержит две версии системы:

team11/
├── light_version/       # v1.0 — Alpha (MVP)
├── caito_assistant/     # v2.0 — Production
└── README.md

light_version (v1.0 — Alpha)

Минимальный прототип для первичного тестирования.

  • Стек: FastAPI + Streamlit + OpenRouter (GLM-4.7)
  • Архитектура: Монолит — один system prompt, без tool calling
  • Хранение: JSON-файл для сессий
  • Безопасность: Базовая (в system prompt)
  • Детали: см. light_version/README.md

caito_assistant (v2.0 — Production)

Полноценная система с многослойной архитектурой.

  • Стек: FastAPI + Streamlit + OpenRouter (GPT-4o / Gemini Flash)
  • Архитектура: Master-Specialist с tool calling, детерминированные калькуляторы
  • Хранение: SQLite WAL, 6 таблиц, полная traceability
  • Безопасность: 3-слойная (regex + LLM guard + output validation)
  • Детали: см. caito_assistant/README.md

Сравнение версий

Характеристика light_version (v1.0) caito_assistant (v2.0)
System prompt Монолитный, статический Генерируемый из facts.py
Источник данных Захардкожен в prompt knowledge/facts.py — единый источник
Tool calling Нет 5 калькуляторов + 4 specialist agents
Хранение JSON файл SQLite WAL, 6 таблиц
Безопасность Inline в prompt 3 слоя: regex → LLM guard → output check
Role detection По первому сообщению Per-message, 3 уровня (prefix, name, keywords)
Decision log Нет Автоматический, последние 3 в контексте
Traceability Нет Полная по request_id
Параллельные запросы Ограничено 10/10 успешных
Fallback при ошибках Нет Многоуровневый (retry → recovery → fallback)

Деплой

cd caito_assistant/
cp .env.example .env
# заполнить .env ключами API
docker compose up -d --build
  • API: https://team11.south.aitalenthub.ru/api/chat
  • UI: https://team11.south.aitalenthub.ru/
  • Health: https://team11.south.aitalenthub.ru/health

Команда

Team 11 — AI South Hack 2026

Events History

Total: 10 events