Внутренний RAG для инженеров эксплуатации

RAG Termidesk

Поиск по Jira, Confluence, Bitbucket, Bamboo и Mattermost — для быстрого разбора инцидентов, поиска решений, кода, сборок и обсуждений в треде.

Ответы со ссылками
Каждый абзац подкреплён ссылками на Jira, Confluence, PR, сборку и тред.
Поиск по инженерному контексту
Индексирует код, логи, тикеты, runbooks и треды — не только текст страниц.
Безопасность и доступы
Фильтрация по правам на этапе поиска, SSO, аудит, PII-фильтр и защита от prompt injection.
Инженер спрашивает
вопрос с контекстом
шаг 1
Termidesk извлекает
источники и связи
шаг 2
Ответ со ссылками
цитата на каждое утверждение
шаг 3
Jira
Conflu
Bitbckt
Bamboo
Mattrm
Задержка конвейераp95 1.8s
Подключается кJira · инцидентыConfluence · runbooksBitbucket · PR и кодBamboo · сборкиMattermost · тредыЛоги сборокADR и RFCCODEOWNERS
Архитектура

Интерактивная схема платформы

Нажмите на узел, чтобы открыть назначение слоя, риски и корпоративный вариант реализации. Подсветите путь индексации, запроса, ответа или обратной связи.

Интерактивная схема доступна с десктопа
Откройте сайт на экране от 1024 px шириной

На мобильном устройстве схема со связями между слоями платформы разворачивается слишком плотно. На десктопе можно переключать режим зрелости, подсвечивать пути и открывать карточки слоёв.

Как это работает

Один вопрос инженера — шесть шагов до проверяемого ответа

От вопроса инженера до фидбэка, который чинит ранжирование и снижает галлюцинации.

  1. шаг 01
    Инженер спрашивает

    «Почему падает deployment billing-service в prod?» — вопрос с операционным контекстом.

  2. шаг 02
    Маршрутизатор запроса

    Намерение: расследование инцидента, поиск по коду, сборкам и документации. Подбирает шаблоны промптов и индексы.

  3. шаг 03
    Извлечение источников

    Гибридный поиск по инцидентам Jira, упавшим сборкам Bamboo, PR в Bitbucket, runbooks Confluence и тредам Mattermost.

  4. шаг 04
    Переранжирование

    Кросс-энкодер выбирает свежие, релевантные и доступные пользователю источники, добавляет разнообразие.

  5. шаг 05
    Ответ со ссылками

    Модель формирует ответ: причина, цитаты на источники, оценка достоверности, следующие шаги.

  6. шаг 06
    Обратная связь

    Инженер отмечает полезность, плохие источники, добавляет правки — сигналы попадают в eval-наборы.

Корпоративная архитектура

Что должна закрывать корпоративная установка

Не отдельный инструмент, а слой инженерных знаний поверх существующего стека Atlassian и Mattermost.

Надёжность

  • Отказоустойчивый Kubernetes в нескольких зонах
  • Переигрывание событий из Kafka
  • Карантинная очередь для сбоев
  • Сине-зелёное развёртывание
  • Резервное копирование и восстановление
  • Пересборка векторного индекса

Безопасность

  • Единый вход через SSO, OIDC и SAML
  • Ролевая и атрибутная авторизация
  • Фильтрация по правам доступа на этапе поиска
  • Журнал аудита
  • Поиск секретов и утечек
  • Защита от prompt injection

Качество ответов

  • Гибридный поиск
  • Кросс-энкодер для переранжирования
  • Свежесть источников
  • Разнообразие источников
  • Регулярные eval-наборы
  • Эталонные наборы вопросов

Инженерный контекст

  • Граф связей задач Jira
  • Связи PR и коммитов
  • Хронология сборок и деплоев
  • Runbooks и архитектурные решения
  • Решения, принятые в Mattermost
  • Метаданные владения сервисами
Не обычный RAG

Чем Termidesk отличается от чата с документами

RAG не поверх документов, а поверх задач, кода, сборок и обсуждений.

Обычный RAG
  • Индексирует документы
  • Ищет похожие фрагменты
  • Часто не знает прав доступа
  • Не учитывает свежесть данных
  • Плохо работает с кодом и логами
  • Нет регулярных оценок качества
RAG Termidesk
  • Индексирует тикеты, код, сборки, документы и треды
  • Связывает Jira, PR, сборки, документы и чаты
  • Фильтрует результаты по правам пользователя
  • Учитывает свежесть и авторитет источника
  • Чанкует код по AST, логи — по сигнатурам падений
  • Eval-наборы, аудит и метрики качества
Каноническая модель документа

Разные источники — одна инженерная карта знаний

Задача Jira, страница Confluence, PR, сборка и тред Mattermost — один объект для поиска и одинаковый набор полей.

canonical-doc.json
v17 · регламент
{
  "document_id": "confluence:RUNBOOK-124",
  "source_type": "confluence",
  "title": "Billing Service Deployment Runbook",
  "body": "...",
  "entities": ["billing-service", "postgres", "bamboo-plan-82"],
  "links": ["jira:INC-913", "bitbucket:PR-441"],
  "acl": ["team:platform", "role:sre"],
  "freshness_score": 0.92,
  "version": 17,
  "last_seen_at": "2026-05-20T10:15:00Z"
}
document_id

Устойчивый идентификатор источника и сущности.

source_type

Тип источника: confluence, jira, bitbucket, bamboo, mattermost.

links / entities

Связи с другими сущностями: PR, инциденты, сборки, сервисы.

acl

Снимок прав доступа на момент индексации.

freshness_score

Свежесть для ранжирования и явного предупреждения.

version

Версия документа для аудита и переиндексации.

Конвейер извлечения

Десять явных шагов вместо чёрного ящика

Каждый этап трассируется через OpenTelemetry и виден в eval-наборах.

  1. 01
    Запрос пользователя

    Вопрос инженера с контекстом текущей сессии.

  2. 02
    Переформулировка

    Расширение, нормализация терминов, синонимы и тезаурус доменов.

  3. 03
    Маршрутизация запроса

    Классификация: инцидент, код, документ, сборка, решение.

  4. 04
    Фильтрация по правам

    Жёсткая фильтрация по правам пользователя на момент запроса.

  5. 05
    Гибридный поиск

    Плотный, разреженный и лексический поиск с объединением через RRF и DBSF.

  6. 06
    Свежесть источников

    Затухание со временем и приоритет авторитетных источников.

  7. 07
    Переранжирование

    Кросс-энкодер по top-N с учётом намерения и разнообразия.

  8. 08
    Сжатие контекста

    Сжатие под бюджет токенов без потери критичных фактов.

  9. 09
    Сбор цитат

    Сборка карты источников и якорей для проверяемых ссылок.

  10. 10
    Ответ со ссылками

    Модель отвечает по контексту, с оценкой достоверности и явным «не знаю».

Метрики и качество · пример

Качество ответов на одном экране

Задержка, покрытие источниками, доля галлюцинаций, свежесть данных и обратная связь инженеров. Цифры ниже — пример того, что показывает дашборд.

Задержка p95
1.84с↘ 0.2с за неделю
Точность извлечения
94.6%среди топ-10
Покрытие цитатами
97.1%утверждений со ссылкой
Доля галлюцинаций
0.6%по эталонному набору
Устаревшие ответы
1.9%данные старше 30 дней
Свежесть источников
0.92средняя оценка
Оценка инженеров
4.6 / 5средняя за неделю
Запросы, на которые система не отвечает
за 24 часа
  • почему упала сборка billing-service 13.04нет связанных регламентов
  • что обсуждали по INC-913 в тредеприватный канал, нет прав доступа
  • где список изменений по обновлению PostgreSQLустаревшая страница, свежесть 0.31
Распределение источников за 24 часа
Confluence38%
Jira24%
Bitbucket18%
Bamboo12%
Mattermost8%
Дорожная карта

От подключения источников к агентам

На каждом этапе фиксируется конкретный объём: сначала подключения, потом надёжность, потом агенты с человеком в петле.

01

Подключение источников

  • Коннекторы к Jira, Confluence, Bitbucket, Bamboo и Mattermost
  • Каноническая модель и хранение исходных снимков
  • Гибридный индекс: векторный и лексический
  • Чат с цитированием источников
  • Базовая модель прав доступа
02

Готовность к проду

  • Отказоустойчивый приём событий и переигрывание
  • Аудит, PII-фильтр и защита от prompt injection
  • Регулярные eval-наборы и эталонные вопросы
  • Метрики качества ответов
  • Свежесть источников и граф связей
03

Агенты и инструменты

  • Инструменты по протоколу MCP и реестр инструментов
  • Подтверждение действий человеком
  • Помощник по инцидентам и черновики расследований
  • Многошаговый поиск по графу знаний
  • Рекомендации действий с подтверждением человеком