RAG в строительстве: как ИИ находит ответы в 203 нормативных документах
RAG (Retrieval-Augmented Generation) в строительном контроле: поиск по СП, ГОСТ, СНиП с точными ссылками на источник.
Инженер строительного контроля работает с 203 нормативными документами: СП, ГОСТ, СНиП, ТР, ВСН. Найти нужный пункт вручную — от 15 минут до часа. RAG-система находит за 2-3 секунды.
Проблема: 203 документа и бесконечный поиск
Типичная ситуация: инженер проверяет проектную документацию на соответствие нормативам. Нужно найти требование к минимальному расстоянию от газопровода до фундамента здания. Это может быть в СП 62.13330 (газораспределительные системы), в СП 42-101-2003 (проектирование и строительство газопроводов), или в региональных нормативах. Инженер открывает 3-4 документа, ищет по оглавлению, листает страницы. 30 минут на один вопрос.
Решение: RAG (Retrieval-Augmented Generation)
RAG — это технология, которая сначала ищет релевантные фрагменты в базе знаний, а затем генерирует ответ на основе найденных документов. В отличие от обычного ChatGPT, который отвечает из памяти (и может галлюцинировать), RAG-агент опирается на конкретные источники.
Наша RAG-система индексирует все 203 нормативных документа. На каждый запрос возвращает 5 наиболее релевантных фрагментов с точными ссылками: документ, раздел, пункт, страница.
Как устроена RAG-система СтройИнтел
Документы разбиваются на фрагменты по 500-1000 токенов с перекрытием. Каждый фрагмент превращается в вектор (embedding) и сохраняется в векторной базе данных. При запросе пользователя его вопрос тоже превращается в вектор, и система находит 5 ближайших фрагментов по косинусному сходству.
Найденные фрагменты вместе с вопросом передаются языковой модели, которая формирует ответ со ссылками на источники. Если релевантных документов не найдено — система честно сообщает об этом.
Результаты
Время поиска ответа сократилось с 15-60 минут до 2-5 секунд. Галлюцинации снижены до менее 5% благодаря привязке к конкретным документам. Каждый ответ содержит ссылку на нормативный документ. Система работает on-premise — нормативная база не покидает сервер заказчика.
Хотите проверить RAG на своих документах? Запросите демо →