AI Document Capture: извлечение и маршрутизация документов on-prem
On-prem-решение принимает входящий поток документов организации, распознаёт тип, извлекает реквизиты, классифицирует и передаёт проверенные данные в учётную систему. Извлечение одного документа — с 2,5 минут до 30 секунд при точности 95%+.
Решение работает в контуре организации — документы не покидают периметр, что закрывает требования Закона РБ № 99-З и банковской тайны. Две конфигурации: Light и Enterprise.
Что такое AI Document Capture и для кого
Document Capture (интеллектуальный захват документов) — класс корпоративных решений, который автоматически принимает входящий документальный поток, определяет тип каждого документа, извлекает из него структурированные данные и передаёт их в учётные и информационные системы организации.
Это не отдельный сценарий одного отдела и не редакция СЭД. Распознавание первички для конкретной службы мы разбираем на страницах ИИ для бухгалтерии и ИИ для кадров; AI-модуль на платформе документооборота — это DIRECTUM Bel Intelligence для среднего бизнеса. AI Document Capture — корпоративный продукт уровня всей организации: единый конвейер захвата для всех типов входящих документов с маршрутизацией в учётные системы.
Решение адресовано техническим и операционным руководителям крупных организаций — ИТ-директорам, директорам по информационной безопасности, руководителям операционных и общих служб. Целевые отрасли — банки, государственные организации и крупный коммерческий сегмент Беларуси, где входящий поток документов измеряется тысячами в месяц, а данные нельзя выводить во внешние облака.
Архитектура решения
Document Capture построен как конвейер из последовательных слоёв. Качество всего продукта определяется первым слоем — приёмом и распознаванием, поэтому именно на нём сосредоточена проверенная часть решения.
Извлечение реквизитов — автоматическое выделение из документа структурированных полей: стороны, даты, номера, суммы, ставки НДС, номенклатура. Извлечённые поля проверяются человеком и передаются дальше уже как данные, а не как картинка.
Конвейер из 5 шагов
Приём и распознавание
Входящие сканы, фото и PDF принимаются из почты и сканеров, распознаётся текст, определяется тип документа.
Классификация
Поток разбивается по типам — накладная, акт, счёт, договор, заявление — и маркируется метаданными.сложное — Enterprise
Извлечение и проверка
Из документа выделяются реквизиты, оператор подтверждает результат — роль меняется с ввода на контроль.
Маршрутизация
Проверенные данные передаются в учётную систему: интеграция с 1С готова, с SAP — под проект.
Поиск и ответы (Vertical RAG)
Вопросы на естественном языке с цитатами на источник и дообучение на корпусе клиента.Enterprise
Под капотом — открытая языковая модель в контуре организации, гибридный поиск по документам и слой контроля качества распознавания. Конкретный состав стека подбирается под тип документов и объём; какие модели и железо применяются для on-prem, разобрано в отдельном гайде.
Интеграция с учётными системами
Маршрутизация (routing) — этап, на котором извлечённые и проверенные данные документа автоматически передаются в целевую систему организации: учётную, СЭД или отраслевую.
Ключевое отличие Document Capture от распознавания «для отдела» — в том, что данные не остаются карточкой внутри одной системы, а маршрутируются по организации. На уровне учётных систем решение интегрируется с 1С; интеграция с SAP и другими корпоративными системами выполняется под конкретный проект. Захваченные документы при этом могут храниться и согласовываться в DIRECTUM Bel — операционном ядре документооборота, поверх которого работает захват.
Такой подход снимает главную скрытую стоимость ручной обработки: данные вводятся один раз — на этапе проверки оператором — и дальше используются всеми системами без повторного набора.
On-prem и Закон № 99-З: почему данные не покидают контур
On-prem (локальное развёртывание) — размещение модели и всего конвейера обработки на инфраструктуре самой организации, без обращения к внешним облачным сервисам. Документ обрабатывается внутри периметра и наружу не передаётся.
Данные в контуре
Модель и конвейер развёрнуты на серверах организации — трансграничной передачи не происходит.
Банковская тайна
Сведения о счетах, операциях и клиентах не передаются вовне — статья 121 Банковского кодекса.
ОАЦ и КИИ
Для госорганизаций учитываются нормативы ОАЦ и статус критической информационной инфраструктуры.
99-З: трансграничка
Нет передачи во внешние сервисы — снимается вопрос статьи 9 Закона № 99-З о трансграничной передаче.
Для белорусской организации это не вопрос удобства, а вопрос права. Входящие документы содержат персональные данные, обработка которых регулируется Законом Республики Беларусь от 7 мая 2021 г. № 99-З «О защите персональных данных». Передача документов во внешний облачный сервис, серверы которого за рубежом, — это трансграничная передача данных: по статье 9 Закона № 99-З она свободна только в государства из перечня Национального центра защиты персональных данных (Приказ НЦЗПД от 15 ноября 2021 г. № 14), а в остальные страны требует отдельного разрешения. За неправомерную обработку персональных данных предусмотрена административная ответственность.
Для банков добавляется банковская тайна (статья 121 Банковского кодекса): сведения о счетах, операциях и клиентах нельзя передавать во внешние сервисы. Для государственных организаций действуют нормативы ОАЦ и статус критической информационной инфраструктуры. On-prem-развёртывание закрывает все три требования разом: передачи данных не происходит, потому что документы не покидают организацию. Подробный регуляторный разбор — в гайде по локальной LLM в Беларуси.
Раздел носит справочный характер и не заменяет юридическую консультацию: конкретную схему обработки данных следует проверять с юристом.
Применение по отраслям
Document Capture решает одну задачу — убрать ручной ввод входящих документов — но в каждой отрасли поток и целевые системы свои.
Банки
Кредитные досье, KYC-документы, заявления, претензии.
Государственные организации
Входящая корреспонденция, обращения, заявления.
Крупный коммерческий сегмент
Счета, акты, накладные, договоры, кадровые документы.
Во всех трёх случаях общий знаменатель — большой поток входящих документов и требование держать данные в контуре. Там, где захват нужен одному отделу, точечно подойдёт готовый модуль распознавания: например, генеративный ИИ в юридическом отделе для работы с договорами. Когда задача не захват входящих, а анализ договоров или ответы по нормативной базе банка — это смежные корпоративные продукты AI Contract Intelligence и AI Compliance Assistant.
Корпоративный захват документов отличается от распознавания для одного отдела не алгоритмом, а масштабом и маршрутизацией. Извлечь реквизиты из счёта умеют многие; ценность появляется, когда поток всей организации идёт через единый конвейер и проверенные данные сами попадают в нужные системы. Поэтому в основе продукта — проверенное capture-ядро, которое мы демонстрируем на реальных документах заказчика, а более сложные сценарии поиска и дообучения наращиваются поверх него.
Антон Жуковец, специалист по продажам ECM-систем, Novacom Systems, 2026
Light и Enterprise
Решение поставляется в двух конфигурациях. Light закрывает проверенный сценарий захвата и маршрутизации; Enterprise добавляет поиск по корпусу и дообучение под организацию.
| Что входит | Light | РекомендуемEnterprise |
|---|---|---|
| Распознавание, извлечение реквизитов, классификация входящих | Да | Да |
| Маршрутизация в учётную систему (1С) и СЭД | Да | Да |
| Объём потока | Под заданный объём | Без ограничений объёма |
| Сложные сценарии классификации, интеграция с SAP | — | Да, под проект |
| Vertical RAG: поиск и ответы по корпусу с цитатами | — | Да, под проект |
| Дообучение на корпусе клиента | — | Да, при достаточном объёме данных |
| Развёртывание | On-prem, в контуре | On-prem, в контуре |
AI Document Capture — корпоративный проект: стоимость рассчитывается индивидуально под объём документального потока и инфраструктуру организации. Чтобы получить расчёт, опишите задачу через форму ниже.
Часто задаваемые вопросы
Чем AI Document Capture отличается от распознавания для бухгалтерии или кадров?
Где физически обрабатываются документы?
В какие системы передаются извлечённые данные?
Какая точность извлечения и кто отвечает за результат?
Что входит в Light, а что в Enterprise?
Соответствует ли решение Закону № 99-З и банковской тайне?
Нужно ли менять учётную систему ради внедрения захвата?
Запросите расчёт AI Document Capture
Следующий шаг: опишите ваш входящий документальный поток — подготовим расчёт AI Document Capture под ваш объём и инфраструктуру.
Обрабатываем данные в соответствии с Законом РБ № 99-З