Cервер распознавания графических объектов¶

Описание и возможности
Установка сервера
Настройка на стороне сервера iBatyr Monitor
Настройка модуля Анализ контента
Политики распознавания контента
- Анализ контента
Логи
- Сервер распознавания
- Сервер iBatyr Monitor

Описание и возможности¶

Сервер распознавания устанавливается на отдельную от сервера iBatyr Monitor (виртуальную) машину. В состав сервера входит несколько движков, которые извлекают данные и обнаруживают графические сущности в документах.

Возможности сервера распознавания:

обнаружение печатей на изображениях по заданному образцу: скан-копии, скриншоты, фотографии документов с оттиском печати;
распознавание лиц и создание оповещений по результатам распознавания;
распознавание больших объёмов текста, в том числе текста с любых изображений (скан-копии, скриншоты, фотографии) или из файлов-контейнеров (например, формата pdf или в zip);
работа с наиболее популярными форматами хранения изображений: png, jpeg, jpg, jpe, pdf.

Установка сервера¶

Для работы анализатора графических объектов установите дополнительные пакеты:

sudo apt update && sudo apt upgrade
sudo apt install software-properties-common

# установите python3.7
sudo add-apt-repository ppa:deadsnakes/ppa
sudo apt install python3.7
sudo apt install python3.7-venv

# установите оставшиеся пакеты
sudo apt install -y libpoppler-cpp0v5 poppler-utils libsm6 tesseract-ocr

Добавьте репозиторий iBatyr Monitor в список репозиториев системы и установите сервер распознавания при помощи apt:

wget -O - https://distr.ibatyr.kz/stable5.06/ibatyr.gpg | sudo apt-key add -
echo "deb https://distr.ibatyr.kz/stable5.06 stable5.06 non-free" | sudo tee /etc/apt/sources.list.d/ibatyr.list
sudo apt update
sudo apt install ibatyr-cpservice

Общий размер пакета около 850 МБ — при низкой скорости доступа в Интернет скачивание может занять длительное время.

На этом установка программного обеспечения завершена.

Настройка на стороне сервера iBatyr Monitor¶

Перед настройкой модуля Анализ контента включите доступ к API сервера в параметрах сервера iBatyr Monitor :

Зайдите в основном интерфейсе в Панель управления → Параметры сервера:

Выберите Доступ к API разрешён.
Поставьте флажок в чекбоксе Значение и нажмите Сохранить. Значение параметра Доступ к API разрешён изменится на Да.
Во вкладке Политики перейдите в Политики → Системные политики → Сервер распознавания.
Добавьте в поля данные машины, на которой установлен сервер распознавания:

Шаг обновления срабатываний — количество событий, которое обрабатывает сервер распознавания за один раз. Чем меньше это число, тем чаще будет происходить обновление. Оптимальное значение параметра — 10 000. Если строка пустая, значение также принимается равным 10 000. Не устанавливайте значения меньше 10 000, чтобы не увеличивать нагрузку на сервер.

Адрес API — доменное имя или IP-адрес сервера распознавания.

Порт — порт доступа к серверу распознавания. По умолчанию — 9090.

Кол-во ядер — должно соответствовать числу ядер сервера модуля.

Статус — наличие связи с сервером.

Загрузка — нагрузка на сервер распознавания.

Активно — включение/выключение сервера распознавания.

Поставьте галочку Политика активна и сохраните изменения.

Настройка модуля Анализ контента¶

Подключитесь к серверу распознавания по SSH. Откройте конфигурационный файл сервера в текстовом редакторе:

sudo nano /etc/ibatyr/cpservice-config

И укажите параметры:

PORT = 9090
SERVER_ADDR = 'http://192.168.1.x'
SECRET = 'xxxxxxxxxxxxxxxx'

Здесь PORT — порт доступа к серверу.
SERVER_ADDR — адрес сервера iBatyr Monitor .
SECRET — значение ключа API, указанное в Параметрах сервера (см. выше).

Сохраните изменения и перезапустите сервер командой:

sudo service ibatyr-cpservice restart

Готово! Сервер настроен.

Политики распознавания контента¶

Настраиваются на сервере iBatyr Monitor в веб-интерфейсе.

Время на обработку изображений:

Формат изображения	Время на обработку, с
full HD изображение без поворота	5
4K изображение	20

Анализ контента¶

В разделе Фильтры перейдите во вкладку Политики, далее в папке Политики выберите Анализ контента.

Сервер распознает:

текст,
речь,
печати,
лица,

Кроме этого, в Анализе контента доступны опции:

Извлечение текста — сохраняет текстовое содержимое из события Перехаченный файл.
Сканер архивов — создает событие Перехваченный файл из файлов перехваченного архива.

Распознавание текста¶

Позволяет распознавать текст на изображениях.

Вкладка Свойства содержит настройки распознавания текста:

Встроенный OCR / Сервер распознавания — выбор инструмента распознавания. Кроме сервера распознавания, вы можете использовать встроенный OCR. Подробнее — в статье Настройка модуля OCR.
Модуль распознавания — движок для распознавания.
- Tesseract. Бесплатная библиотека для базового OCR, простая и гибкая.
- Content AI ABBYY. Платный движок, требует дополнительных настроек на сервере и платной лицензии с компонентом OCR. Обеспечивает высокую точность, лучше распознает перевернутые изображения.
Распознавать перевёрнутые — распознавание текста на перевёрнутых изображениях. Опция расширяет возможности, но нагружает сервер распознавания.
Язык — языки для распознавания: русский, английский.
Облако ABBYY — если у вас есть аккаунт на облачном сервисе ABBYY, вы можете его подключить. Просто введите свой логин и пароль.

Во вкладке Фильтр можно настроить фильтр для политики распознавания текста.

Настроенный по умолчанию фильтр выглядит так:

 agent_attachedfile@mime:mime=application/pdf
 agent_attachedfile@mime:mime=image/jpeg
 agent_attachedfile@mime:mime=image/png
 agent_attachedfile@mime:mime=image/tiff
 agent_attachedfile@extracted:extracted=false
 agent_eventtype@default:agent_eventtype=0#Intercepted file

{
 "operator": "AND",
 "rules": []
}

¶

Распознавание печатей¶

Примечание

На данный момент поддерживается поиск только круглых печатей.

Сервер распознаваний находит изображения печати по заданным образцам в документах формата jpg, jpe, jpeg, png и pdf.

Примечание

На данный момент политику можно создать только одну политику для одной печати. Если у вас несколько печатей, обратитесь в техподдержку.

Для работы политики понадобятся образцы печатей — фрагменты изображений, на котором содержится печать. Окружающий текст и подписи не являются помехами для распознавания. Чтобы повысить качество распознавания используйте несколько образцов печати.

Что важно для таких образцов:

размер изображения — 400x400px;
разная степень нажатия при печати;
небольшие различия между образцами;
отсутствие бракованных оттисков;
расположение печатей под разными углами.

Чтобы создать политику распознавания для печати:

Перейдите во вкладке Политики в папку Политики → Анализ контента.
Сдвиньте переключатель Распознавание печатей вправо.
Загрузите образец печати через кнопку выбора файла в Выбор изображений с печатями; дождитесь, пока у распознанных печатей в столбце Статус появится галочка.
Задайте фильтр для политики. Например:

Типы контента — pdf, jpg, png;

Типы события — перехваченные файлы/скриншоты.

Примечание

Политика не работает с пустыми фильтрами. Не пропускайте этот шаг.

Установите галочку Политика активна для активации политики. Найденные факты будет доступны в разделе Сработавшие политики.

Ложные срабатывания¶

Для любой политики распознавания образов существует вероятность ложного срабатывания. Чаще всего такое происходит с печатями, имеющими определённое сходство. Чтобы снизить количество ложных срабатываний, откройте конфигурационный файл сервера iBatyr Monitor:

sudo nano /usr/share/ibatyr/settings.py

и измените значения параметра STAMP_RECOGNITION_THRESHOLD в сторону уменьшения.

Ложные срабатывания возможны, когда компания или организация имеют похожие печати, отличающиеся названием отдела или кодом подразделения. В этом случае обратитесь в нашу техническую поддержку.

Логи¶

Сервер распознавания¶

Лог расположен по адресу: /var/log/ibatyr-cpservice.log.

Запрос и его опции:

2020-09-10 12:19:39,065 [DEBUG] cp_server:112 Request for 2020_09_10/ae4cd000abaecdaf46eec3d3ac90750d327e688a.jpe : text_extraction face_detection

Где text_extraction face_detection — опциональные параметры, извлечение текста и распознавание лиц.

Результат обработки:

2020-09-10 12:24:20,125 [DEBUG] cp_server:127 Response for 2020_09_10/9ade404783b02bff8741ed1632ffbf63d883c64e.jpe done in 0:01:04.814513: "document_class": undetected, "face": {'size': {'width': 640, 'height': 480}, 'bounds': [{'top': 306, 'right': 381, 'bottom': 476, 'left': 211}], 'vectors': '...'}, "extracted_text": "

В команде указан тип документа, сэмплы результата обработки лиц и извлечения текста, время затраченное на обработку.

Сервер iBatyr Monitor¶

Лог расположен по адресу /var/log/ibatyr/content_processing.log.

Сообщение об ошибке [ERROR] content_processing:420 API error: [Errno28] No space left on device указывает, что серверу недостаточно RAM-диска. Ошибка возникает при работе с большими файлами или большом количестве ядер на сервере. Чтобы ее исправить, увеличьте размер дисковой памяти.

Для увеличения памяти добавьте в /etc/ibatyr/cpservice-config строку:

RAMDISK_SIZE = '5G'

Примечание

Рекомендуемое значение для RAMDISK_SIZE можно рассчитать следующим образом: умножьте максимальный размер файла на обработку на количество ядер сервера. По умолчанию используется 500 MБ.