Классификация документов
Метод /classify
Классификатор находит на изображении документы и присваивает им тип. Список поддерживаемых типов документов.
Алгоритм работы метода API /classify
Алгоритм ищет на входящем изображении прямоугольные области, похожие на документы, и вырезает их.
Классификатор присваивает каждой вырезанной области класс: главный разворот паспорта России, водительское удостоверение образца 2011 года, СНИЛС и так далее. По ссылке доступен список поддерживаемых типов документов.
Алгоритм оценивает ориентацию документа в пространстве. При необходимости, классификатор поворачивает или зеркально отражает документ.
Типы вырезанных областей, которые классификатор не поворачивает и не отражает зеркально:
other — документ неизвестного типа;
not_document — не документ, например, фото кота;
empty — пустая страница.
API-спецификация
Ниже представлена API-спецификация для метода классификации документов. Подробнее о том, как составить запрос на классификацию, в разделе Подключение и тестирование.
classify
POST
https://latest.dbrain.io/classify
Query Parameters
Name | Type | Description |
---|---|---|
min_shape | integer | >0, по умолчанию 256. Минимальный размер изображения в пикселях по короткой стороне. Если размер меньше, параметр low_image_size в ответе вернётся со значением true. Если больше — false. |
min_filesize | integer | >0, по умолчанию 10240. Минимальный вес изображения в байтах. Если вес меньше, параметр low_image_weight в ответе вернётся со значением true. Если больше — false. |
max_exposure_score | number | >0, по умолчанию 0.4. Максимальная экспозиция (яркость) изображения. Если яркость больше, параметр image_exposure в ответе вернётся со значением overexposed. Если меньше — normal. |
min_exposure_score | number | >0, по умолчанию 0.05. Минимальная экспозиция (яркость) изображения. Если яркость меньше, параметр image_exposure в ответе вернётся со значением underexposed. Если больше — normal. |
max_blur_score | number | >0, по умолчанию 2. Минимальный коэффициент чёткости изображения. Если чёткость меньше, параметр image_blured в ответе вернётся со значением true. Если больше — false. |
doc_type | array | Перечень типов документов, которые нужно найти во входящем файле. Используется для детерминированных процессов, например, если в потоке требуется найти только главный разворот паспорта, а на все остальные типы ответ не требуется. По умолчанию выбраны все значения параметра (все типы, имеющиеся в классификаторе). |
priority | integer | >0, по умолчанию — 1. Приоритет асинхронной задачи в очереди на обработку. |
simple_cropper | boolean | false (по умолчанию) — упрощённый алгоритм вырезания документов из изображений не используется true — используется упрощённый алгоритм вырезания документов из изображений: он работает быстрее, но даёт менее точный результат. На изображениях со сложным фоном документы могут быть вырезаны менее аккуратно. |
async | boolean | true — асинхронный режим обработки запросов. false — синхронный режим обработки запросов. |
check_fake_experimental | boolean | устарело и не используется |
check_fake | boolean | true — алгоритм ищет в метаданных файла признаки модификации в цифровых редакторах, результат возвращается в отдельном поле fake. false — алгоритм проверки метаданных отключен. |
pdf_raw_images | boolean | true — алгоритм оставляет решение о растеризации PDF параметру auto_pdf_raw_images. false — любой PDF будет принудительно растеризован, значение параметра auto_pdf_raw_images будет проигнорировано. |
auto_pdf_raw_images | boolean | true — алгоритм ищет текстовый слой в PDF. Если он найден, PDF будет принудительно растеризован. false — алгоритм никогда не растеризует PDF. |
dpi | integer | >0, по умолчанию 300 — устанавливает число пикселей на дюйм при растеризации PDF. Рекомендуется 300. Более высокие значения, как правило, не дают прироста качества, но увеличивают вес изображения. |
quality | integer | 0-100, по умолчанию 75 — устанавливает степень сжатия JPEG при растеризации PDF. Рекомендуется 75 для баланса между весом изображения и его качеством. |
gauss | number | устарело и не используется |
with_hitl | boolean | true — отправляет изображения документов на классификацию людьми, работает только для отдельных документов в сборках для конкретных клиентов false — ручная классификация изображений отключена |
mode | string | classify_crop и classify_only — отключает вырезание документов из изображения, классификацию проходит изображение целиком. Рекомендуется применять только для полностью контролируемого потока файлов, например, с поточного сканера. default — стандартный режим работы классификатора |
task_tags | array | Массив строк, который позволяет присваивать запросу дополнительные идентификаторы. Например можно передавать id пакета документов для биллинга на стороне Dbrain |
return_crops | boolean | false — сервис перестаёт возвращать изображения. Функцию можно использовать для экономии трафика и для удобства отладки — с ней ответ сервиса становится более читабельным. true (по умолчанию) — сервис возвращает в ответе изображения в бинарном формате. |
Request Body
Name | Type | Description |
---|---|---|
image | object | Файл, содержимое которого нужно классифицировать |
Last updated