Классификация документов
Проверяем наличие требуемого списка документов в файле и аккуратно раскладываем их по типам
Сервис поможет обработать многостраничные сканы с поточного сканера или сделать предварительную обработку заявки на налоговый вычет. Он пригодится и в простых случаях: когда нужно убедиться, что на изображении именно тот документ, который вы запрашивали.
Сервис классификации:
Работает с фотографиями и сканами документов.
Находит на изображении все документы, даже если на одном скане присутствуют сразу паспорт, СНИЛС и водительские права.
Отделяет документы от фона. Например, от рук, столов или обоев в цветочек.
Поворачивает и при необходимости зеркально отражает документ.
Присваивает тип каждому найденному документу. Вы можете посмотреть, какие документы мы умеем классифицировать, в разделе «Типы документов».
Обратите внимание, что классификатор может вернуть в API такие типы:
other — документ неизвестного типа
not_document — не документ, например, фото кота
empty — пустая страница
Как начать работать с сервисом классификации документов
Есть 4 популярных способа взаимодействия с сервисом. Для любого из них вам нужен ключ лицензии. Чтобы получить ключ, напишите нам в телеграм или на hello@dbrain.io.
Подготовьте изображение документа для теста. Если у вас такого нет, используйте паспорт РФ из Википедии.
Параметры запроса к API
Возврат найденных областей изображения
return_crops — boolean
Поведение по умолчанию: return_crops=true
— сервис возвращает изображения найденных документов в параметре crop
.
Если вам не нужны найденные сервисом изображения документов (например, в целях экономии трафика), укажите return_crops=false
.
Перед началом работы с сервисами изучите раздел «Общая информация о сервисах». Там мы рассказываем про допустимые форматы файлов, виды запросов и ответов, набор HTTP-статусов и даём рекомендации по устранению ошибок
В ответе API:
task_id
— string, идентификатор запроса, формат: 32 символа, 16-ричная строкаitems
— массив, который содержит найденные документыdocument
— объект, который содержит один из найденных документовtype
— string, тип найденного документа, возможные типы перечислены в таблице вышеrotation
— integer, ориентация документаcoords
— массив, координаты документа на изображении по четырём точкам: верхний левый угол, верхний правый, нижний левый, нижний правыйpage
— integer, номер страницы, на котором найден документ, актуально для многостраничных форматов, например PDFconfidence
— number, уровень уверенности алгоритма в корректности определения типа документа
crop
— $string, изображение документа, отделённое от фона и правильно ориентированное, в бинарном формате
task_tags
— массив string, теги, если они переданы в параметреtask_tags
page_count
— integer, число страниц в файле, актуально для PDF и DJVUdocs_count
— integer, число распознанных документов в файлеtraceback
— string, сообщение об ошибке, которое содержит информацию о том, где произошла ошибка в коде и какие функции были вызваны перед ней. Это сообщение может помочь разработчикам понять причину возникновения ошибки и исправить ее. Передайте её нашей службе поддержки.
Остальные поля не несут практического смысла. Оставили их для совместимости со старыми версиями.