Dbrain Official
Dbrain Реестр ПО (backup)
Dbrain Реестр ПО (backup)
  • Dbrain
  • Общая информация о сервисах
  • Типы документов
  • Классификация документов
  • Извлечение данных
    • Паспорт
    • Паспорт: прописка
    • Водительское удостоверение
    • СТС
    • Бухгалтерская первичка
    • Договоры
    • Прочие документы
  • Проверка документов
    • Признаки подделки
    • Качество изображения
    • Подписи и печати
    • Базы данных
  • Операции с лицами
    • Сравнение лиц
    • Селфи-чек
    • Liveness
  • Базовый OCR
  • Ручная верификация
  • Локальная установка
    • Установка на сервер
    • Локальный сервис лицензий
    • Мобильный SDK
  • Формальности
    • Требования к технической поддержке
  • Changelog
Powered by GitBook
On this page
  • Сервис классификации:
  • Как начать работать с сервисом классификации документов
  • Параметры запроса к API
  • В ответе API:
Export as PDF

Классификация документов

Проверяем наличие требуемого списка документов в файле и аккуратно раскладываем их по типам

PreviousТипы документовNextИзвлечение данных

Сервис поможет обработать многостраничные сканы с поточного сканера или сделать предварительную обработку заявки на налоговый вычет. Он пригодится и в простых случаях: когда нужно убедиться, что на изображении именно тот документ, который вы запрашивали.

Сервис классификации:

  1. Работает с фотографиями и сканами документов.

  2. Находит на изображении все документы, даже если на одном скане присутствуют сразу паспорт, СНИЛС и водительские права.

  3. Отделяет документы от фона. Например, от рук, столов или обоев в цветочек.

  4. Поворачивает и при необходимости зеркально отражает документ.

Обратите внимание, что классификатор может вернуть в API такие типы:

  • other — документ неизвестного типа

  • not_document — не документ, например, фото кота

  • empty — пустая страница

Как начать работать с сервисом классификации документов

Через терминал
  • token — ваш ключ лицензии

  • image — файл с изображением документа

Запрос curl должен выглядеть так:

curl -X 'POST' \
  'https://latest.dbrain.io/classify?token=xxx' \
  -H 'accept: application/json' \
  -H 'Content-Type: multipart/form-data' \
  -F 'image=@image.jpg;type=image/jpeg'
Через Swagger
  • Подготовьте ключ лицензии

  • Введите свой токен в любое поле и нажмите Authorize

  • Прокрутите вниз до раздела Documents, нажмите на метод /classify

  • В открывшемся разделе нажмите на кнопку Try it out

  • Прокрутите страницу вниз до раздела Request body

  • Нажмите на кнопку Выберите файл пункта image

  • Укажите изображение, которое нужно распознать

  • Нажмите кнопку Execute

  • Ответ сервиса появится в пункте Response body раздела Responses

  • Полученный на этом этапе Curl мы рекомендуем использовать как основу для написания интеграции с API сервиса Dbrain

Через веб-демо
  1. Введите ключ лицензии в поле «Введите токен»

  2. Нажмите кнопку «Выберите файлы для распознавания»

  3. Укажите изображение, которое нужно распознать

  4. Нажмите кнопку «Классифицировать»

Через Python
import requests

url = 'https://latest.dbrain.io/classify?token=xxx'
files = {'image': open('image.jpg', 'rb')}
headers = {'accept': 'application/json'}

response = requests.post(url, headers=headers, files=files)

Код использует библиотеку requests для отправки POST-запроса с файлом изображения. Функция open() используется для открытия файла изображения в двоичном режиме и передачи его в параметр files. Параметр headers используется для установки заголовка accept в значение application/json. Ответ от сервера сохраняется в переменной response.

Тело запроса передавайте в кодировке UTF-8.

Параметры запроса к API

Возврат найденных областей изображения

return_crops — boolean

Поведение по умолчанию: return_crops=true — сервис возвращает изображения найденных документов в параметре crop.

Если вам не нужны найденные сервисом изображения документов (например, в целях экономии трафика), укажите return_crops=false.

В ответе API:

  • task_id — string, идентификатор запроса, формат: 32 символа, 16-ричная строка

  • items — массив, который содержит найденные документы

    • document — объект, который содержит один из найденных документов

      • type— string, тип найденного документа, возможные типы перечислены в таблице выше

      • rotation — integer, ориентация документа

      • coords — массив, координаты документа на изображении по четырём точкам: верхний левый угол, верхний правый, нижний левый, нижний правый

      • page — integer, номер страницы, на котором найден документ, актуально для многостраничных форматов, например PDF

      • confidence — number, уровень уверенности алгоритма в корректности определения типа документа

    • crop — $string, изображение документа, отделённое от фона и правильно ориентированное, в бинарном формате

  • task_tags — массив string, теги, если они переданы в параметре task_tags

  • page_count — integer, число страниц в файле, актуально для PDF и DJVU

  • docs_count — integer, число распознанных документов в файле

  • traceback — string, сообщение об ошибке, которое содержит информацию о том, где произошла ошибка в коде и какие функции были вызваны перед ней. Это сообщение может помочь разработчикам понять причину возникновения ошибки и исправить ее. Передайте её нашей службе поддержки.

Остальные поля не несут практического смысла. Оставили их для совместимости со старыми версиями.

Присваивает тип каждому найденному документу. Вы можете посмотреть, какие документы мы умеем классифицировать, в разделе .

Есть 4 популярных способа взаимодействия с сервисом. Для любого из них вам нужен ключ лицензии. Чтобы получить ключ, напишите нам в или на .

Подготовьте изображение документа для теста. Если у вас такого нет, используйте .

Обратитесь к методу /classify по адресу . В этом способе только два обязательных параметра:

Откройте и нажмите кнопку Authorize в правом верхнем углу

Откройте

Перед началом работы с сервисами изучите раздел . Там мы рассказываем про допустимые форматы файлов, виды запросов и ответов, набор HTTP-статусов и даём рекомендации по устранению ошибок

«Типы документов»
телеграм
hello@dbrain.io
паспорт РФ из Википедии
latest.dbrain.io
Swagger
demo.dbrain.io
«Общая информация о сервисах»
Page cover image