Классификация документов

Метод /classify

Классификатор находит на изображении документы и присваивает им тип. Список поддерживаемых типов документов.

Алгоритм работы метода API /classify

  1. Алгоритм ищет на входящем изображении прямоугольные области, похожие на документы, и вырезает их.

  2. Классификатор присваивает каждой вырезанной области класс: главный разворот паспорта России, водительское удостоверение образца 2011 года, СНИЛС и так далее. По ссылке доступен список поддерживаемых типов документов.

  3. Алгоритм оценивает ориентацию документа в пространстве. При необходимости, классификатор поворачивает или зеркально отражает документ.

Типы вырезанных областей, которые классификатор не поворачивает и не отражает зеркально:

  • other — документ неизвестного типа;

  • not_document — не документ, например, фото кота;

  • empty — пустая страница.

API-спецификация

Ниже представлена API-спецификация для метода классификации документов. Подробнее о том, как составить запрос на классификацию, в разделе Подключение и тестирование.

classify

POST https://latest.dbrain.io/classify

Query Parameters

Request Body

{
  "detail": [ // техническая информация
    {
      "loc": [ 
        "string" 
      ],
      "msg": "string",
      "type": "string" 
    }
  ],
  "items": [
    {
      "document": {
        "type": "bank_card", // тип документа
        "page": 0, // номер страницы входного файла, на которой найден документ
        "rotation": 0, // 4 варианта поворота документа на 90 градусов х 2 варианта отзеркаливания
        "coords": [ // координаты изображения документа во входном файле
          [
            0
          ]
        ]
      },
      "crop": "string", // изображение документа в бинарном формате
      "image_exposure": "normal", // экспозиция изображения документа
      "image_blured": false, // чёткость изображения документа
      "low_image_resolution": true, // разрешение изображения документа
      "low_image_weight": true // вес изображения документа
    }
  ],
  "task_id": "string", // внутренний id задачи
  "code": 0, // код ответа
  "message": "string", // сообщение об ошибке в рамках объекта
  "errno": 0, // номер ошибки
  "traceback": "string", // сообщение об ошибке в рамках объекта
  "fake": true, // ответ при параметре check_fake = "true"
  "pages_count": 1, // кол-во страниц во входном файле
  "docs_count": 1 // кол-во документов во входном файле
}

Last updated