Dbrain Official
Dbrain Реестр ПО (backup)
Dbrain Реестр ПО (backup)
  • Dbrain
  • Общая информация о сервисах
  • Типы документов
  • Классификация документов
  • Извлечение данных
    • Паспорт
    • Паспорт: прописка
    • Водительское удостоверение
    • СТС
    • Бухгалтерская первичка
    • Договоры
    • Прочие документы
  • Проверка документов
    • Признаки подделки
    • Качество изображения
    • Подписи и печати
    • Базы данных
  • Операции с лицами
    • Сравнение лиц
    • Селфи-чек
    • Liveness
  • Базовый OCR
  • Ручная верификация
  • Локальная установка
    • Установка на сервер
    • Локальный сервис лицензий
    • Мобильный SDK
  • Формальности
    • Требования к технической поддержке
  • Changelog
Powered by GitBook
On this page
  • Перечень извлекаемых полей
  • Параметры запроса к API
Export as PDF
  1. Извлечение данных

Паспорт

Извлекаем данные из паспорта гражданина РФ: главный разворот, стр. 3-4

PreviousИзвлечение данныхNextПаспорт: прописка

Актуальная форма паспорта выдаётся с 1 октября 1997 года. С 1 июля 2011 года в паспорте заполняются нижние две строки с машиночитаемыми записями (МЧЗ). Сервис извлекает данные как из визуальных полей, так и из МЧЗ. При выборе между ними, сервис ориентируется на контрольные суммы в МЧЗ и читабельность данных визуальных полей.

Тип документа в API: passport_main

Перечень извлекаемых полей

Поле
Название в API
Формат поля

Серия и номер

series_and_number

4 цифры, пробел, 6 цифр

Имя

first_name

Русский алфавит

Фамилия

surname

Русский алфавит

Отчество

other_names

Русский алфавит

Пол

sex

муж. или жен.

Дата рождения

date_of_birth

дд.мм.гггг

Место рождения

place_of_birth

Русский алфавит

Дата выдачи

date_of_issue

дд.мм.гггг

Код подразделения

subdivision_code

3 цифры, тире, 3 цифры

Паспорт выдан

issuing_authority

Русский алфавит

МЧЗ, строка 1

mrz_1

Латинский алфавит, цифры, <>

МЧЗ, строка 2

mrz_2

Латинский алфавит, цифры, <>

Номер разворота

page_number

Параметры запроса к API

Нормализация поля «Паспорт выдан»

use_internal_api — boolean

В крайне редких случаях нормализация может приводить к неточному соответствию результатов распознавания поля «Паспорт выдан» и фактического текста в паспорте. Например, вместо ОТДЕЛОМ УФМС РОССИИ ПО Г. МОСКВЕ ПО РАЙОНУ ЗЮЗИНО сервис может вернуть ОТДЕЛОМ УФМС РОССИИ ПО ГОРОДУ МОСКВЕ ПО РАЙОНУ ЗЮЗИНО.

Мы не рекомендуем, но если вы всё же хотите отключить нормализацию поля «Паспорт выдан», передайте параметр use_internal_api=false

В России нет юридических норм, которые обязывают вас использовать в документах побуквенное воспроизведение поля «Паспорт выдан».

Например, у нашего продакта Артёма текст поля «Паспорт выдан» очень длинный и не влезает ни в одну печатную форму. Что ему делать? Артём всегда использует сокращения.

Для однозначной идентификации места выдачи документа достаточно поля «Код подразделения»

Помимо извлечения данных из паспорта сервис Dbrain умеет:

главного разворота паспорта. Всегда возвращает 2-3

Перед началом работы изучите общее описание сервиса извлечения данных в разделе . Ниже мы перечислили лишь уникальные параметры для главного разворота паспорта

Поведение по умолчанию: use_internal_api=true — сервис нормализует поле «Паспорт выдан». Для этого он использует расширенную версию соответствий кода подразделения и места выдачи. Так мы повышаем точность извлечения поля «Паспорт выдан». Поэтому сервис выдаёт корректный результат даже в ситуациях, когда поле полностью нечитабельно.

«Извлечение данных»
справочника
Проверять
действительность паспорта и находить признаки подделки файлов с документом
Верифицировать результаты извлечения данных в онлайн-режиме с помощью обученных людей
Сравнивать фотографии из паспорта с лицом человека
Номера страниц
Пример документа из
Wikipedia
Page cover image