Changelog

3.6.10 — 2021.10.21

Фичи

  • Сократили время распознавания одного документа на 0,4-0,5 секунд

  • Добавили нормализацию адреса прописки с возвратом кода ФИАС. Используйте параметр normalization_fias=true

  • Научились извлекать из метаданных изображения широту, долготу, высоту и время снимка. Возвращаем их в поле image_exif

Багфиксы

  • Исправили возврат в ответе некорректных координат полей в случае подачи на распознавание неправильно ориентированных документов

  • Перестали путать пустые развороты паспорта с разворотом «Место жительства»

  • Сократили число ошибок 500 при распознавании штампов прописок

  • Уточнили зону замазывания даты регистрации в штампе прописок перед отправкой на ручное распознавание: она больше не перекрывает часть адреса

3.6.8 — 2021.10.12

Повысили качество

  • 2-НДФЛ

Фичи

  • Научили метод /fulltext_by_lines распознавать русский рукописный текст. Для распознавания укажите в параметре language значение handwritten_rus.

  • Научили сервис обрабатывать изображения в формате HEIF.

  • Добавили в методы /recognize и /classify массив task_tags, в котором можно указывать произвольные тэги запросов. Функцию можно использовать для сверки биллинга в случае с объединением документов в пакеты.

  • Добавили в методы /recognize и /classify параметр return_crops. В положении false сервис перестаёт возвращать изображения. Функцию можно использовать для экономии трафика и для удобства отладки — с ней ответ сервиса становится более читабельным.

  • Добавили в метод /recognize параметр first_occurrence_only. В положении true при обработке PDF сервис возвращает только первый найденный документ запрашиваемого класса. Это позволяет сократить время ответа сервиса.

  • Сервис теперь замазывает дату регистрации в штампе прописки перед отправкой на ручное распознавание

3.5.12 — 2021.03.31

Фичи

  • Добавили параметр merge_and_name в методе /recognize. Укажите в нём нужное вам название, чтобы объединить все распознанные поля всех документов в один документ.

  • Dbrain теперь генерирует более осмысленные логи, которые удобней читать

Багфиксы

  • Исправили возврат некорректных координат полей в методе /recognize

  • Научились распознавать 2-НДФЛ и счета-фактуры в закрытом IT-контуре, раньше модель однократно подгружалась из Интернета

  • Теперь возвращаем корректное значение серии-номера СТС на образцах, где ГИБДД продублировала их дважды

3.5.10 — 2021.03.05

Добавили документы

  • Паспорт Украины 1994 года, машинопечатный образец, второй разворот

Повысили качество

  • Обновили алгоритм распознавания полнотекстовых документов в методе fulltext_by_lines. Качество распознавания выросло. Метод теперь возвращает результаты в виде отдельных слов, а не строчек

  • Усилили классификатор дополнительным обучением на паспортах Украины

  • Научились лучше распознавать ФИО и даты на главном развороте паспортов Украины образца 1994 года

Багфиксы

  • Исправили ошибку в эвристиках СТС. В единичных случаях баг приводил к возврату полей, не соответствующих документации

Фичи

  • Добавили параметр hitl_field_to_recognize. В нём можно перечислить поля документа, которые нужно распознать вручную

  • Методы /selfie , /distance и /face теперь возвращают вырезанные из изображений лица, их координаты и угол поворота; метод /selfieвозвращает тип документа на изображении

  • Добавили возврат пороговых значений confidence для целевого уровня точности распознавания в методе /metrics

3.5.8 — 2021.02.19

Повысили качество

  • Обновили алгоритмы поиска и сравнения лиц. Dbrain теперь лучше находит лица на сложных изображениях и обеспечивает отсутствие ложноположительных результатов сравнения

  • Паспорт России, главный разворот: повысили качество распознавания серии-номера

  • Паспорт Украины образца 2016 года: лицевая и обратная сторона

  • Паспорт Украины образца 1994 года, машинопечатный образец, главный разворот

Багфиксы

  • Исправили занижение confidence поля серия-номер на главном развороте паспорта России

  • Исправили баг, который в ряде случаев мешал находить штамп о регистрации на странице прописок

  • Исправили редкий баг, приводивший к ошибке 500 вместо результатов распознавания

Фичи

  • Добавили новый класс документа — passport_registration_handwritten. Он присваивается страницам паспорта, в которых последняя печать о регистрации рукописная.

  • Добавили возврат л.с. и кВт в ПТС отдельными полями engine_hp и engine_kw

  • Добавили комплексную проверку паспорта по внешним источникам. Она доступна в параметре external_check_passport_complex

  • Добавили возможность посимвольного возврата текста полей документов с ручного распознавания. За это отвечает новый параметр hitl_symbol_field. Для перечисленных в нём полей вернётся второй вариант ответа без нормализации по словарям и маскам.

3.5.7 — 2021.02.03

Добавили документы

  • Удостоверение личности Казахстана 2014 года: лицевая и обратная сторона

  • Удостоверение личности Казахстана 1994 года: лицевая и обратная сторона

Повысили качество

  • Научились уверенно распознавать половинки разворотов ПТС

  • Добавили эвристику к полю «Код подразделения» в Паспорте РФ, теперь поле возвращается строго по маске ddd-ddd

Багфиксы

  • Исправили баг с некорректным значением параметра rotation в ответе классификатора

  • Исправили ошибку при использовании параметра check_fake на некоторых изображениях

Фичи

  • Оптимизировали работу решения под нагрузкой

  • Локальные версии Dbrain теперь используют меньше подключений к MongoDB

  • Полностью переписали алгоритм обработки PDF. Теперь не нужно указывать дополнительные параметры в запросе, а PDF обрабатываются намного быстрее.

  • Научили классификатор возвращать четыре новых параметра, описывающих качество входящего изображения:

    • image_exposure

      • normal — нормальные

      • overexposed — переэкспонированные, пересвеченные

      • underexposed — недоэкспонированные, слишком тёмные

    • image_blured — смазанные

    • low_image_resolution — недостаточное разрешение изображения

    • low_image_weight — недостаточный вес изображения.

    Допустимые значения вы можете задать самостоятельно в запросе к классификатору.

  • Добавили возможность распознавания смешанного русско-английского текста в неструктурированных документах в методе full_text_by_lines, для этого нужно выбрать язык multilang

  • Научились распознавать QR-коды на документах

  • Добавили возврат HTTP Status Code 213 для редких кейсов, когда ручное распознавание не уложилось в предельный SLA по времени

3.5.6 — 2020.12.23

Повысили качество

  • Рукописный паспорт России

  • Обратная сторона ВУ-2011 и ВУ-2014: поля «особые отметки», «серия-номер»

  • Обратная сторона СТС

  • 2-НДФЛ: поле «месяц»

  • Алгоритм поиска границ документа теперь лучше справляется с разворотами документов, например с паспортами

Фичи

  • Добавили проверки документов по базам через наших партнёров — IDX. За это отвечают параметры API external_check_***

  • Добавили возможность указывать в конфигах локальной версии Dbrain параметры Redis: хост, порт, логин и пароль

3.5.5 — 2020.11.27

Добавили документы

  • Рукописный паспорт России

  • Паспорт Украины образца 2016 года: лицевая и обратная сторона

  • Паспорт Украины образца 1994 года, машинопечатный образец, главный разворот

  • Удостоверение личности Казахстана 2008 года: лицевая и обратная сторона

Повысили качество

  • Машинопечатный паспорт России

  • ПТС: лицевая сторона

  • 2-НДФЛ — теперь распознаём все поля

Исправили

  • Устранили редкую ситуацию с зависанием задачи

  • Добавили обработку файлов с некорректным расширением, например image.jpg?=

  • Исправили несколько сценариев в алгоритме распознавания, которые приводили к внутренней ошибке 500.

3.5.4 — 2020.11.03

Повысили качество

  • Доработали распознавание «половинок» главного разворота Паспорта России и ПТС

  • Обучили алгоритм поиска границ документов аккуратней обращаться с документами, в которых «подвал» находится на расстоянии от основной части документа.

Исправили

  • Локальные версии Dbrain больше не пишут избыточный объём логов на накопитель

3.5.3 — 2020.10.30

Повысили качество

  • Научили классификатор корректно обрабатывать половинки документов, например одну страницу паспорта вместо разворота.

Фичи

  • Добавили параметр priority для асинхронных запросов. Чем больше число, тем раньше балансировщик возьмёт запрос из очереди в обработку.

  • Добавили эндпоинт /cancel для асинхронных запросов. С его помощью можно отменить запрос, если он потерял актуальность. Это позволит быстрее получить результаты других запросов.

Прочие улучшения

  • Dbrain теперь эффективно обрабатывает большое число одновременных запросов.

3.5.2 — 2020.09.30

Добавили документы

  • Счёт-фактура rus_invoice

Повысили качество

  • Обновили алгоритм вырезания документов из входящих изображений: теперь он лучше справляется со сложными случаями

  • ВУ-2011, обратная сторона: улучшили распознавание поля «особые отметки»

  • ВУ-1999, пластиковый образец: снизили число ложных распознаваний категории «А»

Фичи

  • Добавили параметр API simple_cropper. В положении «true» применяется упрощённый алгоритм вырезания документа от фона. Результаты классификации и распознавания в этом режиме могут быть чуть менее точными. Используйте этот параметр, если экономия 1 секунды даёт вам преимущества. По умолчанию simple_cropper не используется.

3.5.1 — 2020.09.23

Повысили качество

  • ПТС, лицевая сторона: значительно улучшили поля: марка, модель, VIN, шасси, кузов; улучшения по всем остальным полям

3.5.0 — 2020.09.22

Улучшения качества распознавания документов

  • Паспорт России, главный разворот: все поля

  • СТС, лицевая сторона, значительно улучшили поля: марка, модель, мощность двигателя, модель двигателя, номер двигателя, серия ПТС, номер ПТС, регистрационный знак, номер кузова, VIN; незначительные улучшения по другим полям

  • СТС, обратная сторона, значительно улучшили поля: город, имя, фамилия, отчество, республика.

  • Загранпаспорт России 2007, улучшили поля: имя, орган

  • Загранпаспорт России 2014, улучшили поля: имя, место рождения

  • ВУ-1999, бумажные, лицевая сторона: нижняя серия-номер теперь возвращается латиницей

Прочие улучшения

  • Скорректировали подсчёт уровня уверенности распознавания confidence

  • Обновили библиотеки обработки изображений и конвертации PDF

  • Паспорт России, прописка: дополнительно возвращаем информацию из печати с разбивкой на поля

3.4.7 — 2020.09.19

Добавили документы

  • СНИЛС: пластиковый образец

  • Полис ОМС: пластиковый образец Москвы

Повысили качество

  • Паспорт России, разворот с прописками: улучшили распознавание штампов прописки

  • ВУ-2011, обратная сторона, улучшили поля: C, CE

  • ВУ-2014, обратная сторона, улучшили поля: C, C1, CE, C1E

  • СТС, обратная сторона, улучшены поля: фамилия, дата, серия, номер и город

  • Свидетельство о рождении, добавили поля: место рождения, запись акта о рождении, место государственной регистрации, серия, номер

  • Свидетельство о заключении брака, добавили поля: запись акта о заключении брака, место государственной регистрации, серия, номер

  • Свидетельство о расторжении брака, добавили поля: запись акта о расторжении брака, место государственной регистрации, серия, номер

  • Свидетельство о смерти, добавили поля: запись акта о смерти, место государственной регистрации, серия, номер

Исправили

  • Устранили утечку памяти

3.4.6.1 — 2020.09.03

Фичи

  • Новая веб-демо для локальной версии коробки по аналогии с demo.dbrain.io

  • Новый параметр API hitl_async=true разрешает возврат неполного состава полей документа не дожидаясь окончания распознавания всех полей. Параметр работает только при использовании режима ручного распознавания документов with_hitl=true. В параметре hitl_required_fields нужно перечислить названия полей документа, после обработки которых HITL может возвращать неполный ответ. Ответ с неполным составом полей сопровождается кодом 202, полный — кодом 200.

  • Параметр use_external_api получил статус устаревшего. Обогащение ответов из внешних источников теперь контролируется в конфигах локальных версий.

Исправили

  • Вернули качество распознавания заграничных паспортов России 2007 и 2014 из версии 3.4.5.

  • Добавили обнуление уверенности в распознавании поля confidence, если ответ системы не удалось привести к допустимому значению. В поле ответа в таком случае будет пустая строка "text": "" .

  • Исправили поля серия и номер в заграничном паспорте России 2014 года, в версии 3.4.6 они были перепутаны.

3.4.6 — 2020.08.24

Добавили документы

  • Свидетельство о рождении

  • Свидетельство о заключении брака

  • Свидетельство о расторжении брака

  • Свидетельство о смерти

  • Полис ОМС: пластиковый образец (лицевая и обратная сторона)

  • Полис ОМС: бумажный образец (лицевая сторона)

Повысили качество

  • СТС, лицевая сторона: улучшено поле «тип ТС»

Фичи

  • Ускорили работу решения: модули классификации и распознавания работают на 2-3 секунды быстрее

Last updated