Page cover

Установка на сервер

Написали инструкцию, чтобы вы смогли развернуть решение Dbrain в собственном закрытом IT-контуре

Dbrain — серверное решение. Если хотите его протестировать, воспользуйтесь веб-демо. Мы не используем долговременные хранилища данных. Все входящие файлы передаются на сервер по защищённому протоколу, обрабатываются в оперативной памяти и удаляются сразу после возврата результатов пользователю. В тестовых целях пригодится паспорт России из Википедии

Функциональность локальной версии

Локальная версия в отличие от облачной имеет ограниченную функциональность.

Поддерживаются:

  • Извлечение данных из документов:

    • Россия: паспорт, главный разворот, печатный образец — passport_main

    • Россия: паспорт, главный разворот, рукописный образец — passport_main_handwritten

    • Россия: паспорт, место жительства, печатный штамп — passport_registration

    • Россия: паспорт, место жительства, рукописный штамп — passport_registration_handwritten

    • Россия: паспорт, место жительства, штамп о снятии с регистрации — passport_registration_deregistered

    • Россия: Водительское удостоверение, лицевая сторона — driver_license_2011_front

    • Россия: Водительское удостоверение, обратная сторона, образец 2011 года — driver_license_2011_back

    • Россия: Водительское удостоверение, обратная сторона, образец 2014 года — driver_license_2014_back

    • Россия: СТС, лицевая сторона — vehicle_registration_certificate_front

    • Россия: СТС, лицевая сторона — vehicle_registration_certificate_back

    • Россия: СНИЛС образца 1996 года — snils_front

    • Россия: СНИЛС образца 2003 года — insurance_plastic

    • Россия: СНИЛС образца 2019 года — adi_reg

    • Россия: ИНН физлица — inn_person

    • Россия: свидетельство о рождении — birth_certificate

    • Россия: свидетельство о браке — marriage_certificate

    • Россия: ПТС, лицевая сторона — pts_front

    • Россия: ПТС, обратная сторона — pts_back

    • Банковская карта — bank_card

Требования к аппаратной части

Сценарии использования:

Оценили скорость распознавания на изображениях этих документов в формате JPEG:

  • Паспорт РФ — главный разворот

  • Паспорт РФ — прописка с печатными и рукописными штампами

  • Водительское удостоверение — лицевая сторона

  • Водительское удостоверение — обратная сторона 2011 и 2014 годов

  • СТС — лицевая и обратная стороны

  • СНИЛС — образец 1996 года

1. Минимальный

  • Виртуальная машина

  • Процессор: 16 ядер, 2.0 GHz, ориентир: Intel Skylake Xeon E3 v5

  • Оперативная память: 24 Gb

2. Дешёвый

  • Виртуальная машина

  • Видеокарта: Nvidia Tesla T4

  • Процессор: 20 ядер, 2.0 GHz, ориентир: Intel Skylake Xeon E3 v5

  • Оперативная память: 32 Gb

3. Стандартный

  • Физический сервер

  • Видеокарта: Nvidia Tesla T4

  • Процессор: 16 ядер, 3.2-3.9 GHz, ориентир: AMD EPYC 7343

  • Оперативная память: 64 Gb

  • SSD 512 Gb

4. Корпоративный

Балансировщик (2 сервера):

  • Процессор: 2 ядра

  • Оперативная память: 2 Gb

База данных (PostgreSQL, 2 сервера):

  • Процессор: 8 ядер

  • Оперативная память: 64 Gb

  • Накопитель: 512 Gb NVMe (допустимо использование SSD)

Сервисы (2 сервера):

  • Видеокарта (x3): Nvidia Tesla T4

  • Процессор (x2): 24 ядра, 3.2-4.0 GHz, ориентир: AMD EPYC 74F3

  • Оперативная память: 256 Gb

  • Накопитель: 512 Gb SSD

Выше перечислены аппаратные требования для продуктивной эксплуатации. Dbrain запускается и на слабых конфигурациях. Например, на ноутбуке Core i5-8250U 1.6 GHz / 8 Gb ОЗУ / 250 Gb SSD. Но работоспособность на таких слабых конфигурациях не гарантируется.

Требования к окружению:

  1. Современная операционная система на базе Linux (выпуска 2018 года или новее)

  2. Система менеджмента контейнеров Docker

  3. docker-compose

  4. Для использования мощностей видеокарт нужны:

    1. nvidia-docker

    2. Драйвера Nvidia последней доступной версии

    3. CUDA версии не ниже 11.1

  5. Доступ в интернет для проверки лицензии:

    • Адрес: https://license.ml.dbrain.io/check/v2

    • IP: динамический

    • Порт: 443

    • Протокол: TCP

    • Запрос: POST

Запуск локальной версии Dbrain

  1. Создайте файл с названием docker-compose.yml

  2. Скопируйте конфигурацию ниже и вставьте его в docker-compose.yml:

  1. Замените *** в строке LICENSE_TOKEN: "***" на ваш токен. Если у вас нет токена, напишите нам в телеграм или на [email protected].

  2. Если на вашем сервере доступна видеокарта, допишите в раздел environment файла строку ALLOW_GPU: true

  3. Если вы используете прокси для доступа к сервису лицензий, укажите его в параметре LICENSE_TOKEN раздела environment

  4. Сохраните изменения в файле docker-compose.yml

  5. Залогиньтесь через докер для доступа в наш репозиторий. Для этого выполните команду:

  1. Введите логин r@b@t$docr+docr и пароль p2JDaaFKIDEoddf8mho7

  2. Проверьте, что сервис лицензий доступен. Для этого выполните команду:

  1. Если ответ 405 — всё хорошо. В противном случае вам нужно открыть нашему сервису доступ до этого адреса.

  2. Запустите сервис следующей командой:

  1. Подождите, когда сервис полностью развернётся. В логах появится надпись вида INFO: Uvicorn running on http://0.0.0.0:80

Сервис развёрнут локально. Теперь вы можете обращаться к нему по API. Примеры корректных запросов можно получить в свагере, он доступен по адресу localhost:8080/docs

Локально доступные методы:

  • Классификация документов: /pipelines/run/classify

  • Проверка документов на признаки подделки: /pipelines/run/fraud

  • Базовый OCR: /pipelines/run/fulltext

  • Извлечение данных из документов: /pipelines/run/recognize

Ничего не получилось, и вы хотите рассказать, что эта инструкция никуда не годится? Пишите нам в телеграм или на [email protected], мы оперативно поможем

Last updated