Dbrain Official
Dbrain Реестр ПО
Dbrain Реестр ПО
  • Общая информация
    • Общая информация о сервисах
    • Типы документов
    • Информация по технической поддержке
    • Changelog
  • Сервисы
    • Классификация документов
    • Извлечение данных
      • Паспорт
      • Паспорт: прописка
      • Водительское удостоверение
      • СТС
      • Бухгалтерская первичка
      • Договоры
      • Прочие документы
    • Проверка документов
      • Антифрод
      • Антифрод 2.0
      • Подписи и печати
      • Базы данных
    • Операции с лицами
      • Сравнение лиц
      • Селфи-чек
      • Liveness
    • Базовый OCR
    • Ручная верификация
  • Локальная установка
    • Установка на сервер
    • Локальный сервис лицензий
Powered by GitBook
  1. Локальная установка

Установка на сервер

Написали инструкцию, чтобы вы смогли развернуть решение Dbrain в собственном закрытом IT-контуре

PreviousРучная верификацияNextЛокальный сервис лицензий

Last updated 2 months ago

Dbrain — серверное решение. Если хотите его протестировать, . Мы не используем долговременные хранилища данных. Все входящие файлы передаются на сервер по защищённому протоколу, обрабатываются в оперативной памяти и удаляются сразу после возврата результатов пользователю. В тестовых целях пригодится

Функциональность локальной версии

Поддерживаются:

  • (только на серверах с GPU)

Требования к аппаратной части

Сценарии использования:

Оценили скорость распознавания на изображениях этих документов в формате JPEG:

  • Паспорт РФ — главный разворот

  • Паспорт РФ — прописка с печатными и рукописными штампами

  • Водительское удостоверение — лицевая сторона

  • Водительское удостоверение — обратная сторона 2011 и 2014 годов

  • СТС — лицевая и обратная стороны

  • СНИЛС — образец 1996 года

1. Минимальная конфигурация (только CPU)

  • Обработка одного документа: 5.5 секунд

  • Обработка комплекта из 100 документов: 382 секунды (0.3 RPS)

  • Процессор: 2 ядра, 2.3 GHz

  • Оперативная память: 16 Gb

1. Слабая конфигурация (только CPU)

  • Обработка одного документа: 4.2 секунд

  • Обработка комплекта из 100 документов: 96 секунд (0.7 RPS)

  • Оперативная память: 28 Gb

2. Средняя конфигурация (CPU + GPU)

  • Обработка одного документа: 3 секунды

  • Обработка комплекта из 100 документов: 26 секунд (3.5 RPS)

  • Видеокарта: Nvidia Tesla T4

  • Процессор: 24 ядра, 2.3 GHz

  • Оперативная память: 64 Gb

3. Максимальная конфигурация (CPU + GPU)

  • Обработка одного документа: 2.9 секунды

  • Обработка комплекта из 100 документов: 20 секунд (6 RPS)

  • Видеокарта: Nvidia Tesla T4 х 4

  • Процессор: 48 ядер, 2.3 GHz

  • Оперативная память: 512 Gb

4. Production single-node

  • Обработка одного документа: 2.4 секунды

  • Обработка комплекта из 100 документов: 30 секунд (3.3 RPS)

Балансировщик:

  • Процессор: 2 ядра

  • Оперативная память: 4 Gb

Сервисы:

  • Физический сервер

  • Видеокарта: Nvidia A2

  • Оперативная память: 128 Gb

  • SSD 1024 Gb

6. Production double-node

  • Обработка одного документа: 2.6 секунды

  • Обработка комплекта из 100 документов: 17 секунд (5.8 RPS)

Балансировщик:

  • Процессор: 2 ядра

  • Оперативная память: 4 Gb

Сервисы (2 сервера):

  • Физический сервер

  • Видеокарта: Nvidia A2

  • Оперативная память: 128 Gb

  • SSD 1024 Gb

Выше перечислены аппаратные требования для продуктивной эксплуатации. Dbrain запускается и на слабых конфигурациях. Например, на ноутбуке Core i5-8250U 1.6 GHz / 8 Gb ОЗУ / 250 Gb SSD. Но работоспособность на таких слабых конфигурациях не гарантируется.

Требования к окружению:

  1. Операционная система Ubuntu версии 18.04+

  2. Система менеджмента контейнеров Docker

  3. docker-compose

  4. Для использования мощностей видеокарт нужны:

    1. nvidia-docker

    2. Драйвера Nvidia последней доступной версии

    3. CUDA версии не ниже 11.1

  5. Доступ в интернет для проверки лицензии:

    • Адрес: https://license.ml.dbrain.io/check/v2

    • IP: динамический

    • Порт: 443

    • Протокол: TCP

    • Запрос: POST

Запуск локальной версии Dbrain

  1. Создайте файл с названием docker-compose.yml

  2. Скопируйте конфигурацию ниже и вставьте его в docker-compose.yml:

version: "3.7"

# Сначала логинимся докером в наш реджистри:
# docker login registry.dbrain.io/docr
# login: r@b@t$docr+docr
# secret: p2JDaaFKIDEoddf8mho7

# Во всех сервисах закомментирован раздел volumes.
# Нужно самостоятельно решить куда монтировать,
# т.к. это зависит от вашего оркестратора.
# Для тестов - можно просто оставить закомментированными.


x-service: &service
  volumes:
    - "./data/files:/files"
#    - "./data/logs:/logs"
  environment:
    LOGURU_LEVEL: "INFO"
    LOGURU_COLORIZE: "YES"
    LICENSE_TOKEN: "***"  # Поменяйте на своё значение
    ALLOW_GPU: "%ALLOW_GPU%" # Укажите необходимое значение, в зависимости от конфигурации сервера
    FACE_API_URL: ""
    FACE_API_USERNAME: ""
    FACE_API_PASSWORD: ""
    REDIS_URL: "redis://redict?max_connections=16"
    
  depends_on:
    - tasque
    - redis
    - db
    - files
  tmpfs:
    - /tmp
  restart: always
  logging: &logging
    driver: "json-file"
    options:
      max-file: "10"
      max-size: "100m"


services:
  api:
    <<: *service
    image: registry.dbrain.io/docr/api:v4.90.0
    command: [ api ]

  specs:
    <<: *service
    image: registry.dbrain.io/docr/specs:v4.90.0
    command: [ specs ]

  agent:
    <<: *service
    image: registry.dbrain.io/docr/agent:v4.90.0
    command: [ agent ]
    
  redict:
    image: registry.redict.io/redict:7.3-alpine
    restart: always
    logging:
      driver: none

  files:
    image: registry.dbrain.io/docr/files:v4.90.0
    sysctls:
      net.core.somaxconn: 4096
#    volumes:
#      - "./data/files:/files"
    restart: always
    logging: *logging

  db:
    image: registry.dbrain.io/docr/db:v4.90.0
    user: root
#    volumes:
#      - "./data/postgres:/var/lib/postgresql/data"
    environment:
      POSTGRES_DB: postgres
      POSTGRES_USER: postgres
      POSTGRES_PASSWORD: ${POSTGRES_PASSWORD:-postgres}
    healthcheck:
      test: pg_isready -U postgres -h 127.0.0.1
      interval: 5s
    restart: always
    logging: *logging

# Это сервис очистки старых данных по уже отработавшим задачам.
# Он закомментирован, т.к. вы можете захотеть иначе очищать старые файлы.
# Для теста - можно просто оставить закомментированным.

#  cleaner:
#    image: alpine
#    volumes:
#      - "./data/files:/files"
#    command: sh -c "while true ; do find /files -mmin +"$(( ($PIPELINE_TIMEOUT+$COMPLETED_TASK_TTL_SECONDS) / 60 ))" -type f -print0 | xargs -0 -n 100 -P 4 rm -f; echo cleaning done ; sleep 60 ; done"
#    restart: always
#    logging: *logging

  demo:
    image: registry.dbrain.io/docr/demo:v4.90.0
    restart: always
    logging: *logging

  lb:
    image: registry.dbrain.io/docr/lb:v4.90.0
    restart: always
    ports:
      - 8080:80  # Поменяйте на своё значение, например, 8090:80
    logging: *logging

  tasque:
    image: registry.dbrain.io/docr/tasque:v4.90.0
#    volumes:
#      - "./data/logs:/logs"
    restart: always
    logging: *logging
  1. Если на вашем сервере доступна видеокарта, допишите в раздел environment файла строку ALLOW_GPU: true

При первом запуске на сервере может возникнуть конкуренция за процессор, память и видеокарту.

Сервисы и процессы запускаются одновременно и используют одни и те же ресурсы.

Рекомендуем дождаться, пока не произойдет равномерное распределение нагрузки.

  1. Если вы используете прокси для доступа к сервису лицензий, укажите его в параметре LICENSE_TOKEN раздела environment

  2. Сохраните изменения в файле docker-compose.yml

  3. Залогиньтесь через докер для доступа в наш репозиторий. Для этого выполните команду:

docker login registry.dbrain.io/docr
  1. Введите логин r@b@t$docr+docr и пароль p2JDaaFKIDEoddf8mho7

  2. Проверьте, что сервис лицензий доступен. Для этого выполните команду:

curl https://license.ml.dbrain.io/check/v2
  1. Если ответ 405 — всё хорошо. В противном случае вам нужно открыть нашему сервису доступ до этого адреса.

  2. Запустите сервис следующей командой:

docker compose up
  1. Подождите, когда сервис полностью развернётся. В логах появится надпись вида INFO: Uvicorn running on http://0.0.0.0:80

Сервис развёрнут локально. Теперь вы можете обращаться к нему по API. Примеры корректных запросов можно получить в свагере, он доступен по адресу localhost:8080/docs

Обратите внимание, передавать token в запросе не нужно, он передаётся в environment в docker-compose.yml

Пример запроса через терминал:

curl -X POST 'http://localhost:8080/pipelines/run/recognize' \
-H 'Content-Type: multipart/form-data' \
-H 'Accept: application/json' \
-F "image=@image.pdf;type=image/pdf"

Локально доступные методы:

  • Классификация документов: /pipelines/run/classify

  • Проверка документов на признаки подделки: /pipelines/run/fraud

  • Базовый OCR: /pipelines/run/fulltext

  • Извлечение данных из документов: /pipelines/run/recognize

Сервис требует от процессора поддержку набора инструкций AVX-512. Без них сервис не будет работать. Вот с поддержкой AVX-512.

Процессор: 16 ядер, 2.3 GHz, ориентир

Процессор: 10 ядер, 3.5-3.9 GHz, ориентир:

Процессор: 10 ядер, 3.5-3.9 GHz, ориентир:

Замените *** в строке LICENSE_TOKEN: "***" на ваш токен. Если у вас нет токена, напишите нам в или на .

Сервис обращается к , чтобы повысить точность выдаваемых адресов.

Если у вас ограничен доступ в Интернет, внесите в белый список адрес . Если такой возможности нет, отключите обращение к Dadata.ru. Для этого в запросе к методуrecognize передавайте параметр normalization_fias=false

Ничего не получилось, и вы хотите рассказать, что эта инструкция никуда не годится? Пишите нам в или на , мы оперативно поможем

воспользуйтесь веб-демо
паспорт России из Википедии
Извлечение данных из документов
Классификация документов
Антифрод 2.0
Базовый OCR
Бухгалтерская первичка
Подписи и печати
список архитектур
Intel Xeon Gold 5218
Intel W-2255
Intel W-2255
телеграм
hello@dbrain.io
Dadata.ru
https://suggestions.dadata.ru
телеграм
hello@dbrain.io
Page cover image