Docker Failure


Ошибка Docker Failure на Clore.ai

Проблема Clore.ai помечает риг как Docker Failure и держит его офлайн, хотя HiveOS работает.

Симптомы

  • Значок «Docker Failure» в панели Clore.

  • В разделе My Servers карты отображаются как 0× Unknown или их число «скачет».


Причина 1: нестабильная карта или райзер

Clore не может инициализировать карту, если та отпала. Даже если HiveOS её видит — Clore не может использовать GPU → Docker Failure.

Решение: перезапуск и проверка оборудования

  1. Проверь карту или райзер, убедись что всё подключено.

  2. Перезапусти риг:

reboot

Если после перезагрузки ошибка вернулась, проблема в карте/материнке/райзерах


Причина 2: повреждена среда Python (Miniconda)

Clore зависает на старте, если повреждена директория /opt/clore-hosting/miniconda-env.

Решение: удалить среду и запустить заново

sudo systemctl stop clore-hosting.service
sudo rm -rf /opt/clore-hosting/miniconda-env
sudo systemctl start clore-hosting.service

Причина 3: зависла установка зависимостей

Если Clore не стартует — возможна зависшая установка зависимостей (aiofiles, docker и др).

Решение: переустановка зависимостей

sudo /opt/clore-hosting/clore.sh --reinstall

Причина 4: установлена нестабильная версия Docker (например, 28.*)

Рекомендуемая версия: 27.5.1. На 28+ часто возникают сбои.

Решение: откат Docker

sudo apt install \
docker-ce=5:27.5.1-1~ubuntu.22.04~jammy \
docker-ce-cli=5:27.5.1-1~ubuntu.22.04~jammy \
containerd.io -y

Причина 5: не добавлены нужные сервисы в автозагрузку

После ребута система не запускает Docker и Clore Hosting → сервер офлайн.

Решение: включить автозапуск сервисов

sudo systemctl enable clore-hosting.service
sudo systemctl enable docker.service
sudo systemctl enable docker.socket

Причина 6: драйвер не видит карты (nvidia-smi → No devices found)

HiveOS не определяет карту, Clore не может с ней работать → Docker Failure.

Решение: переустановить драйвер

nvidia-driver-update --force

Если не помогло — полностью удалить сервер с Clore, сменить токен, добавить заново. Это часто помогает, если сломались внутренние конфигурации.


Docker Failure почти всегда означает, что Clore не видит GPU. В 90 % случаев виноват отключённый сервис или нестабильная карта/райзер. Исправьте первопричину, добавьте сервисы в автозагрузку — и риг останется онлайн.


Last updated