GPU Hot - GPU-Temperatur und -Auslastung im Container überwachen
GPU Hot - GPU-Temperatur und -Auslastung im Container überwachen
GPU Hot ist ein schlankes Monitoring-Tool, das GPU-Temperatur, Auslastung, VRAM-Verbrauch und Taktfrequenz als Web-Dashboard bereitstellt — nützlich für alle, die GPU-Workloads wie KI-Inferenz oder Transkodierung im Homelab betreiben.
Was ist GPU Hot?
In GPU-lastigen Homelab-Setups fehlt oft eine einfache Möglichkeit, die Grafikkarte im Blick zu behalten. GPU Hot liest Metriken direkt über nvidia-smi (Nvidia) oder ROCm (AMD) aus und stellt sie als übersichtliches Web-Dashboard bereit. Temperatur, GPU-Auslastung in Prozent, VRAM-Belegung und Energie-Verbrauch werden in Echtzeit angezeigt. Das Tool eignet sich besonders für Setups mit Stable-Diffusion-Instanzen, Whisper-Transkription oder Plex/Jellyfin mit Hardware-Transkodierung.
Voraussetzungen
- Docker 20.10+ / Docker Compose
- Nvidia-GPU mit installiertem Nvidia Container Toolkit (
nvidia-docker2) nvidia-smimuss auf dem Host funktionieren
Compose-Beispiel
services:
gpu-hot:
image: nwithan8/gpu-hot:latest
container_name: gpu-hot
restart: unless-stopped
ports:
- "5000:5000"
environment:
- REFRESH_INTERVAL=2
deploy:
resources:
reservations:
devices:
- driver: nvidia
count: all
capabilities: [gpu]
Hinweise
- Nvidia Container Toolkit: Vor dem ersten Start das Toolkit auf dem Host installieren:
apt install nvidia-container-toolkitund danach Docker neu starten. deploy.resources-Syntax: In neueren Docker-Compose-Versionen ersetzt derdeploy-Block das ältereruntime: nvidia. Beide Syntaxvarianten funktionieren,deployist der aktuelle Standard.- Refresh-Intervall:
REFRESH_INTERVALdefiniert in Sekunden, wie häufig Metriken aktualisiert werden. Werte unter 1 erhöhen die Last spürbar. - Mehrere GPUs: Bei Multi-GPU-Systemen zeigt das Dashboard alle erkannten Karten separat an — kein zusätzlicher Konfigurationsaufwand nötig.