⚡ GPU PUR Balance — Architecture Multi-Serveur
Le GPU PUR (Processing Unit Resilient) est l'architecture distribuée de WEVAL qui orchestre 4 nœuds GPU/CPU across 3 providers cloud.
🖥 Nœuds Actifs
| Nœud | GPU | VRAM | Modèle | Tier | Coût | Status |
|---|---|---|---|---|---|---|
| d755 RUNPOD | RTX A5000 24GB | 60% | wevia-brain-v6:14b | T0 | $0.27/hr | Actif |
| KAGGLE T4 | 2x T4 16GB | 45% | qwen3.6:27b | T2 | GRATUIT | Actif |
| S151 OVH | CPU Only | 75% | 6 modèles Ollama | T3 | Inclus | Charge |
| BLADE-IA | Razer Edge ARM | 10% | Réserve | T6 | N/A | Standby |
🎯 Tiers de Routing
- T0 (d755): wevia-brain-v6:14b — Requêtes critiques — 9GB VRAM
- T1: deepseek-r1:14b + cloud Cerebras/Groq — 5.5GB
- T2 (KAGGLE): qwen3.6:27b — Quota 30h/sem — GRATUIT
- T3 (S151): llama3.2:3b local — 6 modèles — 8.3GB
- T4-T6: DDG anonyme, Together, BLADE-IA backup
📊 Métriques en Temps Réel
4
Nœuds
60%
VRAM moyenne
$0.27
Coût/hr
13
Providers
0€
Coût IA
99.7%
Uptime