WEVAL · Démo Live Cascade IA 0€ T1-T2

📊 Le pitch

Tu paies Databricks ? Chaque requête IA = DBU consommés = € qui s'accumulent.
WEVAL Cascade ? Cerebras répond gratuit. Si rate-limit, fallback Groq. Si Groq fail, SambaNova. $0 sur 100% requêtes business standard.
→ Démo live ci-dessous. Pose une question, regarde les 3 providers répondre simultanément avec leur latence + coût (always 0).

💬 Pose une question business à WEVIA Master

⚡ Cerebras T1 · PRIMARY

En attente

$0.00

— ms latence

Réponse apparaîtra ici…

Model : qwen-3-235b · Free tier · Rate limit ~30 req/min

🚄 Groq T1 · FALLBACK 1

En attente

$0.00

— ms latence

Réponse apparaîtra ici…

Model : llama-3.3-70b · Free tier · Rate limit ~30 req/min

🌍 SambaNova T2 · FALLBACK 2

En attente

$0.00

— ms latence

Réponse apparaîtra ici…

Model : Llama-3.3-70B · Free credits · Rate limit ~10 req/min

WEVAL CASCADE TOTAL

$0.00

100% requêtes T1-T2 gratuit · always

DATABRICKS DBU équivalent estimé

$0.18-0.32

par requête similaire · scale 1M req/mois = $180-320k/an

💡 Note honnête : la cascade peut basculer T3 (Claude/OpenAI payant) pour ~5% des requêtes vraiment complexes nécessitant raisonnement profond. Sur 95% volume standard, T1-T2 free suffit. C'est ça qui fait la différence économique vs facturation per-token Databricks/OpenAI/Anthropic direct.