VRAM en uso
0.0 GB
de 12 GB · 0%
Modelos cargados
0
12 disponibles en Ollama
Franja activa
L-V 7:30–18:00
viernes, 03:26 p. m.
Uptime gateway
3d 6h
tiers: fast, std, deep, night, vision
VRAM (caliente ahora)
0.0 / 12 GB
0%
Ningún modelo caliente (VRAM libre sobre el piso).
Servicios
salud en vivo
Ollama (modelos) YOLO antirrobo Bot Inventario Bot Facturas
Sesiones YOLO activas
Pedido #7996 · PL0249 · cam3/cam4expired
Pedido #7995 · PL0009 · cam3/cam4expired
Modelos configurados (por tier)
| Tier | Modelo | VRAM | keep_alive | Rol |
|---|---|---|---|---|
| fast | qwen-fast (3B) | ~1.8 GB | 30s | Asistente rápido / clasificación |
| std | qwen-supervisor (7B) | ~4.4 GB | 2m | Asistente estándar |
| deep | qwen-deep (14B) | ~8.4 GB | 30m | Razonamiento |
| night | deepseek-analyst (14B) | ~8.4 GB | 30m | Supervisores (noche) |
| vision | qwen-vision (VLM) | ~12 GB | 5m | Interpreta eventos YOLO |
| embed | nomic-embed-text | ~0.3 GB | — | Embeddings (pgvector) |
| — | YOLO antirrobo (yolov8n ONNX) | ~1.7 GB | — | Visión · solo horario laboral |
Matriz de franjas horarias (L-V 7:30–18:30 · S 8:00–13:00)
| Franja | YOLO | VLM | Asistente | Supervisor | Entren. |
|---|---|---|---|---|---|
| L-V 7:30–18:00 | activo | throttle | qwen-supervisor | off | off |
| L-V 18:00–22:00 | off | off | off | briefing | off |
| L-V 22:00–06:00 | off | off | off | deepseek | nube |
| Sáb 8:00–13:00 | activo | throttle | qwen-fast | off | off |
| Sáb 13:00–Lun 6:00 | off | off | off | lunes AM | ventana |
Regla de oro: sobre el piso antirrobo, un solo modelo grande caliente a la vez — minimizar swaps de VRAM (estresan el memory controller → BSOD 0x1A).