Sistema · RTX 5070 (12 GB)

Runtime IA — Robocop

en vivo · 03:26:50 p. m.
VRAM en uso
0.0 GB
de 12 GB · 0%
Modelos cargados
0
12 disponibles en Ollama
Franja activa
L-V 7:30–18:00
viernes, 03:26 p. m.
Uptime gateway
3d 6h
tiers: fast, std, deep, night, vision
VRAM (caliente ahora)
0.0 / 12 GB
0%
Ningún modelo caliente (VRAM libre sobre el piso).
Servicios
salud en vivo
Ollama (modelos) YOLO antirrobo Bot Inventario Bot Facturas
Sesiones YOLO activas
Pedido #7996 · PL0249 · cam3/cam4expired
Pedido #7995 · PL0009 · cam3/cam4expired
Modelos configurados (por tier)
TierModeloVRAMkeep_aliveRol
fastqwen-fast (3B) ~1.8 GB30sAsistente rápido / clasificación
stdqwen-supervisor (7B) ~4.4 GB2mAsistente estándar
deepqwen-deep (14B) ~8.4 GB30mRazonamiento
nightdeepseek-analyst (14B) ~8.4 GB30mSupervisores (noche)
visionqwen-vision (VLM) ~12 GB5mInterpreta eventos YOLO
embednomic-embed-text ~0.3 GBEmbeddings (pgvector)
YOLO antirrobo (yolov8n ONNX) ~1.7 GBVisión · solo horario laboral
Matriz de franjas horarias (L-V 7:30–18:30 · S 8:00–13:00)
FranjaYOLOVLMAsistenteSupervisorEntren.
L-V 7:30–18:00activothrottleqwen-supervisoroffoff
L-V 18:00–22:00offoffoffbriefingoff
L-V 22:00–06:00offoffoffdeepseeknube
Sáb 8:00–13:00activothrottleqwen-fastoffoff
Sáb 13:00–Lun 6:00offoffofflunes AMventana
Regla de oro: sobre el piso antirrobo, un solo modelo grande caliente a la vez — minimizar swaps de VRAM (estresan el memory controller → BSOD 0x1A).