Comercial

DataSpoc ML

AutoML en tu data lake. Entrena, predice y explica modelos de machine learning directamente sobre datos Parquet en tu bucket en la nube. Ingenieria de features automatizada, seleccion de modelos y monitoreo de drift.

🧠

Tu Agente ML esta listo.

DataSpoc ML incluye AGENT.md — un archivo de habilidades que permite a los agentes de IA entrenar modelos, generar predicciones y explicar resultados en tu data lake. Pregunta en lenguaje natural: "Podemos predecir que clientes van a abandonar?" y el agente se encarga de la ingenieria de features, el entrenamiento y la evaluacion.

Las predicciones se guardan como Parquet en tu bucket — consultables via Lens. Sin traspasos de notebooks. Sin pipelines de despliegue de modelos. De la pregunta a la prediccion en produccion en una conversacion.

Entrena modelos Genera predicciones Explica resultados Monitorea drift

Claude via MCP → ML

Tu: "Entrena un modelo para predecir
      que clientes van a abandonar"

[MCP] list_tables()
[MCP] ml train --target churn
      --from customers
[MCP] ml explain --model churn

Agente: "Modelo entrenado. AUC: 0.87.
Principales predictores: dias_desde_pedido,
tickets_soporte, tipo_contrato.
Predicciones guardadas en ml/predictions/
Consulta con: SELECT * FROM churn"

Tres comandos a ML en produccion

De datos crudos a predicciones desplegadas sin salir de tu terminal.

Entrenar

Ingenieria de features automatizada, seleccion de modelos y ajuste de hiperparametros. Lee Parquet de tu bucket, escribe artefactos del modelo de vuelta.

$ dataspoc-lens ml train \
    --table curated.finance.customers \
    --target churn \
    --output s3://my-lake/ml/models/churn

Predecir

Ejecuta predicciones sobre nuevos datos usando modelos entrenados. Lee el modelo de tu bucket, escribe predicciones como Parquet.

$ dataspoc-lens ml predict \
    --model s3://my-lake/ml/models/churn \
    --input curated.finance.new_customers \
    --output s3://my-lake/ml/predictions/churn

Explicar

Entiende por que el modelo hace cada prediccion. Importancia de features, valores SHAP y deteccion de drift incluidos.

$ dataspoc-lens ml explain \
    --model s3://my-lake/ml/models/churn \
    --format html

Como ML se conecta a tu data lake

ML lee datos curados, entrena modelos y escribe predicciones de vuelta al bucket. Lens puede consultar todo.

bucket/
  curated/finance/customers/       ← ML lee datos de entrenamiento
    *.parquet

  ml/models/churn/                 ← ML escribe artefactos del modelo
    model.pkl
    features.json
    metrics.json

  ml/predictions/churn/            ← ML escribe predicciones
    *.parquet                      ← Lens puede consultarlas

──────────────────────────────────────────────

[Pipe] ──→ raw/ ──→ curated/ ──→ [ML Train]
                                      │
                                      ▼
                               ml/models/churn/
                                      │
                               [ML Predict]
                                      │
                                      ▼
                            ml/predictions/churn/
                                      │
                                      ▼
                                   [Lens] ──→ SQL / Notebooks / IA

Consulta predicciones con Lens

Una vez que ML escribe predicciones en tu bucket, Lens las descubre automaticamente. Consulta con SQL, notebooks o tu agente de IA.

Consulta SQL sobre predicciones

dataspoc-lens> SELECT customer_id, name, churn_probability
  FROM ml.predictions.churn
  WHERE churn_probability > 0.8
  ORDER BY churn_probability DESC
  LIMIT 10;

IA Ask sobre predicciones

$ dataspoc-lens ask "Which enterprise customers have the highest churn risk?"

Querying ml.predictions.churn joined with raw.postgres.customers...

Found 5 enterprise customers with churn probability above 80%.

Metricas del modelo

$ dataspoc-lens ml metrics --model s3://my-lake/ml/models/churn

Model: churn_classifier_v2
Accuracy:  0.94
Precision: 0.91
Recall:    0.87
F1:        0.89
AUC:       0.96
Trained:   2024-12-15T10:30:00Z
Samples:   45,230

Lleva ML a tu data lake

DataSpoc ML es un producto comercial. Contactanos para precios, demos y programas piloto.