DataSpoc ML
AutoML en tu data lake. Entrena, predice y explica modelos de machine learning directamente sobre datos Parquet en tu bucket en la nube. Ingenieria de features automatizada, seleccion de modelos y monitoreo de drift.
Tu Agente ML esta listo.
DataSpoc ML incluye AGENT.md — un archivo de habilidades que permite a los agentes de IA entrenar modelos, generar predicciones y explicar resultados en tu data lake. Pregunta en lenguaje natural: "Podemos predecir que clientes van a abandonar?" y el agente se encarga de la ingenieria de features, el entrenamiento y la evaluacion.
Las predicciones se guardan como Parquet en tu bucket — consultables via Lens. Sin traspasos de notebooks. Sin pipelines de despliegue de modelos. De la pregunta a la prediccion en produccion en una conversacion.
Claude via MCP → ML
Tu: "Entrena un modelo para predecir que clientes van a abandonar" [MCP] list_tables() [MCP] ml train --target churn --from customers [MCP] ml explain --model churn Agente: "Modelo entrenado. AUC: 0.87. Principales predictores: dias_desde_pedido, tickets_soporte, tipo_contrato. Predicciones guardadas en ml/predictions/ Consulta con: SELECT * FROM churn"
Tres comandos a ML en produccion
De datos crudos a predicciones desplegadas sin salir de tu terminal.
Entrenar
Ingenieria de features automatizada, seleccion de modelos y ajuste de hiperparametros. Lee Parquet de tu bucket, escribe artefactos del modelo de vuelta.
$ dataspoc-lens ml train \
--table curated.finance.customers \
--target churn \
--output s3://my-lake/ml/models/churn Predecir
Ejecuta predicciones sobre nuevos datos usando modelos entrenados. Lee el modelo de tu bucket, escribe predicciones como Parquet.
$ dataspoc-lens ml predict \
--model s3://my-lake/ml/models/churn \
--input curated.finance.new_customers \
--output s3://my-lake/ml/predictions/churn Explicar
Entiende por que el modelo hace cada prediccion. Importancia de features, valores SHAP y deteccion de drift incluidos.
$ dataspoc-lens ml explain \
--model s3://my-lake/ml/models/churn \
--format html Como ML se conecta a tu data lake
ML lee datos curados, entrena modelos y escribe predicciones de vuelta al bucket. Lens puede consultar todo.
bucket/
curated/finance/customers/ ← ML lee datos de entrenamiento
*.parquet
ml/models/churn/ ← ML escribe artefactos del modelo
model.pkl
features.json
metrics.json
ml/predictions/churn/ ← ML escribe predicciones
*.parquet ← Lens puede consultarlas
──────────────────────────────────────────────
[Pipe] ──→ raw/ ──→ curated/ ──→ [ML Train]
│
▼
ml/models/churn/
│
[ML Predict]
│
▼
ml/predictions/churn/
│
▼
[Lens] ──→ SQL / Notebooks / IA Consulta predicciones con Lens
Una vez que ML escribe predicciones en tu bucket, Lens las descubre automaticamente. Consulta con SQL, notebooks o tu agente de IA.
Consulta SQL sobre predicciones
dataspoc-lens> SELECT customer_id, name, churn_probability
FROM ml.predictions.churn
WHERE churn_probability > 0.8
ORDER BY churn_probability DESC
LIMIT 10; IA Ask sobre predicciones
$ dataspoc-lens ask "Which enterprise customers have the highest churn risk?"
Querying ml.predictions.churn joined with raw.postgres.customers...
Found 5 enterprise customers with churn probability above 80%. Metricas del modelo
$ dataspoc-lens ml metrics --model s3://my-lake/ml/models/churn
Model: churn_classifier_v2
Accuracy: 0.94
Precision: 0.91
Recall: 0.87
F1: 0.89
AUC: 0.96
Trained: 2024-12-15T10:30:00Z
Samples: 45,230 Lleva ML a tu data lake
DataSpoc ML es un producto comercial. Contactanos para precios, demos y programas piloto.