DataSpoc ML
AutoML no seu data lake. Treine, preveja e explique modelos de machine learning diretamente nos dados Parquet do seu bucket na nuvem. Feature engineering automatizado, seleção de modelo e monitoramento de drift.
Seu Agente ML está pronto.
DataSpoc ML vem com AGENT.md — um arquivo de habilidades que permite que agentes de IA treinem modelos, gerem previsões e expliquem resultados no seu data lake. Pergunte em linguagem natural: "Dá pra prever quais clientes vão dar churn?" e o agente cuida do feature engineering, treinamento e avaliação.
As previsões ficam como Parquet no seu bucket — consultáveis via Lens. Sem handoffs de notebook. Sem pipelines de deploy de modelo. Da pergunta à previsão em produção em uma conversa.
Claude via MCP → ML
Você: "Treine um modelo para prever quais clientes vão dar churn" [MCP] list_tables() [MCP] ml train --target churn --from customers [MCP] ml explain --model churn Agente: "Modelo treinado. AUC: 0.87. Top preditores: days_since_order, support_tickets, contract_type. Previsões salvas em ml/predictions/ Consulte com: SELECT * FROM churn"
Três comandos até ML em produção
De dados brutos a previsões em produção sem sair do terminal.
Train
Feature engineering automatizado, seleção de modelo e ajuste de hiperparâmetros. Lê Parquet do seu bucket, grava artefatos do modelo de volta.
$ dataspoc-lens ml train \
--table curated.finance.customers \
--target churn \
--output s3://my-lake/ml/models/churn Predict
Rode previsões em dados novos usando modelos treinados. Lê o modelo do seu bucket, grava previsões como Parquet.
$ dataspoc-lens ml predict \
--model s3://my-lake/ml/models/churn \
--input curated.finance.new_customers \
--output s3://my-lake/ml/predictions/churn Explain
Entenda por que o modelo faz cada previsão. Importância de features, valores SHAP e detecção de drift prontos para usar.
$ dataspoc-lens ml explain \
--model s3://my-lake/ml/models/churn \
--format html Como ML se conecta ao seu data lake
ML lê dados curados, treina modelos e grava previsões de volta no bucket. Lens pode consultar tudo.
bucket/
curated/finance/customers/ ← ML lê dados de treinamento
*.parquet
ml/models/churn/ ← ML grava artefatos do modelo
model.pkl
features.json
metrics.json
ml/predictions/churn/ ← ML grava previsões
*.parquet ← Lens pode consultar estes
──────────────────────────────────────────────
[Pipe] ──→ raw/ ──→ curated/ ──→ [ML Train]
│
▼
ml/models/churn/
│
[ML Predict]
│
▼
ml/predictions/churn/
│
▼
[Lens] ──→ SQL / Notebooks / IA Consulte previsões com Lens
Depois que ML grava previsões no seu bucket, Lens as descobre automaticamente. Consulte com SQL, notebooks ou seu agente de IA.
Query SQL nas previsões
dataspoc-lens> SELECT customer_id, name, churn_probability
FROM ml.predictions.churn
WHERE churn_probability > 0.8
ORDER BY churn_probability DESC
LIMIT 10; AI Ask nas previsões
$ dataspoc-lens ask "Quais clientes enterprise têm o maior risco de churn?"
Consultando ml.predictions.churn joined com raw.postgres.customers...
Encontrados 5 clientes enterprise com probabilidade de churn acima de 80%. Métricas do modelo
$ dataspoc-lens ml metrics --model s3://my-lake/ml/models/churn
Model: churn_classifier_v2
Accuracy: 0.94
Precision: 0.91
Recall: 0.87
F1: 0.89
AUC: 0.96
Trained: 2024-12-15T10:30:00Z
Samples: 45,230 Traga ML para seu data lake
DataSpoc ML é um produto comercial. Entre em contato para preços, demos e programas piloto.