Ir al contenido

Generar Predicciones

Puntua datos nuevos contra un modelo entrenado para generar predicciones.

Ventana de terminal
dataspoc-lens ml predict --model <model> --from <table>
FlagDescripcion
--modelNombre de un modelo previamente entrenado
--fromLa tabla fuente con datos nuevos a puntuar
  1. Carga el modelo — lee model.pkl y features.json de bucket/ml/models/<model>/.
  2. Lee datos nuevos — carga la tabla fuente desde tu bucket.
  3. Aplica feature engineering — transforma los datos de entrada usando el mismo pipeline usado durante el entrenamiento.
  4. Genera predicciones — puntua cada fila y produce columnas de prediccion.
  5. Guarda en el bucket — escribe archivos Parquet en bucket/ml/predictions/<model>/.

Las predicciones se guardan como archivos Parquet en:

bucket/
ml/
predictions/
<model>/
predictions_20260415_120000.parquet

Cada archivo de prediccion incluye las columnas clave originales mas la salida de prediccion y puntuaciones de confianza.

Una vez que las predicciones se escriben en el bucket, se vuelven consultables como tablas SQL en Lens:

SELECT customer_id, prediction, confidence
FROM ml_predictions.churned_activity
WHERE confidence > 0.8
ORDER BY confidence DESC

No se necesita configuracion adicional — Lens descubre los archivos Parquet de predicciones automaticamente.

Puntuar datos nuevos de clientes contra un modelo de churn entrenado:

Ventana de terminal
dataspoc-lens ml predict --model churned_activity --from curated/customers/activity

Salida:

[ML] Loading model churned_activity...
[ML] Loading table curated/customers/activity...
[ML] 12,045 rows to score
[ML] Generating predictions...
[ML] 3,218 predicted to churn (26.7%)
[ML] Saved to ml/predictions/churned_activity/
[ML] Done. Query with: SELECT * FROM ml_predictions.churned_activity