Generar Predicciones
Puntua datos nuevos contra un modelo entrenado para generar predicciones.
dataspoc-lens ml predict --model <model> --from <table>| Flag | Descripcion |
|---|---|
--model | Nombre de un modelo previamente entrenado |
--from | La tabla fuente con datos nuevos a puntuar |
Que sucede
Sección titulada «Que sucede»- Carga el modelo — lee
model.pklyfeatures.jsondebucket/ml/models/<model>/. - Lee datos nuevos — carga la tabla fuente desde tu bucket.
- Aplica feature engineering — transforma los datos de entrada usando el mismo pipeline usado durante el entrenamiento.
- Genera predicciones — puntua cada fila y produce columnas de prediccion.
- Guarda en el bucket — escribe archivos Parquet en
bucket/ml/predictions/<model>/.
Las predicciones se guardan como archivos Parquet en:
bucket/ ml/ predictions/ <model>/ predictions_20260415_120000.parquetCada archivo de prediccion incluye las columnas clave originales mas la salida de prediccion y puntuaciones de confianza.
Predicciones en Lens
Sección titulada «Predicciones en Lens»Una vez que las predicciones se escriben en el bucket, se vuelven consultables como tablas SQL en Lens:
SELECT customer_id, prediction, confidenceFROM ml_predictions.churned_activityWHERE confidence > 0.8ORDER BY confidence DESCNo se necesita configuracion adicional — Lens descubre los archivos Parquet de predicciones automaticamente.
Ejemplo
Sección titulada «Ejemplo»Puntuar datos nuevos de clientes contra un modelo de churn entrenado:
dataspoc-lens ml predict --model churned_activity --from curated/customers/activitySalida:
[ML] Loading model churned_activity...[ML] Loading table curated/customers/activity...[ML] 12,045 rows to score[ML] Generating predictions...[ML] 3,218 predicted to churn (26.7%)[ML] Saved to ml/predictions/churned_activity/[ML] Done. Query with: SELECT * FROM ml_predictions.churned_activity