Inicio Rapido
Esta guia te lleva paso a paso a configurar DataSpoc Lens y ejecutar tus primeras consultas contra un data lake.
1. Instalar Lens
Sección titulada «1. Instalar Lens»pip install dataspoc-lens[s3]Reemplaza [s3] con [gcs] o [azure] dependiendo de tu proveedor de nube.
2. Inicializar la configuracion
Sección titulada «2. Inicializar la configuracion»dataspoc-lens initInitialized DataSpoc Lens in ~/.dataspoc-lensEsto crea el directorio de configuracion en ~/.dataspoc-lens/ con un config.yaml por defecto.
3. Registrar un bucket
Sección titulada «3. Registrar un bucket»dataspoc-lens add-bucket s3://my-company-dataBucket added: s3://my-company-dataDiscovering tables...┌──────────────┬─────────┬──────┬────────────┐│ Table │ Columns │ Rows │ Source │├──────────────┼─────────┼──────┼────────────┤│ customers │ 8 │ 5420 │ postgres ││ orders │ 12 │ 48k │ postgres ││ products │ 6 │ 312 │ postgres │└──────────────┴─────────┴──────┴────────────┘
3 table(s) found.Lens lee el manifiesto escrito por DataSpoc Pipe (o escanea archivos .parquet) y monta cada tabla como una vista DuckDB.
4. Explorar el catalogo
Sección titulada «4. Explorar el catalogo»dataspoc-lens catalog┌──────────────┬─────────┬──────┬────────────┐│ Table │ Columns │ Rows │ Source │├──────────────┼─────────┼──────┼────────────┤│ customers │ 8 │ 5420 │ postgres ││ orders │ 12 │ 48k │ postgres ││ products │ 6 │ 312 │ postgres │└──────────────┴─────────┴──────┴────────────┘Ve los detalles de columnas para una tabla especifica:
dataspoc-lens catalog --detail orders┌─────────────────┬───────────┐│ Column │ Type │├─────────────────┼───────────┤│ order_id │ INTEGER ││ customer_id │ INTEGER ││ order_date │ DATE ││ total │ DOUBLE ││ status │ VARCHAR │└─────────────────┴───────────┘5. Ejecutar una consulta SQL
Sección titulada «5. Ejecutar una consulta SQL»dataspoc-lens query "SELECT status, COUNT(*) as cnt FROM orders GROUP BY status"┌───────────┬───────┐│ status │ cnt │├───────────┼───────┤│ completed │ 32100 ││ pending │ 8450 ││ cancelled │ 2130 │└───────────┴───────┘
(3 row(s), 0.142s)6. Abrir el shell interactivo
Sección titulada «6. Abrir el shell interactivo»dataspoc-lens shellDataSpoc Lens Shell (DuckDB)Type SQL or .help for commands.
lens> SELECT * FROM customers LIMIT 3;┌─────┬──────────────┬───────────────────────┐│ id │ name │ email │├─────┼──────────────┼───────────────────────┤│ 1 │ Alice Smith │ alice@example.com ││ 2 │ Bob Johnson │ bob@example.com ││ 3 │ Carol White │ carol@example.com │└─────┴──────────────┴───────────────────────┘
(3 row(s), 0.008s)
lens> .quit7. Configurar consultas con IA (opcional)
Sección titulada «7. Configurar consultas con IA (opcional)»Para IA local gratuita usando Ollama:
dataspoc-lens setup-aiO configura un proveedor en la nube:
export DATASPOC_LLM_PROVIDER=anthropicexport DATASPOC_LLM_API_KEY=sk-ant-...8. Hacer preguntas en lenguaje natural
Sección titulada «8. Hacer preguntas en lenguaje natural»dataspoc-lens ask "What are the top 5 customers by total spending?"SQL: SELECT c.name, SUM(o.total) as total_spent FROM customers c JOIN orders o ON c.id = o.customer_id GROUP BY c.name ORDER BY total_spent DESC LIMIT 5
┌──────────────┬─────────────┐│ name │ total_spent │├──────────────┼─────────────┤│ Alice Smith │ 15420.50 ││ Bob Johnson │ 12300.00 ││ Carol White │ 9870.25 ││ Dave Brown │ 8540.00 ││ Eve Davis │ 7210.75 │└──────────────┴─────────────┘
(5 row(s), 1.230s)Siguientes pasos
Sección titulada «Siguientes pasos»- Shell Interactivo — conoce los comandos dot y funcionalidades del shell
- AI Ask — configura proveedores de IA y uso avanzado
- Notebooks — usa Jupyter o Marimo con tus datos
- Referencia de Comandos — referencia completa del CLI