DataSpoc Lens
DataSpoc Lens es un warehouse virtual sobre Parquet en la nube. Monta tu data lake como vistas DuckDB y te permite consultar con SQL, un shell interactivo, notebooks Jupyter, Marimo, lenguaje natural (IA) o programaticamente via el Python SDK.
Que hace Lens
Sección titulada «Que hace Lens»- Monta Parquet en la nube como vistas DuckDB — no se necesita infraestructura de data warehouse
- Shell SQL con resaltado de sintaxis, autocompletado y comandos dot
- Notebooks Jupyter y Marimo con tablas pre-montadas
- Consultas con IA — haz preguntas en lenguaje natural, obtiene SQL + resultados
- Cache local — trabaja offline y reduce costos de egress en la nube
- Transformaciones SQL — construye datasets curados con archivos SQL numerados
- MCP server — conecta agentes de IA a tu data lake via Model Context Protocol
Interfaces
Sección titulada «Interfaces»| Interfaz | Descripcion |
|---|---|
| CLI | Comandos dataspoc-lens para todas las operaciones |
| Python SDK | from dataspoc_lens import LensClient |
| MCP Server | dataspoc-lens mcp para integracion con agentes de IA |
| Jupyter | dataspoc-lens notebook con magia %%sql |
| Marimo | dataspoc-lens notebook --marimo |
Como funciona
Sección titulada «Como funciona»Cloud Bucket → Catalog Discovery → DuckDB Views → Query / Shell / Notebook / AI │ │ │ manifest.json (from Pipe) │ or scan-based (glob *.parquet) │ └── read via DuckDB httpfs (remote Parquet, no download needed) └── or local cache (~/.dataspoc-lens/cache/) for offline workLens lee el manifiesto escrito por DataSpoc Pipe para el descubrimiento de tablas. Si no se encuentra un manifiesto, escanea el bucket buscando archivos .parquet y los agrupa por directorio.
Instalar
Sección titulada «Instalar»pip install dataspoc-lensOpen source
Sección titulada «Open source»DataSpoc Lens esta licenciado bajo Apache 2.0 — libre para usar, modificar y distribuir.