Ir al contenido

DataSpoc Lens

DataSpoc Lens es un warehouse virtual sobre Parquet en la nube. Monta tu data lake como vistas DuckDB y te permite consultar con SQL, un shell interactivo, notebooks Jupyter, Marimo, lenguaje natural (IA) o programaticamente via el Python SDK.

  • Monta Parquet en la nube como vistas DuckDB — no se necesita infraestructura de data warehouse
  • Shell SQL con resaltado de sintaxis, autocompletado y comandos dot
  • Notebooks Jupyter y Marimo con tablas pre-montadas
  • Consultas con IA — haz preguntas en lenguaje natural, obtiene SQL + resultados
  • Cache local — trabaja offline y reduce costos de egress en la nube
  • Transformaciones SQL — construye datasets curados con archivos SQL numerados
  • MCP server — conecta agentes de IA a tu data lake via Model Context Protocol
InterfazDescripcion
CLIComandos dataspoc-lens para todas las operaciones
Python SDKfrom dataspoc_lens import LensClient
MCP Serverdataspoc-lens mcp para integracion con agentes de IA
Jupyterdataspoc-lens notebook con magia %%sql
Marimodataspoc-lens notebook --marimo
Cloud Bucket → Catalog Discovery → DuckDB Views → Query / Shell / Notebook / AI
│ │
│ manifest.json (from Pipe)
│ or scan-based (glob *.parquet)
└── read via DuckDB httpfs (remote Parquet, no download needed)
└── or local cache (~/.dataspoc-lens/cache/) for offline work

Lens lee el manifiesto escrito por DataSpoc Pipe para el descubrimiento de tablas. Si no se encuentra un manifiesto, escanea el bucket buscando archivos .parquet y los agrupa por directorio.

Ventana de terminal
pip install dataspoc-lens

DataSpoc Lens esta licenciado bajo Apache 2.0 — libre para usar, modificar y distribuir.