Pular para o conteúdo

DataSpoc Lens

DataSpoc Lens é um warehouse virtual sobre Parquet na nuvem. Ele monta seu data lake como views DuckDB e permite consultar com SQL, shell interativo, notebooks Jupyter, Marimo, linguagem natural (IA) ou programaticamente via Python SDK.

  • Monta Parquet da nuvem como views DuckDB — sem necessidade de infraestrutura de data warehouse
  • Shell SQL com syntax highlighting, autocomplete e dot commands
  • Jupyter e Marimo notebooks com tabelas pré-montadas
  • Consultas com IA — faça perguntas em linguagem natural, receba SQL + resultados
  • Cache local — trabalhe offline e reduza custos de egress da nuvem
  • Transformações SQL — construa datasets curados com arquivos SQL numerados
  • MCP server — conecte agentes de IA ao seu data lake via Model Context Protocol
InterfaceDescrição
CLIComandos dataspoc-lens para todas as operações
Python SDKfrom dataspoc_lens import LensClient
MCP Serverdataspoc-lens mcp para integração com agentes de IA
Jupyterdataspoc-lens notebook com %%sql magic
Marimodataspoc-lens notebook --marimo
Cloud Bucket → Catalog Discovery → DuckDB Views → Query / Shell / Notebook / AI
│ │
│ manifest.json (from Pipe)
│ or scan-based (glob *.parquet)
└── read via DuckDB httpfs (remote Parquet, no download needed)
└── or local cache (~/.dataspoc-lens/cache/) for offline work

O Lens lê o manifest escrito pelo DataSpoc Pipe para descobrir tabelas. Se nenhum manifest for encontrado, ele escaneia o bucket por arquivos .parquet e os agrupa por diretório.

Terminal window
pip install dataspoc-lens

DataSpoc Lens é licenciado sob Apache 2.0 — livre para usar, modificar e distribuir.