Cache
O Lens pode cachear arquivos Parquet remotos localmente para que você possa trabalhar offline e evitar cobranças repetidas de egress da nuvem.
Cachear uma tabela
Seção intitulada “Cachear uma tabela”dataspoc-lens cache ordersCaching 'orders'...Cached 'orders': 4 file(s), 12.3 MBIsso baixa todos os arquivos Parquet da tabela orders para seu diretório de cache local.
Listar tabelas cacheadas
Seção intitulada “Listar tabelas cacheadas”dataspoc-lens cache --list┌──────────────┬─────────────────────┬──────────┬────────┐│ Table │ Cached At │ Size │ Status │├──────────────┼─────────────────────┼──────────┼────────┤│ orders │ 2026-04-15 10:30:00 │ 12.3 MB │ fresh ││ customers │ 2026-04-14 08:00:00 │ 2.1 MB │ stale │└──────────────┴─────────────────────┴──────────┴────────┘Para saída em JSON:
dataspoc-lens cache --list --output jsonForçar re-download
Seção intitulada “Forçar re-download”dataspoc-lens cache orders --refreshBaixa os dados mais recentes mesmo que já exista uma cópia local.
Limpar cache
Seção intitulada “Limpar cache”# Clear a specific tabledataspoc-lens cache orders --clear
# Clear all cached datadataspoc-lens cache --clearDetecção de frescor
Seção intitulada “Detecção de frescor”O Lens determina o frescor do cache comparando dois timestamps:
cached_at— quando o cache local foi criadolast_extraction— o timestamp da última extração no manifest do Pipe
Se o Pipe executou uma extração depois que o cache foi criado, o cache é marcado como stale. Caso contrário, é fresh.
| Condição | Status | Comportamento |
|---|---|---|
cached_at > last_extraction | fresh | Queries usam o cache local |
cached_at < last_extraction | stale | Queries ainda usam o cache, mas um aviso é exibido |
| Sem cache | — | Queries leem diretamente do bucket remoto |
Uso automático do cache
Seção intitulada “Uso automático do cache”Quando você executa consultas (via query, shell, ask ou notebooks), o Lens usa automaticamente o cache local para tabelas que possuem uma cópia cacheada e atualizada. Nenhuma configuração é necessária — mount_views() detecta o cache e muda a view DuckDB para ler do caminho local ao invés do bucket remoto.
Estrutura de diretórios
Seção intitulada “Estrutura de diretórios”Os arquivos cacheados ficam em ~/.dataspoc-lens/cache/:
~/.dataspoc-lens/ cache/ orders/ part-0001.parquet part-0002.parquet part-0003.parquet part-0004.parquet customers/ part-0001.parquet cache_meta.json # Metadata: cached_at, size, freshness per tableFluxo de trabalho: análise offline
Seção intitulada “Fluxo de trabalho: análise offline”# 1. Cache the tables you need while onlinedataspoc-lens cache ordersdataspoc-lens cache customersdataspoc-lens cache products
# 2. Verify cachedataspoc-lens cache --list
# 3. Go offline and query normallydataspoc-lens query "SELECT * FROM orders JOIN customers USING (customer_id)"dataspoc-lens shelldataspoc-lens ask "Top customers by revenue"Todas as consultas vão ler do cache local de forma transparente.