Cache
Lens puede cachear archivos Parquet remotos localmente para que puedas trabajar offline y evitar cargos repetidos de egress en la nube.
Cachear una tabla
Sección titulada «Cachear una tabla»dataspoc-lens cache ordersCaching 'orders'...Cached 'orders': 4 file(s), 12.3 MBEsto descarga todos los archivos Parquet de la tabla orders a tu directorio de cache local.
Listar tablas cacheadas
Sección titulada «Listar tablas cacheadas»dataspoc-lens cache --list┌──────────────┬─────────────────────┬──────────┬────────┐│ Table │ Cached At │ Size │ Status │├──────────────┼─────────────────────┼──────────┼────────┤│ orders │ 2026-04-15 10:30:00 │ 12.3 MB │ fresh ││ customers │ 2026-04-14 08:00:00 │ 2.1 MB │ stale │└──────────────┴─────────────────────┴──────────┴────────┘Para salida JSON:
dataspoc-lens cache --list --output jsonForzar re-descarga
Sección titulada «Forzar re-descarga»dataspoc-lens cache orders --refreshDescarga los datos mas recientes aunque ya exista una copia local.
Limpiar cache
Sección titulada «Limpiar cache»# Clear a specific tabledataspoc-lens cache orders --clear
# Clear all cached datadataspoc-lens cache --clearDeteccion de frescura
Sección titulada «Deteccion de frescura»Lens determina la frescura del cache comparando dos marcas de tiempo:
cached_at— cuando se creo el cache locallast_extraction— la marca de tiempo de la ultima extraccion del manifiesto de Pipe
Si Pipe ejecuto una extraccion despues de que se creo el cache, el cache se marca como stale. De lo contrario es fresh.
| Condicion | Estado | Comportamiento |
|---|---|---|
cached_at > last_extraction | fresh | Las consultas usan el cache local |
cached_at < last_extraction | stale | Las consultas aun usan el cache, pero se muestra una advertencia |
| No existe cache | — | Las consultas leen directamente del bucket remoto |
Uso automatico del cache
Sección titulada «Uso automatico del cache»Cuando ejecutas consultas (via query, shell, ask o notebooks), Lens usa automaticamente el cache local para tablas que tienen una copia cacheada fresca. No se necesita configuracion — mount_views() detecta el cache y cambia la vista DuckDB para leer desde la ruta local en lugar del bucket remoto.
Estructura de directorios
Sección titulada «Estructura de directorios»Los archivos cacheados se almacenan en ~/.dataspoc-lens/cache/:
~/.dataspoc-lens/ cache/ orders/ part-0001.parquet part-0002.parquet part-0003.parquet part-0004.parquet customers/ part-0001.parquet cache_meta.json # Metadata: cached_at, size, freshness per tableFlujo de trabajo: analisis offline
Sección titulada «Flujo de trabajo: analisis offline»# 1. Cache the tables you need while onlinedataspoc-lens cache ordersdataspoc-lens cache customersdataspoc-lens cache products
# 2. Verify cachedataspoc-lens cache --list
# 3. Go offline and query normallydataspoc-lens query "SELECT * FROM orders JOIN customers USING (customer_id)"dataspoc-lens shelldataspoc-lens ask "Top customers by revenue"Todas las consultas leeran del cache local de forma transparente.