Ir al contenido

Plataforma DataSpoc

DataSpoc es una plataforma de datos construida tanto para humanos como para agentes de IA. Convierte cualquier fuente de datos en un data lake consultable usando tres herramientas CLI conectadas por archivos Parquet en tu bucket en la nube.

Pipe se conecta a 400+ fuentes de datos y escribe archivos Parquet en tu bucket. Maneja la extraccion incremental, deteccion de esquema y particionamiento de forma automatica.

Lens monta tu bucket como una base de datos SQL. Consulta con SQL, explora en notebooks Jupyter o Marimo, o haz preguntas en lenguaje natural con IA.

ML lee Parquet del bucket, ejecuta feature engineering automatizado, entrena modelos y escribe predicciones de vuelta como Parquet para que Lens las consulte.

Source ──► [Pipe] ──► Parquet in Bucket ──► [Lens] ──► SQL / Jupyter / AI
[ML] ──► train / predict
[MCP] ──► Claude / Cursor / Windsurf

Toda la comunicacion entre productos ocurre a traves de archivos Parquet en un bucket compartido. Pipe escribe, Lens lee, ML lee y escribe. Ningun producto importa codigo de otro.

MetricaValor
Fuentes de datos soportadas400+
Tiempo hasta la primera consulta15 minutos
Costo para comenzar$0
  1. Terminal --- dataspoc-pipe run y dataspoc-lens shell desde cualquier shell
  2. Python --- Importa LensClient o PipeClient en tus scripts y agentes
  3. MCP para agentes de IA --- Conecta Claude Desktop, Claude Code, Cursor o Windsurf directamente a tu data lake