Pular para o conteúdo

Plataforma DataSpoc

DataSpoc é uma plataforma de dados feita para humanos e agentes de IA. Ela transforma qualquer fonte de dados em um data lake consultável usando três ferramentas CLI conectadas por arquivos Parquet no seu bucket na nuvem.

Pipe conecta a mais de 400 fontes de dados e grava arquivos Parquet no seu bucket. Ele cuida de extração incremental, detecção de schema e particionamento de forma automática.

Lens monta seu bucket como um banco de dados SQL. Consulte com SQL, explore em notebooks Jupyter ou Marimo, ou faça perguntas em linguagem natural com IA.

ML lê Parquet do bucket, faz feature engineering automatizada, treina modelos e grava as predições de volta como Parquet para o Lens consultar.

Source ──► [Pipe] ──► Parquet in Bucket ──► [Lens] ──► SQL / Jupyter / AI
[ML] ──► train / predict
[MCP] ──► Claude / Cursor / Windsurf

Toda a comunicação entre os produtos acontece por meio de arquivos Parquet em um bucket compartilhado. Pipe escreve, Lens lê, ML lê e escreve. Nenhum produto importa código de outro.

MétricaValor
Fontes de dados suportadas400+
Tempo até a primeira consulta15 minutos
Custo para começar$0
  1. Terminal --- dataspoc-pipe run e dataspoc-lens shell em qualquer shell
  2. Python --- Importe LensClient ou PipeClient nos seus scripts e agentes
  3. MCP para agentes de IA --- Conecte Claude Desktop, Claude Code, Cursor ou Windsurf diretamente ao seu data lake