Blog

Tutoriais, guias e artigos sobre engenharia de dados, agentes de IA e a plataforma DataSpoc.

data-mesharchitecturedata-engineering

Data Mesh Sem a Complexidade: Um Bucket Por Time

Implemente data mesh com DataSpoc. Cada time ganha seu próprio bucket, seus próprios pipelines, seu próprio agente de IA. Sem gargalo central. Sem time de plataforma necessário.

2026-04-29 · Michael San Martim
medalliondata-lakearchitecture

Construindo um Data Lake com Arquitetura Medallion Usando DataSpoc

Bronze, Silver, Gold -- implemente o padrão medallion do Databricks usando DataSpoc Pipe e Lens. Sem Spark, sem cluster, sem custo.

2026-04-29 · Michael San Martim
ai-agentsagent-mdmcp

O Padrão AGENT.md: Ensinando Agentes de IA a Usar Suas Ferramentas

Como um único arquivo Markdown transforma qualquer agente de IA em um usuário avançado da sua plataforma de dados.

2026-04-28 · Michael San Martim
startupdata-lakecost-reduction

O Data Lake de $0 para Startups: DataSpoc + S3 em 30 Minutos

Uma plataforma de dados completa para startups em estágio inicial. Ingira do Postgres e Stripe, consulte com IA, conecte agentes.

2026-04-28 · Michael San Martim
airflowetlyaml

10 Linhas de YAML vs 200 Linhas de DAG Airflow

Comparação lado a lado de construir o mesmo pipeline ETL com Airflow e DataSpoc Pipe.

2026-04-28 · Michael San Martim
multi-clouds3gcs

Um Data Lake, Três Nuvens: Analytics Multi-Cloud com DataSpoc

Registre buckets S3, GCS e Azure no DataSpoc Lens e consulte todos eles com uma única instrução SQL.

2026-04-28 · Michael San Martim
ollamalocal-aiprivacy

Consulte Seu Data Lake com IA de Graça: Ollama + DataSpoc Lens

Sem chave de API necessária. Execute consultas de IA no seu data lake usando um LLM local com Ollama.

2026-04-28 · Michael San Martim
windsurfmcpai-agents

Análise de Dados pela IDE Windsurf com DataSpoc MCP

Conecte o Windsurf ao seu data lake. Consulte, analise e construa relatórios sem sair do seu editor.

2026-04-28 · Michael San Martim
jupyternotebookduckdb

Jupyter Notebook no Seu Data Lake em 60 Segundos

Inicie o JupyterLab com todas as suas tabelas Parquet na nuvem pré-montadas. Zero configuração.

2026-04-27 · Michael San Martim
incrementalextractionsinger

Padrões de Extração Incremental: Nunca Mais Re-Extraia Dados Antigos

Como o DataSpoc Pipe usa bookmarks Singer para buscar apenas dados novos. Economize tempo, banda e custos de nuvem.

2026-04-27 · Michael San Martim
sqltransformsdata-modeling

Construindo uma Camada Curada de Dados com SQL Transforms (Sem dbt)

Arquivos SQL numerados no DataSpoc Lens substituem o dbt para workflows simples de transformação de dados.

2026-04-27 · Michael San Martim
google-sheetsno-codedata-lake

De Google Sheets para um Data Lake Consultável em 3 Comandos

Transforme qualquer planilha pública do Google Sheets em arquivos Parquet que você pode consultar com SQL.

2026-04-26 · Michael San Martim
marimonotebookreactive

Análise de Dados Reativa com Marimo e DataSpoc Lens

Notebooks Marimo + DuckDB no seu data lake. As células atualizam automaticamente quando você muda uma consulta.

2026-04-26 · Michael San Martim
mongodbmigrationparquet

MongoDB para Parquet: Construa um Data Lake a partir do Seu MongoDB em 15 Minutos

Use o DataSpoc Pipe com tap-mongodb para extrair coleções e convertê-las em arquivos Parquet consultáveis.

2026-04-26 · Michael San Martim
anthropicclaudepython

Construindo um Agente de Consulta de Dados com Anthropic Claude SDK e DataSpoc

Use o recurso tool_use do Claude para permitir que o modelo consulte seu data lake com SQL real.

2026-04-25 · Michael San Martim
crewaimulti-agentai-agents

Construindo um Time de Dados Multi-Agente com CrewAI e DataSpoc

Um agente DE ingere dados, um agente DA analisa, um agente ML treina modelos — tudo alimentado pelo DataSpoc.

2026-04-25 · Michael San Martim
llamaindexai-agentspython

LlamaIndex + DataSpoc: Consulte Seu Data Lake Sem Embeddings

Use agentes com chamada de ferramentas do LlamaIndex com o SDK do DataSpoc Lens para consultas precisas e fundamentadas em dados.

2026-04-25 · Michael San Martim
duckdbsparkcomparison

DuckDB vs Spark para Queries em Data Lake: Quando Cada Um Ganha

DuckDB alimenta o DataSpoc Lens. Spark alimenta o Databricks. Aqui está quando usar cada um — com benchmarks.

2026-04-24 · Michael San Martim
mcpclaudeai-agents

Como Construir um Servidor MCP para Seu Data Lake

Transforme seus arquivos Parquet na nuvem em uma API para agentes de IA com o DataSpoc Lens MCP.

2026-04-24 · Michael San Martim
cursormcpdata-analysis

Analise Seu Data Lake pelo Cursor IDE com DataSpoc MCP

Conecte o Cursor ao seu data lake via MCP. Consulte tabelas, explore schemas e construa relatórios sem sair do editor.

2026-04-23 · Michael San Martim
duckdbsnowflakecost-reduction

Substituímos Nosso Snowflake de $8k/mês por DuckDB e Parquet

Como o DataSpoc Lens te dá um warehouse virtual sobre Parquet na nuvem -- a custo zero.

2026-04-23 · Michael San Martim
fivetranmigrationdata-engineering

Migrando do Fivetran para o DataSpoc Pipe: Guia Passo a Passo

Economize $2k/mês substituindo Fivetran pelo DataSpoc Pipe open-source. Mesmas fontes, mesmos destinos, custo zero.

2026-04-22 · Michael San Martim
ragmcpai-agents

RAG vs SQL: Por Que Seu Agente de IA Deveria Consultar, Não Gerar Embeddings

RAG alucina em dados estruturados. Veja por que MCP + SQL é mais preciso, rápido e barato.

2026-04-22 · Michael San Martim
data-governancesecurityai-agents

Governança de Dados para Agentes de IA: Como o DataSpoc Mantém Seu Lake Seguro

Acesso somente leitura, enforcement de Cloud IAM e trilhas de auditoria — como permitir que agentes de IA consultem sem risco.

2026-04-21 · Michael San Martim
ai-agentslanggraphpython

Construindo um Agente Data Analyst com LangGraph e DataSpoc Lens

Um agente LangGraph que descobre tabelas, escreve SQL e responde perguntas de negócio usando DataSpoc Lens SDK.

2026-04-21 · Michael San Martim
data-engineeringetlpostgresql

Postgres para S3 em 5 Minutos com DataSpoc Pipe

Substitua suas DAGs do Airflow com um único comando CLI. Extração incremental do PostgreSQL para Parquet no S3.

2026-04-20 · Michael San Martim
rest-apietlpipeline

Ingira Qualquer REST API para Parquet em 10 Minutos

Use o DataSpoc Pipe com tap-rest-api para puxar dados de qualquer endpoint de API para seu data lake.

2026-04-20 · Michael San Martim
autogenmulti-agentanalytics

Analytics Multi-Agente com AutoGen e DataSpoc

Construa um time AutoGen onde agentes colaboram para analisar seu data lake — um consulta, um visualiza, um reporta.

2026-04-19 · Michael San Martim
claude-codemcpdata-engineering

Usando Claude Code como Seu Engenheiro de Dados: MCP + DataSpoc

Configure o Claude Code para ingerir dados, consultar seu lake e depurar pipelines — tudo pelo terminal.

2026-04-18 · Michael San Martim
ragparquetduckdb

RAG em Parquet: Como Construir Recuperação Sobre Seu Data Lake Sem Embeddings

Pule o vector store. Use o DataSpoc Lens para dar ao seu LLM acesso SQL direto a arquivos Parquet.

2026-04-17 · Michael San Martim
langchainsqlpython

LangChain SQLDatabaseChain vs DataSpoc Lens: Qual é Melhor para Queries de Dados?

Comparação lado a lado de consultar bancos de dados com a SQL chain do LangChain versus DataSpoc Lens SDK e MCP.

2026-04-16 · Michael San Martim
openaiai-agentspython

Construindo um Agente de Data Lake com OpenAI Function Calling e DataSpoc

Use function calling da OpenAI para permitir que o GPT-4 consulte seu data lake com SQL real via DataSpoc Lens.

2026-04-15 · Michael San Martim