Blog

Tutoriales, guías y artículos sobre ingeniería de datos, agentes de IA y la plataforma DataSpoc.

data-mesharchitecturedata-engineering

Data Mesh Sin la Complejidad: Un Bucket por Equipo

Implementa data mesh con DataSpoc. Cada equipo obtiene su propio bucket, sus propios pipelines, su propio agente de IA. Sin cuello de botella central. Sin equipo de plataforma requerido.

2026-04-29 · Michael San Martim

medalliondata-lakearchitecture

Construyendo un Data Lake con Arquitectura Medallion usando DataSpoc

Bronze, Silver, Gold — implementa el patrón medallion de Databricks usando DataSpoc Pipe y Lens. Sin Spark, sin cluster, sin costo.

2026-04-29 · Michael San Martim

ai-agentsagent-mdmcp

El Patrón AGENT.md: Enseñando a los Agentes de IA a Usar Tus Herramientas

Cómo un solo archivo Markdown convierte a cualquier agente de IA en un usuario experto de tu plataforma de datos.

2026-04-28 · Michael San Martim

startupdata-lakecost-reduction

El Data Lake de $0 para Startups: DataSpoc + S3 en 30 Minutos

Una plataforma de datos completa para startups en etapa temprana. Ingesta desde Postgres y Stripe, consulta con IA, conecta agentes.

2026-04-28 · Michael San Martim

10 Líneas de YAML vs 200 Líneas de DAG de Airflow

Comparación lado a lado de construir el mismo pipeline ETL con Airflow y DataSpoc Pipe.

2026-04-28 · Michael San Martim

multi-clouds3gcs

Un Data Lake, tres nubes: Analitica multi-cloud con DataSpoc

Registra buckets de S3, GCS y Azure en DataSpoc Lens y consulta todos ellos con una sola sentencia SQL.

2026-04-28 · Michael San Martim

ollamalocal-aiprivacy

Consulta tu Data Lake con IA gratis: Ollama + DataSpoc Lens

Sin API key necesaria. Ejecuta consultas de IA sobre tu data lake usando un LLM local con Ollama.

2026-04-28 · Michael San Martim

windsurfmcpai-agents

Analisis de datos desde Windsurf IDE con DataSpoc MCP

Conecta Windsurf a tu data lake. Consulta, analiza y construye reportes sin salir de tu editor.

2026-04-28 · Michael San Martim

jupyternotebookduckdb

Jupyter Notebook en Tu Data Lake en 60 Segundos

Lanza JupyterLab con todas tus tablas Parquet en la nube pre-montadas. Cero configuración.

2026-04-27 · Michael San Martim

incrementalextractionsinger

Patrones de Extracción Incremental: Nunca Más Re-Extraigas Datos Antiguos

Cómo DataSpoc Pipe usa bookmarks de Singer para solo obtener datos nuevos. Ahorra tiempo, ancho de banda y costos de nube.

2026-04-27 · Michael San Martim

sqltransformsdata-modeling

Construyendo una capa de datos curada con SQL Transforms (sin necesidad de dbt)

Archivos SQL numerados en DataSpoc Lens reemplazan a dbt para flujos simples de transformacion de datos.

2026-04-27 · Michael San Martim

google-sheetsno-codedata-lake

De Google Sheets a un Data Lake Consultable en 3 Comandos

Convierte cualquier hoja de cálculo pública de Google Sheets en archivos Parquet que puedes consultar con SQL.

2026-04-26 · Michael San Martim

marimonotebookreactive

Analisis de datos reactivo con Marimo y DataSpoc Lens

Notebooks Marimo + DuckDB sobre tu data lake. Las celdas se actualizan automáticamente cuando cambias una consulta.

2026-04-26 · Michael San Martim

mongodbmigrationparquet

MongoDB a Parquet: Construye un Data Lake desde tu MongoDB en 15 minutos

Usa DataSpoc Pipe con tap-mongodb para extraer colecciones y convertirlas en archivos Parquet consultables.

2026-04-26 · Michael San Martim

anthropicclaudepython

Construyendo un Agente de Consulta de Datos con Anthropic Claude SDK y DataSpoc

Usa la función tool_use de Claude para que el modelo consulte tu data lake con SQL real.

2026-04-25 · Michael San Martim

crewaimulti-agentai-agents

Construyendo un Equipo de Datos Multi-Agente con CrewAI y DataSpoc

Un agente DE ingesta datos, un agente DA los analiza, un agente ML entrena modelos — todo potenciado por DataSpoc.

2026-04-25 · Michael San Martim

llamaindexai-agentspython

LlamaIndex + DataSpoc: Consulta tu Data Lake sin Embeddings

Usa los agentes con tool-calling de LlamaIndex junto con el SDK de DataSpoc Lens para consultas de datos precisas y fundamentadas.

2026-04-25 · Michael San Martim

duckdbsparkcomparison

DuckDB vs Spark para Consultas en Data Lakes: Cuándo Gana Cada Uno

DuckDB potencia DataSpoc Lens. Spark potencia Databricks. Aquí está cuándo usar cada uno — con benchmarks.

2026-04-24 · Michael San Martim

mcpclaudeai-agents

Como construir un servidor MCP para tu Data Lake

Convierte tus archivos Parquet en la nube en una API para agentes de IA con DataSpoc Lens MCP.

2026-04-24 · Michael San Martim

cursormcpdata-analysis

Analiza Tu Data Lake desde Cursor IDE con DataSpoc MCP

Conecta Cursor a tu data lake vía MCP. Consulta tablas, explora schemas y construye reportes sin salir de tu editor.

2026-04-23 · Michael San Martim

duckdbsnowflakecost-reduction

Reemplazamos nuestro Snowflake de $8k/mes con DuckDB y Parquet

Como DataSpoc Lens te da un warehouse virtual sobre Parquet en la nube -- a cero costo.

2026-04-23 · Michael San Martim

fivetranmigrationdata-engineering

Migrando de Fivetran a DataSpoc Pipe: Guia paso a paso

Ahorra $2k/mes reemplazando Fivetran con DataSpoc Pipe de código abierto. Mismas fuentes, mismos destinos, cero costo.

2026-04-22 · Michael San Martim

ragmcpai-agents

RAG vs SQL: Por que tu agente de IA deberia consultar, no crear embeddings

RAG alucina con datos estructurados. Aqui te explicamos por que MCP + SQL es mas preciso, rápido y economico.

2026-04-22 · Michael San Martim

data-governancesecurityai-agents

Gobernanza de Datos para Agentes de IA: Cómo DataSpoc Mantiene Tu Lake Seguro

Acceso de solo lectura, cumplimiento de IAM en la nube y registros de auditoría — cómo dejar que agentes de IA consulten sin riesgo.

2026-04-21 · Michael San Martim

ai-agentslanggraphpython

Construyendo un Agente Analista de Datos con LangGraph y DataSpoc Lens

Un agente LangGraph que descubre tablas, escribe SQL y responde preguntas de negocio usando el SDK de DataSpoc Lens.

2026-04-21 · Michael San Martim

data-engineeringetlpostgresql

Postgres a S3 en 5 minutos con DataSpoc Pipe

Reemplaza tus DAGs de Airflow con un solo comando de CLI. Extracción incremental de PostgreSQL a Parquet en S3.

2026-04-20 · Michael San Martim

rest-apietlpipeline

Ingesta cualquier REST API a Parquet en 10 minutos

Usa DataSpoc Pipe con tap-rest-api para extraer datos de cualquier endpoint de API hacia tu data lake.

2026-04-20 · Michael San Martim

autogenmulti-agentanalytics

Analítica Multi-Agente con AutoGen y DataSpoc

Construye un equipo AutoGen donde los agentes colaboran para analizar tu data lake — uno consulta, uno visualiza, uno reporta.

2026-04-19 · Michael San Martim

claude-codemcpdata-engineering

Usando Claude Code cómo tu Ingeniero de Datos: MCP + DataSpoc

Configura Claude Code para ingestar datos, consultar tu lake y depurar pipelines — todo desde la terminal.

2026-04-18 · Michael San Martim

ragparquetduckdb

RAG sobre Parquet: Como construir recuperacion sobre tu Data Lake sin embeddings

Salta el vector store. Usa DataSpoc Lens para darle a tu LLM acceso SQL directo a archivos Parquet.

2026-04-17 · Michael San Martim

langchainsqlpython

LangChain SQLDatabaseChain vs DataSpoc Lens: ¿Cuál Es Mejor para Consultas de Datos?

Comparación lado a lado de consultar bases de datos con SQL chain de LangChain versus el SDK y MCP de DataSpoc Lens.

2026-04-16 · Michael San Martim

openaiai-agentspython

Construyendo un agente de Data Lake con OpenAI Function Calling y DataSpoc

Usa function calling de OpenAI para que GPT-4 consulte tu data lake con SQL real via DataSpoc Lens.

2026-04-15 · Michael San Martim