Integracion con Agentes de IA
DataSpoc esta construido tanto para humanos COMO para agentes de IA. Cada funcionalidad disponible en el CLI tambien esta disponible programaticamente, para que los agentes puedan descubrir, consultar y gestionar tu data lake de forma autonoma.
Tres Formas de Conectar
Sección titulada «Tres Formas de Conectar»1. MCP Server
Sección titulada «1. MCP Server»El Model Context Protocol (MCP) permite a los asistentes de IA llamar herramientas de DataSpoc directamente. Clientes soportados:
- Claude Desktop --- Haz preguntas sobre tus datos en conversacion
- Claude Code --- Consulta tu data lake desde el agente de terminal
- Cursor --- Accede al contexto de datos mientras programas
- Windsurf --- Integra consultas del data lake en tu flujo de trabajo
Ve Configuracion MCP para la configuracion.
2. Python SDK
Sección titulada «2. Python SDK»Importa LensClient y PipeClient directamente en tus agentes Python:
- CrewAI --- Da a tu crew acceso a SQL y consultas en lenguaje natural
- LangGraph --- Agrega nodos de data lake a tu grafo
- AutoGen --- Permite que los agentes consulten y analicen datos de forma autonoma
Ve Python SDK para la referencia completa del API.
3. Salida JSON del CLI
Sección titulada «3. Salida JSON del CLI»Cada comando soporta --output json para salida legible por maquinas. Usalo en scripts de shell, pipelines de CI/CD o cualquier herramienta de automatizacion.
Ve Salida JSON para ejemplos.
Que Pueden Hacer los Agentes
Sección titulada «Que Pueden Hacer los Agentes»Con Lens
Sección titulada «Con Lens»| Capacidad | Herramienta MCP | Metodo SDK | Flag CLI |
|---|---|---|---|
| Descubrir tablas | list_tables | client.tables() | dataspoc-lens catalog --output json |
| Describir esquema | describe_table | client.schema(table) | dataspoc-lens catalog --table X --output json |
| Ejecutar SQL | query | client.query(sql) | dataspoc-lens query --output json |
| Preguntar en lenguaje natural | ask | client.ask(question) | dataspoc-lens ask --output json |
| Verificar estado del cache | cache_status | client.cache_status() | dataspoc-lens cache --list --output json |
| Actualizar cache | cache_refresh | client.cache_refresh() | dataspoc-lens cache --refresh |
| Actualizar solo desactualizados | cache_refresh_stale | client.cache_refresh_stale() | dataspoc-lens cache --refresh-stale |
Con Pipe
Sección titulada «Con Pipe»| Capacidad | Herramienta MCP | Metodo SDK | Flag CLI |
|---|---|---|---|
| Listar pipelines | list_pipelines | client.pipelines() | dataspoc-pipe status --output json |
| Ver configuracion | pipeline_config | client.config(name) | dataspoc-pipe config --output json |
| Ejecutar pipeline | run_pipeline | client.run(name) | dataspoc-pipe run |
| Verificar estado | pipeline_status | client.status(name) | dataspoc-pipe status --output json |
| Ver logs | pipeline_logs | client.logs(name) | dataspoc-pipe logs --output json |
| Leer manifiesto | show_manifest | client.manifest() | dataspoc-pipe manifest --output json |
| Validar configuracion | validate_pipeline | client.validate(name) | dataspoc-pipe validate --output json |