Ir al contenido

Integracion con Agentes de IA

DataSpoc esta construido tanto para humanos COMO para agentes de IA. Cada funcionalidad disponible en el CLI tambien esta disponible programaticamente, para que los agentes puedan descubrir, consultar y gestionar tu data lake de forma autonoma.

El Model Context Protocol (MCP) permite a los asistentes de IA llamar herramientas de DataSpoc directamente. Clientes soportados:

  • Claude Desktop --- Haz preguntas sobre tus datos en conversacion
  • Claude Code --- Consulta tu data lake desde el agente de terminal
  • Cursor --- Accede al contexto de datos mientras programas
  • Windsurf --- Integra consultas del data lake en tu flujo de trabajo

Ve Configuracion MCP para la configuracion.

Importa LensClient y PipeClient directamente en tus agentes Python:

  • CrewAI --- Da a tu crew acceso a SQL y consultas en lenguaje natural
  • LangGraph --- Agrega nodos de data lake a tu grafo
  • AutoGen --- Permite que los agentes consulten y analicen datos de forma autonoma

Ve Python SDK para la referencia completa del API.

Cada comando soporta --output json para salida legible por maquinas. Usalo en scripts de shell, pipelines de CI/CD o cualquier herramienta de automatizacion.

Ve Salida JSON para ejemplos.

CapacidadHerramienta MCPMetodo SDKFlag CLI
Descubrir tablaslist_tablesclient.tables()dataspoc-lens catalog --output json
Describir esquemadescribe_tableclient.schema(table)dataspoc-lens catalog --table X --output json
Ejecutar SQLqueryclient.query(sql)dataspoc-lens query --output json
Preguntar en lenguaje naturalaskclient.ask(question)dataspoc-lens ask --output json
Verificar estado del cachecache_statusclient.cache_status()dataspoc-lens cache --list --output json
Actualizar cachecache_refreshclient.cache_refresh()dataspoc-lens cache --refresh
Actualizar solo desactualizadoscache_refresh_staleclient.cache_refresh_stale()dataspoc-lens cache --refresh-stale
CapacidadHerramienta MCPMetodo SDKFlag CLI
Listar pipelineslist_pipelinesclient.pipelines()dataspoc-pipe status --output json
Ver configuracionpipeline_configclient.config(name)dataspoc-pipe config --output json
Ejecutar pipelinerun_pipelineclient.run(name)dataspoc-pipe run
Verificar estadopipeline_statusclient.status(name)dataspoc-pipe status --output json
Ver logspipeline_logsclient.logs(name)dataspoc-pipe logs --output json
Leer manifiestoshow_manifestclient.manifest()dataspoc-pipe manifest --output json
Validar configuracionvalidate_pipelineclient.validate(name)dataspoc-pipe validate --output json