Guía Agentes IA Dify 2026: Construye IA autónoma con herramientas
Los agentes IA de Dify van mucho más allá de los chatbots — pueden buscar en la web, ejecutar código Python, llamar cualquier API y resolver tareas multi-paso de forma autónoma. Esta guía cubre todo: desde crear tu primer agente hasta herramientas personalizadas y orquestación multi-agente.
¿Qué son los agentes IA de Dify?
Un agente IA de Dify es una aplicación de IA que decide de forma autónoma qué herramientas usar para completar una tarea. A diferencia de un chatbot ordinario que simplemente genera texto basado en tu prompt, un agente puede tomar acciones reales en el mundo: buscar en Google, leer un artículo de Wikipedia, ejecutar un script Python, consultar el clima actual o llamar cualquier API REST que configures.
La diferencia clave es la autonomía: le das al agente un objetivo ("Investiga las 5 principales startups de IA de 2026 y resume su financiación"), y el agente determina por sí mismo los pasos necesarios — búsqueda web, lectura de resultados, filtrado de información y composición de una respuesta.
Agente vs Chatbot vs Workflow — ¿Cuándo usar cada uno?
Dify ofrece tres tipos principales de aplicaciones. Entender cuándo usar cada uno ahorra tiempo y produce mejores resultados:
| Característica | Chatbot | Workflow | Agente |
|---|---|---|---|
| Uso de herramientas | ✗ Ninguno | ✓ Herramientas fijas | ✓ Selección dinámica |
| Toma de decisiones | Ninguna | Ramas fijas | Razonamiento autónomo |
| Ideal para | P&R, soporte | Pipelines, automatización | Investigación, tareas complejas |
| Pasos | 1 paso (prompt → respuesta) | Pasos predefinidos | Variables, elegidos en runtime |
| Datos en tiempo real | ✗ No | Solo via nodos HTTP | ✓ Sí, via herramientas |
| Previsibilidad | Alta | Muy alta | Menor (flexible) |
Usa un Chatbot cuando...
Necesitas un asistente conversacional simple para soporte al cliente, responder FAQs o helpdesk. Conocimiento estático, sin necesidad de datos en tiempo real.
Usa un Workflow cuando...
Tienes un pipeline repetible y determinista: traducir texto, resumir un artículo, clasificar un ticket de soporte. Los mismos pasos cada vez.
Usa un Agente cuando...
La tarea requiere información en tiempo real, múltiples herramientas o toma de decisiones dinámica. Investigación, análisis competitivo, búsquedas de datos en vivo o tareas multi-paso complejas.
Crea tu primer agente Dify
Sigue estos pasos para construir un agente de investigación que pueda buscar en la web y hacer cálculos. Toma unos 10 minutos:
Crear una nueva aplicación
En Dify Studio, haz clic en "+ Crear aplicación". Cuando se te pida elegir el tipo, selecciona "Agente". Dale un nombre como "Asistente de investigación".
Escribir el prompt del sistema
Describe el rol del agente. Ejemplo: "Eres un asistente de investigación. Cuando se necesite información actual, usa Google Search. Usa la Calculadora para cálculos. Siempre cita tus fuentes."
Añadir herramientas
En la sección "Herramientas" (panel izquierdo), haz clic en "+ Añadir herramienta". Activa "Google Search" — necesitarás una clave SerpAPI (plan gratuito disponible). También activa "Calculadora" que no requiere clave.
Elegir la estrategia del agente
En "Estrategia del agente", selecciona "Function Calling" para GPT-4o o modelos Claude. Selecciona "ReAct" para modelos sin function calling nativo.
Seleccionar tu modelo
Elige GPT-4o o Claude 3.5 Sonnet para el mejor rendimiento del agente. Estos modelos entienden mejor cuándo y cómo usar las herramientas.
Probar el agente
En el panel de vista previa, escribe: "¿Cuál es el precio actual del Bitcoin en euros?" — observa cómo el agente llama a Google Search, lee los resultados y da una respuesta actualizada. Luego prueba: "Si compro 0,5 BTC a ese precio, ¿cuánto pago en total?"
Publicar
Haz clic en el botón azul "Publicar". Tu agente ya está disponible y accesible via el enlace de compartir o la API REST.
Herramientas integradas para agentes Dify
Dify incluye una biblioteca de herramientas listas para usar. La mayoría requieren una clave API gratuita o de pago del proveedor. Aquí están las más útiles:
Google Search
Busca en Google y devuelve los mejores resultados con títulos, fragmentos y URLs. La herramienta de búsqueda más potente — ideal para noticias actuales, precios, datos de empresas y cualquier información sensible al tiempo.
DuckDuckGo
Búsqueda web orientada a la privacidad sin clave API. Buena para búsquedas generales. Ligeramente menos fiable que Google Search para información muy reciente.
Bing Search
Motor de búsqueda de Microsoft vía Azure Cognitive Services. Buena alternativa a SerpAPI con plan gratuito generoso (1.000 transacciones/mes).
Wikipedia
Busca en Wikipedia y devuelve el texto completo del artículo. Ideal para conocimiento enciclopédico y factual. Mucho más fiable que la búsqueda web para hechos estables.
Calculadora
Evalúa expresiones matemáticas. Evita que el modelo intente hacer aritmética mentalmente (los LLM son notoriamente malos en matemáticas). Esencial para precios, porcentajes, conversiones y estadísticas.
Intérprete de código
Ejecuta código Python en un entorno seguro. El agente puede escribir y ejecutar código para analizar datos, procesar texto, realizar cálculos complejos, generar gráficos o manipular archivos.
Tiempo
Devuelve condiciones meteorológicas actuales y pronósticos para cualquier ubicación. Útil para agentes de viaje, planificación de eventos o cualquier aplicación sensible a la ubicación.
WolframAlpha
Inteligencia computacional — responde problemas matemáticos, preguntas científicas, datos históricos, conversiones de unidades con altísima precisión. Excelente complemento a la búsqueda web.
Herramientas personalizadas: Conecta cualquier API
La verdadera potencia de los agentes Dify está en que puedes conectar cualquier API REST como herramienta personalizada. Esto significa que tu agente puede interactuar con los sistemas internos de tu empresa, herramientas SaaS de terceros, bases de datos o cualquier servicio con API.
Método 1: Esquema OpenAPI
Si tu API tiene una especificación OpenAPI (Swagger), pega el JSON o YAML directamente en Dify. Analizará automáticamente todos los endpoints, parámetros y descripciones.
- Herramientas → Herramientas personalizadas → Crear herramienta
- Selecciona "Importar desde esquema OpenAPI"
- Pega tu JSON/YAML de OpenAPI
- Añade autenticación (clave API, Bearer token, etc.)
- Guardar — todos los endpoints se convierten en herramientas
Método 2: Definición manual
Para APIs simples sin especificación formal, define cada endpoint manualmente:
- Nombre: "obtener_cliente" (cómo el agente lo llama)
- Descripción: "Busca un cliente por correo electrónico" (el agente lee esto para decidir cuándo usarlo)
- Método: GET, POST, PUT, DELETE
- URL: Tu URL de endpoint con parámetros
- Parámetros: nombre, tipo, descripción, requerido/opcional
Ejemplo: Herramienta API CRM
Nombre de herramienta: obtener_info_cliente
Descripción: Recupera detalles del cliente desde la base de datos
CRM por correo electrónico. Usa esto cuando se pregunte
sobre el estado o historial de un cliente específico.
Método: GET
URL: https://api.tucrm.com/clientes?email={{email}}
Parámetros:
- email (string, requerido): Correo electrónico del cliente
Cabeceras:
Authorization: Bearer {{api_key}} Una vez configurado, tu agente puede responder preguntas como "¿Cuál es el estado de suscripción de [email protected]?" llamando automáticamente a tu API CRM.
Estrategias del agente: ReAct vs Function Calling
Dify soporta dos estrategias para que el agente razone y use herramientas. La elección correcta depende de tu modelo LLM:
Function Calling
El modelo entiende nativamente cómo llamar herramientas como llamadas de función estructuradas. Más fiable, más eficiente y produce cadenas de razonamiento más limpias.
Mejores modelos:
- GPT-4o, GPT-4 Turbo
- Claude 3.5 Sonnet, Claude 3 Opus
- Gemini 1.5 Pro, Gemini 1.5 Flash
- Mistral Large
ReAct (Razonamiento + Acción)
El modelo escribe su razonamiento como texto ("Pensamiento: necesito buscar X...") seguido de instrucciones de acción ("Acción: google_search[X]"). Funciona con cualquier modelo que pueda seguir instrucciones.
Cuándo usarlo:
- Modelos open-source (Llama, Qwen, Mistral 7B)
- Modelos sin function calling nativo
- Cuando quieres ver el razonamiento completo
Regla rápida
¿Usas GPT-4o, Claude 3.5+ o Gemini Pro? → Usa Function Calling. ¿Usas un modelo open-source? → Usa ReAct. En caso de duda, prueba primero Function Calling.
Orquestación multi-agente
Para tareas complejas, puedes encadenar múltiples agentes especializados. Cada agente se enfoca en lo que mejor hace, y un agente coordinador dirige el trabajo entre ellos.
Ejemplo: Sistema de análisis competitivo
Especialización
Cada agente tiene un prompt del sistema enfocado y solo las herramientas que necesita. Un agente de investigación recibe herramientas de búsqueda; un agente de redacción recibe herramientas de formato.
Ejecución paralela
Los nodos de workflow Dify pueden invocar múltiples agentes en paralelo. Recopila todos los resultados y fúndelos en un paso final para una finalización más rápida.
Control de iteraciones
Establece límites máximos de iteración por agente para evitar bucles infinitos. Un coordinador puede reintentar sub-tareas fallidas o recurrir a enfoques más simples automáticamente.
Aislamiento de herramientas
Mantén herramientas sensibles (acceso CRM, escrituras en base de datos) en agentes separados con controles de acceso estrictos. El coordinador público nunca toca directamente los sistemas sensibles.
Preguntas frecuentes
¿Qué pueden hacer los agentes IA de Dify?
Los agentes Dify pueden buscar en la web (Google, Bing, DuckDuckGo), ejecutar código Python, llamar APIs externas, leer Wikipedia, calcular matemáticas, comprobar el tiempo y más. Razonan sobre qué herramientas usar para cada tarea.
¿Cuál es la diferencia entre un agente Dify y un chatbot?
Un chatbot Dify responde preguntas basándose en su entrenamiento. Un agente Dify usa herramientas activamente — puede buscar en internet, ejecutar código o llamar APIs para obtener información en tiempo real. Usa chatbot para soporte, agente para investigación.
¿Puedo añadir herramientas personalizadas a un agente Dify?
Sí. Puedes añadir cualquier API REST como herramienta personalizada proporcionando una especificación OpenAPI o definiendo manualmente el endpoint con nombre, descripción y parámetros. El agente usará tu herramienta cuando la tarea lo requiera.
¿El agente Dify soporta razonamiento multi-paso?
Sí. Los agentes Dify usan ReAct (Razonamiento + Acción) o Function Calling. El agente piensa paso a paso, llama herramientas, observa resultados y continúa hasta completar la tarea — similar a AutoGPT o LangChain.
¿Listo para desplegar tu agente Dify?
Ejecutar agentes en Dify Cloud acumula créditos rápidamente. Alojar en tu propio servidor te da ejecuciones ilimitadas de agentes por un costo mensual fijo — desde €3,79/mes. Elige hosting gestionado si quieres cero mantenimiento.
Hetzner VPS
Desde €3,79/mes. Control total, ejecuciones ilimitadas de agentes, sin tarifas por mensaje. La mejor opción para agentes IA en producción con uso intensivo de herramientas.
Obtener Hetzner VPS →Elestio
Hosting Dify gestionado — completamente configurado en 5 minutos. Actualizaciones automáticas, copias de seguridad y SSL incluidos. Ideal si quieres centrarte en construir agentes.
Probar Elestio →