Guida Agenti IA Dify 2026: Costruisci IA autonoma con strumenti
Gli agenti IA di Dify vanno ben oltre i semplici chatbot — possono cercare sul web, eseguire codice Python, chiamare qualsiasi API e risolvere attività multi-step in modo autonomo. Questa guida copre tutto: dalla creazione del primo agente agli strumenti personalizzati e all'orchestrazione multi-agente.
Cosa sono gli agenti IA Dify?
Un agente IA Dify è un'applicazione IA che decide autonomamente quali strumenti usare per completare un compito. A differenza di un semplice chatbot che genera solo testo basato sul tuo prompt, un agente può compiere azioni reali nel mondo: cercare su Google, leggere un articolo di Wikipedia, eseguire uno script Python, controllare il meteo attuale o chiamare qualsiasi API REST che configuri.
La differenza chiave è l'autonomia: dai all'agente un obiettivo ("Ricerca le 5 principali startup IA del 2026 e riassumi i loro finanziamenti"), e l'agente determina da solo i passi necessari — ricerca web, lettura dei risultati, filtraggio delle informazioni e composizione di una risposta.
Agente vs Chatbot vs Workflow — Quando usare cosa?
Dify offre tre tipi principali di applicazioni. Capire quale usare in base alla situazione fa risparmiare tempo e produce risultati migliori:
| Caratteristica | Chatbot | Workflow | Agente |
|---|---|---|---|
| Uso di strumenti | ✗ Nessuno | ✓ Strumenti fissi | ✓ Selezione dinamica |
| Presa di decisioni | Nessuna | Rami fissi | Ragionamento autonomo |
| Ideale per | Q&A, supporto | Pipeline, automazione | Ricerca, task complessi |
| Passaggi | 1 passaggio (prompt → risposta) | Passaggi predefiniti | Variabili, scelti a runtime |
| Dati in tempo reale | ✗ No | Solo via nodi HTTP | ✓ Sì, via strumenti |
| Prevedibilità | Alta | Molto alta | Minore (flessibile) |
Usa un Chatbot quando...
Hai bisogno di un semplice assistente conversazionale per il supporto clienti, rispondere alle FAQ o helpdesk. Conoscenza statica, nessun dato in tempo reale necessario.
Usa un Workflow quando...
Hai una pipeline ripetibile e deterministica: tradurre testo, riassumere un articolo, classificare un ticket di supporto. Gli stessi passaggi ogni volta.
Usa un Agente quando...
Il compito richiede informazioni in tempo reale, più strumenti o decisioni dinamiche. Ricerca, analisi competitiva, recupero dati live o attività multi-step complesse.
Crea il tuo primo agente Dify
Segui questi passaggi per costruire un agente di ricerca che possa cercare sul web e fare calcoli. Ci vogliono circa 10 minuti:
Creare una nuova applicazione
In Dify Studio, clicca su "+ Crea applicazione". Quando ti viene chiesto di scegliere il tipo, seleziona "Agente". Dagli un nome come "Assistente di ricerca".
Scrivere il prompt di sistema
Descrivi il ruolo dell'agente. Esempio: "Sei un assistente di ricerca. Quando servono informazioni attuali, usa Google Search. Usa la Calcolatrice per i calcoli. Cita sempre le tue fonti."
Aggiungere strumenti
Nella sezione "Strumenti" (pannello sinistro), clicca su "+ Aggiungi strumento". Abilita "Google Search" — avrai bisogno di una chiave SerpAPI (piano gratuito disponibile). Abilita anche "Calcolatrice" che non richiede chiave.
Scegliere la strategia dell'agente
In "Strategia agente", seleziona "Function Calling" per GPT-4o o i modelli Claude. Seleziona "ReAct" per modelli senza function calling nativo.
Selezionare il modello
Scegli GPT-4o o Claude 3.5 Sonnet per le migliori prestazioni dell'agente. Questi modelli capiscono meglio quando e come usare gli strumenti.
Testare l'agente
Nel pannello di anteprima, digita: "Qual è il prezzo attuale del Bitcoin in euro?" — osserva l'agente chiamare Google Search, leggere i risultati e dare una risposta aggiornata. Poi prova: "Se compro 0,5 BTC a quel prezzo, quanto spendo in totale?"
Pubblicare
Clicca sul pulsante blu "Pubblica". Il tuo agente è ora disponibile e accessibile tramite il link di condivisione o l'API REST.
Strumenti integrati per gli agenti Dify
Dify include una libreria di strumenti pronti all'uso. La maggior parte richiede una chiave API gratuita o a pagamento del fornitore. Ecco i più utili:
Google Search
Cerca su Google e restituisce i migliori risultati con titoli, estratti e URL. Lo strumento di ricerca più potente — ideale per notizie attuali, prezzi, dati aziendali e qualsiasi informazione sensibile al tempo.
DuckDuckGo
Ricerca web orientata alla privacy senza chiave API. Buono per ricerche generali. Leggermente meno affidabile di Google Search per informazioni molto recenti.
Bing Search
Motore di ricerca Microsoft tramite Azure Cognitive Services. Buona alternativa a SerpAPI con piano gratuito generoso (1.000 transazioni/mese).
Wikipedia
Cerca su Wikipedia e restituisce il testo completo dell'articolo. Ideale per conoscenza enciclopedica e fattuale. Molto più affidabile della ricerca web per fatti stabili.
Calcolatrice
Valuta espressioni matematiche. Evita che il modello cerchi di fare aritmetica mentalmente (i LLM sono notoriamente scarsi in matematica). Essenziale per prezzi, percentuali, conversioni e statistiche.
Interprete di codice
Esegue codice Python in un ambiente sicuro. L'agente può scrivere ed eseguire codice per analizzare dati, elaborare testo, eseguire calcoli complessi, generare grafici o manipolare file.
Meteo
Restituisce le condizioni meteorologiche attuali e le previsioni per qualsiasi luogo. Utile per agenti di viaggio, pianificazione eventi o applicazioni sensibili alla posizione.
WolframAlpha
Intelligenza computazionale — risponde a problemi matematici, domande scientifiche, dati storici, conversioni di unità con altissima precisione. Eccellente complemento alla ricerca web.
Strumenti personalizzati: Connetti qualsiasi API
La vera potenza degli agenti Dify sta nel poter connettere qualsiasi API REST come strumento personalizzato. Il tuo agente può così interagire con i sistemi interni della tua azienda, strumenti SaaS di terze parti, database o qualsiasi servizio con API.
Metodo 1: Schema OpenAPI
Se la tua API ha una specifica OpenAPI (Swagger), incolla il JSON o YAML direttamente in Dify. Analizzerà automaticamente tutti gli endpoint, parametri e descrizioni.
- Strumenti → Strumenti personalizzati → Crea strumento
- Seleziona "Importa da schema OpenAPI"
- Incolla il tuo JSON/YAML OpenAPI
- Aggiungi autenticazione (chiave API, Bearer token, ecc.)
- Salva — tutti gli endpoint diventano strumenti disponibili
Metodo 2: Definizione manuale
Per API semplici senza specifica formale, definisci ogni endpoint manualmente:
- Nome: "ottieni_cliente" (come l'agente lo chiama)
- Descrizione: "Cerca un cliente per indirizzo email" (l'agente legge questo per decidere quando usarlo)
- Metodo: GET, POST, PUT, DELETE
- URL: Il tuo URL endpoint con parametri
- Parametri: nome, tipo, descrizione, obbligatorio/opzionale
Esempio: Strumento API CRM
Nome strumento: ottieni_info_cliente
Descrizione: Recupera i dettagli del cliente dal database CRM
tramite email. Usalo quando viene chiesto dello
stato dell'account o della cronologia di un cliente.
Metodo: GET
URL: https://api.tuocrm.it/clienti?email={{email}}
Parametri:
- email (string, obbligatorio): L'indirizzo email del cliente
Intestazioni:
Authorization: Bearer {{api_key}} Una volta configurato, il tuo agente può rispondere a domande come "Qual è lo stato dell'abbonamento di [email protected]?" chiamando automaticamente la tua API CRM.
Strategie dell'agente: ReAct vs Function Calling
Dify supporta due strategie per come un agente ragiona e usa gli strumenti. La scelta giusta dipende dal modello LLM che usi:
Function Calling
Il modello comprende nativamente come chiamare gli strumenti come chiamate di funzione strutturate. Più affidabile, più efficiente e produce catene di ragionamento più pulite.
Migliori modelli:
- GPT-4o, GPT-4 Turbo
- Claude 3.5 Sonnet, Claude 3 Opus
- Gemini 1.5 Pro, Gemini 1.5 Flash
- Mistral Large
ReAct (Ragionamento + Azione)
Il modello scrive il suo ragionamento come testo ("Pensiero: devo cercare X...") seguito da istruzioni di azione ("Azione: google_search[X]"). Funziona con qualsiasi modello capace di seguire istruzioni.
Quando usarlo:
- Modelli open-source (Llama, Qwen, Mistral 7B)
- Modelli senza function calling nativo
- Quando vuoi vedere il ragionamento completo
Regola rapida
Usi GPT-4o, Claude 3.5+ o Gemini Pro? → Usa Function Calling. Usi un modello open-source? → Usa ReAct. In caso di dubbio, prova prima Function Calling.
Orchestrazione multi-agente
Per compiti complessi, puoi concatenare più agenti specializzati. Ogni agente si concentra su ciò che sa fare meglio, e un agente coordinatore dirige il lavoro tra di loro.
Esempio: Sistema di analisi competitiva
Specializzazione
Ogni agente ha un prompt di sistema mirato e solo gli strumenti di cui ha bisogno. Un agente di ricerca riceve strumenti di ricerca; un agente di scrittura riceve strumenti di formattazione.
Esecuzione parallela
I nodi workflow Dify possono invocare più agenti in parallelo. Raccogli tutti i risultati e uniscili in un passaggio finale per un completamento più rapido.
Controllo delle iterazioni
Imposta limiti massimi di iterazione per agente per evitare loop infiniti. Un coordinatore può riprovare i sotto-compiti falliti o ricorrere ad approcci più semplici automaticamente.
Isolamento degli strumenti
Mantieni gli strumenti sensibili (accesso CRM, scritture su database) in agenti separati con controlli di accesso rigidi. Il coordinatore pubblico non tocca mai direttamente i sistemi sensibili.
Domande frequenti
Cosa possono fare gli agenti IA Dify?
Gli agenti Dify possono cercare sul web (Google, Bing, DuckDuckGo), eseguire codice Python, chiamare API esterne, leggere Wikipedia, calcolare matematica, controllare il meteo e altro. Ragionano su quali strumenti usare per ogni attività.
Qual è la differenza tra un agente Dify e un chatbot?
Un chatbot Dify risponde alle domande basandosi sul suo addestramento. Un agente Dify usa attivamente strumenti — può cercare su internet, eseguire codice o chiamare API per informazioni in tempo reale. Usa il chatbot per il supporto, l'agente per la ricerca.
Posso aggiungere strumenti personalizzati a un agente Dify?
Sì. Puoi aggiungere qualsiasi API REST come strumento personalizzato fornendo una specifica OpenAPI o definendo manualmente l'endpoint con nome, descrizione e parametri. L'agente userà il tuo strumento quando il compito lo richiede.
L'agente Dify supporta il ragionamento multi-step?
Sì. Gli agenti Dify usano ReAct (Ragionamento + Azione) o Function Calling. L'agente ragiona passo dopo passo, chiama strumenti, osserva i risultati e continua fino al completamento — simile ad AutoGPT o LangChain.
Pronto a distribuire il tuo agente Dify?
Eseguire agenti su Dify Cloud accumula rapidamente crediti. L'auto-hosting sul proprio server ti dà esecuzioni di agenti illimitate per un costo mensile fisso — a partire da €3,79/mese. Scegli hosting gestito se vuoi zero manutenzione.
Hetzner VPS
Da €3,79/mese. Pieno controllo, esecuzioni di agenti illimitate, senza costi per messaggio. La scelta migliore per agenti IA in produzione con uso intensivo degli strumenti.
Ottieni Hetzner VPS →Elestio
Hosting Dify gestito — completamente configurato in 5 minuti. Aggiornamenti automatici, backup e SSL inclusi. Ideale se vuoi concentrarti sulla creazione di agenti.
Prova Elestio →