Guida Dify RAG 2026: Rispondi a domande dai tuoi documenti
La Retrieval-Augmented Generation (RAG) è la funzionalità più potente di Dify. Questa guida ti mostra esattamente come costruire una IA che cerca nei tuoi documenti prima di rispondere — fornendo risposte precise e fondate invece di allucinazioni.
Cos'è Dify RAG?
RAG sta per Retrieval-Augmented Generation. Questa tecnica dà alla tua IA accesso ai tuoi documenti, database e fonti di conoscenza — invece di rispondere solo dai dati di addestramento generici, cerca prima nel tuo contenuto e genera una risposta basata su ciò che ha trovato.
Gli LLM standard come GPT-4 o Claude allucinano quando vengono interrogati sui tuoi documenti interni, specifiche di prodotto o policy aziendali — perché semplicemente non hanno quei dati. Dify RAG risolve questo problema creando una knowledge base dai tuoi file e iniettando i passaggi più rilevanti come contesto prima che il modello risponda.
Il risultato: un chatbot IA che risponde accuratamente dai tuoi dati reali, cita le fonti e dice "non lo so" invece di inventare risposte quando l'informazione non è disponibile.
Come funziona Dify RAG internamente
Capire la pipeline ti aiuta a configurarla meglio. Ecco cosa succede quando carichi un documento e poni una domanda al tuo chatbot:
Ingestione del documento
Carichi un file. Dify estrae il contenuto testuale da PDF, documenti Word, Markdown, ecc.
Frammentazione (chunking)
Il testo viene diviso in frammenti più piccoli (tipicamente 500–1000 token) per rendere la ricerca precisa.
Embedding
Ogni frammento viene convertito in un vettore (lista di numeri) tramite un modello di embedding come text-embedding-3-small.
Archiviazione vettoriale
I vettori vengono archiviati in un database vettoriale (integrato, pgvector, Qdrant, Weaviate, Milvus o Pinecone).
Retrieval della query
Quando un utente pone una domanda, viene anch'essa vettorizzata e i frammenti più simili vengono recuperati dall'archivio vettoriale.
Iniezione del contesto
I frammenti recuperati vengono iniettati nel prompt dell'LLM come contesto. Il modello risponde basandosi su questi dati reali.
Configurare la tua knowledge base
La knowledge base è il luogo dove carichi e indicizzi i tuoi documenti. Segui questi passaggi:
Aprire Dify → scheda Knowledge
Fai clic su "Knowledge" (Conoscenza) nella barra di navigazione superiore. Qui si trovano tutte le tue raccolte di documenti.
Creare una nuova knowledge base
Fai clic su "+ Crea knowledge base". Dagli un nome descrittivo (es.: "Documentazione prodotto", "FAQ Supporto").
Caricare i file
Trascina e rilascia o sfoglia per caricare. Supportati: PDF, Word (.docx), TXT, Markdown (.md), HTML, CSV. Si possono caricare più file contemporaneamente.
Scegliere la strategia di frammentazione
Seleziona "Automatico" per la maggior parte dei casi. Questo divide i documenti per paragrafi e intestazioni. Per documenti tecnici densi: "Personalizzato" con 800 token e 150 token di sovrapposizione.
Selezionare il modello di embedding
Scegli il tuo modello di embedding. OpenAI text-embedding-3-small è consigliato — veloce, economico e preciso. In self-hosting, nomic-embed-text via Ollama funziona offline.
Indicizzare i documenti
Fai clic su "Salva e processa". Dify frammenta e vettorizza tutto. In base alla dimensione dei documenti, ci vogliono 1–5 minuti. Una barra di avanzamento mostra lo stato.
Collegare RAG alla tua applicazione
Una volta indicizzata la tua knowledge base, collegala a un chatbot o agente:
Apri la tua applicazione Chatbot o Agente in Studio
Nel pannello sinistro, trova la sezione "Contesto"
Fai clic su "+ Aggiungi contesto" e seleziona la tua knowledge base
Imposta la modalità di recupero su "Ricerca semantica" (consigliata) o "Ricerca a testo integrale" per la corrispondenza per parole chiave
Imposta "Top K" a 3–5 (quanti frammenti recuperare per query). Inizia con 3.
Attiva la "Soglia di punteggio" a 0,5 per filtrare i risultati poco rilevanti
Testa nel pannello di anteprima con domande dai tuoi documenti. Verifica che il bot citi informazioni corrette.
Database vettoriali supportati
Dify supporta più archivi vettoriali. Per la maggior parte degli utenti, l'archivio integrato è sufficiente. Per deployment su larga scala (milioni di documenti), passa a un database dedicato:
| Archivio vettoriale | Configurazione | Ideale per | Costo |
|---|---|---|---|
| Integrato (predefinito) Consigliato | Nessuna | La maggior parte degli utenti — fino a ~100k documenti | Gratuito |
| pgvector | Estensione PostgreSQL | Utenti PostgreSQL esistenti | Gratuito (self-hosted) |
| Qdrant | Container Docker | Self-hosted, alte prestazioni | Gratuito (self-hosted) |
| Weaviate | Docker o cloud | Dati multimodali (testo + immagini) | Gratuito / cloud a pagamento |
| Milvus | Docker o Zilliz cloud | Miliardi di vettori, scala enterprise | Gratuito / cloud a pagamento |
| Pinecone | Solo chiave API | Fully managed, nessuna infrastruttura da gestire | SaaS a pagamento |
Suggerimenti RAG per i migliori risultati
Questi consigli di configurazione miglioreranno significativamente la precisione del tuo RAG:
Dimensione ottimale del frammento: 500–1000 token
Troppo piccolo = contesto mancante. Troppo grande = rilevanza diluita. Per la maggior parte dei documenti, 600 token con 100 token di sovrapposizione è l'ideale.
Pulire i documenti sorgente
Rimuovi intestazioni e piè di pagina ripetuti, numeri di pagina e menu di navigazione. Questi elementi aggiungono rumore che danneggia la qualità del recupero.
Usare il filtraggio per metadati
Etichetta i documenti con categorie (es.: "prodotto: fatturazione", "tipo: FAQ"). I filtri permettono di recuperare solo i sottoinsiemi rilevanti per ogni query.
Separare le knowledge base per argomento
Non mescolare il manuale del prodotto con la policy HR. Dataset separati danno un recupero più preciso. Puoi collegare più basi alla stessa app.
Usare la ricerca ibrida
Dify supporta la modalità ibrida (semantica + parole chiave combinata). Attivala per una migliore copertura dei termini esatti: codici prodotto, nomi propri.
Monitorare il recupero nei log
Vai a Log e Annotazioni nella tua app per vedere esattamente quali frammenti sono stati recuperati per ogni query. Usalo per diagnosticare risposte scorrette.
Le modalità di recupero spiegate
Dify offre tre modalità di recupero. Scegli in base al tipo di contenuto:
Ricerca semantica
Trova contenuti concettualmente simili anche se le parole esatte differiscono. Ideale per domande in linguaggio naturale su argomenti complessi. Usa la similarità vettoriale.
Ricerca a testo integrale
Ricerca per parole chiave come un motore di ricerca tradizionale. Migliore per la corrispondenza esatta: codici prodotto, nomi, ID. Veloce e prevedibile.
Ricerca ibrida
Combina ricerca semantica e a testo integrale con un reranker. Migliore precisione complessiva ma più lenta. Richiede un modello reranker (es.: cohere-rerank).
Fonti dati esterne e sincronizzazione
Dify va oltre i semplici upload di file. Puoi connettere fonti esterne che si sincronizzano automaticamente:
Notion
Connetti il tuo workspace Notion. Dify sincronizza le pagine automaticamente. Ideale per wiki di team e documentazione.
Web scraping
Fornisci un URL e Dify recupera e indicizza la pagina. Utile per siti di documentazione pubblica.
API personalizzata
Crea un plugin di recupero tramite l'API External Knowledge Base. Connetti qualsiasi database o fonte dati proprietaria.
Sincronizzazione file via API
Carica e aggiorna documenti programmaticamente tramite l'API Dataset. Utile per integrazioni con CMS.
Domande frequenti
Cos'è Dify RAG?
RAG sta per Retrieval-Augmented Generation. Dify RAG permette alla tua IA di cercare nei tuoi documenti, PDF o database prima di rispondere, riducendo drasticamente le allucinazioni e migliorando la precisione su domande specifiche del dominio.
Quali formati di file supporta Dify RAG?
La knowledge base di Dify supporta PDF, Word (.docx), testo normale (.txt), Markdown (.md), HTML e CSV. Puoi anche collegare fonti esterne tramite API o sincronizzare con Notion.
Come riduce Dify RAG le allucinazioni?
Invece di affidarsi esclusivamente ai dati di addestramento dell'LLM, Dify RAG recupera frammenti rilevanti dai tuoi documenti e li inietta come contesto. Il modello risponde quindi basandosi sui tuoi dati reali.
Quali database vettoriali funzionano con Dify RAG?
Dify supporta diversi archivi vettoriali: integrato (predefinito, nessuna configurazione), pgvector (PostgreSQL), Qdrant, Weaviate, Milvus e Pinecone. L'archivio integrato va bene per la maggior parte degli utenti.
Pronto ad auto-ospitare Dify con RAG?
L'auto-hosting di Dify ti dà pieno controllo sui tuoi dati — fondamentale quando la tua knowledge base contiene documenti sensibili. Esegui Dify sul tuo server a partire da €3,79/mese su Hetzner, oppure ottieni un'istanza completamente gestita su Elestio in meno di 5 minuti.