Aggiornato marzo 2026 Guida RAG Avanzato

Guida Dify RAG 2026: Rispondi a domande dai tuoi documenti

La Retrieval-Augmented Generation (RAG) è la funzionalità più potente di Dify. Questa guida ti mostra esattamente come costruire una IA che cerca nei tuoi documenti prima di rispondere — fornendo risposte precise e fondate invece di allucinazioni.

Cos'è Dify RAG?

RAG sta per Retrieval-Augmented Generation. Questa tecnica dà alla tua IA accesso ai tuoi documenti, database e fonti di conoscenza — invece di rispondere solo dai dati di addestramento generici, cerca prima nel tuo contenuto e genera una risposta basata su ciò che ha trovato.

Gli LLM standard come GPT-4 o Claude allucinano quando vengono interrogati sui tuoi documenti interni, specifiche di prodotto o policy aziendali — perché semplicemente non hanno quei dati. Dify RAG risolve questo problema creando una knowledge base dai tuoi file e iniettando i passaggi più rilevanti come contesto prima che il modello risponda.

Il risultato: un chatbot IA che risponde accuratamente dai tuoi dati reali, cita le fonti e dice "non lo so" invece di inventare risposte quando l'informazione non è disponibile.

✓ Risponde dai tuoi documenti

✓ Riduce drasticamente le allucinazioni

✓ Cita passaggi specifici come fonte

✓ Compatibile con PDF, Word, TXT, Markdown

✓ Nessun fine-tuning del modello necessario

✓ Knowledge base aggiornabile in qualsiasi momento

Come funziona Dify RAG internamente

Capire la pipeline ti aiuta a configurarla meglio. Ecco cosa succede quando carichi un documento e poni una domanda al tuo chatbot:

Ingestione del documento

Carichi un file. Dify estrae il contenuto testuale da PDF, documenti Word, Markdown, ecc.

Frammentazione (chunking)

Il testo viene diviso in frammenti più piccoli (tipicamente 500–1000 token) per rendere la ricerca precisa.

Embedding

Ogni frammento viene convertito in un vettore (lista di numeri) tramite un modello di embedding come text-embedding-3-small.

Archiviazione vettoriale

I vettori vengono archiviati in un database vettoriale (integrato, pgvector, Qdrant, Weaviate, Milvus o Pinecone).

Retrieval della query

Quando un utente pone una domanda, viene anch'essa vettorizzata e i frammenti più simili vengono recuperati dall'archivio vettoriale.

Iniezione del contesto

I frammenti recuperati vengono iniettati nel prompt dell'LLM come contesto. Il modello risponde basandosi su questi dati reali.

Concetto chiave: RAG non modifica l'LLM. Aggiunge una fase di recupero prima della generazione. Ciò significa che puoi aggiornare la tua knowledge base in qualsiasi momento senza toccare il modello.

Configurare la tua knowledge base

La knowledge base è il luogo dove carichi e indicizzi i tuoi documenti. Segui questi passaggi:

Aprire Dify → scheda Knowledge

Fai clic su "Knowledge" (Conoscenza) nella barra di navigazione superiore. Qui si trovano tutte le tue raccolte di documenti.

Creare una nuova knowledge base

Fai clic su "+ Crea knowledge base". Dagli un nome descrittivo (es.: "Documentazione prodotto", "FAQ Supporto").

Caricare i file

Trascina e rilascia o sfoglia per caricare. Supportati: PDF, Word (.docx), TXT, Markdown (.md), HTML, CSV. Si possono caricare più file contemporaneamente.

Scegliere la strategia di frammentazione

Seleziona "Automatico" per la maggior parte dei casi. Questo divide i documenti per paragrafi e intestazioni. Per documenti tecnici densi: "Personalizzato" con 800 token e 150 token di sovrapposizione.

Selezionare il modello di embedding

Scegli il tuo modello di embedding. OpenAI text-embedding-3-small è consigliato — veloce, economico e preciso. In self-hosting, nomic-embed-text via Ollama funziona offline.

Indicizzare i documenti

Fai clic su "Salva e processa". Dify frammenta e vettorizza tutto. In base alla dimensione dei documenti, ci vogliono 1–5 minuti. Una barra di avanzamento mostra lo stato.

Suggerimento: I documenti ben formattati si indicizzano meglio. Rimuovi intestazioni, piè di pagina, numeri di pagina e testi boilerplate dai tuoi PDF prima di caricarli per ottenere la migliore qualità di recupero.

Collegare RAG alla tua applicazione

Una volta indicizzata la tua knowledge base, collegala a un chatbot o agente:

Apri la tua applicazione Chatbot o Agente in Studio

Nel pannello sinistro, trova la sezione "Contesto"

Fai clic su "+ Aggiungi contesto" e seleziona la tua knowledge base

Imposta la modalità di recupero su "Ricerca semantica" (consigliata) o "Ricerca a testo integrale" per la corrispondenza per parole chiave

Imposta "Top K" a 3–5 (quanti frammenti recuperare per query). Inizia con 3.

Attiva la "Soglia di punteggio" a 0,5 per filtrare i risultati poco rilevanti

Testa nel pannello di anteprima con domande dai tuoi documenti. Verifica che il bot citi informazioni corrette.

Consiglio pro: Aggiungi un'istruzione di citazione nel tuo prompt di sistema: "Quando rispondi dal contesto fornito, cita sempre il nome del documento sorgente." Questo chiarisce da quale documento proviene la risposta.

Database vettoriali supportati

Dify supporta più archivi vettoriali. Per la maggior parte degli utenti, l'archivio integrato è sufficiente. Per deployment su larga scala (milioni di documenti), passa a un database dedicato:

Archivio vettoriale	Configurazione	Ideale per	Costo
Integrato (predefinito) Consigliato	Nessuna	La maggior parte degli utenti — fino a ~100k documenti	Gratuito
pgvector	Estensione PostgreSQL	Utenti PostgreSQL esistenti	Gratuito (self-hosted)
Qdrant	Container Docker	Self-hosted, alte prestazioni	Gratuito (self-hosted)
Weaviate	Docker o cloud	Dati multimodali (testo + immagini)	Gratuito / cloud a pagamento
Milvus	Docker o Zilliz cloud	Miliardi di vettori, scala enterprise	Gratuito / cloud a pagamento
Pinecone	Solo chiave API	Fully managed, nessuna infrastruttura da gestire	SaaS a pagamento

Raccomandazione: Inizia con l'archivio vettoriale integrato. Non richiede alcuna configurazione e funziona bene per la maggior parte dei progetti. Passa a uno esterno solo se hai più di 100.000 frammenti di documenti.

Suggerimenti RAG per i migliori risultati

Questi consigli di configurazione miglioreranno significativamente la precisione del tuo RAG:

Dimensione ottimale del frammento: 500–1000 token

Troppo piccolo = contesto mancante. Troppo grande = rilevanza diluita. Per la maggior parte dei documenti, 600 token con 100 token di sovrapposizione è l'ideale.

Pulire i documenti sorgente

Rimuovi intestazioni e piè di pagina ripetuti, numeri di pagina e menu di navigazione. Questi elementi aggiungono rumore che danneggia la qualità del recupero.

Usare il filtraggio per metadati

Etichetta i documenti con categorie (es.: "prodotto: fatturazione", "tipo: FAQ"). I filtri permettono di recuperare solo i sottoinsiemi rilevanti per ogni query.

Separare le knowledge base per argomento

Non mescolare il manuale del prodotto con la policy HR. Dataset separati danno un recupero più preciso. Puoi collegare più basi alla stessa app.

Usare la ricerca ibrida

Dify supporta la modalità ibrida (semantica + parole chiave combinata). Attivala per una migliore copertura dei termini esatti: codici prodotto, nomi propri.

Monitorare il recupero nei log

Vai a Log e Annotazioni nella tua app per vedere esattamente quali frammenti sono stati recuperati per ogni query. Usalo per diagnosticare risposte scorrette.

Le modalità di recupero spiegate

Dify offre tre modalità di recupero. Scegli in base al tipo di contenuto:

Consigliato

Ricerca semantica

Trova contenuti concettualmente simili anche se le parole esatte differiscono. Ideale per domande in linguaggio naturale su argomenti complessi. Usa la similarità vettoriale.

Ricerca a testo integrale

Ricerca per parole chiave come un motore di ricerca tradizionale. Migliore per la corrispondenza esatta: codici prodotto, nomi, ID. Veloce e prevedibile.

Ricerca ibrida

Combina ricerca semantica e a testo integrale con un reranker. Migliore precisione complessiva ma più lenta. Richiede un modello reranker (es.: cohere-rerank).

Fonti dati esterne e sincronizzazione

Dify va oltre i semplici upload di file. Puoi connettere fonti esterne che si sincronizzano automaticamente:

Notion

Connetti il tuo workspace Notion. Dify sincronizza le pagine automaticamente. Ideale per wiki di team e documentazione.

Web scraping

Fornisci un URL e Dify recupera e indicizza la pagina. Utile per siti di documentazione pubblica.

API personalizzata

Crea un plugin di recupero tramite l'API External Knowledge Base. Connetti qualsiasi database o fonte dati proprietaria.

Sincronizzazione file via API

Carica e aggiorna documenti programmaticamente tramite l'API Dataset. Utile per integrazioni con CMS.

Domande frequenti

Cos'è Dify RAG?

RAG sta per Retrieval-Augmented Generation. Dify RAG permette alla tua IA di cercare nei tuoi documenti, PDF o database prima di rispondere, riducendo drasticamente le allucinazioni e migliorando la precisione su domande specifiche del dominio.

Quali formati di file supporta Dify RAG?

La knowledge base di Dify supporta PDF, Word (.docx), testo normale (.txt), Markdown (.md), HTML e CSV. Puoi anche collegare fonti esterne tramite API o sincronizzare con Notion.

Come riduce Dify RAG le allucinazioni?

Invece di affidarsi esclusivamente ai dati di addestramento dell'LLM, Dify RAG recupera frammenti rilevanti dai tuoi documenti e li inietta come contesto. Il modello risponde quindi basandosi sui tuoi dati reali.

Quali database vettoriali funzionano con Dify RAG?

Dify supporta diversi archivi vettoriali: integrato (predefinito, nessuna configurazione), pgvector (PostgreSQL), Qdrant, Weaviate, Milvus e Pinecone. L'archivio integrato va bene per la maggior parte degli utenti.

Pronto ad auto-ospitare Dify con RAG?

L'auto-hosting di Dify ti dà pieno controllo sui tuoi dati — fondamentale quando la tua knowledge base contiene documenti sensibili. Esegui Dify sul tuo server a partire da €3,79/mese su Hetzner, oppure ottieni un'istanza completamente gestita su Elestio in meno di 5 minuti.

Auto-ospita Dify su Hetzner → Dify gestito su Elestio Confronta tutte le opzioni di hosting