Il limite strutturale del RAG classico
Il RAG (Retrieval-Augmented Generation) ha portato i large language model nei team finance, ma il suo schema operativo resta primitivo: prende la domanda, cerca i passaggi piu simili in un indice vettoriale, li infila nel prompt e genera una risposta. Funziona per il FAQ interno. Si rompe quando la domanda e analitica.
Consideriamo una due diligence reale su un emittente quotato a Euronext Milan. La domanda non e "qual e l'EBITDA?" ma "come si e mossa la marginalita adjusted negli ultimi tre esercizi, al netto delle componenti non ricorrenti dichiarate, e cosa dicono le note al bilancio sulle riclassifiche?". Un chatbot RAG recupera tre o quattro chunk semanticamente vicini, spesso dallo stesso documento, e compone una risposta plausibile. Il problema e duplice: non sa di aver bisogno di leggere la relazione semestrale, il bilancio consolidato IFRS e il comunicato sui risultati insieme, e tende a riempire i vuoti con numeri verosimili ma inventati. Nella finanza, una cifra verosimile e sbagliata e peggio di nessuna risposta.
Cosa fa diversamente un agente di ricerca
Un agente, ispirato all'approccio di piattaforme come Hebbia e Rogo, non si limita a recuperare: pianifica. Scompone la domanda in sotto-attivita, decide quali documenti servono, itera la ricerca su migliaia di file e verifica le risposte intermedie prima di sintetizzare. Su una data room di un processo M&A con dodicimila documenti, la differenza e categorica.
Il flusso tipico di Amaril su una richiesta di due diligence assomiglia a questo. Primo, pianificazione: l'agente capisce che servono bilanci IFRS triennali, contratti chiave nella data room, term sheet e filing depositati presso Consob. Secondo, ricerca mirata e iterativa: interroga ogni fonte separatamente, raffinando le query in base a cio che trova, senza fermarsi al primo match. Terzo, estrazione con ancoraggio: ogni dato estratto resta legato alla pagina e al paragrafo di origine. Quarto, sintesi verificata: l'agente confronta le evidenze, segnala le incongruenze (per esempio un covenant nel credit file che contraddice quanto dichiarato nel management presentation) invece di appianarle.
Questo e il punto che separa uno strumento di produttivita da uno strumento di analisi. Il RAG risponde alla domanda che gli hai posto. L'agente risponde alla domanda che avresti dovuto porre, e ti mostra dove ha guardato.
Citazione della fonte: il vincolo che rende l'AI utilizzabile in finanza
Nessun analista firma un memo d'investimento su numeri che non puo tracciare. Nessun comitato crediti delibera su una sintesi che dice "il rapporto di indebitamento e elevato" senza riferimento al rigo di bilancio. Per questo Amaril e costruita attorno a un vincolo non negoziabile: ogni affermazione, ogni cifra, ogni clausola citata rimanda alla fonte esatta, pagina e paragrafo, cliccabile e verificabile.
Le conseguenze sono pratiche. Quando l'agente produce un IC memo o un credit memo, l'analista non rilegge tremila pagine: verifica le citazioni. Quando una comparable analysis allinea i multipli di un panel di peer europei (un emittente su Deutsche Borse, uno su Euronext Paris, uno su Borsa Italiana), ogni multiplo punta al filing da cui e stato estratto, con la sua valuta in euro e la sua data di riferimento. Quando la sintesi degli earnings di una banca dialoga con i requisiti CRR/CRD o con le metriche Solvency II di un assicuratore, il numero e ancorato, non rigenerato.
E soprattutto: l'agente e progettato per dire "non e nei documenti" anziche inventare. In un dominio regolato da MAR sull'abuso di mercato e da MiFID II, un'allucinazione non e un fastidio, e un rischio di compliance. La disciplina dell'astensione vale piu della fluidita della risposta.
Architettura, perimetro e fiducia
La potenza analitica non serve se il dato esce dal perimetro di controllo. Amaril gira su cloud UE, con crittografia end-to-end e policy di zero retention: i documenti della data room non addestrano modelli e non persistono oltre la sessione. Per chi opera sotto Banca d'Italia, BaFin, AMF o le linee guida EBA, e disponibile il deployment on-premise, con la pipeline agentica interamente dentro l'infrastruttura del cliente. GDPR, SFDR e DORA non sono caselle da spuntare a posteriori: sono vincoli di progetto.
Takeaway
Il RAG classico e un buon motore di ricerca conversazionale. Per la due diligence, la comparable analysis e i memo d'investimento o di credito serve qualcosa di diverso: un agente che pianifica il lavoro, cerca davvero su migliaia di documenti, ancora ogni numero alla sua fonte e si astiene quando il dato non c'e. La fluidita di un chatbot impressiona in demo. La tracciabilita di un agente regge in comitato, davanti al regolatore e al closing. In finanza, la fonte non e un dettaglio: e la differenza tra un'opinione e un'analisi.




