Funzionamento, storia e campi di applicazione della Rete Neurale
Neural Network: un sistema computazionale ispirato al cervello umano che impara a svolgere compiti analizzando esempi. In italiano prende il nome anche di Rete Neurale ed è costituita da nodi interconnessi, organizzati in livelli che elaborano le informazioni e fanno previsioni.
I principali campi di applicazione della Rete Neurale riguardano l’Intelligenza Artificiale, in particolare quella generativa.
FUNZIONAMENTO
Una rete neurale è come un insieme di “neuroni” artificiali, chiamati nodi, che sono organizzati in diversi strati:
- Strato di Input: dove entrano i dati iniziali.
- Strati Nascosti: dove i dati vengono elaborati attraverso calcoli complessi. Ogni nodo riceve informazioni dai nodi dello strato precedente, le elabora e le passa ai nodi dello strato successivo.
- Strato di Output: dove si ottiene il risultato finale, che può essere una previsione, una classificazione o un’altra decisione.
Ogni nodo esegue una funzione matematica sull’input che riceve e passa l’output al nodo successivo se supera una soglia.
Come in una gerarchia organizzativa, i nodi elaborano e trasmettono i dati in modo strutturato, mentre le decisioni più complesse vengono trasmesse ai livelli superiori, proprio come i rendiconti spese in un’azienda passano attraverso manager e direttori in base a determinate soglie.
Le reti neurali sono disponibili in vari tipi in base alla loro struttura e funzione:
- Reti neurali superficiali e profonde
- Perceptron
- Perceptron multistrato
- Reti neurali feed-forward e ricorrenti
- Reti modulari
- Reti con funzioni di base radiali
- Macchine a stati liquidi
- Reti residue
Ogni tipologia di rete neurale si differenzia in base a come i dati fluiscono e come interagiscono i livelli, partendo da semplici progetti forward-only ad architetture complesse che creano cicli, saltano o combinano gli output.
STORIA
Le reti neurali hanno origine da un articolo matematico del 1943 che descriveva il funzionamento del cervello attraverso un modello matematico.
Gli informatici iniziarono a provare a costruire semplici reti neurali negli anni ’50 e ’60, ma col tempo il concetto cadde in disuso fino agli anni ’80. In questo periodo il concetto è stato ripreso e negli anni ’90 le reti neurali sono state utilizzate nella ricerca sull’Intelligenza Artificiale.
Con l’avvento dell’elaborazione iperveloce, delle enormi capacità di archiviazione dei dati e dell’accesso alle risorse di calcolo, le reti neurali hanno potuto progredire fino al punto in cui sono arrivate oggi, dove possono imitare o talvolta superare le capacità cognitive umane.
RETI NEURALI TRANSFORMER
Le Reti Neurali Transformer hanno assunto un ruolo di enorme importanza nei modelli di Intelligenza Artificiale oggi ampiamente utilizzati.
Proposti per la prima volta nel 2017, i modelli transformer sono reti neurali che utilizzano una tecnica chiamata “auto-attenzione” per tenere conto del contesto degli elementi in una sequenza, non solo degli elementi stessi. Grazie all’auto-attenzione, riescono a individuare anche i modi più sottili in cui parti di un set di dati sono correlate tra loro.
Questa capacità li rende ideali per analizzare, ad esempio, frasi e paragrafi di testo anziché singole parole.
Prima che venissero sviluppati i modelli Transformer, i modelli di intelligenza artificiale che elaboravano il testo spesso “dimenticavano” l’inizio di una frase quando arrivavano alla fine, con il risultato che combinavano il significato dei discorsi. Invece, i modelli Transformer possono elaborare e generare il linguaggio umano in un modo molto più naturale.
CAMPI DI APPLICAZIONE
Le reti neurali hanno trovato applicazione particolare nell’Intelligenza Artificiale Generativa.
I modelli transformer sono parte integrante dell’IA generativa, in particolare degli LLM (Large Language Models), che possono produrre testo in risposta a prompt arbitrari.
Grazie alla loro capacità di analizzare e comprendere il contesto, le reti neurali transformer sono ideali per elaborare linguaggio naturale, permettendo di analizzare frasi e paragrafi di testo anziché singole parole e frasi, generando contenuti in modo più naturale e coerente.