Scopri
BDH di Pathway: un nuovo approccio post-trasformatore all'IA per le aziende, su AWS

BDH di Pathway: un nuovo approccio post-trasformatore all'IA per le aziende, su AWS

Come ti è sembrato il contenuto?

I modelli Transformer, l'architettura alla base dei moderni LLM, hanno rivoluzionato il nostro modo di vivere, lavorare, creare e competere. Hanno permesso alle startup di sperimentare e lanciare idee con team snelli e hanno rappresentato un punto di svolta in settori verticali B2B come la programmazione, l'analisi e la creazione di contenuti. Sia per i fondatori che per le aziende, hanno sbloccato aumenti di produttività che sarebbero stati inimmaginabili solo pochi anni fa.

L'IA basata su Transformer si è evoluta con la scalabilità della forza bruta, il che significa che modelli più grandi, più dati e più calcolo hanno migliorato i LLM. Se è così, perché allora c'è un tasso di fallimento del 95% per i progetti di IA per le aziende, secondo uno studio dell'MIT? La risposta risiede nell'architettura dei modelli Transformer. Essi iniziano ogni operazione sempre nello stesso stato e, non avendo memoria, rimangono bloccati in un ciclo infinito, incapaci di imparare dal passato. Questa limitazione tecnica si traduce in reali implicazioni aziendali, poiché la stessa infrastruttura che ha permesso la crescita e potenziato le organizzazioni ora rappresenta un ostacolo al progresso.

Un approccio radicalmente diverso ai modelli

Con l'evoluzione dell'IA, la posta in gioco si è alzata. Le aziende ora cercano di applicare l'IA a casi d'uso e flussi di lavoro interni proprietari, richiedendo modelli in grado di apprendere e adattare il comportamento nel tempo, supportare il ragionamento a lungo termine e produrre inferenze osservabili e verificabili. I modelli Transformer un tempo significavano trasformazione aziendale, ma ora è necessario un approccio radicalmente diverso.

Pathway, un partner AWS per i modelli di frontiera, sta aprendo la strada a questa nuova generazione di intelligenza artificiale con Dragon Hatchling (BDH). Sviluppato su Amazon SageMaker e ottimizzato per l'infrastruttura AWS, BDH è un modello di frontiera post-trasformatore che alimenta l'apprendimento continuo, il contesto infinito e l'adattamento in tempo reale. Risolve la sfida principale per l'adozione dell'IA per le aziende, ovvero la memoria e l'apprendimento in tempo reale, consentendo alle organizzazioni di sbloccare nuove funzionalità critiche e di capitalizzare sull'intelligenza aziendale personalizzata.

I limiti dei trasformatori in azienda

I modelli Transformer rimangono la scelta predefinita per molte attività e hanno cambiato radicalmente le operazioni aziendali. Tuttavia, dopo quasi un decennio di esistenza, il modello Transformer sta iniziando a raggiungere i suoi limiti pratici e matematici in ambito aziendale.

I Transformer non sono stati progettati per l'apprendimento continuo. Vengono addestrati una sola volta, non possono acquisire nuove competenze nel tempo e non possono diventare più intelligenti col passare del tempo, poiché possono solo accumulare testo in un database esterno.
I Transformer sono incredibilmente dispendiosi in termini di risorse.Utilizzano enormi quantità di potenza di calcolo perché elaborano le informazioni in un modo che cresce molto rapidamente con l'aumentare dei dati, necessitano di memoria molto veloce per funzionare e si adattano e tengono costantemente conto dei parametri di un modello.
I Transformer si scontrano con vincoli architetturali nell'offrire ciò che è necessario per una vera intelligenza artificiale nativa aziendale. Le aziende contengono conoscenze e processi specializzati che devono essere interiorizzati e appresi. Richiedono inoltre governance e osservabilità. Gli attuali modelli basati sui trasformatori agiscono come black box con ragionamenti opachi, si affidano a pesi pre-addestrati e mancano di meccanismi per modellare "cosa succederà dopo".

In sostanza, cosa significa tutto questo?

I limiti tecnologici dei trasformatori si traducono direttamente in implicazioni aziendali concrete, generando costi e complessità aggiuntive per aziende e startup. Anziché fungere da strumento di potenziamento, i trasformatori sono diventati una fonte di colli di bottiglia, costringendo i team a dedicare più tempo alla gestione di soluzioni temporanee che alla creazione di valore.

È necessario un lavoro supplementare per adattare il modello al funzionamento effettivo dell'azienda. Allineare i modelli preconfezionati al modo in cui un'organizzazione opera spesso comporta la gestione di carichi di lavoro o correzioni aggiuntive, come la creazione di LLM personalizzati, il ridimensionamento dei modelli e l'utilizzo di flussi di lavoro agentici per integrare i processi.
L'adattamento o la contestualizzazione di conoscenze specializzate richiede ai team di gestire un ampio fine-tuning e/o implementazioni complesse di flussi di lavoro agentici.
La differenziazione diventa una sfida. Ottenere risultati unici significa che i team devono personalizzare i modelli autonomamente, consapevoli del fatto che potrebbero perdere rilevanza e accuratezza nel tempo, oppure utilizzare gli stessi modelli standard dei concorrenti.
I costi impongono compromessi difficili. Costi elevati di addestramento e inferenza costringono i team a selezionare con cura i contesti in cui implementare l'IA, precludendosi così potenziali opportunità.

BDH: ideare un nuovo paradigma di intelligence aziendale

Abbiamo assistito all'evoluzione dei modelli di transformatore, ma per le aziende che desiderano differenziare la propria offerta e aggiungere valore, questo non è più sufficiente. Invece di fornire un miglioramento incrementale allo stack del trasformatore, BDH segna un cambio di paradigma, inaugurando una nuova ondata di IA per le aziende.

A differenza dei modelli basati su trasformatori che utilizzano pesi fissi, l'architettura di BDH è strutturata più come una rete di neuroni e sinapsi. Le connessioni vengono continuamente aggiornate man mano che arrivano nuove informazioni, consentendo al modello di conservare e affinare la conoscenza nel tempo anziché essere resettato per ogni attività. Il risultato è una visione dell'intelligenza aziendale come basata sulla memoria, autonoma e osservabile. Ciò sblocca nuove funzionalità per le aziende, tra cui:

1. Apprendimento continuo: BDH impara da ogni interazione e interiorizza tale apprendimento nel tempo per il ragionamento, competenze durature e risoluzione dei problemi sempre più autonoma.

Perché è importante

BDH non si limita ad assimilare e rigurgitare più informazioni. Sviluppa intelligenza e capacità di giudizio nel tempo.
L'esperienza nel settore si accumula, creando un vantaggio esponenziale grazie alla personalizzazione.
Crea un legame aziendale che non può essere replicato tramite dati o addestramento. L'IA diventa insostituibile man mano che apprende le caratteristiche della tua attività.
Ragioni che si estendono su orizzonti temporali lunghi.
Apprende da dati scarsi e specializzati (a differenza della fame di dati dei trasformatori).

2. Efficienza: BDH funziona come un cervello su GPU con un'efficienza integrata, sia in fase di addestramento che di inferenza. L'intelligenza parte da interazioni locali che si rafforzano o si indeboliscono nel tempo e si attivano quando necessario, non tutte contemporaneamente. Solo il 5% dei neuroni si attiva per token, a differenza dei trasformatori che attivano l'intero modello in una sola volta.

Inoltre, il BDHè è un modello di ragionamento veramente nativo. Creando uno spazio di ragionamento interno più ampio, chiamato spazio di ragionamento latente, possiede meccanismi di memoria intrinseci che supportano l'apprendimento e l'adattamento durante l'uso. BDH mantiene i punti di forza dei transformer, in particolare la comprensione e la generazione del linguaggio, aggiungendo la capacità di risolvere problemi non linguistici che mettono in difficoltà gli LLM standard. Ad esempio, BDH raggiunge una precisione del 97,4% nei benchmark di Extreme Sudoku, una raccolta di circa 250.000 dei puzzle di Sudoku più difficili disponibili, mentre i principali LLM faticano a ottenere risultati soddisfacenti.

Perché è importante?

Miglioramento di 10 volte dell'efficienza, considerando tutte le attività di addestramento e i token di inferenza.
Riduzione del consumo di energia e potenza.
Time to market più rapido, senza la necessità di un imponente addestramento iniziale (set di dati limitati, apprendimento nel tempo).
Un'unica architettura che eccelle sia nei compiti linguistici che in quelli non linguistici (ad esempio, i giochi), indice di un forte potenziale decisionale.

3. Livello aziendale: con BDH, le aziende possono utilizzare un'intelligenza artificiale che comprende il loro business, si adatta continuamente ed è facile da monitorare e interpretare. Il tutto senza bisogno di soluzioni alternative o correzioni aggiuntive.

Perché è importante

Si tratta di un'intelligenza artificiale che si integra nel contesto dell'esperienza di un'organizzazione.
C'è fiducia nell'implementazione di sistemi che continuano ad apprendere in produzione con tracciabilità.
L'intelligenza artificiale tiene conto del tempo e può quindi gestire la consapevolezza dei processi, la creazione di gemelli digitali e l'individuazione della migliore azione successiva.
Gestione delle modalità e delle motivazioni che regolano le modifiche di un modello nel tempo.
Sono disponibili meccanismi chiari per mettere in pausa, isolare o annullare l'apprendimento quando necessario.

L'“inferenza persistente” sblocca funzionalità critiche dell'IA

Qual è il tuo vantaggio competitivo? Quando l'implementazione di soluzioni di IA standard e la formazione una tantum non garantiscono più un vantaggio competitivo, è necessario un approccio diverso. BDH è progettato per casi d'uso di "inferenza persistente" che creano il vantaggio competitivo definitivo per l'azienda. BDH apprende continuamente dai dati proprietari, sviluppando nel tempo competenze specifiche del settore e creando un reale vantaggio competitivo.

I casi d'uso dell'inferenza persistente sono profondamente legati alla risorsa più preziosa di un'azienda: i suoi dati proprietari. Richiedono un accesso costante alle informazioni più recenti e immediate per rimanere accurate e utili, e dipendono dalla capacità di ragionare in modo osservabile per lunghi periodi di tempo.

Dove si manifestano dunque questi casi d'uso "persistenti"? BDH offre soluzioni per casi d'uso di inferenza persistente in diversi settori, sia orizzontali che verticali. In ambito orizzontale, li vediamo emergere in aree in cui le nuove funzionalità sono fondamentali. In ambito verticale, li riscontriamo in settori come la vendita al dettaglio, le assicurazioni, la tecnologia, i servizi finanziari e la sanità, dove i dati e il contesto sono elementi davvero determinanti per il successo aziendale.

Orizzontale:

BDH automatizza un lungo processo contabile di fine trimestre per un'azienda globale e multidisciplinare ragionando tra regioni e reparti aziendali per diversi mesi. Anziché considerare la chiusura finanziaria come un evento isolato, BDH abbraccia l'intero trimestre, eseguendo previsioni anticipate, valutando le varianze a metà ciclo, analizzando le esposizioni per orientare la copertura, coordinando le riconciliazioni e concludendo con una chiusura chiara e verificabile dello studio. Questa intelligenza a lungo termine migliora la precisione e la previsione nel tempo.

Verticale: agnostico
Orizzontale: gestione
Principale fattore di differenziazione: il ragionamento a lungo termine

Vendita al dettaglio:

BDH garantisce che un'azienda di vendita al dettaglio mantenga le vendite in linea con gli obiettivi in base a condizioni dinamiche. Tenendo conto dei dati interni ed esterni in continua evoluzione, BDH suggerisce le azioni più opportune da intraprendere, come ad esempio dove concentrarsi nel flusso di lavoro di personalizzazione del prodotto, le opportunità per la definizione dinamica dei prezzi o le aree in cui le promozioni personalizzate risultano più efficaci.

Verticale: vendita al dettaglio
Orizzontale: vendite
Principale fattore di differenziazione: la migliore azione successiva

Settore assicurativo

BDH aumenta l'automazione della pre-autorizzazione e della successiva verifica delle richieste di rimborso medico per una società di servizi assicurativi, analizzando scenari complessi e non predefiniti in tempo reale. Riduce il costo per sinistro automatizzando una percentuale maggiore di richieste, migliorando al contempo la precisione e fornendo un audit trail integrato per ogni decisione.

Verticale: settore assicurativo
Orizzontale: operazioni
Principale fattore di differenziazione: l'interoperabilità

Grandi aziende tecnologiche

BDH gestisce un gemello digitale in tempo reale della rete di ciascun cliente aziendale per un fornitore di telecomunicazioni. Grazie all'acquisizione continua di dati di telemetria, topologia e dati in tempo reale dei clienti, BDH confronta l'utilizzo effettivo con quello probabile e raccomanda le azioni più opportune da intraprendere in termini di riconfigurazione preventiva, manutenzione e assistenza.

Verticale: alta tecnologia
Orizzontale: servizi
Principale fattore di differenziazione: il gemellaggio digitale in tempo reale

Assistenza sanitaria

BDH supporta la ricerca clinica complessa integrando continuamente le storie cliniche dei pazienti per suggerire opzioni di trattamento più informate. A differenza dei modelli lineari basati su dati tradizionali, che non sono progettati per apprendere da un set di dati limitato e faticano con casi rari o unici, BDH può apprendere da "esemplari di uno" e trasformarli in informazioni utili.

Verticale: assistenza sanitaria
Orizzontale: ricerca
Principale fattore di differenziazione: i set di thin data

Servizi finanziari

BDH effettua ricerche di opportunità altamente personalizzate, apprendendo le strategie di gestione del rischio e le tesi di investimento proprietarie di ciascuna banca. Analizzando continuamente i dati di mercato in tempo reale, genera nuove opportunità di investimento e individua nuove opportunità più redditizie rispetto alle opzioni di mercato standard.

Verticale: servizi finanziari
Orizzontale: rischi
Principale fattore di differenziazione: l'apprendimento continuo

Sviluppato su Amazon SageMaker HyperPod, ottimizzato per AWS

AWS e Pathway rendono questa tecnologia accessibile già da oggi, portando l'innovazione più all'avanguardia dell'IA nei casi d'uso in cui contesto, memoria e ragionamento a lungo termine sono fondamentali. BDH è sviluppato su Amazon SageMaker HyperPod, progettato per l'addestramento distribuito su larga scala e che aiuta i team a predisporre e gestire cluster GPU con flussi di lavoro gestiti.

È inoltre ottimizzato per l'infrastruttura AWS, il che significa che funziona in modo efficiente e con le massime prestazioni. BDH è accessibile tramite API alle applicazioni e ai flussi di lavoro AWS esistenti e migliora continuamente in base ai dati che le organizzazioni già archiviano su AWS.

Contatta Pathway (dragon@pathway.com) per iniziare a esplorare e implementare BDH. I clienti possono iniziare con un investimento iniziale ridotto tramite programmi POC supportati da AWS. Puoi anche accedere alla ricerca di Pathway su Arxiv e ai relativi repository open source su Github.

Come ti è sembrato il contenuto?