Vai al contenuto
Giallo

Cluster · come funziona ChatGPT

Come funziona ChatGPT

Come funziona ChatGPT spiegato semplice: previsione del token, addestramento, RLHF, finestra di contesto, limiti reali e come usarlo bene in azienda.

Tempo di lettura: 10 min

Guida operativa · Assistenti AI

Schema di come funziona ChatGPT: dal prompt alla previsione del token successivo fino alla risposta generata

ChatGPT funziona in modo molto più semplice di come sembra: a ogni passo prevede qual è la parola successiva più probabile e la aggiunge alla risposta, una dopo l'altra. Non cerca la risposta in un archivio e non ragiona come una persona. È un modello linguistico di grandi dimensioni (LLM) addestrato su enormi quantità di testo, che ha imparato gli schemi statistici del linguaggio e li usa per continuare un testo nel modo più plausibile.

Capire questo meccanismo cambia il modo in cui lo usi. Se sai che ChatGPT produce la continuazione più probabile — non quella certamente vera — smetti di trattarlo come un oracolo e inizi a usarlo come uno strumento veloce ma da controllare. La maggior parte degli errori d'uso nasce proprio dal non sapere cosa c'è sotto il cofano.

In questa guida vediamo, in modo accessibile anche a chi non è tecnico, come funziona ChatGPT passo per passo: cos'è un token, come avviene la previsione, come è stato addestrato il modello, cosa fa l'RLHF, cos'è la finestra di contesto e perché tutto questo conta quando lo porti nel lavoro di tutti i giorni.

In sintesi

  • ChatGPT è un LLM che genera testo prevedendo, un passo alla volta, il token successivo più probabile dato tutto il testo precedente.
  • Lavora su token (frammenti di parola), non su parole intere: è l'unità con cui legge il tuo testo e costruisce la risposta.
  • È stato addestrato in più fasi: pre-addestramento su grandi quantità di testo, poi messa a punto e RLHF (feedback umano) per renderlo utile e sicuro.
  • La finestra di contesto è quanto testo riesce a tenere a mente in una volta: superato il limite, le parti più vecchie escono dalla memoria attiva.
  • Produce la risposta più probabile, non quella verificata: può sbagliare con sicurezza, quindi va sempre controllato sui punti critici.

Cos'è ChatGPT, in una frase

ChatGPT è un'applicazione costruita sopra un modello linguistico di grandi dimensioni sviluppato da OpenAI. Il "GPT" sta per Generative Pre-trained Transformer: un modello generativo, pre-addestrato su testo, basato su un'architettura chiamata Transformer. In pratica è un sistema che, dato un testo in ingresso (il tuo messaggio), genera un testo in uscita (la risposta) continuandolo nel modo statisticamente più plausibile.

La famiglia di modelli a cui appartiene è quella dei modelli linguistici (LLM): la stessa categoria di Claude e Gemini. Se vuoi una panoramica generale dello strumento, dei piani e dei casi d'uso, la trovi nella guida ChatGPT: cos'è e come usarlo. Qui invece scaviamo nel meccanismo.

Come funziona ChatGPT passo per passo

Il cuore di ChatGPT è un'idea sorprendentemente semplice ripetuta milioni di volte: prevedere il prossimo pezzetto di testo. Vediamo il flusso, dal tuo messaggio alla risposta.

  1. Tokenizzazione. Il tuo testo viene spezzato in token, cioè frammenti di parola. "Automazione" può diventare due o tre token; uno spazio e una virgola sono token a loro volta. Il modello non vede lettere o parole intere, vede sequenze di token.
  2. Codifica numerica. Ogni token viene trasformato in numeri (vettori). È così che il linguaggio entra in una funzione matematica: il modello lavora solo su numeri.
  3. Previsione del token successivo. La rete neurale calcola, per ogni possibile token del suo vocabolario, quanto è probabile che venga dopo. Ottiene una lista di candidati con le rispettive probabilità.
  4. Scelta del token. Tra i candidati più probabili ne viene selezionato uno (con una piccola dose di casualità controllata, per non essere sempre identico). Questo token diventa la prima parte della risposta.
  5. Ripetizione. Il token appena scelto viene aggiunto al testo e il processo ricomincia: nuova previsione, nuovo token. Frase dopo frase, finché la risposta è completa.

Tutto qui. Non c'è un database di risposte pronte, non c'è una ricerca: c'è una previsione del token successivo ripetuta a velocità altissima. La ragione per cui le risposte sembrano "intelligenti" è che il modello, per prevedere bene la parola dopo, ha dovuto imparare grammatica, fatti ricorrenti, stili e strutture argomentative presenti nel testo su cui è stato addestrato.

Perché lavora a token e non a parole

Lavorare a token rende il modello più efficiente e flessibile: gestisce parole rare, errori di battitura, lingue diverse e codice senza dover conoscere ogni parola in anticipo. Questo dettaglio non è solo teoria: i token sono anche l'unità con cui si misura il costo e la lunghezza delle conversazioni. Se vuoi capire perché contano (anche economicamente), c'è la guida dedicata su cosa sono i token AI.

Da ricordare ChatGPT non "sa" la risposta e poi te la scrive. Costruisce la risposta mentre la genera, token dopo token. È il motivo per cui a volte parte bene e poi si perde: ogni pezzo nuovo dipende da quelli prima.

Come è stato addestrato ChatGPT

La capacità di prevedere bene il token successivo non nasce dal nulla: è il risultato di un addestramento in più fasi. Capirle aiuta a capire sia i punti di forza sia i limiti del modello.

Fase 1 — Pre-addestramento (impara il linguaggio)

Il modello viene esposto a enormi quantità di testo e allenato su un solo compito: prevedere il token successivo. Sbagliando e correggendosi miliardi di volte, regola i suoi parametri interni finché impara grammatica, fatti, modi di dire e strutture del linguaggio. Al termine ha un'ampia conoscenza generale, ma è "grezzo": tende a continuare il testo, non a rispondere in modo utile.

Fase 2 — Messa a punto su istruzioni (impara a rispondere)

Il modello viene ulteriormente addestrato su esempi di istruzioni e risposte di qualità, scritti o selezionati da persone. Così impara a comportarsi come un assistente: capire una richiesta, seguire un formato, dare una risposta pertinente invece di limitarsi a proseguire il testo.

Fase 3 — RLHF, feedback umano (impara cosa è "buono")

RLHF significa apprendimento per rinforzo dal feedback umano. Delle persone confrontano più risposte del modello e indicano quali sono migliori (più chiare, utili, sicure). Da queste preferenze si costruisce un segnale che guida il modello verso risposte più gradite e meno problematiche. È la fase che dà a ChatGPT il suo tono e la sua "educazione".

Il punto importante: l'addestramento si ferma a una certa data. Il modello di base non conosce gli eventi successivi e non "impara" dalle tue conversazioni in tempo reale. Alcune versioni possono cercare sul web o leggere i file che carichi, ma le funzioni dipendono dal piano e cambiano spesso: verifica sempre la pagina ufficiale di OpenAI per sapere cosa è attivo nel tuo account.

Cos'è la finestra di contesto

La finestra di contesto è una delle cose più utili da capire per usare bene ChatGPT. È la quantità massima di testo, misurata in token, che il modello può considerare in una sola volta: comprende il tuo messaggio, eventuali istruzioni di sistema e la cronologia della conversazione.

Immaginala come una scrivania di dimensioni fisse. Finché i fogli ci stanno, il modello vede tutto. Quando aggiungi troppo testo, i fogli più vecchi cadono dal bordo: escono dalla memoria attiva e il modello smette di tenerne conto. Ecco perché in una conversazione molto lunga ChatGPT può sembrare che "dimentichi" qualcosa detto all'inizio: non l'ha cancellato per scelta, semplicemente non rientra più nella finestra.

Aspetto Cosa significa in pratica
Unità di misura Token, non parole o caratteri. Documenti lunghi consumano molti token.
Cosa contiene Istruzioni, tuo messaggio e cronologia della chat: tutto compete per lo stesso spazio.
Limite superato Le parti più vecchie escono dal contesto; il modello non le considera più.
Effetto tipico Nelle chat lunghe sembra "dimenticare" dettagli iniziali o ripetersi.
Come gestirla Riassumi i punti chiave, incolla solo le parti rilevanti, apri una nuova chat quando cambi tema.

La finestra di contesto non è memoria permanente: è memoria di lavoro temporanea, valida per quella conversazione. Alcune versioni offrono funzioni di "memoria" tra chat diverse, ma sono un meccanismo a parte e vanno verificate sul piano in uso.

Perché ChatGPT a volte sbaglia (e con sicurezza)

Se hai seguito fin qui, l'origine degli errori è chiara: ChatGPT produce la continuazione più probabile, non quella vera. Quando una formulazione falsa "suona bene" statisticamente, il modello la genera con lo stesso tono sicuro di una corretta. Questo fenomeno si chiama allucinazione: il modello inventa nomi, numeri, citazioni o fonti che non esistono, presentandoli come fatti.

Non è un difetto da "bug": è una conseguenza diretta di come funziona. Per questo va gestito con metodo — chiedendo le fonti, fornendo i dati nel prompt, verificando i numeri. La guida dedicata su come evitare le allucinazioni AI spiega le tecniche pratiche. E poiché la qualità della risposta dipende molto da come poni la domanda, vale la pena partire dalle basi di prompt engineering.

Esempi pratici

Due scenari concreti per vedere cosa cambia quando capisci il meccanismo.

1. Studio professionale — riassunto di un contratto. Un assistente incolla un contratto e chiede a ChatGPT un riassunto. Sapendo che il modello lavora nella finestra di contesto, incolla solo le clausole rilevanti invece dell'intero faldone: il risultato è più preciso e non rischia di "perdere" parti per superamento del limite. E sapendo che il modello può allucinare, verifica le scadenze e gli importi contro il testo originale, invece di fidarsi a scatola chiusa.

2. E-commerce — descrizioni prodotto. Il team chiede una prima bozza di descrizione partendo dalla scheda tecnica reale, incollata nel prompt. Poiché il modello prevede il testo più plausibile, fornirgli i dati veri (materiali, misure, usi) lo tiene ancorato ai fatti ed evita che inventi caratteristiche. La persona rivede e pubblica. Senza questo accorgimento, ChatGPT riempirebbe i vuoti con aggettivi inventati ma "probabili".

In entrambi i casi la differenza non è ChatGPT: è chi lo usa sapendo come ragiona.

Errori da evitare

  • Trattarlo come un motore di ricerca. ChatGPT non interroga un archivio aggiornato: prevede testo. Su fatti recenti o dati precisi, controlla sempre o fornisci tu la fonte.
  • Incollare interi documenti senza criterio. Oltre la finestra di contesto, le parti più vecchie spariscono. Meglio selezionare le sezioni rilevanti o lavorare per blocchi.
  • Aspettarsi che ricordi le chat precedenti. Salvo funzioni di memoria specifiche, ogni conversazione parte "pulita". Quel che non è nel contesto, per il modello non esiste.
  • Dare per vera ogni risposta sicura. Il tono convinto non è un indicatore di correttezza. Numeri, norme e dati clienti vanno verificati a mano.
  • Inserire dati sensibili senza regole. Caricare dati personali di clienti in uno strumento pubblico può violare il GDPR. Serve una policy chiara su cosa si può condividere e cosa no.

Come applicarlo in azienda

Capire come funziona ChatGPT non è curiosità tecnica: è ciò che ti permette di usarlo in modo affidabile nei processi. Ecco come tradurlo in pratica in una PMI.

  • Fornisci sempre il contesto nel prompt (dati, esempi, formato atteso): il modello ancora la risposta a ciò che gli dai, riducendo le invenzioni.
  • Tieni le richieste dentro la finestra di contesto: documenti lunghi vanno divisi o riassunti, non incollati interi.
  • Metti sempre una revisione umana sui punti critici: numeri, clausole, comunicazioni ai clienti.
  • Definisci una regola sui dati: cosa è vietato incollare (anagrafiche clienti, segreti) e cosa è ammesso.
  • Quando un uso si ripete ogni giorno, valuta di strutturarlo in un flusso invece di copiare e incollare a mano ogni volta.

L'ultimo punto è quello che fa la differenza per un'azienda. Usare ChatGPT a mano va benissimo per provare, ma quando un'attività si ripete decine di volte al giorno conviene trasformarla in un processo collegato ai tuoi strumenti — un agente AI o un'automazione che riceve i dati, li elabora con il modello e restituisce il risultato dove serve, con i controlli giusti. È il passaggio dal "giocare con ChatGPT" all'"AI nei processi". Se vuoi una panoramica più ampia, c'è la guida ChatGPT per aziende, e gli esperimenti applicati li raccontiamo nel The Lab.

ChatGPT a mano va bene quando

  • L'uso è occasionale o esplorativo.
  • Ogni richiesta è diversa dalle altre.
  • La persona controlla e rifinisce ogni output.
  • Non servono integrazioni con i tuoi sistemi.

Serve un flusso strutturato quando

  • La stessa attività si ripete molte volte al giorno.
  • I dati arrivano da email, gestionale o CRM.
  • Vuoi tracciabilità e controlli ripetibili.
  • Il risultato deve finire in un altro software.

Conclusione

ChatGPT funziona prevedendo il token successivo più probabile, un passo alla volta, sulla base degli schemi imparati durante l'addestramento e affinati con l'RLHF. Non cerca, non ragiona e non ricorda oltre la sua finestra di contesto: genera la continuazione più plausibile del testo che gli dai. Sapere questo è esattamente ciò che ti serve per usarlo bene — sfruttandone la velocità sulle prime stesure e tenendo la persona dove servono verifica e giudizio. Da qui puoi proseguire con la base teorica sugli LLM o con la differenza concreta tra i piani in ChatGPT gratis vs Plus.

Se vuoi passare dai test con ChatGPT a un sistema AI integrato nei processi aziendali, Giallo Studio progetta agenti e automazioni su misura.

Risorse correlate

Servizi di consulenza AI e automazione dei processi

FAQ

Come funziona ChatGPT in parole semplici?

ChatGPT è un modello linguistico che genera la risposta una parola (anzi, un token) alla volta. A ogni passo calcola quale token è più probabile che venga dopo, dato tutto il testo precedente, e lo aggiunge. Ripetendo questo processo molte volte costruisce frasi intere. Non cerca informazioni in un database e non 'capisce' come una persona: prevede la continuazione più plausibile sulla base di ciò che ha imparato durante l'addestramento.

ChatGPT capisce davvero quello che scrive?

No, non nel senso umano. ChatGPT non ha consapevolezza né comprensione del significato: riconosce schemi statistici nel linguaggio e produce l'output più probabile. Spesso il risultato è corretto e utile, ma il modello può anche generare informazioni false con lo stesso tono sicuro. Per questo le risposte vanno verificate, soprattutto su dati, numeri e norme.

Cos'è la finestra di contesto di ChatGPT?

La finestra di contesto è la quantità massima di testo (misurata in token) che ChatGPT può considerare in una volta: il tuo messaggio, le istruzioni e la cronologia della conversazione. Quando si supera questo limite, le parti più vecchie escono dalla 'memoria' attiva e il modello smette di tenerne conto. Per questo nelle conversazioni lunghe può sembrare che 'dimentichi' cose dette all'inizio.

Cos'è l'RLHF e perché conta?

RLHF significa apprendimento per rinforzo dal feedback umano. È una fase di addestramento in cui delle persone valutano e ordinano le risposte del modello, insegnandogli quali sono più utili, chiare e sicure. È il motivo per cui ChatGPT risponde in modo conversazionale e segue le istruzioni, invece di limitarsi a completare il testo in modo grezzo come farebbe il modello di base.

ChatGPT è connesso a internet e sa cosa succede oggi?

Il modello di base ha una data di addestramento oltre la quale non conosce gli eventi. Alcune versioni e funzioni possono però cercare sul web o leggere file che carichi. Le funzioni disponibili cambiano spesso a seconda del piano: verifica sempre la pagina ufficiale di OpenAI per sapere cosa è incluso nel tuo account.

Perché ChatGPT a volte dà risposte diverse alla stessa domanda?

Perché la generazione include una componente casuale controllata: a ogni passo il modello non sceglie sempre il token più probabile in assoluto, ma campiona tra i candidati più plausibili. Questo rende le risposte più naturali e varie, ma significa anche che la stessa domanda può produrre formulazioni diverse in momenti diversi.

Applichiamolo

Trasformiamo la guida in un primo flusso live.

Raccontaci quale processo vuoi alleggerire: valutiamo fattibilita, ritorno e primo step operativo.