Indice
La Guinness delle origini
La statistica è la scienza che si occupa di studiare fenomeni collettivi tramite metodi matematici. Data la sua natura fortemente applicativa, questa disciplina è ricca di storie affascinanti. Una di queste riguarda proprio la Guinness e la nascita del test t-Student.
La storia del birrificio inizia nel XVIII secolo con Arthur Guinness che, nel 1759, prende in affitto i locali della celebre St. James’s Gate Brewery (Fig.1), a Dublino [1]. Sin dagli albori il birrificio si contraddistingue per la sua birra scura. Questa veniva ottenuta sfruttando la recente tecnologia di torrefazione dei malti d’orzo, sviluppata all’incirca una cinquantina di anni prima.
Classificata all’epoca come Porter, è uno dei simboli del movimento birrario irlandese, che fa della “pinta scura” una vera e propria bandiera. La Guinness, in particolare, si contraddistingue per il suo profilo rotondo e cremoso, sgradito inizialmente ai londinesi che la denigrarono per la mancanza di acidità e la carbonazione troppo vivace. I gusti però cambiano e il successo della Guinness supera rapidamente i confini nazionali [2].
La distribuzione normale o Gaussiana
L’ambito statistico nel quale questa storia si sviluppa richiede innanzitutto di definire la distribuzione normale o Gaussiana, dal nome del matematico tedesco Carl Friedrich Gauss. La distribuzione Gaussiana è una distribuzione di probabilità continua che descrive l’andamento di variabili casuali che tendono a concentrarsi attorno ad un valore medio [3].
Riportando su un grafico le frequenze dei dati statistici raccolti si ottiene la curva relativa a questa distribuzione, detta anche curva a campana (Fig.2). Il nome della curva deriva dalla tipica forma che la caratterizza: i dati con valori molto bassi hanno frequenze quasi nulle, il massimo viene raggiunto in corrispondenza del valor medio e la curva torna poi a calare in maniera simmetrica, con frequenze che ridiventano bassissime in corrispondenza dei valori più elevati [4].
La distribuzione Gaussiana comprende una famiglia di curve, caratterizzate fondamentalmente da due parametri (Fig. 2):
- la media μ, che stabilisce la posizione della curva lungo l’asse delle ascisse. Corrisponde in questa curva alla moda e alla mediana, e determina dunque il dato centrale della curva, nonché il dato presente con maggiore frequenza;
- la deviazione standard della popolazione σ (o la varianza – σ2), che determina l’ampiezza della curva. Quando la deviazione standard è piccola la curva è stretta ed allungata: ciò significa che i dati si addensano attorno al valore medio della distribuzione. Se la deviazione standard è invece grande, la curva si abbassa e si allarga, indicando dati più dispersi che si addensano meno attorno al valore medio [3,4].
La distribuzione della popolazione nella Gaussiana
In tutti i casi in cui si osserva una distribuzione normale però, si ha ovviamente un’identica distribuzione di probabilità del parametro analizzato all’interno della popolazione in esame (Fig.3). Ciò significa che in tutte le distribuzioni normali, per un dato parametro, il 68.27% della popolazione si trova all’interno dell’intervallo μ±σ e il 99.73% all’interno dell’intervallo μ±3σ, con dunque gli estremi delle code della distribuzione che includono solo lo 0.27% della popolazione esaminata.
Una distribuzione teorica è ovviamente una rappresentazione idealizzata dei dati, che va a coincidere perfettamente con le osservazioni sperimentali solo nel momento in cui esse sono in numero tendente all’infinito. Essa riporta cioè un’immagine della distribuzione di una variabile che non tiene conto di irregolarità minori e possibili outliers.
William Sealy Gosset e il problema dei piccoli numeri
Ed è a questo punto che torniamo nella Guinness Brewery, con un salto avanti nel tempo di oltre un secolo rispetto agli inizi.
All’inizio del XX secolo Guinness, si è ormai imposto come birrificio più grande al mondo. L’azienda si trova a dover affrontare il problema di migliorare la qualità del prodotto, garantendone oltretutto una maggiore ripetibilità in termini di consistenza della schiuma e contenuto alcolico [1]. Particolarmente importante specialmente il secondo, in quanto una gradazione alcolica troppo bassa non sarebbe gradita dai consumatori, mentre una gradazione troppo alta porterebbe ad una tassazione maggiore.
L’azienda crea dunque un primordiale reparto di controllo qualità, dotandosi di un team di giovani chimici e statistici, tra i quali figura William Sealy Gosset.
Assunto nel 1899, lavorò in Guinness per tutta la vita, approfondendo lo studio delle leggi della statistica ed elaborando nuovi modelli da applicare al controllo qualità, tra cui il test t di Student. Perchè Student? Questo è lo pseudonimo che lo stesso Gosset scelse, poiché la politica aziendale di Guinness permetteva ai dipendenti di pubblicare le proprie ricerche a patto di non menzionare il proprio nome o quello dell’azienda.
Lavorando nel birrificio, Gosset si rende conto dei limiti dei modelli statistici esistenti. Egli nota come le stime fatte, a partire dai dati provenienti dagli esperimenti, presentano un errore sempre maggiore man mano che il numero di osservazioni a disposizione diminuisce. Dopo aver ottenuto da Guinness la possibilità di trascorrere un anno presso il laboratorio di K. Pearson, Gosset concretizza i risultati dei suoi studi nella pubblicazione “The Probable Error of a Mean”, risalente al 1908, nella quale per la prima volta introduce il test t e la distribuzione t di Student come soluzione al problema della bassa numerosità dei campioni [6].
Il test t di Student
La distribuzione t di Student è caratterizzata da una forma a campana simile a quella della distribuzione normale, ma le code della distribuzione sottendono un’area maggiore, dunque una maggiore probabilità (Fig. 4). In particolare, tale distribuzione risulta preferibile quando la deviazione standard della popolazione di riferimento (σ) è sconosciuta ed è solamente stimabile tramite la deviazione standard del campione che si analizza (s), e/o quando il campione in esame ha una bassa numerosità. La forma esatta della distribuzione t dipende infatti dai gradi di libertà, che sono determinati dalla dimensione del campione.
Il test t, basato su tale distribuzione, è uno strumento statistico utilizzato per confrontare le medie di due campioni e determinare se le differenze osservate siano statisticamente significative o meno. La variabilità dei dati interni a ciascun gruppo viene quindi confrontata con le differenze tra i due gruppi tramite una comparazione del valore t, calcolato con i valori critici della distribuzione t per un determinato numero di gradi di libertà. In particolare, se la varianza di due gruppi posti a confronto è omogenea, nel confronto tra le due medie i gradi di libertà che si utilizzano per la distribuzione t sono dati dal numero totale di osservazioni (n1+n2) meno i parametri utilizzati per ottenere la stima della deviazione standard ossia, in questo caso, i valori delle due medie. Se dobbiamo stimare due medie quindi, i “pezzi di informazione” che non sono più liberi di variare sono due, e i gradi di libertà saranno uguali ad n1+n2-2.
Gosset osserva che, con un numero di campioni superiore a 30 le differenze di risultati ottenuti utilizzando il test t e il test z (il test associato alla distribuzione normale) risultano trascurabili, mentre il test t e l’utilizzo della distribuzione t si dimostrano necessari per gruppi campionari con numerosità minore di 30.
La Guinness di oggi
L’applicazione del test t e l’utilizzo della distribuzione t di Student permettono al birrificio di effettuare esperimenti e test dalla notevole rilevanza statistica pur con una numerosità campionaria bassa. Ciò consente alla Guinness di perfezionare il proprio prodotto sotto vari punti di vista.
In particolare:
- ottenendo una birra dal contenuto alcolico costante, tramite una migliore calibrazione della quantità di zucchero da aggiungere durante la fermentazione secondaria della birra;
- determinando la varietà migliore di orzo da utilizzare, sia in termini qualitativi che di resa per acro. Tali studi portano alla selezione della varietà Archer (Fig. 5);
- valutando l’ottimale grado di tostatura dell’orzo. All‘aumentare del livello di tostatura corrisponde infatti un colore più scuro della birra, oltre ad un sapore più robusto e intenso, nel quale gli aromi derivanti dal malto sovrastano quelli originati dal luppolo [1,2,8].
Tanti altri piccoli “segreti” caratterizzano questa birra leggendaria (quali la spillatura tramite una miscela di CO2 ed N2, che permette di ottenere la caratteristica schiuma fine e densa, pur mantenendo la birra ferma), alcuni implementati prima dell’arrivo di Gosset, altri in seguito. Gli studi di Gosset sono stati però un passo determinante per il perfezionamento di questa birra. La Guinness venne classificata dagli anni ’40 del XX secolo come Stout, avvicinandosi man mano alla versione moderna che ancora oggi rimane tra le birre più apprezzate del mondo e ha reso il St. James’s Gate Brewery un luogo di pellegrinaggio per gli appassionati del settore.
Conclusioni
La connessione tra Guinness e test t-Student rappresenta un interessante capitolo nella storia della statistica. Il test è nato infatti dalla necessità di affrontare le sfide legate alla produzione di birra presso la Guinness Brewery.
William Sealy Gosset, in particolare, ha portato alla nascita di un test che è ancora oggi ampiamente utilizzato quando si intende verificare ipotesi sulla differenza tra due gruppi aventi dimensioni relativamente piccole e deviazione standard della popolazione sconosciuta.
—
Speriamo che tu abbia trovato la lettura di questo articolo sul caso della birra Guinness interessante. Per altri contenuti simili, consulta la sezione QUALITA’ del nostro sito web. E se vuoi restare sempre al passo con le ultime novità in fatto di Agrifood, iscriviti alla nostra Newsletter!
[1] Giaccone L., Signoroni E. Il piacere della birra: Viaggio nel mondo della bevanda più antica. Slow Food Editore, 2017.
[2] Fermento Birra. Porter e Stout, le origini.
[3] Todeschini, R. Introduzione alla Chemiometria. EdiSES, 1998.
[4] Treccani. Enciclopedia della matematica. 2013.
[5] Okpedia. Distribuzione normale. 2018.
[6] Gosset W.S. The Probable Error of a Mean. Biometrika, 1908.
[7] Scribbr. Statistics, t-distribution. 2023.
[8] Box J.F. Guinness, Gosset, Fisher, and Small Samples. Statistical Science, 1987.
Federico Stilo
Consegue nel 2021 il titolo di Dottore di Ricerca in ambito Food Chemistry presso l’Università degli Studi di Torino, con un’attività di ricerca focalizzata sull’analisi dei composti volatili del cibo tramite GC-MS e GC×GC-MS. Dopo un’esperienza come analista nel Gruppo Tentamus, ha attualmente un ruolo manageriale presso Biosano Italia, azienda operante nel settore vitivinicolo e agroalimentare.