Indice
Cos’è il Design of Experiment?
Il Design of Experiment (DoE) è un metodo statistico che guida nella decisione di quali e quanti esperimenti effettuare per massimizzare l’informazione estratta da un processo/sistema chimico, minimizzando al contempo gli sforzi sperimentali, e di conseguenza i tempi e i costi [1]. Questo concetto fu introdotto da Ronald A. Fisher [2] che sviluppò l’idea di pianificazione e selezione razionale degli esperimenti da condurre per ottenere la miglior conoscenza possibile del sistema in esame.
Il DoE è basato sull’idea che ogni sistema sperimentale sia caratterizzato da variabili – qualitative o quantitative – che solitamente non sono del tutto indipendenti le une dalle altre, rendendo necessario un approccio che consideri e studi contemporaneamente tutte le variabili e le interazioni fra loro [1,3,4]. L’approccio che il DoE utilizza si contrappone alla strategia one-variable-at-a-time (OVAT), la quale procede cambiando una variabile alla volta e mantenendo costanti le altre, al fine di studiare separatamente l’effetto di ogni singola variabile.
I vantaggi del DOE rispetto all’OVAT
Sebbene la programmazione dei test da effettuare utilizzando l’approccio OVAT ci possa sembrare più intuitiva, tale metodologia presenta una serie di limiti non trascurabili.
In particolare:
- perde di vista le interazioni fra le variabili;
- esplora solo una piccola parte del dominio sperimentale;
- con un crescente numero di variabili richiederebbe un numero enorme di esperimenti [1,3,4].
Il DoE segue invece un workflow differente e solitamente si sviluppa nelle seguenti fasi:
- definizione dell’obiettivo;
- definizione delle variabili potenzialmente impattanti sul sistema;
- definizione del range entro cui studiare ogni variabile e decisione del modello da applicare, pianificando quindi gli esperimenti da svolgere;
- esecuzione degli esperimenti;
- analisi dei risultati.
Quello che differenzia un DoE da un altro è dunque principalmente la scelta del modello da applicare (oltre alle variabili, che ovviamente sono strettamente connesse al sistema/processo preso in esame).
I differenti modelli spiegano in che modo esplorare lo spazio sperimentale definito dai range entro cui esplorare le variabili, e indicano quindi quali condizioni sperimentali testare.
Tipologie e modelli di Design of Experiment
Esistono due tipologie principali di DoE:
- Mixture design: utilizzato per miscele (ad esempio nell’ottimizzare le proporzioni tra gli ingredienti di una torta), caratterizzate dal fatto che la somma di tutte le variabili debba essere uguale ad 1 (corrispondente al 100%);
- Design of independent variables: in questo tipo di DoE ogni variabile può assumere un qualunque valore all’interno del range stabilito per quella variabile, a prescindere dal valore assunto dalle altre [2,4].
Design of independent variables
Il design of independent variables si articola a sua volta in due sottocategorie, a seconda della finalità per la quale viene utilizzato: screening designs e response surface methologies.
Screening designs
Lo screening design è utilizzato per selezionare le variabili rilevanti all’interno di un sistema, eliminando quelle poco o per nulla significative (Fig. 1). I modelli più utilizzati all’interno di questa categoria sono:
- Plackett-Burman design: permette di valutare rapidamente il contributo di un gran numero di variabili senza considerare le interazioni fra loro. Ogni variabile viene testata su 2 livelli (il minimo e il massimo del range stabilito per quella variabile) e richiede N esperimenti per valutare N-1 variabili;
- Full (o fractional) factorial design a 2 livelli: non propriamente un design di screening (valuta anche le interazioni fra le variabili), ma di semplice struttura e dunque spesso usato per questo scopo. Il numero di esperimenti necessari, date k variabili, è pari a 2k; non è dunque adatto quando il numero di variabili da valutare è elevato. Una variante di questo modello è il fraction factorial design, nel quale non si valutano le interazioni fra le variabili e il numero di esperimenti risulta dunque ridotto [2,4].
Response surface methodologies
Le response surface methodologies sono i modelli più utilizzati per ottimizzare processi al fine di determinarne le condizioni ideali; in caso di sistemi con molte variabili si utilizzano dopo una scrematura delle variabili ad opera di uno dei modelli di screening.
I modelli a superficie di risposta generano un output grafico molto intuitivo (Fig. 2), che illustra chiaramente la relazione tra coppie di variabili sperimentali e la risposta [5]. I modelli più utilizzati, dovendo mediare fra la necessità di non svolgere troppi esperimenti e valutare sia le singole variabili che le interazioni fra esse, sono:
- Box-Behnken design: molto utilizzato, ma non esplora i punti estremi del dominio, dunque non è adatto nel caso in cui le condizioni ottimali corrispondano agli estremi [5,6];
- central composite design: corrisponde ad un full factorial design a 2 livelli, al quale viene aggiunta l’esplorazione di alcuni star points [1];
- Doehlert design: esplora un dominio sperimentale di tipo esagonale, permettendo di svolgere meno esperimenti dei due precedenti modelli, pur studiando comunque le interazioni fra le variabili [1,5].
Caso studio
Proviamo a rendere più concreto quanto detto fin qui analizzando un caso studio reale [7]: nella pubblicazione in esame gli autori hanno avuto come obiettivo quello di valutare le potenzialità dei residui della potatura dell’uva come fonte di composti fenolici. In particolare, il DoE è stato utilizzato per ottimizzare la fase di estrazione di tali composti.
Prima di tutto si è scelto un modello di screening design (Fig. 3A) per valutare se tutte le variabili caratterizzanti l’estrazione (solvente, tempo e temperatura di estrazione, quantità di matrice, volume di solvente) risultassero rilevanti, e i risultati hanno indicato come significative tutte queste variabili. A questo punto, per motivi spiegati all’interno del paper [7], gli autori hanno imposto i parametri relativi al solvente, al tempo e alla temperatura di estrazione, procedendo invece all’ottimizzazione della quantità di matrice e del volume di solvente utilizzati tramite un response surface design (Fig. 3B).
Una volta stilato il piano sperimentale previsto dal modello scelto, ed eseguiti gli esperimenti, la superficie di risposta generata ha portato ad individuare come condizioni ottimali 500mg di matrice e 50 ml di solvente. Gli autori hanno infine effettuato un test con quantità minori (100 mg di matrice e 10 ml di solvente), esterne ai range iniziali previsti, per risparmiare in termini di matrice e solventi utilizzati: ottenendo la medesima risposta dal sistema, hanno avuto conferma del fatto che ad essere determinante fosse la proporzione tra le due variabili.
Valutazione di un modello
Il processo non termina però ottenendo le condizioni sperimentali ottimali: è infatti necessario essere in grado di analizzare la bontà del modello e dei risultati acquisiti.
Esistono vari parametri che ci possono aiutare a valutare la qualità e il significato del modello ottenuto come risultato dell’applicazione di un DoE:
- Residual standard deviation % (RSD%): indica la ripetibilità degli esperimenti ed è solitamente calcolata sulle repliche del punto centrale, per tutte le variabili monitorate. In linea di massima può essere considerata accettabile sotto il 20%;
- i residui (Fig. 4A): indicano la distanza tra il valore della risposta nei punti sperimentali e in quelli teorici elaborati dal modello. Questa valutazione può essere espressa numericamente tramite il parametro della varianza spiegata: valori superiori a 0.7/0.8 sono solitamente considerati accettabili [1,5];
- i coefficienti (Fig. 4B): indicano la significatività delle singole variabili all’interno del modello (1,2,3), ma anche la significatività delle interazioni tra le variabili (4,5,6) e dei termini quadratici delle singole variabili (7,8,9) [1];
- superficie di risposta (Fig. 4C): la forma della superficie di risposta non ci dà informazioni sulla qualità del modello, ma risulta molto utile per visualizzare interazioni tra coppie di variabili e/o il contributo che esse hanno nel definire la risposta del sistema.
Considerazioni finali
Questa introduzione al Design of Experiment non ha certo la pretesa di essere esaustiva, ma il take home message è il seguente: quando si approccia un sistema o un processo per approfondire il ruolo delle variabili che lo caratterizzano, l’utilizzo del DoE permette di ottenere risultati migliori rispetto a quelli derivanti da un approccio OVAT, rendendo in aggiunta più efficiente il processo di studio, con un conseguente risparmio in termini di tempi e costi.
Per definire le condizioni necessarie ad ottenere le performance migliori dal sistema/processo in esame, risultano oltretutto cruciali la scelta del modello più adatto e la capacità di interpretare correttamente i risultati ottenuti.
—
Speriamo che tu abbia trovato la lettura di questo articolo sul Design of Experiment interessante. Per altri contenuti simili, consulta la sezione Ricerca e Sviluppo del nostro sito web. E se vuoi restare sempre al passo con le ultime novità in fatto di Agrifood, iscriviti alla nostra Newsletter!
[1] Benedetti, B.; Caponigro, V.; Ardini, F. Experimental Design Step by Step: A Practical Guide for Beginners. Crit. Rev. Anal. Chem. 2020, 0 (0), 1–14.
[2] Fisher, R. A. The Design of Experiments. Hafner Press 1935.
[3] Leardi, R. Experimental Design. In Data Handling in Science and Technology; Copyright © 2013 Elsevier B.V. All rights reserved., 2013; Vol. 28, pp 9–53.
[4] Leardi, R. Experimental Design in Chemistry: A Tutorial. Anal. Chim. Acta 2009, 652 (1–2), 161–172.
[5] Lundstedt, T.; Seifert, E.; Abramo, L.; Thelin, B.; Nyström, Å.; Pettersen, J.; Bergman, R. Experimental Design and Optimization. Chemom. Intell. Lab. Syst. 1998, 42 (1–2), 3–40.
[6] Ferreira, S. L. C.; Bruns, R. E.; Ferreira, H. S.; Matos, G. D.; David, J. M.; Brandão, G. C.; da Silva, E. G. P.; Portugal, L. A.; dos Reis, P. S.; Souza, A. S.; dos Santos, W. N. L. BoxBehnken Design: An Alternative for the Optimization of Analytical Methods. Anal. Chim. Acta 2007, 597 (2), 179–186.
[7] Acquadro S., Appleton S., Marengo A., Bicchi C., Sgorbini B., Mandrone M., Gai F., Peiretti P.B., Cagliero C.; Rubiolo P., Grapevine Green Pruning Residues as a Promising and Sustainable Source of Bioactive Phenolic Compounds. Molecules, 2020, 25, 464.
Federico Stilo
Consegue nel 2021 il titolo di Dottore di Ricerca in ambito Food Chemistry presso l’Università degli Studi di Torino, con un’attività di ricerca focalizzata sull’analisi dei composti volatili del cibo tramite GC-MS e GC×GC-MS. Dopo un’esperienza come analista nel Gruppo Tentamus, ha attualmente un ruolo manageriale presso Biosano Italia, azienda operante nel settore vitivinicolo e agroalimentare.