tecniche di machine learning per la classficazione della psd del
by user
Comments
Transcript
tecniche di machine learning per la classficazione della psd del
TECNICHE DI MACHINE LEARNING PER LA CLASSFICAZIONE DELLA PSD DEL POLVERINO IN IMPIANTI INDUSTRIALI Damiano Rossetti, Daniele Ferretti, Fabio Vesperini, Paolo Vecchiotti, Stefano Squartini Dipartimento di Ingegneria dell’Informazione, Università Politecnica delle Marche Via Brecce Bianche 12, 60131, Ancona, Italy, e-mail [email protected] La granulometria delle polveri è un parametro importante in molti processi industriali, perché influenza le proprietà fisiche e chimiche di un materiale. È importante quindi monitorare la dimensione della polvere durante il suo processo di lavorazione per verificare che la granulometria rientri nei limiti fissati per un corretto svolgimento del processo. Poiché si ha interesse a monitorare la dimensione di un insieme di particelle e non delle singole particelle, è necessario utilizzare parametri cumulativi per descriverne la granulometria, come la Particle Size Distribution (PSD). All’interno di impianti industriali, la valutazione della PSD è fatta normalmente prelevando campioni di polvere dal processo produttivo e analizzandoli in laboratorio. Naturalmente questo metodo produce una stima esatta della PSD per un determinato istante temporale, ma risulta molto dispendioso in termini di tempo e difficilmente utilizzabile per un monitoraggio continuo. Avendo la necessità di un monitoraggio continuo della dimensione della polvere, è necessario impiegare una tecnica che permetta una stima in maniera non invasiva per ogni istante temporale d’interesse. Le Acoustic Emission (AE) emesse dall’impatto della polvere con la superficie metallica del condotto in cui la polvere viene trasportata sono correlate con la dimensione della polvere stessa e per questo motivo permettono un monitoraggio non invasivo della PSD [1]. In un impianto industriale sono molte le fonti di AE, quindi non è semplice ricavare un correlazione esplicita tra le AE prodotte dalla polvere e la PSD della polvere. Date le premesse, è necessario utilizzare tecniche che permettano di creare modelli senza però conoscere tutte le variabili e tutte le fonti di disturbo che influenzano il processo. Gli autori di questa memoria hanno quindi svolto una ricerca per studiare tecniche di Machine Learning che possano essere impiegate per determinare la PSD tramite le AE generate dalla polvere. Il dataset utilizzato per questa ricerca è il dataset creato per il sistema POWdER [2], un sistema sviluppato dal Gruppo Loccioni per il monitoraggio della granulometria del polverino di carbone. Questo dataset contiene i dati ricavati dal monitoraggio di condotti per il trasporto del polverino in un impianto industriale per la produzione di energia, il dataset è suddiviso a sua volta in vari dataset associati ai condotti per il trasporto di carbone monitorati. La PSD del polverino è caratterizzata con tre mesh: MESH50 (300µm), MESH100 (150µm) e MESH200 (75µm). Il valore numerico associato con ogni mesh indica la percentuale di polverino di carbone del campione iniziale con dimensioni inferiore alla dimensione del mesh, per cui un vettore di 3 targets è associato ad ogni osservazione nel dataset. In un primo studio svolto dagli autori [3], sono state implementati tre differenti algoritmi di machine learning per la regressione: l’Artificial Neural Network (ANN) [4], la Support Vector Machine (SVM) [5] e l’Extreme Learning Machine (ELM) [6]. Questa memoria verte su un secondo studio fatto con l’idea di trasformare il problema di regressione in uno di classificazione. Per effettuare un tale cambiamento si è reso necessario intervenire sui target associati alle osservazioni del dataset analizzato. Sono stati considerati i Mesh 50 e 200, che identificano i le due dimensioni limite, e per ognuno di essi sono state scelte una o più soglie di labellizazione per in modo da associare ad ogni targets una classe. Tutte le tecniche elencate in precedenza (ANN, SVM e ELM) sono state riconvertite per l’addestramento di modelli per la classificazione. Ogni algoritmo è stato utilizzato con una procedura di Cross Validation KFolds con folds contenenti il 15% dell’intero dataset disponibile. Lo studio è stato fatto separatamente per i due mesh, in modo da avere, per ogni dataset utilizzato, due differenti modelli. Dal punto di vista industriale, il passaggio da regressione a classificazione può ritenersi valido in tutti quei contesti in cui non si ha la necessità di conoscere puntualmente la dimensione della polvere che viaggia all’interno del condotto, ma è necessario solamente sapere se la dimensione di quella polvere è accettabile o meno per il processo monitorato. Sono state esplorate varie strade per capire le potenzialità di questo nuovo approccio al problema. È stato variato il numero di classi, verificando l’accuratezza per una classificazione a 2 o 4 classi. L’utilizzo di due classi permette di discriminare le dimensioni di polvere corrette da quelle non accettabili, nelle Figura 1 e Figura 2 sono mostrati i valori di accuratezza medi per tutti i dataset dei condotti utilizzati per questo lavoro. L’utilizzo di 4 classi permette non solo di discriminare le dimensioni corrette da quelle errate ma anche di osservare il trend che sta seguendo la dimensione del polverino intervenendo prima che si verifichi una situazione pericolosa. Questo ulteriore livello di dettaglio porta tipicamente ad una diminuzione di accuratezza nella classificazione. Un altro studio condotto ha cercato di ottenere modelli che permettessero di eliminare i falsi positivi dai risultati del classificatore. I falsi positivi sono potenzialmente pericolosi in un sistema utilizzato per la sicurezza e il controllo in contesto industriale perché potrebbero portare ad una mancata rilevazione di condizioni operative indesiderate e potenzialmente pericolose. Un esempio dei risultati ottenuti per un condotto con l’algoritmo basato su SVM è mostrato nelle Tabella 1 e Tabella 2, come si può notare dai valori di “confusion matrix”, si possono ridurre i falsi positivi (in rosso) pur mantenendo una buona accuratezza di classificazione. Si è infine verificata la possibilità di ridurre il numero di osservazioni utilizzate per l’addestramento dei modelli con lo scopo di capire se sia possibile diminuire il numero di acquisizioni da fare per ogni impianto al fine di ridurre i tempi e i costi per la messa a punto di un sistema di classificazione della PSD in un nuovo impianto. Il lavoro di ricerca continuerà per verificare la possibilità di applicare le stesse tecniche di classificazione automatica anche per differenti tipi di impianti e differenti tipi di polvere. SVM ANN ELM 97.51% 97.34% 96.92% 100.00% 100.00% SVM ANN 94.02% Figura 2 - Accuratezza Media 2 classi - 200 mesh False Positive Reduction Standard Algorithm PREDICTED CLASSES ACTUAL CLASSES False Positive Reduction PREDICTED CLASSES 20.67 1.00 14.50 6.50 1.33 22.33 0.17 34.33 Tabella 1 – Confusion Matrix - 50 mesh -SVM 92.86% 92.35% 90.00% 90.00% Figura 1 – Accuratezza Media 2 classi - 50 mesh Standard Algorithm ELM ACTUAL CLASSES 28.33 0.83 27.50 1.67 0.50 15.67 0.33 15.83 Tabella 2 - Confusion Matrix - 200 mesh - SVM Bibliografia [1] M. Leach, G. Rubin e J. Williams, «Particle size determination from acoustic emissions,» Powder Technology, vol. 16, n. 2, pp. 153 - 158, 1977. [2] S. Collura, D. Possanzini, M. Gualerci, L. Bonelli e D. Pestonesi, Coal mill performances optimization through non-invasive online coal fineness monitoring, in Powergen, Vienna, 2013. [3] D. Rossetti, S. Squartini e S. Collura, «Machine Learning Techniques for the Estimation of Particle Size Distribution in Industrial Plants,» in Advances in Neural Networks, Springer International Publishing Switzerland, 2016. [4] S. Haykin, Neural Networks: A Comprehensive Foundation, Upper Saddle River, NJ, USA: Prentice Hall PTR, 1998. [5] V. N. Vapnik, The Nature of Statistical Learning Theory, New York, NY, USA: SpringerVerlag New York, Inc., 1995. [6] G.-B. Huang, Q.-Y. Zhu e C.-K. Siew, «Extreme learning machine: a new learning scheme of feedforward neural networks,» in Neural Networks, 2004. Proceedings. 2004 IEEE International Joint Conference on, vol. 2, 2004, pp. 985-990.