tecniche di machine learning per la classficazione della psd del

by user

on 06 июля 2016

Category: Documents

>> Downloads: 2

views

Report

Comments

Description

Download tecniche di machine learning per la classficazione della psd del

Transcript

tecniche di machine learning per la classficazione della psd del

TECNICHE DI MACHINE LEARNING PER LA CLASSFICAZIONE
DELLA PSD DEL POLVERINO IN IMPIANTI INDUSTRIALI
Damiano Rossetti, Daniele Ferretti, Fabio Vesperini, Paolo Vecchiotti, Stefano Squartini
Dipartimento di Ingegneria dell’Informazione, Università Politecnica delle Marche
Via Brecce Bianche 12, 60131, Ancona, Italy, e-mail [email protected]
La granulometria delle polveri è un parametro importante in molti processi industriali, perché
influenza le proprietà fisiche e chimiche di un materiale. È importante quindi monitorare la
dimensione della polvere durante il suo processo di lavorazione per verificare che la granulometria
rientri nei limiti fissati per un corretto svolgimento del processo. Poiché si ha interesse a monitorare
la dimensione di un insieme di particelle e non delle singole particelle, è necessario utilizzare
parametri cumulativi per descriverne la granulometria, come la Particle Size Distribution (PSD).
All’interno di impianti industriali, la valutazione della PSD è fatta normalmente prelevando
campioni di polvere dal processo produttivo e analizzandoli in laboratorio. Naturalmente questo
metodo produce una stima esatta della PSD per un determinato istante temporale, ma risulta molto
dispendioso in termini di tempo e difficilmente utilizzabile per un monitoraggio continuo. Avendo
la necessità di un monitoraggio continuo della dimensione della polvere, è necessario impiegare una
tecnica che permetta una stima in maniera non invasiva per ogni istante temporale d’interesse. Le
Acoustic Emission (AE) emesse dall’impatto della polvere con la superficie metallica del condotto
in cui la polvere viene trasportata sono correlate con la dimensione della polvere stessa e per questo
motivo permettono un monitoraggio non invasivo della PSD [1]. In un impianto industriale sono
molte le fonti di AE, quindi non è semplice ricavare un correlazione esplicita tra le AE prodotte
dalla polvere e la PSD della polvere.
Date le premesse, è necessario utilizzare tecniche che permettano di creare modelli senza però
conoscere tutte le variabili e tutte le fonti di disturbo che influenzano il processo. Gli autori di
questa memoria hanno quindi svolto una ricerca per studiare tecniche di Machine Learning che
possano essere impiegate per determinare la PSD tramite le AE generate dalla polvere.
Il dataset utilizzato per questa ricerca è il dataset creato per il sistema POWdER [2], un sistema
sviluppato dal Gruppo Loccioni per il monitoraggio della granulometria del polverino di carbone.
Questo dataset contiene i dati ricavati dal monitoraggio di condotti per il trasporto del polverino in
un impianto industriale per la produzione di energia, il dataset è suddiviso a sua volta in vari dataset
associati ai condotti per il trasporto di carbone monitorati. La PSD del polverino è caratterizzata con
tre mesh: MESH50 (300µm), MESH100 (150µm) e MESH200 (75µm). Il valore numerico
associato con ogni mesh indica la percentuale di polverino di carbone del campione iniziale con
dimensioni inferiore alla dimensione del mesh, per cui un vettore di 3 targets è associato ad ogni
osservazione nel dataset. In un primo studio svolto dagli autori [3], sono state implementati tre
differenti algoritmi di machine learning per la regressione: l’Artificial Neural Network (ANN) [4],
la Support Vector Machine (SVM) [5] e l’Extreme Learning Machine (ELM) [6].
Questa memoria verte su un secondo studio fatto con l’idea di trasformare il problema di
regressione in uno di classificazione. Per effettuare un tale cambiamento si è reso necessario
intervenire sui target associati alle osservazioni del dataset analizzato. Sono stati considerati i Mesh
50 e 200, che identificano i le due dimensioni limite, e per ognuno di essi sono state scelte una o più
soglie di labellizazione per in modo da associare ad ogni targets una classe. Tutte le tecniche
elencate in precedenza (ANN, SVM e ELM) sono state riconvertite per l’addestramento di modelli
per la classificazione. Ogni algoritmo è stato utilizzato con una procedura di Cross Validation KFolds con folds contenenti il 15% dell’intero dataset disponibile. Lo studio è stato fatto
separatamente per i due mesh, in modo da avere, per ogni dataset utilizzato, due differenti modelli.
Dal punto di vista industriale, il passaggio da regressione a classificazione può ritenersi valido in
tutti quei contesti in cui non si ha la necessità di conoscere puntualmente la dimensione della
polvere che viaggia all’interno del condotto, ma è necessario solamente sapere se la dimensione di
quella polvere è accettabile o meno per il processo monitorato. Sono state esplorate varie strade per
capire le potenzialità di questo nuovo approccio al problema.
È stato variato il numero di classi, verificando l’accuratezza per una classificazione a 2 o 4
classi. L’utilizzo di due classi permette di discriminare le dimensioni di polvere corrette da quelle
non accettabili, nelle Figura 1 e Figura 2 sono mostrati i valori di accuratezza medi per tutti i dataset
dei condotti utilizzati per questo lavoro. L’utilizzo di 4 classi permette non solo di discriminare le
dimensioni corrette da quelle errate ma anche di osservare il trend che sta seguendo la dimensione
del polverino intervenendo prima che si verifichi una situazione pericolosa. Questo ulteriore livello
di dettaglio porta tipicamente ad una diminuzione di accuratezza nella classificazione.
Un altro studio condotto ha cercato di ottenere modelli che permettessero di eliminare i falsi
positivi dai risultati del classificatore. I falsi positivi sono potenzialmente pericolosi in un sistema
utilizzato per la sicurezza e il controllo in contesto industriale perché potrebbero portare ad una
mancata rilevazione di condizioni operative indesiderate e potenzialmente pericolose. Un esempio
dei risultati ottenuti per un condotto con l’algoritmo basato su SVM è mostrato nelle Tabella 1 e
Tabella 2, come si può notare dai valori di “confusion matrix”, si possono ridurre i falsi positivi (in
rosso) pur mantenendo una buona accuratezza di classificazione. Si è infine verificata la possibilità
di ridurre il numero di osservazioni utilizzate per l’addestramento dei modelli con lo scopo di capire
se sia possibile diminuire il numero di acquisizioni da fare per ogni impianto al fine di ridurre i
tempi e i costi per la messa a punto di un sistema di classificazione della PSD in un nuovo impianto.
Il lavoro di ricerca continuerà per verificare la possibilità di applicare le stesse tecniche di
classificazione automatica anche per differenti tipi di impianti e differenti tipi di polvere.
SVM ANN ELM
97.51% 97.34% 96.92%
100.00%
100.00%
SVM
ANN
94.02%
Figura 2 - Accuratezza Media 2 classi - 200 mesh
False Positive Reduction
Standard Algorithm
PREDICTED CLASSES
ACTUAL
CLASSES
False Positive Reduction
PREDICTED CLASSES
20.67
1.00
14.50
6.50
1.33
22.33
0.17
34.33
Tabella 1 – Confusion Matrix - 50 mesh -SVM
92.86% 92.35%
90.00%
90.00%
Figura 1 – Accuratezza Media 2 classi - 50 mesh
Standard Algorithm
ELM
ACTUAL
CLASSES
28.33
0.83
27.50
1.67
0.50
15.67
0.33
15.83
Tabella 2 - Confusion Matrix - 200 mesh - SVM
Bibliografia
[1] M. Leach, G. Rubin e J. Williams, «Particle size determination from acoustic emissions,»
Powder Technology, vol. 16, n. 2, pp. 153 - 158, 1977.
[2] S. Collura, D. Possanzini, M. Gualerci, L. Bonelli e D. Pestonesi, Coal mill performances
optimization through non-invasive online coal fineness monitoring, in Powergen, Vienna, 2013.
[3] D. Rossetti, S. Squartini e S. Collura, «Machine Learning Techniques for the Estimation of
Particle Size Distribution in Industrial Plants,» in Advances in Neural Networks, Springer
International Publishing Switzerland, 2016.
[4] S. Haykin, Neural Networks: A Comprehensive Foundation, Upper Saddle River, NJ, USA:
Prentice Hall PTR, 1998.
[5] V. N. Vapnik, The Nature of Statistical Learning Theory, New York, NY, USA: SpringerVerlag New York, Inc., 1995.
[6] G.-B. Huang, Q.-Y. Zhu e C.-K. Siew, «Extreme learning machine: a new learning scheme of
feedforward neural networks,» in Neural Networks, 2004. Proceedings. 2004 IEEE
International Joint Conference on, vol. 2, 2004, pp. 985-990.