Recently, there has been an increasing interest in developing tools able to find groups in matrix-valued data. To this extent, matrix Gaussian mixture models (MGMM) represent an extension of the popular model-based clustering based on normal mixtures. Unfortunately overparametrization issues, already affecting the vector-variate framework, are exacerbated in the MGMM one, where the number of parameters grows quadratically with both row and column dimensions. To overcome this limitation, we introduce a sparse model-based clustering approach for three-way data structures. The proposed penalized estimation scheme, shrinking the estimates towards zero, achieves more stable and parsimonious clustering in high-dimensional scenarios. An application to satellite images underlines the benefits of the proposal
Il crescente interesse verso metodi in grado di identificare gruppi in dati matriciali ha portato allo sviluppo di modelli di mistura matriciali Gaussiani (MGMM) che rappresentano una naturale estensione del clustering basato su misture di normali. L’eccessiva parametrizzazione, che già interessa il contesto vettoriale, e particolarmente evidente nei MGMM dove il numero di parametri cresce all’aumentare sia del numero di righe che di colonne. Al fine di superare questa limitazione, in questo lavoro si introduce un approccio di clustering basato su modelli sparsi per dati matriciali. La procedura di stima penalizzata adottata permette di ottenere un clustering più stabile e parsimonioso in scenari ad alta dimensione. Un’applicazione a immagini satellitari evidenzia i vantaggi del metodo proposto
(2021). Penalized model-based clustering for three-way data structures = Clustering penalizzato basato su un modello per dati con struttura tridimensionale . Retrieved from https://hdl.handle.net/10446/269576
Penalized model-based clustering for three-way data structures = Clustering penalizzato basato su un modello per dati con struttura tridimensionale
Casa, Alessandro;
2021-01-01
Abstract
Recently, there has been an increasing interest in developing tools able to find groups in matrix-valued data. To this extent, matrix Gaussian mixture models (MGMM) represent an extension of the popular model-based clustering based on normal mixtures. Unfortunately overparametrization issues, already affecting the vector-variate framework, are exacerbated in the MGMM one, where the number of parameters grows quadratically with both row and column dimensions. To overcome this limitation, we introduce a sparse model-based clustering approach for three-way data structures. The proposed penalized estimation scheme, shrinking the estimates towards zero, achieves more stable and parsimonious clustering in high-dimensional scenarios. An application to satellite images underlines the benefits of the proposalFile | Dimensione del file | Formato | |
---|---|---|---|
Cappozzo et al_SIS_2021.pdf
Solo gestori di archivio
Versione:
publisher's version - versione editoriale
Licenza:
Licenza default Aisberg
Dimensione del file
340.11 kB
Formato
Adobe PDF
|
340.11 kB | Adobe PDF | Visualizza/Apri |
Pubblicazioni consigliate
Aisberg ©2008 Servizi bibliotecari, Università degli studi di Bergamo | Terms of use/Condizioni di utilizzo