Recently, there has been an increasing interest in developing tools able to find groups in matrix-valued data. To this extent, matrix Gaussian mixture models (MGMM) represent an extension of the popular model-based clustering based on normal mixtures. Unfortunately overparametrization issues, already affecting the vector-variate framework, are exacerbated in the MGMM one, where the number of parameters grows quadratically with both row and column dimensions. To overcome this limitation, we introduce a sparse model-based clustering approach for three-way data structures. The proposed penalized estimation scheme, shrinking the estimates towards zero, achieves more stable and parsimonious clustering in high-dimensional scenarios. An application to satellite images underlines the benefits of the proposal

Il crescente interesse verso metodi in grado di identificare gruppi in dati matriciali ha portato allo sviluppo di modelli di mistura matriciali Gaussiani (MGMM) che rappresentano una naturale estensione del clustering basato su misture di normali. L’eccessiva parametrizzazione, che già interessa il contesto vettoriale, e particolarmente evidente nei MGMM dove il numero di parametri cresce all’aumentare sia del numero di righe che di colonne. Al fine di superare questa limitazione, in questo lavoro si introduce un approccio di clustering basato su modelli sparsi per dati matriciali. La procedura di stima penalizzata adottata permette di ottenere un clustering più stabile e parsimonioso in scenari ad alta dimensione. Un’applicazione a immagini satellitari evidenzia i vantaggi del metodo proposto

(2021). Penalized model-based clustering for three-way data structures = Clustering penalizzato basato su un modello per dati con struttura tridimensionale . Retrieved from https://hdl.handle.net/10446/269576

Penalized model-based clustering for three-way data structures = Clustering penalizzato basato su un modello per dati con struttura tridimensionale

Casa, Alessandro;
2021-01-01

Abstract

Recently, there has been an increasing interest in developing tools able to find groups in matrix-valued data. To this extent, matrix Gaussian mixture models (MGMM) represent an extension of the popular model-based clustering based on normal mixtures. Unfortunately overparametrization issues, already affecting the vector-variate framework, are exacerbated in the MGMM one, where the number of parameters grows quadratically with both row and column dimensions. To overcome this limitation, we introduce a sparse model-based clustering approach for three-way data structures. The proposed penalized estimation scheme, shrinking the estimates towards zero, achieves more stable and parsimonious clustering in high-dimensional scenarios. An application to satellite images underlines the benefits of the proposal
2021
Cappozzo, Andrea; Casa, Alessandro; Fop, Michael
File allegato/i alla scheda:
File Dimensione del file Formato  
Cappozzo et al_SIS_2021.pdf

Solo gestori di archivio

Versione: publisher's version - versione editoriale
Licenza: Licenza default Aisberg
Dimensione del file 340.11 kB
Formato Adobe PDF
340.11 kB Adobe PDF   Visualizza/Apri
Pubblicazioni consigliate

Aisberg ©2008 Servizi bibliotecari, Università degli studi di Bergamo | Terms of use/Condizioni di utilizzo

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10446/269576
Citazioni
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact