In modal clustering framework groups are regarded as the domains of attraction of the modes of probability density function underlying the data. Operationally, to obtain a partition, a nonparametric density estimate is required and kernel density estimator is commonly considered. When resorting to these methods a relevant issue regards the selection of the smoothing parameter governing the shape of the density and hence possibly the modal structure. In this work we propose a criterion to choose the bandwidth, specifically tailored for the clustering problem since based on the minimization of the distance between a partition of the data induced by the kernel estimator and the whole-space partition induced by the true density

Nell’ambito del clustering, l’approccio modale associa i gruppi ai domini di attrazione delle mode della funzione di densità sottostante i dati. L’individuazione dei gruppi richiede una stima non parametrica della densità, spesso basata su metodi kernel. Un problema rilevante, a tale scopo, riguarda la selezione del parametro di lisciamento che governa la forma della densità e, di conseguenza, la struttura modale. In questo lavoro si propone un criterio per la selezione del parametro di lisciamento, specificamente orientato al problema del clustering non parametrico e basato sulla minimizzazione di una misura di distanza tra la partizione dei dati indotta da uno stimatore kernel e la partizione dello spazio indotta dalla vera funzione di densità

(2018). On the choice of an appropriate bandwidth for modal clustering = Scelta di un appropriato parametro di lisciamento per ilclustering modale . Retrieved from https://hdl.handle.net/10446/269565

On the choice of an appropriate bandwidth for modal clustering = Scelta di un appropriato parametro di lisciamento per il clustering modale

Casa, Alessandro;
2018-01-01

Abstract

In modal clustering framework groups are regarded as the domains of attraction of the modes of probability density function underlying the data. Operationally, to obtain a partition, a nonparametric density estimate is required and kernel density estimator is commonly considered. When resorting to these methods a relevant issue regards the selection of the smoothing parameter governing the shape of the density and hence possibly the modal structure. In this work we propose a criterion to choose the bandwidth, specifically tailored for the clustering problem since based on the minimization of the distance between a partition of the data induced by the kernel estimator and the whole-space partition induced by the true density
2018
Casa, Alessandro; Chacón, José E.; Menardi, Giovanna
File allegato/i alla scheda:
File Dimensione del file Formato  
Casa et al_SIS_2018.pdf

Solo gestori di archivio

Versione: publisher's version - versione editoriale
Licenza: Licenza default Aisberg
Dimensione del file 969.41 kB
Formato Adobe PDF
969.41 kB Adobe PDF   Visualizza/Apri
Pubblicazioni consigliate

Aisberg ©2008 Servizi bibliotecari, Università degli studi di Bergamo | Terms of use/Condizioni di utilizzo

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10446/269565
Citazioni
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact