Dimensionality reduction when data are density functions

Authors:
P. Delicado
Affiliations:
Universitat Politècnica de Catalunya, Barcelona, Spain
Venue:
Computational Statistics & Data Analysis
Year:
2011

Citing 5
Cited 5

The statistical analysis of compositional data

The statistical analysis of compositional data
Classifying densities using functional regression trees: Applications in oceanology

Computational Statistics & Data Analysis
Editorial: Statistics for Functional Data

Computational Statistics & Data Analysis
An overview to modelling functional data

Computational Statistics
Variational Bayesian functional PCA

Computational Statistics & Data Analysis

Functional density synchronization

Computational Statistics & Data Analysis
Principal components for multivariate functional data

Computational Statistics & Data Analysis
Functional data analysis in shape analysis

Computational Statistics & Data Analysis
Model-based clustering of probability density functions

Advances in Data Analysis and Classification
A hierarchical modeling approach for clustering probability density functions

Computational Statistics & Data Analysis

Quantified Score

Hi-index	0.03

Visualization

Abstract

Functional Data Analysis deals with samples where a whole function is observed for each individual. A relevant case of FDA is when the observed functions are density functions. Among the particular characteristics of density functions, the most of the fact that they are an example of infinite dimensional compositional data (parts of some whole which only carry relative information) is made. Several dimensionality reduction methods for this particular type of data are compared: functional principal components analysis with or without a previous data transformation, and multidimensional scaling for different inter-density distances, one of them taking into account the compositional nature of density functions. The emphasis is on the steps previous and posterior to the application of a particular dimensionality reduction method: care must be taken in choosing the right density function transformation and/or the appropriate distance between densities before performing dimensionality reduction; subsequently the graphical representation of dimensionality reduction results must take into account that the observed objects are density functions. The different methods are applied to artificial and real data (population pyramids for 223 countries in year 2000). As a global conclusion, the use of multidimensional scaling based on compositional distance is recommended.