A Redundancy-Based Measure of Dissimilarity among Probability Distributions for Hierarchical Clustering Criteria

Authors:
Kazunori Iwata;Akira Hayashi
Affiliations:
-;-
Venue:
IEEE Transactions on Pattern Analysis and Machine Intelligence
Year:
2008

Citing 22
Cited 1

Elements of information theory

Elements of information theory
Algorithms for Model-Based Gaussian Hierarchical Clustering

SIAM Journal on Scientific Computing
An experimental comparison of model-based clustering methods

Machine Learning
Minimum-Entropy Data Partitioning Using Reversible Jump Markov Chain Monte Carlo

IEEE Transactions on Pattern Analysis and Machine Intelligence
Information Theoretic Clustering

IEEE Transactions on Pattern Analysis and Machine Intelligence
Neural Networks for Pattern Recognition

Neural Networks for Pattern Recognition
Mathematics of Information and Coding

Mathematics of Information and Coding
Improving Performance of Similarity-Based Clustering by Feature Weight Learning

IEEE Transactions on Pattern Analysis and Machine Intelligence
An Efficient k-Means Clustering Algorithm: Analysis and Implementation

IEEE Transactions on Pattern Analysis and Machine Intelligence
A Maximum Variance Cluster Algorithm

IEEE Transactions on Pattern Analysis and Machine Intelligence
Performance Evaluation of Some Clustering Algorithms and Validity Indices

IEEE Transactions on Pattern Analysis and Machine Intelligence
A New Cluster Isolation Criterion Based on Dissimilarity Increments

IEEE Transactions on Pattern Analysis and Machine Intelligence
Pattern Classification (2nd Edition)

Pattern Classification (2nd Edition)
Markov Edit Distance

IEEE Transactions on Pattern Analysis and Machine Intelligence
A Similarity-Based Robust Clustering Method

IEEE Transactions on Pattern Analysis and Machine Intelligence
Statistical Shape Analysis: Clustering, Learning, and Testing

IEEE Transactions on Pattern Analysis and Machine Intelligence
Automated Variable Weighting in k-Means Type Clustering

IEEE Transactions on Pattern Analysis and Machine Intelligence
Clustering of time series data-a survey

Pattern Recognition
Some inequalities for information divergence and related measures of discrimination

IEEE Transactions on Information Theory
A new metric for probability distributions

IEEE Transactions on Information Theory
A similarity metric for edge images

IEEE Transactions on Pattern Analysis and Machine Intelligence
Survey of clustering algorithms

IEEE Transactions on Neural Networks

Stochastic approximation learning for mixtures of multivariate elliptical distributions

Neurocomputing

Quantified Score

Hi-index	0.14

Visualization

Abstract

We introduce novel dissimilarity into a probabilistic clustering task to properly measure dissimilarity among multiple clusters when each cluster is characterized by a subpopulation in the mixture model. This measure of dissimilarity is called redundancy-based dissimilarity among probability distributions. From aspects of both source coding and a statistical hypothesis test, we shed light on several of the theoretical reasons for the redundancy-based dissimilarity among probability distributions being a reasonable measure of dissimilarity among clusters. We also elucidate a principle in common for the measures of redundancy-based dissimilarity and Ward’s method in terms of hierarchical clustering criteria. Moreover, we show several related theorems that are significant for clustering tasks. In the experiments, properties of the measure of redundancy-based dissimilarity are examined in comparison with several other measures.