Which dissimilarity is to be used when extracting typologies in sequence analysis? a comparative study

Authors:
Sébastien Massoni;Madalina Olteanu;Nathalie Villa-Vialaneix
Affiliations:
Centre d'Economie de la Sorbonne, UMR CNRS 8174, Université Paris 1, France;SAMM, EA 4543, Université Paris 1, Paris, France;SAMM, EA 4543, Université Paris 1, Paris, France,Unité MIAT, INRA de Toulouse, Auzeville, France
Venue:
IWANN'13 Proceedings of the 12th international conference on Artificial Neural Networks: advances in computational intelligence - Volume Part I
Year:
2013

Citing 4
Cited 0

Self-Organizing Maps

Self-Organizing Maps
Fast algorithm and implementation of dissimilarity self-organizing maps

Neural Networks - 2006 Special issue: Advances in self-organizing maps--WSOM'05
Extracting Knowledge from Life Courses: Clustering and Visualization

DaWaK '08 Proceedings of the 10th international conference on Data Warehousing and Knowledge Discovery
Career-Path Analysis Using Optimal Matching and Self-Organizing Maps

WSOM '09 Proceedings of the 7th International Workshop on Advances in Self-Organizing Maps

Quantified Score

Hi-index	0.00

Visualization

Abstract

Originally developed in bioinformatics, sequence analysis is being increasingly used in social sciences for the study of life-course processes. The methodology generally employed consists in computing dissimilarities between the trajectories and, if typologies are sought, in clustering the trajectories according to their similarities or dissemblances. The choice of an appropriate dissimilarity measure is a major issue when dealing with sequence analysis for life sequences. Several dissimilarities are available in the literature, but neither of them succeeds to become indisputable. In this paper, instead of deciding upon one dissimilarity measure, we propose to use an optimal convex combination of different dissimilarities. The optimality is automatically determined by the clustering procedure and is defined with respect to the within-class variance.