Automatic evaluation of pathologic speech - from research to routine clinical use

  • Authors:
  • Elmar Nöth;Andreas Maier;Tino Haderlein;Korbinian Riedhammer;Frank Rosanowski;Maria Schuster

  • Affiliations:
  • Universität Erlangen-Nürnberg, Lehrstuhl für Mustererkennung, Erlangen, Germany;Universität Erlangen-Nürnberg, Lehrstuhl für Mustererkennung, Erlangen, Germany and Universität Erlangen-Nürnberg, Abteilung für Phoniatrie und Pädaudiologie, Er ...;Universität Erlangen-Nürnberg, Lehrstuhl für Mustererkennung, Erlangen, Germany and Universität Erlangen-Nürnberg, Abteilung für Phoniatrie und Pädaudiologie, Er ...;Universität Erlangen-Nürnberg, Lehrstuhl für Mustererkennung, Erlangen, Germany;Universität Erlangen-Nürnberg, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Germany;Universität Erlangen-Nürnberg, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Germany

  • Venue:
  • TSD'07 Proceedings of the 10th international conference on Text, speech and dialogue
  • Year:
  • 2007

Quantified Score

Hi-index 0.00

Visualization

Abstract

Previously we have shown that ASR technology can be used to objectively evaluate pathologic speech. Here we report on progress for routine clinical use: 1) We introduce an easy-to-use recording and evaluation environment. 2) We confirm our previous results for a larger group of patients. 3) We show that telephone speech can be analyzed with the same methods with only a small loss of agreement with human experts. 4) We show that prosodic information leads to more robust results. 5) We show that text reference instead of transliteration can be used for evaluation. Using word accuracy of a speech recognizer and prosodic features as features for SVM regression, we achieve a correlation of .90 between the automatic analysis and human experts.