The EuTrans Spoken Language Translation System

  • Authors:
  • Juan Carlos Amengual;Asunción Castaño;Antonio Castellanos;Victor M. Jiménez;David Llorens;Andrés Marzal;Federico Prat;Juan Miguel Vilar;José Miguel Benedi;Francisco Casacuberta;Moisés Pastor;Enrique Vidal

  • Affiliations:
  • Departamento de Lenguajes y Sistemas de Informáticos, Campus Riu Sec, Universitat Jaume I, 12071 Castellón de la Plana, Spain;Departamento de Lenguajes y Sistemas de Informáticos, Campus Riu Sec, Universitat Jaume I, 12071 Castellón de la Plana, Spain;Departamento de Lenguajes y Sistemas de Informáticos, Campus Riu Sec, Universitat Jaume I, 12071 Castellón de la Plana, Spain;Departamento de Lenguajes y Sistemas de Informáticos, Campus Riu Sec, Universitat Jaume I, 12071 Castellón de la Plana, Spain;Departamento de Lenguajes y Sistemas de Informáticos, Campus Riu Sec, Universitat Jaume I, 12071 Castellón de la Plana, Spain;Departamento de Lenguajes y Sistemas de Informáticos, Campus Riu Sec, Universitat Jaume I, 12071 Castellón de la Plana, Spain;Departamento de Lenguajes y Sistemas de Informáticos, Campus Riu Sec, Universitat Jaume I, 12071 Castellón de la Plana, Spain;Departamento de Lenguajes y Sistemas de Informáticos, Campus Riu Sec, Universitat Jaume I, 12071 Castellón de la Plana, Spain;Departamento de Sistemas Informáticos y Computación and Instituto Tecnológico de Informática, Universidad Politécnica de Valencia, 46022 Valencia, Spain;Departamento de Sistemas Informáticos y Computación and Instituto Tecnológico de Informática, Universidad Politécnica de Valencia, 46022 Valencia, Spain;Departamento de Sistemas Informáticos y Computación and Instituto Tecnológico de Informática, Universidad Politécnica de Valencia, 46022 Valencia, Spain;Departamento de Sistemas Informáticos y Computación and Instituto Tecnológico de Informática, Universidad Politécnica de Valencia, 46022 Valencia, Spain

  • Venue:
  • Machine Translation
  • Year:
  • 2000

Quantified Score

Hi-index 0.00

Visualization

Abstract

The EuTransAll project aims at using example-based approaches for the automatic development of Machine Translation systems accepting text and speech input for limited-domain applications. During the first phase of the project, a speech-translation system that is based on the use of automatically learned subsequential transducers has been built. This paper contains a detailed and mostly self-contained overview of the transducer-learning algorithms and system architecture, along with a new approach for using categories representing words or short phrases in both input and output languages. Experimental results using this approach are reported for a task involving the recognition and translation of sentences in the hotel-receptioncommunication domain, with a vocabulary of 683 words in Spanish. Atranslation word-error rate of 1.97% is achieved in real-timefactor 2.7 on a Personal Computer.