Blind Source Separation of Convolutive Mixtures of Speech in Frequency Domain

Authors:
Shoji Makino;Hiroshi Sawada;Ryo Mukai;Shoko Araki
Affiliations:
The authors are with NTT Communication Science Laboratories, NTT Corporation, Kyoto-fu, 619-0237 Japan. E-mail: maki@cslab.kecl.ntt.co.jp;The authors are with NTT Communication Science Laboratories, NTT Corporation, Kyoto-fu, 619-0237 Japan. E-mail: maki@cslab.kecl.ntt.co.jp;The authors are with NTT Communication Science Laboratories, NTT Corporation, Kyoto-fu, 619-0237 Japan. E-mail: maki@cslab.kecl.ntt.co.jp;The authors are with NTT Communication Science Laboratories, NTT Corporation, Kyoto-fu, 619-0237 Japan. E-mail: maki@cslab.kecl.ntt.co.jp
Venue:
IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences
Year:
2005

Citing 0
Cited 8

Time-domain convolutive blind source separation employing selective-tap adaptive algorithms

EURASIP Journal on Audio, Speech, and Music Processing
Frequency-domain blind source separation of many speech signals using near-field and far-field models

EURASIP Journal on Applied Signal Processing
Speech intelligibility improvement using convolutive blind source separation assisted by denoising algorithms

Speech Communication
An adaptive stereo basis method for convolutive blind audio source separation

Neurocomputing
A Sparsity-Based Method to Solve Permutation Indeterminacy in Frequency-Domain Convolutive Blind Source Separation

ICA '09 Proceedings of the 8th International Conference on Independent Component Analysis and Signal Separation
Indeterminacy free frequency-domain blind separation of reverberant audio sources

IEEE Transactions on Audio, Speech, and Language Processing
Spatial efficiency of blind source separation based on decorrelation - subjective and objective assessment

Speech Communication
A multistage approach to blind separation of convolutive speech mixtures

Speech Communication

Quantified Score

Hi-index	0.01

Visualization

Abstract

This paper overviews a total solution for frequency-domain blind source separation (BSS) of convolutive mixtures of audio signals, especially speech. Frequency-domain BSS performs independent component analysis (ICA) in each frequency bin, and this is more efficient than time-domain BSS. We describe a sophisticated total solution for frequency-domain BSS, including permutation, scaling, circularity, and complex activation function solutions. Experimental results of 2 × 2, 3 × 3, 4 × 4, 6 × 8, and 2 × 2 (moving sources), (#sources × #microphones) in a room are promising.