Multi-relational Data Mining for Tetratricopeptide Repeats (TPR)-Like Superfamily Members in Leishmania spp.: Acting-by-Connecting Proteins

  • Authors:
  • Karen T. Girão;Fátima C. Oliveira;Kaio M. Farias;Italo M. Maia;Samara C. Silva;Carla R. Gadelha;Laura D. Carneiro;Ana C. Pacheco;Michel T. Kamimura;Michely C. Diniz;Maria C. Silva;Diana M. Oliveira

  • Affiliations:
  • Núcleo Tarcisio Pimenta de Pesquisa Genômica e Bioinformática - NUGEN, Faculdade de Veterinária, Universidade Estadual do Ceara - UECE, Fortaleza, Brazil CE 60740-000;Núcleo Tarcisio Pimenta de Pesquisa Genômica e Bioinformática - NUGEN, Faculdade de Veterinária, Universidade Estadual do Ceara - UECE, Fortaleza, Brazil CE 60740-000;Núcleo Tarcisio Pimenta de Pesquisa Genômica e Bioinformática - NUGEN, Faculdade de Veterinária, Universidade Estadual do Ceara - UECE, Fortaleza, Brazil CE 60740-000;Núcleo Tarcisio Pimenta de Pesquisa Genômica e Bioinformática - NUGEN, Faculdade de Veterinária, Universidade Estadual do Ceara - UECE, Fortaleza, Brazil CE 60740-000;Núcleo Tarcisio Pimenta de Pesquisa Genômica e Bioinformática - NUGEN, Faculdade de Veterinária, Universidade Estadual do Ceara - UECE, Fortaleza, Brazil CE 60740-000;Núcleo Tarcisio Pimenta de Pesquisa Genômica e Bioinformática - NUGEN, Faculdade de Veterinária, Universidade Estadual do Ceara - UECE, Fortaleza, Brazil CE 60740-000;Núcleo Tarcisio Pimenta de Pesquisa Genômica e Bioinformática - NUGEN, Faculdade de Veterinária, Universidade Estadual do Ceara - UECE, Fortaleza, Brazil CE 60740-000;Núcleo Tarcisio Pimenta de Pesquisa Genômica e Bioinformática - NUGEN, Faculdade de Veterinária, Universidade Estadual do Ceara - UECE, Fortaleza, Brazil CE 60740-000;Núcleo Tarcisio Pimenta de Pesquisa Genômica e Bioinformática - NUGEN, Faculdade de Veterinária, Universidade Estadual do Ceara - UECE, Fortaleza, Brazil CE 60740-000;Núcleo Tarcisio Pimenta de Pesquisa Genômica e Bioinformática - NUGEN, Faculdade de Veterinária, Universidade Estadual do Ceara - UECE, Fortaleza, Brazil CE 60740-000;Núcleo Tarcisio Pimenta de Pesquisa Genômica e Bioinformática - NUGEN, Faculdade de Veterinária, Universidade Estadual do Ceara - UECE, Fortaleza, Brazil CE 60740-000;Núcleo Tarcisio Pimenta de Pesquisa Genômica e Bioinformática - NUGEN, Faculdade de Veterinária, Universidade Estadual do Ceara - UECE, Fortaleza, Brazil CE 60740-000

  • Venue:
  • PRIB '08 Proceedings of the Third IAPR International Conference on Pattern Recognition in Bioinformatics
  • Year:
  • 2008

Quantified Score

Hi-index 0.00

Visualization

Abstract

The multi-relational data mining (MRDM) approach looks for patterns that involve multiple tables from a relational database made of complex/structured objects whose normalized representation does require multiple tables. We have applied MRDM methods (relational association rule discovery and probabilistic relational models) with hidden Markov models (HMMs) and Viterbi algorithm (VA) to mine tetratricopeptide repeat (TPR), pentatricopeptide (PPR) and half-a-TPR (HAT) in genomes of pathogenic protozoa Leishmania. TPR is a protein-protein interaction module and TPR-containing proteins (TPRPs) act as scaffolds for the assembly of different multiprotein complexes. Our aim is to build a great panel of the TPR-like superfamily of Leishmania. Distributed relational state representations for complex stochastic processes were applied to identification, clustering and classification of Leishmaniagenes and we were able to detect putative 104 TPRPs, 36 PPRPs and 08 HATPs, comprising the TPR-like superfamily. We have also compared currently available resources (Pfam, SMART, SUPER-FAMILY and TPRpred) with our approach (MRDM/HMM/VA).