1. Method for automatic determination of clades using community detection algorithm
- Author
-
Eva Reda Moussa Mansour, Alexandre Cláudio Botazzo Delbem, Waldo Gonzalo Cancino Ticona, and Karla Vittori
- Subjects
Computer science ,Efficient algorithm ,business.industry ,Resampling ,Biological objects ,Pattern recognition ,Artificial intelligence ,business ,Clade - Abstract
Análises filogenéticas são bastante utilizadas para a compreensão das relações existentes entre objetos biológicos, beneficiando as investigações em vários campos das ciências da vida. Vários métodos computacionais para reconstruir filogenias tem sido desenvolvidos. Em geral, os métodos que fornecem filogenias mais confiáveis, requerem significativamente maior tempo computacional, restringindo a aplicação deles a conjuntos de dados relativamente pequenos. Por outro lado, a utilização de conjuntos de dados maiores é fundamental para proporcionar uma amostragem que seja suficiente, para restringir as incongruências na identificação de clados em uma filogenia. Este trabalho propõe uma abordagen (denominada CladeNet) de reamostragem de filogenias, obtidas por algoritmos relativamente eficientes, a fim de melhorar a identificação de clados. Experimentos com sete conjuntos de dados, que variam de dezenas a centenas de sequências de DNA mostram que, em geral, clados encontrados pela abordagem proposta tornam-se mais confiavéis, conforme os tamanhos dos conjuntos de sequências aumentam, com um moderado aumento do tempo computacional relativamente moderado. Além disso, o CladeNet é um método que também inova ao identificar clados de forma automáticamente por meio de um algoritmo de identificação de comunidades em redes. Phylogenies are useful for understanding relationships among biological objects, benefiting investigations in various fields of life sciences. Several computational methods for reconstructing phylogenies have been developed. In general, methods that provide more reliable phylogenies require significantly larger computing time, constraining their application to relatively small datasets of objects. On the other hand, the use of larger datasets is fundamental to provide enough samples in order to reduce incongruence in clade identification from a phylogeny. This work proposes an approach of resampling phylogenies (called CladeNet) obtained from relatively efficient algorithms, in order to improve clade identification. Experiments with seven datasets with sizes varying from dozens to hundreds of DNA sequences show that, in general, clades found by the proposed approach are more reliable as the dataset sizes augment, with relatively moderate increase of computing time. Moreover, CladeNet is a new method for identifying clades in an automatic way by means of community detection algorithm for networks.
- Published
- 2013