1. Multiple sequence alignment using ant colony optimization with chaotic jump
- Author
-
Freitas, Matheus Lino de, Universidade Estadual Paulista (Unesp), and Zafalon, Geraldo Francisco Donegá [UNESP]
- Subjects
Ant colony optimization ,Hybrid approaches ,Abordagens híbridas ,Chaotic jump ,Colônia de formigas ,Multiple sequence alignment ,Alinhamento múltiplo de sequências - Abstract
Submitted by Matheus Lino de Freitas (lino.freitas@unesp.br) on 2021-11-16T04:28:50Z No. of bitstreams: 1 Mestrado_Bioinformatica_com_ficha.pdf: 1347903 bytes, checksum: 54fb2f30aae533d76718220ec2d19562 (MD5) Rejected by Elza Mitiko Sato null (elzasato@ibilce.unesp.br), reason: Solicitamos que realize correções na submissão seguindo as orientações abaixo: 01 – Na FOLHA DE ROSTO solicitamos colocar o nome do orientador completo: Ex: Prof. Dr. Geraldo Francisco Donegá Zafalon 02 – Solicitamos corrigir as Palavras-chave/keywords: iniciando com letras maiúsculas e separadas por ponto. 03 - Observamos que na ficha catalográfica você selecionou a formatação em páginas? Caso seja em páginas observar a margem, as margens devem ser: para o anverso, esquerda e superior de 3 cm e direita e inferior de 2 cm; para o verso, direita e superior de 3 cm e esquerda e inferior de 2 cm. Agora caso a impressão seja em folhas apenas corrija na ficha (f). 04 - A paginação deve ser sequencial, iniciando a contagem na FOLHA DE ROSTO e mostrando o número a partir da INTRODUÇÃO, a FICHA CATALOGRÁFICA ficará após a folha de rosto, será contada caso o trabalho seja formatado em página, se for formatado como folhas não deverá ser contada, e na ficha catalográfica o número de folhas deve ser igual ao número da última folha do trabalho. Sugerimos que siga as orientações do template para as correções, na página da Biblioteca, link: https://www.ibilce.unesp.br/#!/biblioteca/servicos-oferecidos/normalizacao/estrutura-do-trabalho-academico/ Lembramos que o arquivo depositado no Repositório deve ser igual ao impresso, o rigor com o padrão da Universidade se deve ao fato de que o seu trabalho passará a ser visível mundialmente. Agradecemos a compreensão. on 2021-11-16T13:51:44Z (GMT) Submitted by Matheus Lino de Freitas (lino.freitas@unesp.br) on 2021-11-16T17:12:35Z No. of bitstreams: 2 Mestrado_Bioinformatica_com_ficha.pdf: 1347903 bytes, checksum: 54fb2f30aae533d76718220ec2d19562 (MD5) Mestrado_Bioinformatica_com_ficha_revisada.pdf: 1347898 bytes, checksum: 1058176b28ea2a5cde20516c8ead95ef (MD5) Approved for entry into archive by Elza Mitiko Sato null (elzasato@ibilce.unesp.br) on 2021-11-16T19:40:42Z (GMT) No. of bitstreams: 1 freitas_ml_me_sjrp.pdf: 1347898 bytes, checksum: 1058176b28ea2a5cde20516c8ead95ef (MD5) Made available in DSpace on 2021-11-16T19:40:42Z (GMT). No. of bitstreams: 1 freitas_ml_me_sjrp.pdf: 1347898 bytes, checksum: 1058176b28ea2a5cde20516c8ead95ef (MD5) Previous issue date: 2021-09-08 Alinhamento múltiplo de sequências é uma das técnicas mais relevantes no contexto de bioinformática. Os sequenciadores modernos produzem um grande volume de dados que são posteriormente analisados por biólogos, biomédicos e profissionais da área genética. Devido a esse grande volume, estratégias computacionais são necessárias para auxiliar na análise dos dados, como por exemplo, os alinhamentos de sequências. A tarefa de alinhar sequências é um desafio computacional e biológico. Do ponto de vista biológico, os modelos são incompletos e não levam em consideração todos os aspectos estruturais e evolutivos das espécies. Além disso, do ponto de vista computacional, com os hardwares atuais, soluções exatas podem não ser obtidas em um tempo hábil. A alternativa prática é a utilização de heurísticas e modelos probabilísticos para se obter resultados com significância biológica, dentro de um tempo factível. Entretanto, heurísticas possuem a característica de se fixarem em pontos de máximo ou mínimo local e, deste modo, as soluções tornam-se sub-ótimas. Para amenizar esse problema recorre-se à utilização de estratégias híbridas e aplicação de estado caótico no algoritmo para deslocar a solução de um ponto no espaço de busca para outro. Portanto, o presente trabalho desenvolveu-se um novo método que, por meio de uma combinação entre as ferramentas KAlign e Clustal Ômega, produz um alinhamento inicial e efetua seu refinamento com otimização por colônia de formigas e chaotic jump. Houve a obtenção de 100% de melhores resultados quando comparados com a ferramenta MSA-GA e pelo menos 50% de melhores resultados quando comparados com as ferramentas KAlign e Clustal Ômega, para todas as famílias do benchmark utilizadas. Multiple sequence alignment is one of the most relevant techniques in the bioinformatics field. The next generation sequencing technologies produces a large volume of data that is later analised by biologists, biomedicals and geneticists. Due to this huge volume, computational effort are necessary to aid in the data analisys, as an example, for sequence alignment. The sequence alignment task is a both a computational and biological challenge. From the biological perspective, the abstract models are incomplete and it does not take into consideration every structural and evolutionary aspect of the species. Besides, from the computational perspective, with currently available hardwares, exact solutions cannot be found in reasonable time. The practical alternative is to use heuristics and probabilistic models to reach results with biological meaning in a feasible time. However, heuristics has a particular characteristic of falling in local maxima or local minima and therefore the solutions that are found could be suboptimal. In order to ease this problem, one can appel to the usage of hybrid strategies and the application of chaotic state in the algorithm to jump the solution in the search space from one point to another. Thus, this works aims to intruduce a novel method that combines the KAlign and Clustal Omega tools in order to produce a seed alignment that will later be refined by Ant Colony Optimization and Chaotic Jump. The results showed us that for every test the ACO produced better alignments than the MSA-GA tool and at least for 50% of tests the proposed method was able to improved the initial alignments produced by the KAlign and Clustal Omega tools.
- Published
- 2021