1. Sparse precision matrix estimation in phylogenetic trait evolution models
- Author
-
Pinheiro, Felipe Grillo, Cybis, Gabriela Bettella, and Prass, Taiane Schaedler
- Subjects
Phylogenetics ,Trait evolution model ,Filogenética ,Inferência bayesiana ,Fenótipo ,Bayesian inference ,Gaussian graphical models - Abstract
Os modelos filogenéticos para evolução de traços (fenotípicos) permitem a estimativa de correlações evolutivas entre um conjunto de traços observados numa amostra de organismos relacionados. Ao modelar diretamente a evolução dos traços numa árvore filogenética num contexto Bayesiano, a estrutura do modelo nos permite controlar para a história evolutiva compartilhada entre os organismos da amostra e evitar as inferências espúrias originadas pelo parentesco. Nestes modelos, as correlações relevantes são definidas por meio do intervalo de credibilidade das correlações marginais. No entanto, as correlações selecionadas por si só podem não fornecer a melhor informação sobre as relações entre as características em estudo. A sua estrutura de associação, em contraste, fornece uma informação clara sobre associações diretas entre os traços em estudo. A fim de empregar um método baseado em modelo para identificar a estrutura de associação subjacente entre as variáveis, exploramos a utilização de modelos Gaussianos com grafos (GGM) para a seleção das covariâncias. Modelamos a matriz de precisão com a distribuição G-Wishart, uma priori conjugada que resulta em estimativas de precisão esparsa. Avaliamos a nossa abordagem através de simulações de Monte Carlo e comparamos os resultados com o método padrão, onde nenhuma estrutura de associação é explicitamente modelada. Também testamos a nossa abordagem para examinar a estrutura de associação e correlações evolutivas em dois conjuntods de dados: um envolvendo traços fenotípicos dos tentilhões de Darwin e outro envolvendo traços genômicos e fenotípicos de procariotos. A nossa abordagem fornece uma solução sistemática para a eliminação de correlações espúrias e melhor inferência para as matrizes de precisão e correlação, especialmente para as variáveis condicionalmente independentes, que são o alvo da esparsidade nos GGMs. Combinar a inferência das correlações evolutivas e da estrutura de associação permite uma seleção mais precisa das características que potencialmente interagiram ou interagem ao longo do processo evolutivo dos organismos estudados. Phylogenetic trait evolution models allow for the estimation of evolutionary correlations between a set of traits observed in a sample of related organisms. By directly modeling the evolution of the traits on a phylogenetic tree in a Bayesian framework, the model’s structure allows us to control for shared evolutionary history between the organisms in the sample and avoid spurious inference that could have been originated from common ancestors. In these models, relevant correlations are obtained through the high posterior density interval of marginal correlations. However, the selected correlations alone may not provide the best information regarding trait relationships. Their association structure, in contrast, provide straightforward information about direct associations. In order to employ a model based method to identify the underlying association structure between the variables we explore the use of Gaussian graphical models (GGM) for covariance selection. We model the precision matrix with a G-Wishart conjugate prior which results in sparse precision estimates. We evaluate our approach through Monte Carlo simulations and compare the results to the standard method, where no association structure is explicitly modeled. We also test our approach to examine the association structure and evolutionary correlations of Darwin’s finches phenotypic traits and prokaryotic genomic and phenotypic traits. Our approach provides a systematic solution for elimination of spurious correlations and better inference for the precision and correlation matrices, especially for conditionally independent variables, which are the target for sparsity in GGMs. Combining correlation and association structure inference allows for a more precise selection of candidate traits that may interact along the evolutionary process of related organisms.
- Published
- 2022