49 results on '"Werhli, Adriano Velasque"'
Search Results
2. Search for Zinc Complexes with High Affinity in Pyrazinamidase from Mycobacterium Tuberculosis Resistant to Pyrazinamide
- Author
-
Alvarado-Huayhuaz, Jesus Antonio, Talaverano-Rojas, Daniel Alonso, Quispe, Reneé Isabel Huamán, Balboni, Maurício Dorneles Caldeira, Arce, Oscar Emilio Arrúa, Werhli, Adriano Velasque, Machado, Karina dos Santos, Valderrama-Negrón, Ana Cecilia, Goos, Gerhard, Founding Editor, Hartmanis, Juris, Founding Editor, Bertino, Elisa, Editorial Board Member, Gao, Wen, Editorial Board Member, Steffen, Bernhard, Editorial Board Member, Yung, Moti, Editorial Board Member, Scherer, Nicole M., editor, and de Melo-Minardi, Raquel C., editor more...
- Published
- 2022
- Full Text
- View/download PDF
Catalog
3. A Non Exhaustive Search of Exhaustiveness
- Author
-
Cecotti, Letícia Kristian Silva, Balboni, Maurício Dorneles Caldeira, Arce, Oscar Emilio Arrúa, Machado, Karina dos Santos, Werhli, Adriano Velasque, Goos, Gerhard, Founding Editor, Hartmanis, Juris, Founding Editor, Bertino, Elisa, Editorial Board Member, Gao, Wen, Editorial Board Member, Steffen, Bernhard, Editorial Board Member, Yung, Moti, Editorial Board Member, Scherer, Nicole M., editor, and de Melo-Minardi, Raquel C., editor more...
- Published
- 2022
- Full Text
- View/download PDF
4. Whole-genome sequencing as a tool for studying the microevolution of drug-resistant serial Mycobacterium tuberculosis isolates
- Author
-
de Lourdes do Carmo Guimarães Diniz, Jaciara, von Groll, Andrea, Unis, Gisela, Dalla-Costa, Elis Regina, Rosa Rossetti, Maria Lúcia, Vianna, Júlia Silveira, Ramos, Daniela Fernandes, Reis, Ana Júlia, Bartolomeu Halicki, Priscila Cristina, Rheingantz Scaini, João Luis, Castillos de Ibrahim das Neves, Yasmin, Phelan, Jody, Gomes, Ana Rita, Campino, Susana, Machado, Karina dos Santos, Werhli, Adriano Velasque, Pain, Arnab, Clark, Taane Gregory, Perdigão, João, Viveiros, Miguel, Portugal, Isabel, and Almeida Silva, Pedro Eduardo more...
- Published
- 2021
- Full Text
- View/download PDF
5. Mefloquine synergism with anti-tuberculosis drugs and correlation to membrane effects: Biologic, spectroscopic and molecular dynamics simulations studies
- Author
-
dos Santos, Marinalva Cardoso, Scaini, João Luís Rheingantz, Lopes, Márcio Vinicius Costa, Rodrigues, Beatriz Gonçalves, Silva, Nichole Osti, Borges, Carla Roberta Lopes, dos Santos, Sandra Cruz, dos Santos Machado, Karina, Werhli, Adriano Velasque, da Silva, Pedro Eduardo Almeida, Lourenço, Maria C.S., da Silva, Emerson T., de Souza, Marcus V.N., de Lima, Vânia Rodrigues, and Gonçalves, Raoni Schroeder B. more...
- Published
- 2021
- Full Text
- View/download PDF
6. A Non Exhaustive Search of Exhaustiveness
- Author
-
Cecotti, Letícia Kristian Silva, primary, Balboni, Maurício Dorneles Caldeira, additional, Arce, Oscar Emilio Arrúa, additional, Machado, Karina dos Santos, additional, and Werhli, Adriano Velasque, additional more...
- Published
- 2022
- Full Text
- View/download PDF
7. Search for Zinc Complexes with High Affinity in Pyrazinamidase from Mycobacterium Tuberculosis Resistant to Pyrazinamide
- Author
-
Alvarado-Huayhuaz, Jesus Antonio, primary, Talaverano-Rojas, Daniel Alonso, additional, Quispe, Reneé Isabel Huamán, additional, Balboni, Maurício Dorneles Caldeira, additional, Arce, Oscar Emilio Arrúa, additional, Werhli, Adriano Velasque, additional, Machado, Karina dos Santos, additional, and Valderrama-Negrón, Ana Cecilia, additional more...
- Published
- 2022
- Full Text
- View/download PDF
8. Long-chain fatty dihydropyridines: Docking calcium channel studies and antihypertensive activity
- Author
-
Santa-Helena, Eduarda, Cabrera, Diego da Costa, D'Oca, Marcelo G. Montes, Scaini, João Luís Rheingantz, de Oliveira, Matheus William Bandeira, Werhli, Adriano Velasque, Machado, Karina dos Santos, Gonçalves, Carla Amorim Neves, and Nery, Luiz Eduardo Maia more...
- Published
- 2020
- Full Text
- View/download PDF
9. Molecular modelling and competitive inhibition of a Mycobacterium tuberculosis multidrug-resistance efflux pump
- Author
-
Scaini, Joāo Luís Rheingantz, Camargo, Alex Dias, Seus, Vinicius Rosa, von Groll, Andrea, Werhli, Adriano Velasque, da Silva, Pedro Eduardo Almeida, and Machado, Karina dos Santos
- Published
- 2019
- Full Text
- View/download PDF
10. Reconstruction of gene regulatory networks from postgenomic data
- Author
-
Werhli, Adriano Velasque, Armstrong, Douglas., and Husmeier, Dirk
- Subjects
004 ,Informatics ,Institute for Adaptive and Neural Computation ,Bayesian networks ,machine learning - Abstract
An important problem in systems biology is the inference of biochemical pathways and regulatory networks from postgenomic data. The recent substantial increase in the availability of such data has stimulated the interest in inferring the networks and pathways from the data themselves. The main interests of this thesis are the application, evaluation and the improvement of machine learning methods applied to the reverse engineering of biochemical pathways and networks. The thesis starts with the application of an established method to newly available gene expression data related to the interferon pathway of the human immune system in order to identify active subpathways under di erent experimental conditions. The thesis continues with the comparative evaluation of various machine learning methods (Relevance networks, Graphical Gaussian Models, Bayesian networks) using observational and interventional data from cytometry experiments as well as simulated data from a gold-standard network. The thesis also extends and improves existing methods to include biological prior knowledge under the Bayesian approach in order to increase the accuracy of the predicted networks and it quanti es to what extent the reconstruction accuracy can be improved in this way. more...
- Published
- 2007
11. Complete genome sequencing of Mycobacterium Tuberculosis in the identification of gene mutations associated with antimicrobial resistance
- Author
-
Rocha, Iago Prina, primary, Machado, Karina dos Santos, additional, Cunha, Caroline Valois, additional, Fontoura, Ana Paula Furtado Carneiro da, additional, Dias, Rafaela Sinnott, additional, Goulart, Ivana da Cruz, additional, Perim, Laura Fontoura, additional, Chaves, Ana Claudia Klein de Almeida de, additional, and Werhli, Adriano Velasque, additional more...
- Published
- 2023
- Full Text
- View/download PDF
12. Estimation of Parameters of Mycobacterium tuberculosis Growth: A Multi-Agent-Based Simulation Approach
- Author
-
Werlang, Pablo, Fagundes, Michel Q., Adamatti, Diana Francisca, Machado, Karina Santos, von Groll, Andrea, da Silva, Pedro E. A., Werhli, Adriano Velasque, Goebel, Randy, Series editor, Tanaka, Yuzuru, Series editor, Wahlster, Wolfgang, Series editor, Bazzan, Ana L.C., editor, and Pichara, Karim, editor more...
- Published
- 2014
- Full Text
- View/download PDF
13. Bayesian Network Structure Inference with an Hierarchical Bayesian Model
- Author
-
Werhli, Adriano Velasque, Hutchison, David, Series editor, Kanade, Takeo, Series editor, Kittler, Josef, Series editor, Kleinberg, Jon M., Series editor, Mattern, Friedemann, Series editor, Mitchell, John C., Series editor, Naor, Moni, Series editor, Nierstrasz, Oscar, Series editor, Pandu Rangan, C., Series editor, Steffen, Bernhard, Series editor, Sudan, Madhu, Series editor, Terzopoulos, Demetri, Series editor, Tygar, Doug, Series editor, Vardi, Moshe Y., Series editor, Weikum, Gerhard, Series editor, Goebel, Randy, editor, Siekmann, Jörg, editor, Wahlster, Wolfgang, editor, da Rocha Costa, Antônio Carlos, editor, Vicari, Rosa Maria, editor, and Tonidandel, Flavio, editor more...
- Published
- 2010
- Full Text
- View/download PDF
14. Using Probability Distributions in Parameters of Variables at Agent-Based Simulations
- Author
-
Fonseca de Moraes, Marcilene, primary, Adamatti, Diana Francisca, additional, Oliveira de Borba, Albano, additional, Werhli, Adriano Velasque, additional, and von Groll, Andrea, additional
- Published
- 2017
- Full Text
- View/download PDF
15. E-Volve: understanding the impact of mutations in SARS-CoV-2 variants spike protein on antibodies and ACE2 affinity through patterns of chemical interactions at protein interfaces
- Author
-
Dos Santos, Vitor Pimentel, primary, Rodrigues, André, additional, Dutra, Gabriel, additional, Bastos, Luana, additional, Mariano, Diego, additional, Mendonça, José Gutembergue, additional, Lobo, Yan Jerônimo Gomes, additional, Mendes, Eduardo, additional, Maia, Giovana, additional, Machado, Karina dos Santos, additional, Werhli, Adriano Velasque, additional, Rocha, Gerd, additional, de Lima, Leonardo Henrique França, additional, and de Melo-Minardi, Raquel, additional more...
- Published
- 2022
- Full Text
- View/download PDF
16. Estimation of Parameters of Mycobacterium tuberculosis Growth: A Multi-Agent-Based Simulation Approach
- Author
-
Werlang, Pablo, primary, Fagundes, Michel Q., additional, Adamatti, Diana Francisca, additional, Machado, Karina Santos, additional, von Groll, Andrea, additional, da Silva, Pedro E. A., additional, and Werhli, Adriano Velasque, additional more...
- Published
- 2014
- Full Text
- View/download PDF
17. Bayesian Network Structure Inference with an Hierarchical Bayesian Model
- Author
-
Werhli, Adriano Velasque, primary
- Published
- 2010
- Full Text
- View/download PDF
18. Data Analysis Tool and Image Acquisition System for Linear Arc Weld Deposition Evaluation
- Author
-
Galani Pernambuco, Bryan Stefan, primary, Rafael Steffens, Cristiano, additional, Werhli, Adriano Velasque, additional, and Silva da Costa Botelho, Silvia, additional
- Published
- 2019
- Full Text
- View/download PDF
19. Modelo de dobramento de proteína em jogo computacional
- Author
-
Da Luz, Renan Martinez, primary, Adamatti, Diana Francisca, additional, and Werhli, Adriano Velasque, additional
- Published
- 2017
- Full Text
- View/download PDF
20. Automated seam tracking system based on passive monocular vision for automated linear robotic welding process
- Author
-
Weis, Átila Astor, primary, Werhli, Adriano Velasque, additional, Filho, Nelson L. Duarte, additional, Soares, Luciane Baldassari, additional, Steffens, Cristiano Rafael, additional, Frantz de Faria, Matheus, additional, Jorge Drews-Jr, Paulo Lilles, additional, and Silva da Costa Botelho, Sílvia, additional more...
- Published
- 2017
- Full Text
- View/download PDF
21. A serious game to teach modeling, operating and maintenance of industrial plants
- Author
-
Barbat, Mauro Medeiros, Dutra Júnior, Nilo Cesar da Silva, and Werhli, Adriano Velasque
- Subjects
Serious games ,Industrial plants ,Modeling - Abstract
With the technological advancement and the level of immersion that technology represents in our lives, new teaching methodologies must be developed. The use of serious games in education gains more space among researchers and educators, because of their immersive and playful power, facilitating the cognition of basic and advanced concepts. In this context, the focus of this paper is the development of an educational serious game to be used with high school and first years undergraduate students. It deals with elementary topics on modeling, operation and maintenance of industrial plants. more...
- Published
- 2014
22. Desenvolvimento de um jogo sério para modelagem, operação e manutenção de plantas industriais
- Author
-
Barbat, Mauro Medeiros, Adamatti, Diana Francisca, and Werhli, Adriano Velasque
- Subjects
Plantas industriais ,Educação ,Jogos sérios ,Simulador ,Imersão - Abstract
Com o avanço tecnológico e o nível de imersão que a tecnologia representa na vida de seus usuários, novas metodologias de ensino surgem objetivando valer-se deste potencial para atingir os estudantes de forma mais eficaz. O uso de jogos sérios na educação conquista espaço junto a pesquisadores e educadores, dado seu poder imersivo e lúdico servindo como intermédio entre a teoria e a prática, facilitando a cognição de tópicos elementares e avançados. Baseado neste contexto, o foco deste trabalho é o desenvolvimento de um jogo sério dos tipos educacional e simulador, visando expor aos estudantes do ensino médio e da graduação tópicos elementares sobre a modelagem, operação e manutenção de plantas industriais, devido sua importância em ambientes industriais. more...
- Published
- 2014
23. Desenvolvimento de um jogo sério para ensino sobre a elaboração, operação e manutenção de plantas industriais.
- Author
-
Barbat, Mauro Medeiros, primary, Dutra, Nilo Cesar, additional, Adamatti, Diana Francisca, additional, and Werhli, Adriano Velasque, additional
- Published
- 2015
- Full Text
- View/download PDF
24. Industrial processes alarm prediction using non-supervised classification
- Author
-
Braunstein, Sérgio Halpern, Lerm, André Arthur Perleberg, Lerm, Rafael Andréas Raffi, Werhli, Adriano Velasque, Botelho, Silvia Silva da Costa, and Lippe, Edwaldo Oliveira
- Subjects
Atheoretical regression trees ,Time series ,Classificação não-supervisionada ,Manutenção preditiva ,Non-supervised classification ,Predictive maintenance ,Árvores de regressão ,Séries temporais - Abstract
Um sistema de predição de alarmes com a finalidade de auxiliar a implantação de uma política de manutenção preditiva industrial e de constituir-se em uma ferramenta gerencial de apoio à tomada de decisão é proposto neste trabalho. O sistema adquire leituras de diversos sensores instalados na planta, extrai suas características e avalia a saúde do equipamento. O diagnóstico e prognóstico implica a classificação das condições de operação da planta. Técnicas de árvores de regressão e classificação não-supervisionada são utilizadas neste artigo. Uma amostra das medições de 73 variáveis feitas por sensores instalados em uma usina hidrelétrica foi utilizada para testar e validar a proposta. As medições foram amostradas em um período de 15 meses. In this work an alarm prediction system is proposed. Its main aims are to contribute to the establishment of predictive industrial maintenance guidelines and to produce a management decision support tool. The proposed system obtains readings from many sensors that are installed in the industrial plant, extract its characteristics and evaluates the equipment’s health. The diagnosis and prognosis implies in a classification of the industrial plant’s operational condition. Classification and regression trees are applied in this paper. A measurement sample from 73 sensors installed in a hydroelectric power plant is utilized to test and validate the proposed methodology. The measurements were obtained in a 15 months period. more...
- Published
- 2009
25. Discussion on the paper by Handcock, Raftery and Tantrum
- Author
-
Snijders, Thomas, Robinson, Tony, Atkinson, Anthony C., Riani, Marco, Gormley, Isobel Claire, Murphy, Thomas Brendan, Sweeting, Trevor, Leslie, David S., Longford, N. T., Kent, John T., Lawrance, Tony, Airoldi, Edoardo M., Besag, Julian, Blei, David, Fienberg, Stephen E., Breiger, Ronald, Butts, Carter T., Doreian, Patrick, Batagelj, Vladimir, Ferligoj, Anuska, Draper, David, van Duijn, Marijtje A. J., Faust, Katherine, Petrescu-Prahova, Miruna, Forster, Jonathan J., Gelman, Andrew, Goodreau, Steven M., Greenwood, Priscilla E., Gruenberg, Katharina, Francis, Brian, Hennig, Christian, Hoff, Peter D., Hunter, David R., Husmeier, Dirk, Glasbey, Chris, Krackhardt, David, Kuha, Jouni, Skrondal, Anders, Lawson, Andrew, Liao, Tim F., Mendes, Bruno, Reinert, Gesine, Richardson, Sylvia, Lewin, Alex, Titterington, D. M., Wasserman, Stanley, Werhli, Adriano Velasque, Ghazal, Peter, and Sociology/ICS more...
- Subjects
EXPONENTIAL FAMILY ,LIKELIHOOD ,DYADIC DATA ,DIRECTED-GRAPHS ,BAYES FACTORS ,MIXTURES ,EFFECTS MODELS ,INFERENCE ,SOCIAL NETWORKS ,FACTOR ANALYZERS - Published
- 2007
26. Bayesian Network Structure Inference with an Hierarchical Bayesian Model.
- Author
-
Werhli, Adriano Velasque
- Abstract
Bayesian Networks (BNs) are applied to a wide range of applications. In the past few years great interest is dedicated to the problem of inferring the structure of BNs solely from the data. In this work we explore a probabilistic method which enables the inclusion of extra knowledge in the inference of BNs. We briefly present the theory of BNs and introduce our probabilistic model. We also present the method of Markov Chain Monte Carlo (MCMC) which is used to sample network structures and hyper-parameters of our probabilistic model. Finally we present and discuss the results focusing on aspects related with the accuracy of the reconstructed networks and how the proposed method behaves when provided with sources of knowledge of different quality. [ABSTRACT FROM AUTHOR] more...
- Published
- 2011
- Full Text
- View/download PDF
27. A Computational Method to Propose Mutations in Enzymes Based on Structural Signature Variation (SSV).
- Author
-
Mariano, Diego César Batista, Santos, Lucianna Helene, Machado, Karina dos Santos, Werhli, Adriano Velasque, de Lima, Leonardo Henrique França, and de Melo-Minardi, Raquel Cardoso
- Subjects
GENETIC mutation ,ENZYMES ,BIOMASS energy ,GLUCOSE tolerance tests ,BETA-glucosidase - Abstract
With the use of genetic engineering, modified and sometimes more efficient enzymes can be created for different purposes, including industrial applications. However, building modified enzymes depends on several in vitro experiments, which may result in the process being expensive and time-consuming. Therefore, computational approaches could reduce costs and accelerate the discovery of new technological products. In this study, we present a method, called structural signature variation (SSV), to propose mutations for improving enzymes' activity. SSV uses the structural signature variation between target enzymes and template enzymes (obtained from the literature) to determine if randomly suggested mutations may provide some benefit for an enzyme, such as improvement of catalytic activity, half-life, and thermostability, or resistance to inhibition. To evaluate SSV, we carried out a case study that suggested mutations in β-glucosidases: Essential enzymes used in biofuel production that suffer inhibition by their product. We collected 27 mutations described in the literature, and manually classified them as beneficial or not. SSV was able to classify the mutations with values of 0.89 and 0.92 for precision and specificity, respectively. Then, we used SSV to propose mutations for Bgl1B, a low-performance β-glucosidase. We detected 15 mutations that could be beneficial. Three of these mutations (H228C, H228T, and H228V) have been related in the literature to the mechanism of glucose tolerance and stimulation in GH1 β-glucosidase. Hence, SSV was capable of detecting promising mutations, already validated by in vitro experiments, that improved the inhibition resistance of a β-glucosidase and, consequently, its catalytic activity. SSV might be useful for the engineering of enzymes used in biofuel production or other industrial applications. [ABSTRACT FROM AUTHOR] more...
- Published
- 2019
- Full Text
- View/download PDF
28. Assistive Robotics: The Use of Kinect for Upper Limb Rehabilitation
- Author
-
Guimarães, Leonardo Lucchesi da Cunha, Werhli, Adriano Velasque, and Oliveira, Vinícius Menezes de
- Subjects
Kinect ,Rehabilitation ,Assistive robotics ,Reabilitação ,Upper limbs ,Range of motions ,Amplitude de movimentos ,Membros superiores ,Robótica assistiva - Abstract
Uma importante etapa do processo de reabilitação de movimentos é o diagnóstico de limitações do paciente. A técnica mais utilizada tradicionalmente por fisioterapeutas consiste na goniometria, exame no qual o paciente realiza movimentos propostos pelo especialista e este mede o ângulo desenvolvido pela articulação com o auxilio de um goniômetro. Este exame é muito influenciado pela experiência do especialista, que de acordo com a sua técnica pode encontrar diferentes resultados do mesmo exame realizado por outro especialista. Assim, surgem alternativas tecnológicas para facilitar esta avaliação, porém muitas alternativas encontradas comercialmente possuem um elevado custo do equipamento e alternativas com menor custo são mais difíceis de ser encontradas, em sua maioria são apenas sistemas utilizados em laboratório e sem uma validação realizada com movimentos reais e com o acompanhamento de especialistas da área. O presente trabalho busca desenvolver um sistema de baixo custo para realizar a tarefa descrita, nesta proposta é utilizado um sensor Kinect, que é capaz de capturar com uma boa precisão os pontos das articulações do indivíduo no espaço. Através dos pontos no espaço são utilizadas equações de ângulo entre retas e filtros para suavizar os valores encontrados online para capturar a amplitude de movimentos dos membros superiores. Para validar o sistema desenvolvido foi realizada uma parceria com o curso de Fisioterapia da Faculdade Anhanguera do Rio Grande, assim é possível comparar resultados obtidos pelo sensor e resultados obtidos através de exames tradicionais de goniometria realizados por alunos do curso. An important step in the movement rehabilitation process is the diagnosis of patient limitations. The technique most traditionally used by physiotherapists is goniometry, an exam which the patient performs movements proposed by the specialist and he measures the angle developed by the joint with the aid of a goniometer. This exam is greatly influenced by the experience of the specialist, who according to his technique can find different results from the same exam performed by another specialist. Thus, technological alternatives emerge to facilitate this evaluation, but many alternatives found commercially have a high cost of equipment and lower cost alternatives are more difficult to find, most are only systems used in the laboratories and without a validation performed with real movements with the accompaniment of experts in this field. The present work seeks to develop a low cost system to perform the described task. In this proposal a Kinect sensor is used, which is able to capture with good precision the points of the individuals joints in space. Through points in space, angle equations between lines and filters are used to smooth out the values found in real time to capture the range of motion of the upper limbs. To validate the developed system, a partnership was made with the Physiotherapy course of the Anhanguera College of Rio Grande, so it is possible to compare results obtained by the sensor and results obtained through traditional goniometry exams performed by students of the course. more...
- Published
- 2021
29. Distribuição de icebergs no oceano austral através de inteligência artificial: uma contribuição para o entendimento da sua influência na circulação e no clima
- Author
-
Barbat, Mauro Medeiros, Mata, Mauricio Magalhães, and Werhli, Adriano Velasque
- Abstract
Icebergs são complexos e importantes elementos do ambiente polar. Corpos de gelo de origem continental, estes são aptos a interagir com o ambiente no seu entorno de distintas formas incluindo interações com o leito oceânico e margens continentais, transporte de nutrientes e em decorrência da adição de água fria e doce proveniente do derretimento, impactar a estrutura termohalina local. Embora de similar magnitude com o derretimento basal das plataformas de gelo flutuantes, os icebergs desempenham um papel ainda não inteiramente compreendido no balanço de calor e água doce no ambiente Antártico. Em parte, devido à complexidade operacional e tecnológica para monitoramento em grande escala no ambiente polar. Neste sentido, esta tese apresenta (i) um novo método autônomo para monitoramento e análise de icebergs em grande escala a partir de imagens de Radar de Abertura Sintética (SAR) baseada em inteligência artificial; na sequência a aplicação cientifica do método para (ii) investigar e documentar integralmente a distribuição de icebergs na região costeira do continente Antártico, assim como, a variabilidade interanual, relacionando com as principais regiões de ruptura de icebergs e formação de água densa de fundo; por fim, (iii) apresenta e discute a extensão método para o rastreamento automático de icebergs ao longo do tempo assim como, sua aplicabilidade para monitorar potencial injeção de água doce através de imagens SAR. Como resultados, o método provou-se altamente adaptável sendo capaz de distinguir icebergs dos demais elementos presentes nas cenas polares com acurácia média de 97,5 ± 0,6%. Como primeira aplicação científica, documenta e investiga a evolução espacial da distribuição de tamanho (e massa) de icebergs integralmente sobre a plataforma continental e região costeira Antártica para os anos de 1997, 2000 e 2008. Por fim, apresenta e discute a capacidade e aplicabilidade do método para rastreamento de icebergs em um estudo de caso no mar de Weddell, Antártica. Ao todo, esta tese destaca a aplicabilidade de métodos de inteligência artificial para o complexo problema de classificação de icebergs. Desta forma, preenchendo uma lacuna entre esforços observacionais e de modelagem numérica, que pode ser um passo essencial para futuros estudos acerca da variabilidade espaço-temporal do aporte de água doce a partir do derretimento de icebergs e seu possível impacto nas mudanças climáticas. Icebergs are complex and important features of the polar environment. Bodies of continental ice they are able to interact with their surroundings in numerous ways. This includes interactions with the seabed and continental margins, transport of nutrients and terrigenous material, as well as interactions by impacting the thermohaline structure through cooling and freshwater input from melting icebergs. Being of similar magnitude to ice shelf basal melting, icebergs plays an important and not yet fully understood role in the heat and freshwater balance of the Antarctic environment, this knowledge gap does not close due to the operational and technological complexity associated with a reliable monitoring of icebergs in the polar environment. In this sense, this thesis presents (i) a new autonomous method for large-scale monitoring and analysis of icebergs from Synthetic Aperture Radar (SAR) based on artificial intelligence; next steps are the scientific application of the developed method in order to (ii) investigate and document the pan-Antarctic nearcoastal iceberg distribution and its variability between years and to relate it with the main Antarctic calving fronts and bottom water formation sites; the final goal is (iii) to present an extension of the detection method that allows to automatically track icebergs over time and to observe their potential freshwater input via satellites. As results, the method proved to be highly adaptable and capable of distinguishing icebergs with a high average accuracy of 97.5 ± 0.6%. As a first scientific application, it was possible to document and investigate the spatial evolution of the size distribution (and mass) of pan-Antarctic icebergs on the continental shelf and in the near-coastal region for the years of 1997, 2000 and 2008. Finally, this thesis presents and discusses the tracking capabilities of the method proposed for a case study of the Weddell Sea, Antarctica. The extended method allows no only to monitor drifting icebergs but also their potential freshwater input over time automatically. Altogether, this work sheds light on the applicability of novel artificial intelligence methods to the complex iceberg classification problem. It bridges the gap between observational and numerical modeling efforts, which could be an essential step for future studies of the spatio-temporally changing freshwater input from Antarctic icebergs and thus climate change. more...
- Published
- 2020
30. Ensemble Learning Applications for Study- ing the Effect of Single Point Mutations on Three Dimensional Protein Structures
- Author
-
Freitas, Eduardo Kenji Hasegawa de, Machado, Karina dos Santos, and Werhli, Adriano Velasque
- Subjects
Weka ,Machine learning ,Esemble learning ,Classificação ,Classification ,Regression ,Regressão - Abstract
O refinar de propriedades das proteínas, através de mutações pontuais sobre seus aminoácidos é uma prática muito comum utilizada em processos da indústria bioquímica. Métodos computacionais acurados são necessários para realizar a predição sobre esses experimentos de mutações, tornando o design de proteínas mais eficiente. Por meio de bases de dados provenientes do Protherm, onde cada instância inclui dados numéricos,como variação da energia livre de Gibbs, mudança de entalpia, mudança de capacidade térmica, temperatura de transição, entre outros, são informações importantes para a compreensão da estabilidade da proteína. As predições do efeito da mutação na estrutura da proteína medido pela variação da variação da energia de Gibbs (ddG) são divididas entre duas classes, estabilizante e desestabilizante, onde algoritmos de classificação e ensemble de classificadores, disponibilizados pelo software Weka, terão a função de determinar a acurácia dos modelos de predição. Através de três experimentos, que são diferenciados pelo pré-processamento dos dados de entrada para os modelos de predição, é avaliado o comportamento dos das predições cada ferramenta, proporcionando uma discussão de como a bioinformática pode se beneficiar desses resultados e como os modelos de predição criados podem predizer o impacto de mutações pontuais na estrutura de proteínas. The refining of protein properties, through point mutations on their amino acids, is avery common practice used in biochemical industry processes. Accurate computational methods are required to carry out the prediction on these mutation experiments, making protein design more efficient. Through databases from Protherm, where each instance in-cludes numerical data, such as Gibbs free energy variation, enthalpy change, thermal ca-pacity change, transition temperature, among others, are important for the understanding of protein stabilization. The predictions will be divided between two classes, stabilizing and destabilizing, where algorithms for classification and ensemble classifiers, available on the Weka software, have the objective to determine the accuracy of the prediction models. By making use of three experiments, that are unique in the way of data inputpre-processing for the prediction models, it is evaluated the prediction behavior of each tool, providing a discussion on how bioinformatics can benefit from these results and how the created predicting models can predict the impact of point mutations on the structure of proteins. more...
- Published
- 2020
31. A machine learning scoring function for protein–ligand docking
- Author
-
Arce, Oscar Emilio Arrua, Machado, Karina dos Santos, Werhli, Adriano Velasque, and Aderhold, Andrej
- Subjects
Otimização de parâmetros ,Bioinformatic ,Função de escore ,Seleção de atributos ,Molecular docking ,Machine learning ,Feature selection ,Bioinformática ,Docagem molecular ,Aprendizado de máquina ,Scoring function ,Hyperparameters optimization - Abstract
No desenho de fármacos, as scoring functions ou funções de escore são úteis para prever as afinidades de ligação dos complexos proteína-ligante. O constante aumento dos dados bioquímicos e biofísicos, juntamente com o trabalho experimental, permitiu que as funções de escore baseadas em machine learning apresentassem resultados promissores. O objetivo deste trabalho foi desenvolver uma função de escore baseada em machine learning para docagem molecular proteína-ligante. A metodologia aplicada nesta dissertação foi elaborada a partir dos trabalhos relacionados disponíveis na literatura, dos quais foram extraídos informações sobre coleções de complexos proteína-ligante que são utilizados como conjunto de treinamento; atributos das proteínas, dos ligantes e informações geradas das interações entre eles utilizadas como descritores; métodos de machine learning utilizados para treinar modelos, incluindo técnicas de seleção de atributos e otimização de parâmetros; e conjuntos de testes utilizados para avaliar as funções de escore. Para compilar o conjunto de treinamento, foram estudados: PDBbind refined set, PDBbind general set, CSAR-NRC HiQ e Decoys CSAR-NRC HiQ. Como grupos de atributos foram vistos: descritores geométricos, descritores do SFCscore, descritores e escore do AutoDock Vina, descritores relacionados à área de superfície acessível ao solvente, descritores do DeltaVinaRF20, descritores relacionados à sequência de aminoácidos, descritores relacionados à estrutura secundária de as proteínas, atributos dos ligantes gerados com o PaDEL Descriptor, descritores de interação proteína-ligante utilizados no NNscore 2.0 e descritores 2D/3D gerados com RDKit. Como métodos machine learning foram comparados o Random Forest e o Gaussian Process, além do LASSO para calcular os pesos dos atributos e o GridSearchCV como técnica para otimizar os parâmetros. A função de escore proposta foi avaliada com o benchmark CASF-2016 em relação a quatro métricas: Scoring Power, Ranking Power, Docking Power e Screening Power. No teste do Scoring Power, a função de escore proposta alcançou um coeficiente de correlação de Pearson entre as afinidades previstas e as afinidades medidas experimentalmente de 0.81 contra os 0.816 alcançados pela melhor função de escore no CASF-2016 (DeltaVinaRF20). No teste do Ranking Power, a função de escore proposta atingiu um coeficiente de correlação de Spearman entre a classificação, com base nos valores de afinidade previstos e os valores medidos experimentalmente de 0.66 contra os 0.75 atingidos pela melhor função de escore no CASF-2016 (DeltaVinaRF20). No teste do Docking Power, a função de escore proposta alcançou uma taxa de sucesso de 86% para identificar a melhor pose de união com RMSD abaixo de 2 Å da pose nativa, em comparação com 90.2% alcançados pela melhor função de escore no CASF-2016 (AutoDock Vina). No teste do Docking Power sem considerar a pose nativa, a função de escore proposta atingiu uma taxa de sucesso de 83.8% contra os 84.9% atingidos pela melhor função de escore no CASF-2016 (DeltaVinaRF20). No teste de Forward Screening Power, a função de escore proposta obteve uma taxa de sucesso de 26.5% para identificar ligantes ativos entre moléculas aleatórias para uma proteína alvo no top 1% da classificação, em comparação com 42.1% obtida pela melhor função de escore no CASF-2016 (DeltaVinaRF20). No teste de Reverse Screening Power, a função de escore proposta alcançou uma taxa de sucesso de 18.5% para identificar proteínas-alvo potenciais para um ligante específico no top 1% da classificação, obtendo a melhor pontuação no CASF-2016. In the field of drug design, scoring functions are useful for predicting the binding affinity of protein-ligand complexes. The machine learning approach is showing a promising performance as a result of the increasing amount of data regarding biochemical and biophysical processes, obtained from previous experiments. The aim of this work was to develop a scoring function based on machine learning method for protein-ligand molecular docking. The current methodology was designed from related works available in the literature, where the information about protein-ligand complexes that are used like training collection were obtained; features of proteins, features of ligands and interactions between them the are used as descriptors; machine learning methods that are to used to train models, including feature selection techniques and hyperparameters optimization; and test sets that are used to evaluate scoring functions. To compile the training set were studied: PDBbind refined set, PDBbind general set, CSAR-NRC HiQ and Decoys CSAR-NRC HiQ. As atributes set where seen: geometrical features, SFCscore features, AutoDock Vina features and score, solvent-accessible surface area features, DeltaVinaRF20 features, protein primary structure features, descriptors related to protein secundary structure, features from PaDEL Descriptor, NNScore 2.0 interactions features, Features 2D/3D from RDKit. Random Forest and Gaussian Process were compared as machine learning methods, in addition to LASSO to calculate the weights of the attributes and GridSearchCV as a technique to hyperparameters optimization. The proposed scoring function will be evaluated using the CASF-2016 benchmark, based on the following parameters: Scoring Power, Ranking Power, Docking Power and Screening Power. For the Scoring Power test, the proposed scoring function achieves a Pearson correlation coefficient between predicted affinities and experimental measured affinities of 0.81 versus 0.816 achieved by the best scoring function in CASF-2016 (DeltaVinaRF20). For the Ranking Power, the proposed scoring function achieves a Spearman correlation coefficient between the ranks based on the predicted affinities values and the experimentally values measured of 0.66 versus 0.75 achieved by the best scoring function in CASF-2016 (DeltaVinaRF20). For the Docking Power test, the proposed scoring function has obtain a 86% success rate in identifying the top best-scored ligand binding pose below 2 Å root-mean-square deviation from the native pose compared to 90.2% achieved by the best scoring function in CASF-2016 (AutoDock Vina). For the Docking Power test without native pose, the proposed scoring function has obtain a success rate of 83.8% versus 84.9% achieved by the best scoring function in CASF-2016 (DeltaVinaRF20). For the Forward Screening Power test, the proposed scoring function has a got 26.5% success rate to identifying potential small-molecule ligands for a chosen target protein at the top 1% level versus 42.1% by the best scoring function in CASF-2016 (DeltaVinaRF20). For the Reverse Screening Power test, the proposed scoring function achieve a 18.5% success rate in identifying potential target proteins for a bioactive small-molecule compound at the top 1% level and was the best scoring function in CASF-2016. more...
- Published
- 2020
32. ESSEX : identification of an amino acid of interest in biological sequences of different origins
- Author
-
Quaresma Junior, Wolmer Dias, Werhli, Adriano Velasque, and Machado, Karina dos Santos
- Subjects
Biological sequence ,Alinhamento local ,Multiple alignment ,Escola de Saúde do Exército (EsSEx) ,Local alignment ,Global alignment ,Sequência Biológica ,Alinhamento global ,Alinhamento múltiplo ,Essex - Abstract
O objetivo desta dissertação é propor uma ferramenta para tratar um problema importante da biologia computacional, que corresponde na localização de um determinado aminoácido em uma sequência biológica para que possa obter algum significado biológico. Obter essa informação muitas vezes é um processo complexo, pois a numeração deste aminoácido na sequência onde o experimento foi realizado não é obrigatoriamente a mesma numeração encontrada para sequências da mesma proteína obtida de diferentes organismos ou diferentes experimentos. A ferramenta desenvolvida apresenta na sua saída as sequências alinhadas e renumeradas, de modo correto e consequentemente apresente a exibição das informações de maneira objetiva, através da representação visual acrescentado com o esquema de cor e a numeração correta para cada aminoácido, fazendo com que o usuário localize com mais clareza o aminoácido de interesse em um processo de alinhamento de sequências biológicas. Essas sequências poderão vir de diferentes experimentos e de diversas espécies. A partir da ferramenta construída podemos destacar diversas vantagens da utilização da ferramenta comparada com as demais ferramentas existentes, dentre elas, é possível destacar a apresentação da régua horizontal enumerando cada aminoácido da sequência com a sequência que foi determinada como referência, após o processo de alinhamento. A régua horizontal é dinâmica e se adéqua de acordo com a sequência que é definida como referência, ajudando o usuário da ferramenta a encontrar de maneira rápida e eficaz o aminoácido de interesse. Nessa mesma perspectiva, a ferramenta utiliza informações representadas por meios de tooltip's, essas informações consistem em posição real que seria a posição original que o aminoácido se encontra na sequência e posição de alinhamento que se refere sobre a posição que o aminoácido se encontra logo após o processo de alinhamento. Por fim, é importante mencionar que a comparação de sequências proteicas é uma ferramenta essencial na procura da existência de relações de semelhança entre todo ou parte dessa sequência. Isso é muito comum quando temos uma sequência desconhecida e queremos identificar associando-a um grupo de proteínas de funções conhecidas, comparando essa sequência com outras de um banco de dados, também servem para a predizer as estruturas secundárias de proteínas ou para outras técnicas computacionais, como o docking e dinâmica molecular. The purpose of this dissertation is to propose a tool to deal with an important problem of computational biology, which corresponds to the location of a certain amino acid in a biological sequence so that it can obtain some biological meaning. Obtaining this information is often a complex process because the numbering of this amino acid in the sequence where the experiment was performed is not necessarily the same numbering found for sequences of the same protein obtained from different organisms or different experiments. The developed tool presents in its output the correctly aligned and renumbered sequences and consequently displays the information in an objective way, through the visual representation added with the color scheme and the correct numbering for each amino acid, causing the user to locate with more clarity the amino acid of interest in a process of biological sequence alignment. These sequences may come from different experiments and from several species. From the built tool we can highlight several advantages of using the tool compared to the other existing tools, among them it is possible to highlight the presentation of the horizontal ruler by enumerating each amino acid of the sequence with the sequence that was determined as reference after the alignment process. The horizontal ruler is dynamic and conforms according to the sequence that is defined as reference, helping the tool user to quickly and effectively find the amino acid of interest. In this same perspective, the tool employs information represented by tooltip's means, this information consists of the actual position that would be the original position that the amino acid is in the sequence and position of alignment that refers to the position that the amino acid is just after the alignment process. Finally, it is important to mention that the comparison of protein sequences is an essential tool in the search for the existence of relations of similarity between all or part of that sequence. This is very common when we have an unknown sequence and we want to identify it by associating it with a group of proteins of known functions, comparing this sequence with others of a database, also serve to predict the secondary structures of proteins or to other computational techniques like the docking and molecular dynamics. more...
- Published
- 2019
33. EN-MUTATE : prediction of protein stability changes upon single point mutation using Ensemble Learning
- Author
-
Camargo, Alex Dias, Machado, Karina dos Santos, and Werhli, Adriano Velasque
- Subjects
Mutações pontuais ,Point mutation ,Ensemble learning ,Predição de estabilidade ,Stability prediction - Abstract
A metodologia abordada nesta dissertação é baseada na combinação dos resultados de diferentes ferramentas de predição do impacto de mutações pontuais em proteínas, assumindo-se o pressuposto de Ensemble Learning na qual a capacidade de generalização de um conjunto é frequentemente mais forte do que uma decisão individual. O objetivo é predizer qual o impacto que uma mutação pode resultar em um mutante "in-silico". Para isso, foram adotadas ferramentas descritas na literatura como capazes de predizer os efeitos na estabilidade de uma proteína sobre mutações pontuais através da variação da energia livre ∆∆G, ou seja, a diferença de energia livre entre uma proteína do tipo selvagem e o seu mutante. As primeiras versões da metodologia proposta, EN-MUTATE, realizaram o ensemble por meio de uma votação por pluralidade entre as ferramentas integradas. À vista disso, com a necessidade de se expandir as análises com o intuito de permitir uma metodologia baseada em modelos treinados através de diferentes classificadores, a abordagem proposta foi reestruturada e passou a abordar múltiplas opções de predição ensemble, o que acabou sendo agregado a ferramenta desenvolvida EN-MUTATEweb. Um fator relevante a ser mencionado sobre a viabilidade da sua utilização é a dificuldade de seleção de um determinado método a priori, tendo em vista que não há como se prever àquele que terá melhor desempenho para os dados de interesse. Do mesmo modo, o trabalho necessário para teste e comparação de múltiplas abordagens pode tornar o tempo de pesquisa demasiadamente alto para o especialista. De forma a mensurar a viabilidade de aplicação de ensemble learning ao problema de pesquisa, esta dissertação avaliou seus resultados com base em valores biológicos experimentais, sendo que os experimentos computacionais foram divididos em cinco abordagens com diferentes configurações. Por fim, para os principais conjuntos de dados adotados, a metodologia EN-MUTATE obteve em grande parte modelos mais acurados. Desse modo, as principais contribuições obtidas com o desenvolvimento desta dissertação atendem ao seu principal objetivo: definir uma metodologia cuja finalidade é adotar o conceito de Ensemble Learning para combinar em uma única abordagem os resultados de diferentes ferramentas de predição do impacto de mutações pontuais em proteínas, buscando, assim, a adoção de abordagens para produzir um resultado final em conjunto potencialmente melhor do que os individuais The methodology used in this dissertation is based on the combination of the results of different tools to predict the impact of point mutations on proteins, using the assumption of Ensemble Learning, in which the capacity of generalization of a set is often stronger than an individual decision. The goal is to predict the impact that a mutation can have on an "in-silico" mutant. To this end, tools described in the literature have been chosen for being capable of predicting the effects on stability of a protein on single point mutations through the free energy variation G, that is, the free energy difference between a wild-type protein and its mutant. The first versions of the proposed methodology, EN-MUTATE, performed the ensemble by means of a plurality voting among the integrated tools. Having this in view, and considering the need to expand the analyzes in order to allow a methodology based on models trained through different classifiers, the proposed approach was restructured and started to address multiple options of ensemble prediction, which ended up being added to EN-MUTATEweb, the tool developed. A relevant factor to be mentioned about the viability of its use is the difficulty of selecting a certain method a priori, considering that there is no way to predict the one that will perform best for the data of interest. Likewise, the work required to test and compare multiple approaches can make the search time too high for the specialist. In order to measure the feasibility of applying ensemble learning to the research problem, this dissertation evaluated its results based on experimental biological values, and the computational experiments were divided into five approaches with different configurations. Finally, in the main datasets used EN-MUTATE methodology obtained in large part more accurate models. Thus, the main contributions of this dissertation cover the main objective: define a methodology whose purpose is to adopt the concept of Ensemble Learning to combine results of different tools to predict the impact of point mutations on proteins, seeking the adoption of approaches to produce a potentially better combined result than the individual ones. more...
- Published
- 2017
34. Análise de características da poça de fusão e dos modos de transferência com visão computacional
- Author
-
Silva, Renan Zafalon da and Werhli, Adriano Velasque
- Subjects
High speed camera ,Visão computacional ,Processing image ,Processamento de imagens ,Computer vision ,Câmera de alta velocidade ,Poça de fusão ,Welding pool - Abstract
A soldagem metálica é muito importante e amplamente utilizada nas indústrias no dias de hoje. Embora seja um processo bastante conhecido, os detalhes da poça de fusão são difíceis de serem investigados. Neste trabalho utilizamos câmeras de alta velocidade para filmar a poça de solda. Em um primeiro momento uma revisão sistemática da literatura é apresentada. Em seguida, técnicas de visão computacional são aplicadas para a obtenção automática de parâmetros do processo de transferência metálica. Ademais, técnicas de visão computacional são aplicadas para a determinação automática do tipo de transferência metálica. Os resultados da determinação automática do tipo de transferência metálica são promissores e deverão permitir em estudos futuros o estudo da transição de um modo para outro. The metallic welding is very important and widely used in the industry nowadays. Despite being a well known process the details of the welding pool are difficult to be studied. In this work high speed cameras are employed to record images of the welding pool. First, a literature systematic review is presented. Following, computer vision methods are applied to automatically obtain the parameters of the metallic transfer. Moreover, computer vision techniques are employed to the automatic determination of the transference type. The results are promising and should permit the study of the transitions between metallic transfer modes in future studies. more...
- Published
- 2017
35. Visualization of Intermediate Layers of Image Transformation Convolutional Neural Networks
- Author
-
Protas, Églen da Veiga, Drews Junior, Paulo Lilles Jorge, and Werhli, Adriano Velasque
- Subjects
Maximização da Ativação ,Restauração de Imagens ,Deep Learning ,Visualização ,Redes Neurais ,Convolutional neural networks ,Convolutional Neural Network ,Image Restoration ,Activation Maximization ,Visualization - Abstract
As Redes Neurais Convolucionais são um modelo de aprendizado supervisionado que nos últimos anos tem se tornado o estado da arte em diversas aplicações da área de visão computacional, como reconhecimento de carácteres, classificação de imagens e detecção de objetos. Apesar do grande poder deste modelo, ele possui algumas desvantagens, entre elas a dificuldade de se compreender como os seus diversos parâmetros se relacionam para chegar a resposta final. Recentemente, algumas técnicas de visualização foram desenvolvidas com o objetivo de auxiliar na compreensão do funcionamento interno de uma rede neural, e o conhecimento obtido através da aplicação destas técnicas foi utilizado para melhorar o desempenho das arquiteturas em questão. Estas técnicas, porém, foram desenvolvidas para e aplicadas em redes de classificação de imagens. O objetivo deste trabalho é estudar os métodos de visualização existentes e avaliar a sua aplicação em redes neurais destinadas a problemas de transformação de imagem, que são aqueles onde a entrada e a saída são uma imagem, geralmente do mesmo tamanho. Foram utilizadas como estudo de caso redes neurais relacionadas aos problemas de estimativa de profundidade, remoção de névoa e restauração de imagens subaquáticas. A aplicação de métodos de visualização nestes modelos permitiu uma melhor compreensão sobre os mesmos, que pode ajudar no desenvolvimento de arquiteturas melhores e mais eficientes. Convolutional Neural Networks are a supervised learning model that in recent years has become the state-of-the-art in many fields of computer vision, such as character recognition, image classification and object detection. Despite its power, this model has some disadvantages, among them the difficulty in understanding how the model parameters are related in order to reach the network's final answer. Recently, some visualization techniques have been developed with the objective of helping the understanding of the inner working of a neural network, and the knowledge obtained through the application of these techniques was used to improve the performance of the architectures in question. Those techniques, however, were developed for and applied to image classification networks. The objective of this work is to study existing visualization methods and evaluate their application in neural networks intended to image transformation problems, i.e., problems where both the input and output are images, usually of the same size. Convolutional Neural Networks related to the problems of depth estimation, image dehazing and underwater image restoration were used as case studies. The application of visualization methods in these models allowed a better understanding of them, which may help in the development of better and more efficient architectures. more...
- Published
- 2017
36. A multi-statistic method for identification of differentially expressed genetic pathways
- Author
-
Fontoura, Carla Adriane Ramos Segatto, Mombach, Jose Carlos Merino, Oliveira, Gilberto Orengo de, Werhli, Adriano Velasque, Dorneles, Lucio Strazzabosco, and Librelotto, Giovani Rubert
- Subjects
Vias genéticas ,Gene pathways ,Microarranjo ,Gene expression ,Expressão gênica ,Microarray ,Software R ,R software ,CIENCIAS EXATAS E DA TERRA::FISICA [CNPQ] - Abstract
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior The determination of the causes and origins of a given disease is a complex undertaking, considering that there is a large number of genes engaged that interact with each other (Watson, 2006). Bioinformatics experts working in the search for a perfect integration between biology and information, in order to understand the likely factors that trigger certain diseases (Pevzner, 2000). To achieve this, the revolutionary methodology of Microarrays (LOCKHART et al., 1996) based on the gene expression of patients, it has been widely used to simultaneously measuring changes and regulation of the genes of the genome under certain biological conditions, resulting in a list of genes that may be considered interesting from a biological point of view for a particular disease. In this thesis, we present a multi-statistic method to detect differentially expressed genetic pathways in DNA microarray data. Many statistical methods of analysis are based on the use of a single statistical test. It is believed that the use of multiple tests decreases the number of false positive discoveries. Our method can be applied to transcriptome data to investigate which pathways have changes in expression when subjected to some type of disturbance. The method determines the activity of pathways evaluated, and verifies if the changes found are statistically significant through the bootstrap, Fisher exact and Wilcoxon tests. Implemented in R language and available for download from the Comprehensive R Archive Network (CRAN) as a package called PATHChange, our method showed consistency in its results with those predicted in the literature when tested for microarray of cancer and pre-cancer colon public data. The PATHChange method offers an alternative type of analysis of differentially expressed genes pathways for researchers seeking to determine phenotypes of diseases such as cancer. A determinação das causas e origens de uma determinada doença é uma tarefa complexa, considerando que existe um grande número de genes comprometidos que interagem entre si (WATSON, 2006). Especialistas em Bioinformática trabalham na busca de uma perfeita integração entre a biologia e a informação, com o intuito de compreender os prováveis fatores que desencadeiam determinadas doenças (PEVZNER, 2000). Para tal, a metodologia revolucionária de Microarranjos (LOCKHART et al., 1996), baseada na expressão gênica de pacientes, tem sido amplamente utilizada para medir simultaneamente as mudanças e regulação dos genes do genoma sob certas condições biológicas, resultando em uma lista de genes que podem ser considerados interessantes do ponto de vista biológico para uma determinada doença. Na presente tese, nós apresentamos um método multiestatístico destinado à detectar vias genéticas diferencialmente expressas em dados de microarranjos de DNA. Grande parte dos métodos de análise estatística são baseados no uso de apenas um teste estatístico. Acredita-se que associar métodos estatísticos baseados em testes diferentes diminui o número de falsos positivos. O método que nós desenvolvemos determina a atividade das vias avaliadas, e verifica se as alterações encontradas são estatisticamente significativas através dos testes de bootstrap, exato de Fisher e Wilcoxon. Este método pode ser aplicado à dados de transcriptoma para investigar quais vias apresentam mudanças na expressão de seus genes quando submetidos à algum tipo de perturbação. Implementado em linguagem R e disponibilizado para download no CRAN (do inglês, Comprehensive R Archive Network) como um pacote denominado PATHChange, nosso método demonstrou consistência entre os seus resultados com os previstos na literatura quando testado para dados públicos de microarranjos de câncer e pré-câncer de cólon. O método do PATHChange oferece um tipo alternativo de análise de vias de genes diferencialmente expressas para os pesquisadores que buscam apurar fenótipos de doenças, tais como o câncer. more...
- Published
- 2016
37. Cat-p-Data : a tool for manipulating protein data
- Author
-
Seus, Vinicius Rosa, Machado, Karina dos Santos, and Werhli, Adriano Velasque
- Subjects
Ferramentas automatizadas - Abstract
Bancos de dados públicos como o PDB (Protein Data Bank), NCBI protein e ZINC possuem uma enorme quantidade de dados armazenados. Com esta grande quantidade de dados, fica evidente que o uso de ferramentas que realizam a aquisiçãoo e análise desse conjunto de dados é uma necessidade. Além disso, relacionar dados estruturais de proteínas com dados sequenciais de proteínas e relacionar experimentos de docagem molecular e triagem virtual ainda é um desafio. Dessa forma, é apresentado neste trabalho a ferramenta Cat-p-Data(do inglês Custom Analysis tool for protein data). A ferramenta Cat-p-Data integra em um mesmo ambiente diversas funcionalidades para facilitar a pesquisa de dados proteicos. No final deste trabalho, um estudo de caso com o grupo de proteínas da beta-glicosidase é realizado para validar a ferramenta. Public databases such as PDB (Protein Data Bank), NCBI protein and ZINC have an enormous amount of stored data. With this large amount of data, it is evident that the use of tools that perform the acquisition and analysis of this data set is a necessity. In addition, relate structural proteins data with sequence proteins data and relate experiments of molecular docking and virtual screening is still a challenge. Thus, it is presented in this paper the Cat-p-Data (Custom Analysis Tool for Protein Data) tool. The tool Cat-p-Data integrates in the same environment several features to facilitate the research of protein data. At the end of this work, a case study with the protein group of beta-glucosidase is performed to validate the tool. more...
- Published
- 2016
38. A comparison of classifiers for predicting color class from structural data on fluorescent proteins
- Author
-
Silva, Roger Sá da and Werhli, Adriano Velasque
- Subjects
Mineração de dados ,Bioinformatics ,Bioinformática ,Fluorescent proteins ,Data mining ,Proteínas Fluorescentes - Abstract
Proteínas Fluorescentes são importantes ferramentas em pesquisas de Biologia Molecular e possuem grande valor comercial na produção de peixes transgênicos fluorescentes. De modo geral, a criação de variantes de cor destas proteínas ocorre por alterações estruturais na macromolécula, ocasionadas por mutações na sequência de aminoácidos. Porém, relacionar de forma exata dados estruturais e sequenciais com a definição de cor de emissão de proteínas fluorescentes ainda necessita de mais estudos. Neste contexto, a aplicação do processo de descoberta de conhecimento em bases de dados se apresenta como uma possibilidade de obtenção de conhecimento sobre essa relação da sequência/estrutura e a cor de emissão. Dessa forma, é realizado neste trabalho a comparação entre três classificadores (baseados em Árvore de Decisão, Redes Neurais Artificiais e Máquinas de Vetores de Suporte) com o intuito de investigar a performance deles na predição da classe de cor de proteínas fluorescentes a partir de seus dados estruturais no âmbito do projeto Peixes Transgênicos Fluorescentes. Para tanto, uma ferramenta web é desenvolvida para o armazenamento, organização e preparação dos dados estruturais utilizados no treinamento dos classificadores. Ao final, um processo de comparação quantitativa e qualitativa é realizado sobre métricas de desempenho e capacidades de cada classificador, culminando na escolha do classificador baseado em Árvore de Decisão como o mais adequado na tarefa de predição da classe de cor de proteínas fluorescentes. Fluorescent proteins are important tools in molecular biology research and have great commercial value in production of fluorescent transgenic fishes. In general, the creation of color variants of these proteins occurs by structural changes in the macromolecule caused by mutations in amino acid sequence. However, to relate accurately structural and sequence data of fluorescent proteins with its emission color still needs further study. In this context, the application of knowledge discovery in databases process presents a possibility of obtaining knowledge on this relationship of the sequence / structure and emission color. Thus, in this work it is carried out a comparison between classifiers (based on Decision Tree, Artificial Neural Networks and Support Vector Machines) in order to investigate their performance in predicting the class color of fluorescent proteins from their structural data, in the context of Fluorescent Transgenic Fishes project. Therefore, an web tool is designed for the storage, organization and preparation of structural data used in the classifiers training. At the end, a quantitative and qualitative comparison process is carried out on performance metrics and capabilities of each classifier, culminating in the selection of the classifier based on Decision Tree as the most appropriate for the task of predicting the fluorescent proteins color class. more...
- Published
- 2016
39. Using probability distributions in variables at Agent- Based Simuations: a case study for the Tuberculosis Bacillus Growth curve
- Author
-
Moraes, Marcilene Fonseca de, Adamatti, Diana Francisca, and Werhli, Adriano Velasque
- Subjects
Agent-based simulation ,Distribuição de probabilidades ,Probability distributions ,Mycobacterium tuberculosis ,Simulação baseada em agentes - Abstract
Mesmo tratável e podendo ser prevenida com medicamentos, a tuberculose (TB) continua a infectar e causar mortes em toda população, especialmente nas de países pobres e em partes mais vulneráveis de países ricos. Diante dessa situação, o estudo da curva de crescimento do Mycobacterium tuberculosis, causador da tuberculose, pode ser um forte aliado contra a TB, seja para a elaboração de novos fármacos, ou até mesmo no desenvolvimento da teoria. Este trabalho modela a curva de crescimento do Mycobacterium tuberculosis com a utilização de simulação baseada em agentes, e tem como objetivo simular a curva com o mínimo de erro possível com relação à real. Para implementar esse modelo, foi definido um meio onde agentes representam as bactérias em seu habitat, a forma como interagem umas com as outras e como ambiente. E para tornar o modelo mais similar a um modelo de crescimento real, os valores das variáveis dos agentes são gerados a partir de distribuições de probabilidades. O modelo baseado em agentes desenvolvido apresentou resultados satisfatórios, uma vez que a curva de crescimento modelada revelou-se similar a curva real. Essa similaridade torna o modelo bastante útil para verificação de hipóteses, já que as simulações levam minutos, em oposição aos experimentos in vitro que levariam dias. Even treatable and prevented with medicines, tuberculosis (TB) continues to infect and cause deaths in the whole population, especially in poor countries and in vulnerable parts of the rich countries. In this way, the study of the growth curve of Mycobacterium tuberculosis can be a strong ally against TB, to develop new drugs or a theory.This paper models the growth curve of Mycobacterium tuberculosis with using agent-based simulation, and it aims to simulate the curve with minimum error possible comparing to real. To implement this model, we have defined agents as the bacteria in their habitat, how they interact each other and with the environment. And to make the model more similar to a real growth model, the values of the agents variables are generated from probability distributions.The agent-based model developed presented satisfactory results, since the growth curve modeled proved similar to real curve. This similarity makes the model high useful for verification of hypotheses, since simulations take minutes to execute on contrary of in vitro experiments that could take days. more...
- Published
- 2016
40. Classificação de sedimentos superficiais de leitos oceânicos e águas continentais: uma abordagem baseada em super segmentação e sabedoria das massas
- Author
-
Barbat, Mauro Medeiros and Werhli, Adriano Velasque
- Subjects
Classificação de sedimentos ,Sabedoria das massas ,Visão computacional ,Machine learning ,Sediments classification ,Sonar de varredura lateral ,Computer vision ,Aprendizado de máquina ,Wisdom of crowds ,Side scan sonar - Abstract
Observando o problema de classificar o substrato marinho, existem diversificadas técnicas que em grande parte consistem em metodologias tradicionais que demandam a necessidade de especialistas e/ou aquisição física de amostras para efetuar a classificação em laboratório, consumindo grande quantidade de recursos humanos e financeiros. No entanto, técnicas para classificação remota são capazes de proporcionar não apenas ganhos em relação a tempo e recursos mas também, são capazes de operar sobre grandes volumes de dados de maneira eficiente e eficaz, processo o qual poderia requerer um tempo considerável de trabalho. Neste intuito, este trabalho propõe o desenvolvimento de uma metodologia/ferramenta computacional focada no contexto de classificação de sedimentos superficiais de leitos oceânicos e de águas continentais, utilizando sonografias de sonares de varredura lateral (Side Scan Sonar) que consistem em imagens digitais de alta resolução. Observing the problem of marine bottom classification, there are various techniques that largely consist of traditional methods that require the knowledge of experts and / or ground proof of samples to their classification in the laboratory, consuming large amounts of human and financial resources. However, techniques for remote classification are not only able to provide gains of time and resources, but also are able to operate on large volumes of data efficiently and effectively process which would require a considerable amount of work. Therefore, so far this dissertation proposes the development of a computational methodology/tool focused on the context of surface sediment classification of ocean floors and continental waters, using as a basis the use of side scan sonar that consist of high-resolution digital images. more...
- Published
- 2016
41. Analysis of risk dependencies in collaborative risk management
- Author
-
Barchet, Catherine de Lima, Fontoura, Lisandra Manzoni, Piveta, Eduardo Kessler, and Werhli, Adriano Velasque
- Subjects
Jogos de diálogo ,Bayesian networks ,Redes bayesianas ,Gerenciamento colaborativo de riscos ,Argumentation ,Dependências de riscos ,Collaborative risk management ,Dialogue game ,CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO [CNPQ] ,Risk dependencies ,Argumentação - Abstract
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior In a collaborative risk management environment, which the project stakeholders are involved in risk management activities, the identification and analysis of dependencies often is not a simple process to be performed, although to be necessary for more efficient and concise risk management. This work propose an approach for the identification and analysis of direct and causal dependencies between the risks identified in software projects, being this analysis supported by a probabilistic model of Bayesian networks to assist participants during the process. Thus, collaborative risks discussions of software projects can be conducted through an existing discussion system, the RD System. This research includes the adaptation made in the protocol used by the RD System wherein these modifications by making possible the identification and the analysis of risk dependencies collaboratively. As a way to assist and support the process of analyzing the dependencies once identified, a probabilistic model of Bayesian networks is proposed, enabling the participants simulate different scenarios and discuss starts from the results obtained in a collaborative way with the aim of improve the strategies for the treatment of risks of software projects. In order to validate the proposed approach, we present and discuss a case study involving experts in the area and a practical experiment carried out with students from the computing area. The results show clear evidence of acceptance and applicability of the developed approach for to resolve the identification and analysis of risks dependencies in collaborative environments for risk management of software project. Em um ambiente de gerenciamento colaborativo de riscos, em que as partes interessadas de um projeto estão envolvidas nas atividades de gestão de riscos, muitas vezes a identificação e análise de dependências não é um processo simples de ser realizado, apesar de ser necessário para um gerenciamento de riscos mais eficiente e conciso. Este trabalho propõe uma abordagem para a identificação e análise de dependências causais entre os riscos e causas identificados em projetos de software, sendo esta análise apoiada por um modelo probabilístico de redes Bayesianas para auxiliar os participantes durante o processo. Desta forma, discussões colaborativas de riscos de projetos de software podem ser realizadas por meio de um sistema de discussão já existente, o RD System. Esta pesquisa abrange a adaptação realizada no protocolo utilizado pelo RD System, sendo que estas modificações possibilitam que a identificação e a análise das dependências dos riscos sejam realizadas de forma colaborativa. Como forma de auxiliar e apoiar o processo de análise das dependências uma vez identificadas, um modelo probabilístico de redes Bayesianas é proposto, possibilitando que os participantes simulem diferentes cenários e discutam, a partir dos resultados obtidos de forma colaborativa, com o objetivo de aprimorar as estratégias de tratamento para os riscos de projetos de software. A fim de validar a abordagem proposta, é apresentado e discutido um estudo de caso envolvendo especialistas na área e um experimento prático realizado com alunos da área de computação. Os resultados obtidos apresentam claras evidências de aceitação e aplicabilidade da abordagem desenvolvida para a solução da identificação e análise de dependências de riscos em ambientes colaborativos para gestão de riscos de projetos de software. more...
- Published
- 2015
42. Visual Sensor: Vision-Based Mesureament of Pointer-Scale Indicators
- Author
-
Santos, Eduardo Schmidt Fernandes dos, Werhli, Adriano Velasque, and Rodrigues, Ricardo Nagel
- Subjects
Extração de informações de vídeo ,Sensores ,Sensors ,Visão computacional ,Pointer-scale indicators ,Computational vision ,Instrumento de ponteiro ,Variáveis de processo ,Video information extraction ,Process variables - Abstract
O presente trabalho tem por objetivo propor uma técnica para extração do mensurando de instrumentos de ponteiros e determinar as suas características intrínsecas, desempenho e limitações através de experimentos. Entre as principais características destacam-se a acurácia e a robustez. O método consiste em captar imagens do instrumento através de uma câmera, processar este stream de vídeo e dele extrair a informação da grandeza. O intuito é utilizar esta informação como entrada para um sistema de controle, assim como um elemento sensor faria em um sistema convencional. The objective of this paper is to propose a value extraction technique of pointer-scale indicators and to obtain its features, performance and limitations through experiments. Among these features we can highlight accuracy and robustness. This method consists in capturing images from cameras of these instruments, processing them and to extract the information of these process variables. The aim of this is to use this information as input to a control system, like a real sensor. more...
- Published
- 2015
43. Computação Bayesiana Aproximada Monte Carlo Sequencial como ferramenta para a interferência de parâmetros na rede genética circadiana da Arabidopsis Thaliana
- Author
-
Negret López, Maria Claudia, Emmendorfer, Leonardo Ramos, and Werhli, Adriano Velasque
- Subjects
Modelo matemático ,Relógio biológico ,Mathematical model ,Rede regulatória ,Inferência Bayesiana ,Bayesian inference ,ABC- SMC ,ABC- SysBio ,Regulatory network ,Biological clock - Abstract
A modelagem de sistemas complexos é um desafio para os pesquisadores nas diferentes áreas, já que cada vez deseja-se simular a natureza na forma mais precisa possível. Estes modelos, especialmente aqueles que representam sistemas biológicos, precisam de dados experimentais que, na maioria dos casos, são muito difíceis ou impossíveis de medir experimentalmente de forma direta, sendo que outra alternativa de procurá-los é por meio da estimação ou por inferência a partir dos dados observados. Neste contexto, os métodos de Computação Bayesiana Aproximada (ABC), e mais precisamente aqueles que incorporam os métodos Monte Carlo Sequencial (SMC), foram utilizados para aproximar a distribuição posteriori dos dados dadas as vantagens que apresentam estes métodos em relação aos anteriores. O sistema complexo considerado foi o correspondente à rede do ciclo circadiano da Arabidopsis thaliana, uma planta reconhecida pela comunidade científica para a realização de experimentos. Com isto, procurou-se aplicar o algoritmo ABC-SMC em uma rede regulatória biológica complexa, para ajustar a maior quantidade dos valores dos parâmetros relacionados especialmente com as proteínas LHY/CCA1 as quais envolvem os efeitos da luz na planta e que dos quais, segundo a literatura, tem-se menos confiabilidade de seus valores. Depois de ajustar cinco parâmetros, encontraram se algumas limitações da metodologia utilizada com o pacote ABC-SysBio como o tamanho do conjunto de dados a trabalhar. Conclui-se que os valores dos parâmetros observados são confiáveis devido à semelhança que eles têm com aqueles que foram encontrados nas simulações. Complex system modeling is a challenge for the researchers in different fields, and the aim is to simulate the nature in the most precise way. These models, specially those that represent biological systems, need experimental data that, in the most cases, are difficult to be measured or it is almost impossible to measure them in a direct way. Thus, they must to be found by estimation or by inference from the observed data. In this context, Approximate Bayesian Computation (ABC) methods, and more precisely, those that incorporate Sequential Monte Carlo methods were used to approximate the posterior distribution of the data. In this way, the complex system considered was the circadian net in Arabidopsis thaliana a renamed plant in the scientific community, that it is recognized by their experimental advantages. With this aim the method ABC-SMC was applied to a biological complex net that represents the circadian circuit in A. thaliana to fit the most number of parameters values related specially with LHY/CCA1 proteins, those that involves light effects in the plant and those that have less confidence of their values. Fitted five parameters, it was found some limitations of the software ABC-SysBio that make the interpretation very difficult such the data set to be worked. It is concluded that the observed parameters could be considered reliable because the similarity between them. more...
- Published
- 2015
44. Inferência de redes regulatórias utilizando algoritmos de estimação de distribuição
- Author
-
Salvá, Thyago, Werhli, Adriano Velasque, and Emmendorfer, Leonardo Ramos
- Subjects
Rede bayesiana ,Redes de regulação gênica ,Bayesian networks ,Redes bayesianas ,Computer engineering ,Estimation of distribution algorithm ,Computation ,Engenharia de computação ,Algoritmos de estimação de distribuição ,Ciência da computação ,Algoritmo de estimação de distribuição ,Gene regulatory networks - Abstract
Inferência de redes de regulação gênica a partir de dados de expressão esparsos e na presença de ruído ainda é um desafio nos dias de hoje. Neste trabalho, foram utilizados dois Algoritmos de Estimação de Distribuição distintos para inferir uma Rede de Regulação Gênica. A fim de avaliá-los, os algortimos foram aplicados em três tipos de dados: (i) dados simulados a partir de uma distribuição Gaussiana multivariada, (ii) dados simulados a partir de um simulador realista, GeneNetWeaver e (iii) dados a partir de experimentos de citometria de fluxo. Os métodos de inferências em questão apresentam um desempenho comparável com algoritmos de inferência tradicionais em termos de precisão na reconstrução da rede. Inference of Gene Regulatory Networks from sparse and noisy expression data is still a challenge nowadays. In this work two different Estimation of Distribuition Algorithms were used to infer Gene Regulatory Networks. In order to evaluate them, the algorithms were applied to three types of data: (i) data simulated from a multivariate Gaussian distribution, (ii) data simulated from a realistic simulator, GeneNetWeaver and (iii) data from flow cytometry experiments. The proposed inference method shows a performance comparable with traditional inference algorithms in terms of the network reconstruction accuracy. more...
- Published
- 2014
45. Descoberta de Conhecimento com Auxílio da Inteligência Humana: um estudo de caso para dobramento de proteínas
- Author
-
Luz, Renan Martinez da, Werhli, Adriano Velasque, and Adamatti, Diana Francisca
- Subjects
Serious game ,Jogo sério ,Mineração de dados ,Inteligência humana ,Human inteligence ,Dobramento de proteínas ,Protein folding ,Data mining - Abstract
As proteínas desempenham um papel fundamental na natureza e a descoberta de suas funcionalidades e seus comportamentos ainda inexplorados, despertam muito o interesse de diversas áreas. Em 2010, o jogo sério chamado "Fold it" foi desenvolvido com objetivo de capturar técnicas de dobramento de proteína através da inteligência humana chegando a resultados surpreendentes.Este trabalho tem como objetivo principal a busca por conhecimentos e técnicas de dobramento de proteínas através da inteligência humana, utilizando estruturas de proteínas no modelo HP possibilitando a predição dessas estruturas de forma simplificada, mas próxima a da realidade.Para tanto foi elaborado um jogo sério de dobramento de proteína no modelo HP, onde foi possível obter dobramentos realizados pelos jogadores. Estes dados foram submetidos a técnicas de mineração de dados onde foi possível extrair conhecimentos e algumas estratégias de dobramento de proteínas.Através dos resultados obtidos foi possível analisar que, é possível obter conhecimentos com a ajuda da inteligência humana, isso indica que no futuro existem chances de se desenvolver um jogador artificial que tenha o potencial de executar dobramentos melhores dos que foram adquiridos, com a ajuda de algoritmos. Proteins are fundamental units in nature and the discovery of its unexplored functionalities and behaviors captures the attention of many areas of study. In 2010 the game called "foldit" was developed with the aim of capturing folding techniques using human intelligence. The results of this work were very promising. The main aim of this work is to search for knowledge and techniques of protein folding using human intelligence. The HP protein model is used as a means to simplify the problem while keeping its main characteristics. Following the main aim a serious game was developed where players have to fold an HP model protein. Using this game it was possible to record in a database the folding made by the players. This data set was analyzed with data mining techniques where some strategies and knowledge about the protein folding were extracted.Analyzing the results we can observe that it is possible to obtain knowledge with the help from human intelligence. The results also indicates that further research has the potential to produce an artificial player that will have the ability to fold proteins better than traditional algorithms. more...
- Published
- 2014
46. Uma proposta para melhorar a convergência de MCMC
- Author
-
Agostinho, Nilzair Barreto and Werhli, Adriano Velasque
- Abstract
Atualmente na área de sistemas Biológicos vêm-se trabalhando para o desenvolvimento de ferramentas que possam auxiliar a obter um maior conhecimento sobre as interações moleculares em um organismo. Pesquisas tem sido desenvolvidas tendo como objetivo principal obter um detalhamento da organização funcional de Sistemas Biológicos. As redes regulatórias genéticas tem sido utilizadas como ferramenta para dispor mapas detalhados sobre as interações entre os genes e consequentemente sobre as interações moleculares e a organização funcional. Porém essas redes regulatórias são altamente complexas e o processo para inferí-las é custoso computacionalmente. Neste trabalho optou-se por trabalhar com redes Bayesianas devido à sua natureza probabilística e flexibilidade. As redes Bayesianas foram amostradas através do MCMC que garante que haja uma convergência para distribuição posterior. Porém, na prática o MCMC é relativamente lento e sem garantia de alcançar a convergência. Desta forma propõe-se utilizar a saída de métodos mais rápidos e menos precisos como GGM como entrada para o método MCMC. Sendo assim, o presente trabalho propõe o desenvolvimento de um BNGGM permitindo que a amostragem MCMC seja guiada por um método mais rápido. Sendo assim, buscou-se então contribuir para o desenvolvimento de métodos de inferência de redes genéticas e assim também acrescentar recursos ao trabalho de desenvolvimento de métodos de diagnósticos e curas de doenças. more...
- Published
- 2014
47. Modelagem de emoções utilizando redes bayesianas
- Author
-
Silva, Felipe Neves da, Adamatti, Diana Francisca, and Werhli, Adriano Velasque
- Subjects
Artificial intelligence ,Emoções ,Redes bayesianas ,Multiagent systems ,Emotions ,Bayesians networks ,Inteligência artificial ,Sistemas multiagentes - Abstract
As emoções são consideradas a regra central de nossas vidas, tendo grande impacto na tomada de decisões, ações, memória, atenção, etc. Sendo assim, existe grande interesse em simulá-las em ambientes computacionais, possibilitando que situações do cotidiano humano possam ser estudadas em ambientes controlados. Embora existam modelos teóricos para o funcionamento de emoções, estes por si só são insuficientes para uma simulação precisa em meios computacionais. Tendo como base um destes modelos, o modelo OCC, essa dissertação propõe a simulação de emoções em ambientes mutiagentes através da criação de uma rede Bayesiana capaz de traduzir estímulos gerados neste ambiente em emoções. A utilização de redes Bayesianas combinadas à estrutura do modelo OCC busca a adição de imprevisibilidade ao modelo, além de fornecê-lo uma estrutura computacional. A aplicação do modelo proposto a um sistema multiagentes proporciona o estudo da influência das emoções sobre as ações e comportamento dos agentes, possibilitando um estudo de comparação entre os resultados obtidos ao se realizar uma simulação multiagentes clássica e uma simulação multiagentes contendo emoções. De forma a validar e avaliar seu funcionamento, é apresentado o estudo da aplicação da rede Bayesiana de emoções sobre um modelo multiagentes exemplo, observando as variações que as emoções provocam sobre o comportamento dos agentes. Emotions are considered the central rule of our lives, having great impact in decision-making, actions, memory, attention, etc. Thus, there is great interest in simulating them in computing environments, thus enabling the day-to-day human situations be studied in controlled environments. Although are theoretical models for the operation of emotions does exist, these alone are insufficient for accurate simulation on computational means. Based on one of these models, the OCC model, this thesis proposes the simulation of emotions in multiagents environments by creating a Bayesian network able to translate stimulus generated in this environment on emotions. The combined use of Bayesian networks in the structure of the OCC model seeks to add unpredictability to the deterministic model, besides providing a computational structure to the model. The application of the proposed model to a multiagent system provides the study of the influence of emotions on the actions and behavior of agents, thus allowing a study comparing the results obtained by performing a classical multi-agent simulation and multi-agent simulation having emotions. In order to validate and evaluate its functioning, the study of the application of the Bayesian network of emotions over a multiagent model example is presented, noting the changes that emotions provoke on agents' behavior. more...
- Published
- 2014
48. Explorando técnicas de ensemble learning para otimizar a engenharia reversa de redes regulatórias genéticas
- Author
-
Recamonde-Mendoza, Mariana, Bazzan, Ana Lucia Cetertich, and Werhli, Adriano Velasque
- Subjects
Bioinformatics ,Ensemble learning ,Machine learning ,Bioinformática ,Engenharia reversa ,Inteligência artificial ,Reverse engineering ,Maquina [Aprendizagem] ,Gene regulatory networks - Abstract
Nesta tese estamos especificamente interessados no problema de engenharia re- versa de redes regulatórias genéticas a partir de dados de pós-genômicos, um grande desafio na área de Bioinformática. Redes regulatórias genéticas são complexos cir- cuitos biológicos responsáveis pela regulação do nível de expressão dos genes, desem- penhando assim um papel fundamental no controle de inúmeros processos celulares, incluindo diferenciação celular, ciclo celular e metabolismo. Decifrar a estrutura destas redes é crucial para possibilitar uma maior compreensão à nível de sistema do desenvolvimento e comportamento dos organismos, e eventualmente esclarecer os mecanismos de doenças causados pela desregulação dos processos acima mencio- nados. Devido ao expressivo aumento da disponibilidade de dados experimentais de larga escala e da grande dimensão e complexidade dos sistemas biológicos, métodos computacionais têm sido ferramentas essenciais para viabilizar esta investigação. No entanto, seu desempenho ainda é bastante deteriorado por importantes desafios com- putacionais e biológicos impostos pelo cenário. Em particular, o ruído e esparsidade inerentes aos dados biológicos torna este problema de inferência de redes um difícil problema de otimização combinatória, para o qual métodos computacionais dispo- níveis falham em relação à exatidão e robustez das predições. Esta tese tem como objetivo investigar o uso de técnicas de ensemble learning como forma de superar as limitações existentes e otimizar o processo de inferência, explorando a diversidade entre um conjunto de modelos. Com este intuito, desenvolvemos métodos computa- cionais tanto para gerar redes diversificadas, como para combinar estas predições em uma solução única (solução ensemble ), e aplicamos esta abordagem a uma série de cenários com diferentes fontes de diversidade a fim de compreender o seu potencial neste contexto específico. Mostramos que as soluções propostas são competitivas com algoritmos tradicionais deste campo de pesquisa e que melhoram nossa capa- cidade de reconstruir com precisão as redes regulatórias genéticas. Os resultados obtidos para a inferência de redes de regulação transcricional e pós-transcricional, duas camadas adjacentes e complementares que compõem a rede de regulação glo- bal, tornam evidente a eficiência e robustez da nossa abordagem, encorajando a consolidação de ensemble learning como uma metodologia promissora para decifrar a estrutura de redes regulatórias genéticas. In this thesis we are concerned about the reverse engineering of gene regulatory networks from post-genomic data, a major challenge in Bioinformatics research. Gene regulatory networks are intricate biological circuits responsible for govern- ing the expression levels (activity) of genes, thereby playing an important role in the control of many cellular processes, including cell differentiation, cell cycle and metabolism. Unveiling the structure of these networks is crucial to gain a systems- level understanding of organisms development and behavior, and eventually shed light on the mechanisms of diseases caused by the deregulation of these cellular pro- cesses. Due to the increasing availability of high-throughput experimental data and the large dimension and complexity of biological systems, computational methods have been essential tools in enabling this investigation. Nonetheless, their perfor- mance is much deteriorated by important computational and biological challenges posed by the scenario. In particular, the noisy and sparse features of biological data turn the network inference into a challenging combinatorial optimization prob- lem, to which current methods fail in respect to the accuracy and robustness of predictions. This thesis aims at investigating the use of ensemble learning tech- niques as means to overcome current limitations and enhance the inference process by exploiting the diversity among multiple inferred models. To this end, we develop computational methods both to generate diverse network predictions and to combine multiple predictions into an ensemble solution, and apply this approach to a number of scenarios with different sources of diversity in order to understand its potential in this specific context. We show that the proposed solutions are competitive with tra- ditional algorithms in the field and improve our capacity to accurately reconstruct gene regulatory networks. Results obtained for the inference of transcriptional and post-transcriptional regulatory networks, two adjacent and complementary layers of the overall gene regulatory network, evidence the efficiency and robustness of our approach, encouraging the consolidation of ensemble systems as a promising methodology to decipher the structure of gene regulatory networks. more...
- Published
- 2014
49. Simulação da curva de crescimento do mycobacterium tuberculosis utilizando sistemas multiagentes
- Author
-
Werlang, Pablo Santos, Werhli, Adriano Velasque, and Adamatti, Diana Francisca
- Subjects
Simulação computacional ,Growth curve ,Multi-agent systems ,Mycobacterium tuberculosis ,Curva de crescimento ,Computer simulation ,Sistemas multiagentes - Abstract
A tuberculose é uma doença infecciosa causada pelo bacilo Mycobacterium tuberculosis. Ainda hoje a tuberculose preocupa os profissionais da saúde, principalmente nos países em desenvolvimento. O estudo da curva de crescimento do Mycobacterium tuberculosis é muito importante e possibilita o estudo de suas características e o desenvolvimento de novos fármacos. Porém, a realização de testes experimentais com este bacilo é bastante demorado, levando pelo menos três semanas para mostrar algum resultado, e muitas vezes falham por causa de contaminação ou desidratação do meio. Portanto, é objeto de pesquisa o estudo de modelos que representem com fidelidade a curva de crescimento do M. tuberculosis e que obtenham estes resultados em um tempo menor. Com este fim, existem diversos modelos matemáticos que descrevem curvas de crescimento de bactérias, e embora bastante precisos e úteis, carecem de uma correspondência clara com o ambiente real do qual tentam reproduzir. Tomando uma outra direção, o presente trabalho descreve um modelo de curvas de crescimento de bactérias baseado em sistemas multiagentes. Este tipo de modelo possui por característica a modelagem do comportamento individual de agentes se utilizando de parâmetros que possuem alguma relação com variáveis observadas no ambiente real. O crescimento populacional dos agentes resulta em uma curva de crescimento que converge com o resultado obtido nas curvas experimentais. Além disso, o modelo apresentado também conta com um mecanismo de inferência de parâmetros, que possibilita que através da entrada de valores de uma curva real e a aplicação de um método numérico possa encontrar os valores de parâmetros da simulação que resultarão em uma curva de crescimento o mais próximo possível da curva experimental. Os resultados obtidos foram bastante satisfatórios e as curvas geradas através dos parâmetros automaticamente encontrados pelo método alcançaram um nível de similaridade bastante próximo às curvas reais, o que torna o modelo bastante útil para a verificação de hipóteses, uma vez que as simulações levem minutos e os testes de hipóteses horas, em oposição aos dias que levariam para realizar tais testes in vitro. Tuberculosis is an infectious disease caused by Mycobacterium tuberculosis. Even today tuberculosis worries health professionals, especially in third world countries. The study of the growth curve of Mycobacterium tuberculosis is very important and allows the study of its characteristics and the development of new drugs. However, experimental tests with this bacillus is very time consuming, and therefore it is extremely useful to use a model which faithfully represents the growth curve of M. tuberculosis to obtain these results in a shorter time. To this end, there are several mathematical models that describe growth curves, and although quite accurate and useful, they lack a clear correspondence with the actual environment which they try to reproduce. Taking another direction, this paper describes a model developed based on multiagent systems. This kind of model has the characteristic of individual behavior modeling using parameters that are related to the observed variables in the real environment. The population growth of the agents results in a growth curve that converges with the results obtained in the experimental curves. Furthermore, the model also has a parameter inference engine, which in face of a real curve data and the application of a numerical method can find the parameter values of the simulation that in turn will result in a growth curve similar to the experimental curve. The results obtained were satisfactory and curves generated using parameters found automatically by the method achieved a considerable degree of similarity with real curves. This makes the model useful for testing hypotheses in a matter of hours as opposed to days that would take to perform such tests in vitro. more...
- Published
- 2013
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.