CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico FAPEMIG - Fundação de Amparo a Pesquisa do Estado de Minas Gerais A família Solanaceae é uma das maiores famílias do reino vegetal, incluindo várias plantas de importância agronômica e médica, sobretudo o tomate, por seu alto consumo a nível mundial. Além de sua importância como alimento, o tomate possui características agronômicas interessantes, a saber, fruto carnoso e folhas compostas, que plantas modelo não possuem, ex. Arabidopsis thaliana. Nesse sentido, o tomate comum (Solanum lycopersicum) tem sido utilizado como modelo para espécies que também apresentam tais características. Devido às características específicas e às condições de cultivo, as variedades de tomate são constantemente melhoradas. No entanto, essa cultura é suscetível a diversas pragas e patógenos. Para auxiliar no controle dessas doenças, a maioria dos produtores opta pelo uso de agentes químicos que, muitas vezes, são caros, às vezes ineficazes e têm efeitos deletérios ao meio ambiente. Uma alternativa para esses problemas é cruzar o tomate cultivado com espécies silvestres. São várias as espécies conhecidas de tomate selvagem, constituídas por recursos genéticos pouco explorados e de grande importância para o melhoramento, pesquisa e desenvolvimento da cultura, como o Solanum pennellii, Solanum galapagense, Solanum chilense, Solanum peruvianum e Solanum pimpinellifolium. Algumas espécies de tomate selvagem têm sido amplamente utilizadas para a construção e mapeamento de populações devido a sua tolerância ao estresse ambiental. Nesse sentido, um melhor entendimento da base molecular do tomate é necessário para se atingir a eficiência e o sucesso na seleção de marcadores associados às características de interesse, como a tolerância biótica e abiótica. Da mesma forma que é importante obter um maior conhecimento sobre as bases moleculares de muitas espécies de plantas, alguns animais, parasitas, bactérias e vírus também necessitam de estudos moleculares para auxiliarem no controle de doenças que acometem os serem humanos. Neste sentido, a esquistossomose humana é uma doença parasitária causada por helmintos do gênero Schistosoma que afeta milhões de pessoas em todo o mundo. Cinco espécies de Schistosoma são responsáveis pela maioria das infecções humanas: Schistosoma mansoni, Schistosoma japonicum, Schistosoma haematobium, Schistosoma mekongi e Schistosoma intercalatum. O S. haematobium afeta o sistema reprodutivo e urinário e tem sido considerado um grande problema de saúde pública na África. A disseminação da doença é dependente da interação entre o parasita e o hospedeiro intermediário. Esta interação é complexa e determinada por alguns genes envolvidos na infectividade do parasita e suscetibilidade do hospedeiro. Portanto, compreender os mecanismos de regulação gênica é extremamente importante para compreender as interações parasita-hospedeiro e quais genes podem contribuir para a infecção. O progresso atual no sequenciamento do genoma de plantas e animais tem gerado informações úteis para auxiliar no estudo da diversidade genética de muitas espécies. Nos anos 2000 foram sequenciados os genomas de S. galapagense, S. peruvianum, S. haematobium, S. lycopersicum, S. pennellii, S. pimpinellifolium e S. chilense. A interpretação dos genomas do esquistossomo melhorou nosso entendimento da biologia molecular desses parasitas, permitindo a identificação e caracterização de genes ainda não descobertos. A disponibilidade de um genoma de referência de tomate forneceu um arcabouço para a análise genômica da família Solanaceae, gerando uma fonte de informações importantes para seu melhoramento molecular. Além disso, o sequenciamento de genomas de espécies selvagens de tomate forneceu um recurso valioso para a compreensão de várias características proeminentes, como mudanças na resposta ao déficit hídrico, resistência biótica e abiótica e metabolismo. Entretanto, várias partes desses genomas precisam ser exaustivamente estudadas e anotadas, uma vez que o sequenciamento do genoma e o depósito das sequências em bancos de dados públicos são apenas os passos iniciais do estudo. Estudos recentes têm mostrado a importância da regulação gênica envolvendo várias classes de pequenos RNAs, seu sistema de processamento e desempenho celular em diferentes organismos. Os principais representantes dessa classe de pequenos RNAs são os microRNAs (miRNAs), cujas formas de regulação podem envolver a inibição do processo de tradução, degradação de RNAm ou silenciamento de genes, seja por complementaridade de alvos ou por sinalização de modificações no DNA em regiões específicas do genoma. Diferentes proteínas atuam para gerar miRNAs maduros específicos para a regulação pós-transcricional. Em plantas e animais estas vias de síntese dos miRNAs possuem algumas diferenças. Estratégias computacionais têm sido usadas para identificar miRNAs e proteínas envolvidas em suas vias em vários organismos. Os métodos computacionais são amplamente utilizados na identificação de genes, uma vez que alguns transcritos são expressos apenas sob certas condições ou em células específicas. Assim, as técnicas computacionais auxiliam no processo de descoberta de novos miRNAs, utilizando todas as informações contidas no genoma e/ou no transcriptoma independentemente da amostragem. Além disso, tais métodos são úteis para a previsão de precursores de miRNA e seus alvos. Diante da importância de tais RNAs não codificantes na regulação da expressão gênica, é importante estudarmos miRNAs maduros e precursores, bem como os genes envolvidos na via de miRNA nestas espécies de tomate cultivado e selvagens para auxiliar na elucidação de processos biológicos, bem como seus desempenhos no nível celular. Também em S. haematobium, o conhecimento destas pequenas moléculas e sua via de processamento pode ajudar a entender o ciclo de vida desse parasita, seu mecanismo de infectividade e na busca de novos métodos de controle da esquistossomose. Além da via de produção dos miRNAs, outras vias de defesa são importantes em algumas plantas. Diferentes aleloquímicos presentes em espécies de Solanum têm sido associados à resistência a pragas, como metil-cetonas, sesquiterpenos e acilaçúcares. A seleção para altos teores destes aleloquímicos poderia, desta maneira, constituir-se uma técnica eficiente de seleção indireta para resistência a pragas. Esses fitoquímicos purificados podem agir contra as pragas reduzindo o desenvolvimento larval, prejudicando a alimentação e a ovoposição de muitas pragas do tomate. Tendo em vista a grande importância do tomate e a alta taxa de aplicação de agrotóxicos na cultura, um maior conhecimento sobre as bases moleculares do tomate faz-se necessário na seleção de marcadores associados a características importantes em resposta ao estresse biótico e abiótico. Portanto, compreender os miRNAs, sua via de processamento e os genes relacionados com a produção de metabólitos poderá auxiliar na compreensão do seu envolvimento na resistência a artrópodes, principalmente pela produção de acilaçúcar e a regulação pós transcricional mediada pelos miRNAs. Tendo em vista essas questões, o Capítulo I apresentará a fundamentação teórica sobre os miRNAs, acilaçucares e suas vias, além da importância de estudar estas moléculas em S. lycopersicum, S. pennellii, S. galapagense, S. chilense, S. peruvianum, S. pimpinellifolium e S. haematobium. No Capítulo II serão expostos os artigos publicados e submetidos referente às pesquisas realizadas durante o doutorado. O tomate cultivado, Solanum lycopersicum, é uma das frutas mais comuns na indústria global de alimentos e, junto com o tomate selvagem Solanum pennellii, são espécies amplamente utilizadas no desenvolvimento de melhores cultivares. Os microRNAs atuam na regulação do mRNA, inibindo sua tradução e / ou promovendo sua degradação. ARGONAUTA e DICER são importantes proteínas envolvidas nesses processos. Este estudo teve como objetivo identificar e caracterizar genes envolvidos nas vias de processamento de miRNAs, moléculas de miRNAs e genes-alvo no genoma de ambas as espécies por meio de análise in silico. Também validamos a expressão de genes e miRNAs em diferentes bibliotecas de NGS, além de validar alguns miRNAs usando RT-PCR quantitativa. Identificamos 70 proteínas em S. lycopersicum e 108 em S. pennellii envolvidas no processamento de pequenos RNAs. Destes, 28 e 32 participam de vias de processamento de miRNA, respectivamente. Identificamos 343 miRNAs maduros, 226 pré-miRNAs em 87 famílias, incluindo 192 miRNAs não identificados anteriormente, pertencentes a 38 novas famílias em S. lycopersicum. Em S. pennellii, encontramos 388 miRNAs maduros, 234 pré-miRNAs contidos em 85 famílias. Todos os miRNAs encontrados em S. pennellii não foram publicados, sendo identificados pela primeira vez em nosso estudo. Além disso, identificamos 2.471 e 3.462 miRNA diferentes alvos em S. lycopersicum e S. pennellii, respectivamente. Genes-chave controlam a infectividade do Schistosoma haematobium causando esquistossomose. Um método para entender a regulação desses genes pode auxiliar no desenvolvimento de novas estratégias de controle da esquistossomose, como o silenciamento mediado por microRNAs (miRNAs). Os miRNAs têm sido estudados em espécies de esquistossomos e desempenham papéis importantes na regulação pós-transcricional de genes e nas interações parasita-hospedeiro. No entanto, a identificação e caracterização em todo o genoma de novos miRNAs e seus genes de vias e sua expressão gênica não foram explorados profundamente no genoma e no transcriptoma de S. haematobium. Neste sentido, este estudo teve como objetivo identificar e caracterizar miRNAs maduros, precursores e seus genes de vias no genoma de S. haematobium. Predição computacional e caracterização de miRNAs e genes envolvidos na via de miRNA do genoma de S. haematobium no SchistoDB. A análise de domínio conservado foi realizada usando os bancos de dados PFAM e CDD. Um algoritmo robusto foi aplicado para identificar miRNAs maduros e seus precursores. A caracterização dos miRNAs precursores foi realizada utilizando scripts RNAfold, RNAalifold e Perl. Identificamos e caracterizamos 14 proteínas envolvidas na via de miRNA, incluindo ARGONAUTE e DICER em S. haematobium. Além disso, 149 miRNAs maduros e 131 miRNAs precursores foram identificados no genoma, incluindo novos miRNAs. A via de miRNA ocorre em S. haematobium, incluindo miRNAs endógenos e componentes da via de miRNA, sugerindo um papel deste tipo de RNAs não codificantes na regulação gênica do parasita. Os resultados encontrados neste trabalho abrirão um novo caminho para o estudo de miRNAs na biologia de S. haematobium, auxiliando no entendimento do mecanismo de silenciamento gênico do parasita humano Esquistossomo. Os acilaçucares são aleloquímicos secretados por tricomas do tipo IV nas folhas e têm sido associados à resistência a artrópodes-praga em espécies de Solanaceae. Neste estudo, os genes putativos envolvidos no metabolismo de acilaçucar foram identificados, caracterizados e validados em tomate cultivado, Solanum lycopersicum, e em tomate selvagem, Solanum pennellii. Oitenta e sete genes foram identificados em S. lycopersicum e 77 em S. pennellii envolvidos na via de acilaçucar, incluindo as proteínas-chave desidrogenase cetoácido de cadeia ramificada E2 (BCKD E2), 2-isopropilmalato sintase A (IPMSA) e treonina desaminase / desidratase (TD). As proteínas putativas do tomate exibiram conservação usando distribuição de domínio conservado e sítio ativo em comparação com proteínas ortólogas da via de acilaçucar. A análise filogenética das proteínas putativas BCKD E2, IPMSA e TD mostrou que todas as prováveis proteínas do tomate se agruparam com seus ortólogos das espécies de Solanaceae, corroborando com a distribuição da árvore da vida. Os transcritos BCKD E2 e IPMSA de S. pennellii apresentaram maior expressão gênica em relação aos transcritos de S. lycopersicum, sugerindo que a via do acilaçúcar é mais ativa em tomate selvagem do que em cultivado, corroborando com a literatura. Dado o importante papel dos aleloquímicos produzidos em Solanaceae, os resultados contribuem para uma melhor compreensão dos acilaçucares e suas vias de processamento e abrem oportunidades para estudar sua relação com a resistência biótica nessas importantes espécies e outras espécies de Solanaceae. The Solanaceae family is one of the largest families in the plant kingdom, including several plants of agronomic and medical importance, especially tomatoes, due to their high consumption worldwide. In addition to its importance as a food, tomatoes have interesting agronomic characteristics, namely, fleshy fruit and compound leaves, which model plants do not have, eg. Arabidopsis thaliana. In this sense, the common tomato (Solanum lycopersicum) has been used as a model for species that also have such characteristics. Due to their specific characteristics and growing conditions, tomato varieties are constantly being improved. However, this crop is susceptible to several pests and pathogens. To help control these diseases, most producers choose to use chemical agents, which are often expensive, sometimes ineffective and have harmful effects on the environment. An alternative to these problems is to cross the cultivated tomato with wild species. There are several known species of wild tomatoes, constituted by little explored genetic resources and of great importance for the improvement, research and development of the culture, such as Solanum pennellii, Solanum galapagense, Solanum chilense, Solanum peruvianum and Solanum pimpinellifolium. Some species of wild tomatoes have been widely used for the construction and mapping of populations due to their tolerance to environmental stress. In this sense, a better understanding of the molecular basis of tomatoes is necessary to achieve efficiency and success in the selection of markers associated with the characteristics of interest, such as biotic and abiotic tolerance. In the same way that it is important to obtain a greater knowledge about the molecular bases of many species of plants, some animals, parasites, bacteria and viruses also need molecular studies to assist in the control of diseases that affect humans. In this sense, human schistosomiasis is a parasitic disease caused by helminths of the genus Schistosoma that affects millions of people worldwide. Five species of Schistosoma are responsible for the majority of human infections: Schistosoma mansoni, Schistosoma japonicum, Schistosoma haematobium, Schistosoma mekongi and Schistosoma intercalatum. S. haematobium affects the reproductive and urinary systems and has been considered a major public health problem in Africa. The spread of the disease is dependent on the interaction between the parasite and the intermediate host. This interaction is complex and determined by some genes involved in the parasite's infectivity and host susceptibility. Therefore, understanding the mechanisms of gene regulation is extremely important to understand the parasite-host interactions and which genes can contribute to the infection. Current progress in sequencing the genome of plants and animals has generated useful information to assist in the study of the genetic diversity of many species. In the 2000s, the genomes of S. galapagense, S. peruvianum, S. haematobium, S. lycopersicum, S. pennellii, S. pimpinellifolium and S. chilense were sequenced. The interpretation of schistosome genomes has improved our understanding of the molecular biology of these parasites, allowing the identification and characterization of genes not yet discovered. The availability of a tomato reference genome provided a framework for the genomic analysis of the Solanaceae family, generating a source of important information for its molecular improvement. In addition, the sequencing of genomes of wild tomato species has provided a valuable resource for understanding several prominent characteristics, such as changes in response to water deficit, biotic and abiotic resistance and metabolism. However, several parts of these genomes need to be thoroughly studied and annotated, since sequencing the genome and depositing the sequences in public databases are only the initial steps of the study. Recent studies have shown the importance of gene regulation involving several classes of small RNAs, their processing system and cell performance in different organisms. The main representatives of this class of small RNAs are microRNAs (miRNAs), whose forms of regulation may involve inhibiting the translation process, mRNA degradation or gene silencing, either by target complementarity or by signaling changes in DNA in regions specific to the genome. Different proteins act to generate mature miRNAs specific for post-transcriptional regulation. In plants and animals, these miRNA synthesis pathways have some differences. Computational strategies have been used to identify miRNAs and proteins involved in their pathways in various organisms. Computational methods are widely used to identify genes, since some transcripts are expressed only under certain conditions or in specific cells. Thus, computational techniques assist in the process of discovering new miRNAs, using all the information contained in the genome and / or the transcriptome regardless of the sample. In addition, such methods are useful for predicting miRNA precursors and their targets. Given the importance of such non-coding RNAs in the regulation of gene expression, it is important to study mature miRNAs and precursors, as well as the genes involved in the miRNA pathway in these species of cultivated and wild tomatoes to assist in the elucidation of biological processes, as well as their performances at the cellular level. Also in S. haematobium, the knowledge of these small molecules and their processing pathway can help to understand the life cycle of this parasite, its mechanism of infectivity and in the search for new methods to control schistosomiasis. In addition to the miRNA production pathway, other defense pathways are important in some plants. Different allelochemicals present in Solanum species have been associated with resistance to pests, such as methyl ketones, sesquiterpenes and acyl sugars. The selection for high levels of these allelochemicals could, in this way, constitute an efficient technique of indirect selection for resistance to pests. These purified phytochemicals can act against pests by reducing larval development, impairing the nutrition and oviposition of many tomato pests. In view of the great importance of tomatoes and the high rate of application of pesticides in the crop, greater knowledge about the molecular basis of tomatoes is necessary in the selection of markers associated with important characteristics in response to biotic and abiotic stress. Therefore, understanding the miRNAs, their processing pathway and the genes related to the production of metabolites may help to understand their involvement in resistance to arthropods, mainly due to the production of acyl sugar and post-transcriptional regulation mediated by miRNAs. In view of these issues, Chapter I will present the theoretical background on miRNAs, acylacars and their pathways, in addition to the importance of studying these molecules in S. lycopersicum, S. pennellii, S. galapagense, S. chilense, S. peruvianum, S. pimpinellifolium and S. haematobium. In Chapter II, articles published and submitted regarding research carried out during the doctorate will be exposed. Cultivated tomato, Solanum lycopersicum, is one of the most common fruits in the global food industry and together with the wild tomato Solanum pennellii, are both species widely used in developing better cultivars. microRNAs act on mRNA regulation, inhibiting their translation and/or promoting its degradation. Important proteins involved in these processes are ARGONAUTA and DICER. This study aimed to identify and characterize genes involved in miRNA processing pathways, miRNAs molecules and target-genes in the genome of both species using in silico analysis. We also validated the genes and miRNAs expression in different NGS libraries, in addition to validating some miRNAs using quantitative RT-PCR. We identified 70 putative proteins in S. lycopersicum and 108 in S. pennellii involved in small RNAs processing. Of these, 28 and 32 participate in miRNA processing pathways, respectively. We identified 343 mature miRNAs, 226 pre-miRNAs in 87 families, including 192 miRNAs not previously identified, belonging to 38 new families in S. lycopersicum. In S. pennellii, we found 388 mature miRNAs, 234 pre-miRNAs contained in 85 families. All miRNAs found in S. pennellii were unpublished, being first identified in our study. Furthermore, we identified 2471 and 3462 miRNA different target in S. lycopersicum and S. pennellii, respectively. Key genes control the infectivity of the Schistosoma haematobium causing schistosomiasis. A method for understanding the regulation of these genes might help in developing new strategies to control schistosomiasis, such as the silencing mediated by microRNAs (miRNAs). The miRNAs have been studied in schistosome species and they play important roles in the post-transcriptional regulation of genes, and in parasite-host interactions. However, genome-wide identification and characterization of novel miRNAs and their pathway genes and their gene expression have not been explored deeply in the genome and transcriptome of S. haematobium. Identify and characterize mature and precursor miRNAs and their pathway genes in the S. haematobium genome. Computational prediction and characterization of miRNAs and genes involved in miRNA pathway from S. haematobium genome on SchistoDB. Conserved domain analysis was performed using PFAM and CDD databases. A robust algorithm was applied to identify mature miRNAs and their precursors. The characterization of the precursor miRNAs was performed using RNAfold, RNAalifold and Perl scripts. We identified and characterized 14 putative proteins involved in miRNA pathway including ARGONAUTE and DICER in S. haematobium. Besides that, 149 mature miRNAs and 131 precursor miRNAs were identified in the genome including novel miRNAs. miRNA pathway occurs in the S. haematobium, including endogenous miRNAs and miRNA pathway components, suggesting a role of this type of non-coding RNAs in gene regulation in the parasite. The results found in this work will open up a new avenue for studying miRNAs in the S. haematobium biology in helping to understand the mechanism of gene silencing in the human parasite Schistosome. Acylsugars are allelochemicals secreted by type IV trichomes in leaves and have been associated with resistance to arthropod pests in Solanaceae species. In this study, the putative genes involved in the acylsugar metabolism were identified, characterized, and validated in cultivated tomato, Solanum lycopersicum, and wild tomato, Solanum pennellii. Eighty-seven putative genes were identified in S. lycopersicum and 77 in S. pennellii involved in the acylsugar pathway, including the key proteins branched-chain keto acid dehydrogenase E2 (BCKD E2), 2-isopropylmalate synthase A (IPMSA), and threonine deaminase/dehydratase (TD). The putative tomato proteins displayed conservation using conserved domain distribution and active site comparing to ortholog proteins from the acylsugar pathway. Phylogenetic analysis of the putative proteins BCKD E2, IPMSA, and TD showed that all putative tomato proteins grouped with their orthologs from the Solanaceae species, corroborating with the distribution of the tree of life. The BCKD E2 and the IPMSA transcripts from S. pennellii showed higher gene expression compared to S. lycopersicum transcripts, suggesting that the acylsugar pathway is more active in wild than in cultivated tomato, corroborating with the literature. Given the important role of the allelochemicals produced in Solanaceae, the results contribute to a better understanding of acylsugars and their processing pathways and open up opportunities to study their relationship with biotic resistance in these important species and other Solanaceae species. Tese (Doutorado) 2023-02-24