1. Computational studies of DNA modifications and mutations in bulk and single-cell data
- Author
-
Bonet Giner, Jose, 1994, López Bigas, Núria, González-Pérez, Abel, and Universitat Pompeu Fabra. Departament de Medicina i Ciències de la Vida
- Subjects
Seqüenciació ,Bayesian statistics ,Metilació ,Càncer ,Unsupervised learning ,Supervised learning ,Dany i reparació de DNA ,ConvNets - Abstract
Sequencing technologies have recently evolved and generated large amounts of data. These datasets have had significant impacts in the cancer field and the detection of damage and repair mechanisms. Methodologies to analyze the data focus on rendering information from this data to improve our understanding of fundamental biological questions and related health and disease status. This thesis provides, first, advances in the computational methods to group cancer single-cell DNA sequencing data into tumor subclones. This progress allows current approaches to deal with thousands of cells and future-like datasets. In a second chapter, the thesis promotes our understanding of the detection of modifications through Nanopore sequencing. First, through the introduction of a novel ConvNet-based model, and secondly, through highlighting the limitations of detecting modifications when prior knowledge of the alteration is not available, and the proportion of them in the genome is low Les tècniques de seqüenciació han evolucionat recentment, generant d'aquesta manera un gran nombre de dades. Aquestes dades han tingut un impacte significatiu en camps de recerca com el càncer o en la detecció de dany i reparació del material genòmic. Les metodologies que utilitzen aquestes dades se centren principalment a obtenir informació per millor el nostre coneixement de qüestions biològiques fonamentals o de les diferències entre salut i malaltia. Aquesta tesi proporciona, en primer lloc, una millora dels mètodes computacionals per agrupar dades de DNA de cèl·lules singulars tumorals en els diferents súbclons que conformen el tumor. Aquest progrés permet una millora de les tecnologies per treballar amb milers de cèl·lules i dimensions de dades similars a les que vindran en un futur. En un segon capítol, la tesi doctoral present avança la nostra comprensió per detectar modificacions amb la tecnologia de seqüenciació nomenada Nanopore. Primerament, mitjançant la introducció d'un model nou basat en xarxes neurals de convolució (ConvNets), i seguidament, proporcionant una sèrie de limitacions per detectar modificacions quan no disposem d'informacio prèvia de l'alteració i la proporció de dany al genoma és baix
- Published
- 2022