Back to Search
Start Over
Detección de proteínas multifuncionales con funciones celulares ocultas utilizando BIG-DATA
- Source :
- Dipòsit Digital de Documents de la UAB, Universitat Autònoma de Barcelona
- Publication Year :
- 2017
-
Abstract
- Las proteínas moonlighting son proteínas con funciones múltiples totalmente independientes y ocultas, es decir, se desconocen muchas de las funciones que tienen las proteínas moonlighting. Además, las proteínas moonlitghting están estrechamente ligadas a enfermedades genéticas. En este articulo se han descubierto nuevas funciones desconocidas en las proteínas de una forma inédita, ya que, hasta el momento, las que se han descubierto han sido, principalmente, en laboratorio. Y, en este trabajo, se ha realizado el proceso de detección de nuevas funciones desconocidas desde la bioinformática. Para ello, se recoge información en lenguaje natural de las bases de datos Gene Ontology[1], funciones asociadas a los genes, y UniProt[2], funciones asociadas a las proteínas. La base de datos de Gene Ontology fue creada para tener toda la información de todos los genes y la base de datos de Uniprot para tener toda la información sobre las proteínas. En este trabajo utilizamos los datos que están relacionados con el Homo sapiens y usamos las bases de datos para descubrir funciones desconocidas en las proteínas mediante un algoritmo de árbol de decisiones basado en reglas biológicas. El descubrimiento de las nuevas funciones desconocidas puede permitir saber las aflicciones que sufren las proteínas, conocer reacciones desconocidas al entrar en contacto con algún medicamento, o la relación con algunas patologías. Moonlighting proteins are proteins with multiple totally independent and hidden function sand, that is to say, that many of the functions that have the moonlighting proteins are unknown. They are also closely linked to genetic diseases. This Article pretends to discover new hidden functions in proteins in an unpublished way, since those that have been discovered have been by laboratory and now, the process of detecting new unknown functions has been performed from bioinformatics. For it collects information in natural language from database, Gene Ontology[1], functions associated to genes, and the database Uni-prot[2], functions associated to protein. The Gene Ontology database was created to have all the information of all the genes and the Uniprot database to have all the information about the proteins. In this article, we use data that are related to Homo sapiens and we use databases to discover unknown functions in proteins using a decision tree algorithm based on biological rules. The discovery of the new unknown functions can allow to know the afflictions that suffer the proteins when coming in contact with some medicine or the relation with some pathologies. Les proteïnes moonlighting són proteïnes amb funcions múltiples totalment independents i ocultes, és a dir, es desconeixen moltes de les funcions que tenen les proteïnes moonlighting. A més, les proteïnes moonlitghting estan estretament lligades a malalties genètiques. En aquest article s'han descobert noves funcions desconegudes en les proteïnes d'una forma inèdita, ja que, fins al moment, les que s'han descobert han estat, principalment, en laboratori. I, en aquest treball, s'ha realitzat el procés de detecció de noves funcions desconegudes des de la bioinformàtica. Per a això, es recull informació en llenguatge natural de les bases de dades Gene Ontology [1], funcions associades als gens, i UniProt [2], funcions associades a les proteïnes. La base de dades de Gene Ontology va ser creada per tenir tota la informació de tots els gens i la base de dades de UniProt per tenir tota la informació sobre les proteïnes. En aquest treball utilitzem les dades que estan relacionats amb l'Homo sapiens i fem servir les bases de dades per descobrir funcions desconegudes en les proteïnes mitjançant un algoritme d'arbre de decisions basat en regles biològiques. El descobriment de les noves funcions desconegudes pot permetre saber les afliccions que pateixen les proteïnes, conèixer reaccions desconegudes en entrar en contacte amb algun medicament, o la relació amb algunes patologies.
Details
- Language :
- Spanish; Castilian
- Database :
- OpenAIRE
- Journal :
- Dipòsit Digital de Documents de la UAB, Universitat Autònoma de Barcelona
- Accession number :
- edsair.dedup.wf.001..ba0a5cbf982c70c170e27e119ba93673