13 results on '"Máquinas de Vectores de Soporte"'
Search Results
2. Factores que afectan los umbrales topográficos en la ocurrencia de erosión y su manejo a través de modelos predictivos de aprendizaje automático
- Author
-
Mahdieh Valipour, Neda Mohseni, and Seyed Reza Hosseinzadeh
- Subjects
confiabilidad ,reliability ,General Earth and Planetary Sciences ,árbol de regresión optimizado ,erosión ,support vector machine ,prediction ,predición ,máquinas de vectores de soporte ,erosion ,boosted regression tree - Abstract
Soil degradation induced by gully erosion represents a worldwide problem in the many arid and semi-arid countries, such as Iran. This study assessed: (1) the importance of variables that control gully erosion using the Boruta algorithm, (2) the relationship among causative variables and gullied locations using the evidential belief function model (EBF), and (3) gully erosion development using the algorithms of boosted regression tree (BRT) and support vector machine (SVM). Based on the results of the Boruta algorithm, slope, land use, lithology, plan curvature, and elevation were the most important factors controlling gully erosion. The results of the EBF model showed the predominance of gully erosion on rangeland and loess-marl deposition. The predominance of gullied locations on the concave positions, with the slope of 5°-20° in the vicinity of drainage lines, illustrates a preferential topographic zone and, therefore, a terrain threshold for gullying. The correlation of gullied locations with rangelands and weak soils in concave positions demonstrates that the interactions among soil characteristics, topography, and land use stimulate a low topographic threshold for gullies development. These relationships are consistent with the threshold concept that a given soil, land use, and climate within a given landscape encourage a given drainage area and a critical soil surface slope that are necessary for gully incision. Furthermore, the BRF-SVM had the highest efficiency and the lowest root mean square error, followed by BRT for predicting gully development, compared with LN-SVM algorithm. The application of two machine learning methods for predicting the gully head cut susceptibility in northern Iran showed that the maps generated by these algorithms could provide an appropriate strategy for geo-conservation and restoration efforts in gullying-prone areas. RESUMEN La degradación del suelo por erosión representa un problema generalizado para aquellos países con suelos áridos y semiáridos como Iran. En este estudio se miden los siguientes aspectos: 1. La importancia de las variables que controlan la erosión a través del algoritmo de Boruta; 2. La relación entre causales y los lugares erosionados a través del modelo de confianza (EBF, del inglés evidential belief function model), y 3. desarrollo de la erosión a través de los algoritmos árboles de regresión potenciado (BRT, Boosted Regression Tree) y máquinas de vectores de soporte (SVM, support vector machine). Con base en los resultados del algoritmo de Boruta, la inclinación, el uso del suelo, la litología, la curvatura y la elevación son los factores más importantes en el control de la erosión. Los resultados del modelo de confianza muestran la predominancia de la erosión en los pastizales y en las deposiciones de marga de loess. La predominancia de lugares erosionados en puntos cóncavos, con una pendiente de entre 5 y 20 grados junto a líneas de drenaje, ejemplifica una zona topográfica preferencial y, además, un umbral en el terreno para la erosión. La correlación de zonas erosionadas con pastizales y suelos débiles en posiciones cóncavas demuestra que las interacciones entre las características del suelo, la topografía, y el estudio del suelo estimulan un umbral bajo para el desarrollo de la erosión. Estas relaciones se enmarcan en el concepto de que ante un tipo de suelo dado, el uso que se le brinde y el clima en un paisaje específico se crea una área de drenaje y una pendiente con superficie de suelo crítico, necesarios para un corte erosionado. Además, los algoritmos BRF-SVM tuvieron la mayor eficiencia y el menor error cuadrático medio, seguido por el BRT en la predicción del desarrollo de erosión frente al algortimo LN-SVM. La aplicación de dos métodos de aprendizaje automático para para predecir la susceptibilidad de corte en el norte de Irán muestra que los mapas generados por estos algortimos pueden proveer una estrategia apropiada para la geoconservación y los esfuerzos de restauración en zonas propensas a la erosión.
- Published
- 2022
3. Analyse de sentiments dans des articles de presse en espagnol en utilisant des prédicats en tant que caractéristiques
- Author
-
Gabriel Quiroz, Antonio Tamayo, Diego A. Burgos, and Julián David Arias Londoño
- Subjects
réduction des dimension ,linguistic features ,machines à vecteurs de support ,dimension reduction ,Computer science ,Feature vector ,artículos de noticias ,socio-politics ,Feature selection ,computer.software_genre ,lcsh:P1-1091 ,Support Vector Machines ,sociopolítica ,analyse des sentiments ,análisis de sentimientos ,articles de presse ,Transitive relation ,características lingüísticas ,business.industry ,sentiment analysis ,news articles ,support vector machines ,naïve bayes ,Sentiment analysis ,máquinas de vectores de soporte ,Naïve Bayes ,Predicate (grammar) ,Weighting ,caractéristiques linguistiques ,Support vector machine ,lcsh:Philology. Linguistics ,reducción de dimensión ,lcsh:PC1-5498 ,lcsh:Romanic languages ,Artificial intelligence ,sociopolitique ,business ,computer ,Natural language processing ,Sentence - Abstract
The automatic prediction of the course of action of agents involved in social or economic trends is an imperative challenge nowadays. However, it is a difficult task because stance or opinion is often spread throughout long, complex texts, such as news articles. The current study tests sentence predicates as features to automatically determine the writer’s stance in news articles. We capture the semantics and stance of the text by encoding features such as the attribute of copulative sentences, the predicate of transitive sentences, adjectival phrases, and the section of the article. Under the assumption that these features are informative enough to model the semantics of the text, each word sequence is disambiguated and assigned a sentiment value using weighting rules. Different experiments were run using either SentiWordNet and ML-Senticon to determine words’ sentiment. Feature vectors are automatically built to populate a database that is tested using two machine learning algorithms. An efficiency of 69% was achieved using a SVM with Gaussian kernel along with a feature selection strategy. This score outperformed the bag-of-words baseline in 12%. These results are promising considering that the sentiment analysis is performed on very complex texts written in Spanish. Resumen La predicción automática del modo de proceder de los agentes involucrados en las tendencias sociales o económicas es un desafío preponderante en la actualidad. Sin embargo, es una tarea difícil debido al hecho de que la postura u opinión a menudo se extiende a través de documentos extensos y complejos, como los artículos de noticias. El presente trabajo evalúa los predicados de oraciones como características para determinar automáticamente la postura del escritor en los artículos de noticias. Capturamos la semántica y la postura del texto codificando características como el atributo de oraciones copulativas, el predicado de oraciones transitivas, sintagmas adjetivales y la sección del artículo. Bajo el supuesto de que estas características son lo suficientemente informativas para modelar la semántica del texto, cada secuencia de palabras se desambigua y se le asigna un valor de sentimiento con reglas de ponderación. Se realizaron diferentes experimentos empleando SentiWordNet y ML-Senticon para determinar la opinión de las palabras. Los vectores de características se construyen automáticamente para completar una base de datos que se prueba mediante el uso de dos algoritmos de aprendizaje automático. Se logró una eficiencia del 69 % utilizando una SVM con kernel gaussiano junto con una estrategia de selección de características. Esta puntuación superó la línea de base de la técnica de "bag of words" en un 12 %. Estos resultados son prometedores si tenemos en cuenta que el análisis de sentimientos se hace en documentos muy complejos en español. Résumé La prédiction automatique des façons d’agir des agents impliqués dans les tendances sociales ou économiques est un défi impératif de nos jours. Cependant, cette tâche s´avère difficile étant donné que les avis s’entendent dans des documents longs et complexes, tels que des articles de presse. Le présent travail évalue les prédicats de phrases en tant que caractéristiques pour déterminer systématiquement le point de vue de l’écrivain dans les articles de presse. Il s’agit de capturer la sémantique et la posture du texte en décodant des caractéristiques telles que l'attribut de phrases copulatives, le prédicat de phrases transitives, de syntagmes adjectivaux et la section de l'article. En supposant que ces fonctionnalités soient suffisamment informatives pour modéliser la sémantique du texte, chaque séquence de mots est désambiguïsée et une valeur de sentiment est attribuée à l'aide de règles de pondération. Différentes expériences ont été réalisées à l'aide de SentiWordNet et de ML-Senticon afin de déterminer l’avis des mots. Les vecteurs de fonctionnalités sont construits de façon automatique pour alimenter une base de données testée à l'aide de deux algorithmes d'apprentissage automatique. Une efficacité de 69% a été obtenue avec un SVM à noyau gaussien et une stratégie de sélection des fonctionnalités. Ce score a dépassé la base de référence de la technique «bag of words» dans 12%. Ces résultats sont prometteurs compte tenu du fait que l'analyse des sentiments est effectuée sur des documents très complexes en espagnol.
- Published
- 2019
4. Automatic sorting of peruvian Subtle Lemon (citrus aurantifolia) using support vector machines
- Author
-
Juan Carlos Callejas, Freddy Alcarazo Ibáñez, Victor Tuesta Monteza, Raciel Yera, and Heber Ivan Mejía Cabrera
- Subjects
Support vector machine ,Polymers and Plastics ,Citrus aurantifolia ,Color space ,Máquinas de vectores de soporte ,Image pre-processing ,Artificial vision ,Limón Sutil peruano ,Clasificación automática ,Automatic classification ,K-Vecinos más cercanos ,Subtle peruvian lemon ,Pre-procesamiento de imágenes ,Humanities ,Color moments ,K-Nearest neighbors ,Mathematics - Abstract
Fil: Alcarazo Ibáñez, Freddy. Universidad Señor de Sipán; Perú. Fil: Tuesta Monteza, Victor. Universidad Señor de Sipán; Perú. Fil: Mejía Cabrera, Heber Iván. Universidad Señor de Sipán; Perú. Fil: Callejas, Juan Carlos. Universidad Señor de Sipán; Perú. Fil: Yera, Raciel. Universidad de Ciego de Avila; Cuba. La clasificación manual de frutas es un proceso que requiere de personal experto y es propenso al error humano. Reviste entonces vital importancia la automatización del mismo utilizando herramientas computacionales. En esta investigación se propuso un marco de trabajo basado en la aplicación de técnicas de Pre Procesamiento de Imágenes y de Visión Artificial para clasificar de manera automática frutos del Limón Sutil Peruano (Citrus Aurantifolia) por color. Se presenta un prototipo de clasificación soportado por una plataforma de hardware para extraer las características de Momentos de Color de las imágenes de Citrus Aurantifolia con vistas a entrenar las técnicas de clasificación de Máquina de Vectores de Soporte (SVM) y K-Vecinos más Cercanos (KNN). Los resultados arrojaron que utilizando el Momento de Color de la media del canal R (rojo), SVM obtuvo una precisión del 98%. Al convertir las imágenes al espacio de color CIELAB utilizando las coordenadas a* y b* la precisión obtenida por las técnicas SVM y K-NN fue del 100%. The manual classification of fruits is a process that requires expert knowledge and is prone to human error. Therefore, the automation of such process through the use of computational tools is of high importance. This research proposes a framework based on the application of image pre-processing techniques and artificial vision for automatically classifying Citrus Aurantifolia fruits through their colors. A classification prototype is presented which is supported by a hardware platform to extract the Color Moments features from the Citrus Aurantifolia images, so as to train the Support Vector Machine (SVM) and K-nearest neighbors (KNN) classification techniques. Results conclude that using the Color Moment related to the mean of the R channel, SVM reaches a precision of 98%. When images were converted into the CIELAB color space, the use of the coordinates a* and b* leads to a precision of 100% using the classifiers SVM and KNN.
- Published
- 2020
5. Predicción de la interacción de proteínas relacionadas con el Alzheimer a partir de su estructura primaria
- Author
-
Pérez López, Carlos, Cánovas Izquierdo, Javier Luis, and Sánchez Martínez, Melchor
- Subjects
Bioinformática -- TFM ,interacció entre proteïnes ,support vector machine ,màquines de vectors de suport ,interacción entre proteínas ,protein interaction ,máquinas de vectores de soporte ,random forest ,Bioinformàtica -- TFM ,Bioinformatics -- TFM - Abstract
La enfermedad del Alzheimer (EA) es una enfermedad neurodegenerativa que afecta a una gran cantidad de personas en la actualidad. Todavía se está trabajando en multitud de terapias, sin embargo, los estudios para la elaboración de nuevos medicamentos, son procesos muy costosos; por lo que se está recurriendo a técnicas computacionales de machine learning para abaratar costes. En este trabajo se van a entrenar modelos de machine learning para intentar predecir si dos proteínas interaccionan o no. Para ello, se recogen datos de proteínas que intervienen en el proceso de la EA y se estudia que proteínas interaccionan con ellas (PPIs); por otra parte, también se recogen datos de los repositorios de Intact y Negatome sobre proteínas que se tienen pruebas experimentales de que no interaccionan (nPPIs); también, se emparejan proteínas al azar de Uniprot y se asume que son nPPIs. A partir de estas bases de datos, se obtienen las estructuras primarias de las proteínas y se generan características en forma de datos cuantitativos empleando las metodologías de Composición de aminoácidos (AAC), Composición de dipéptidos (DPC), Composición/Transición/Distribución (CTD) y Composición de pseudoaminoácidos (PAAC). Para elaborar los modelos, a partir de estas características, se emplean los algoritmos Support Vector Machine (SVM) y Random Forest (RF). Finalmente se obtiene que el modelo generado mediante SVM, empleando AAC y empleando la base de datos de Uniprot como fuente de nPPIs es el que mayor capacidad de predicción y robustez presenta. Alzheimer's disease (AD) is a neurodegenerative disease that affects a large number of people at this time. Nowadays, numerous therapies are being used to treat it. However, studies on the development of new medications turn out to be expensive processes; therefore, machine learning techniques are being used to reduce costs. In this thesis, machine learning models will be trained to try to predict whether two proteins interact or not. In order to do this, protein data involved in the AD process are collected, and it is then studied which proteins interact with them (PPIs). Data are also collected from the Intact and Negatome repositories on proteins that have experimental evidence showing that they don't have interactions (nPPIs); while random proteins from Uniprot are paired and assumed to be nPPIs. Drawing from these databases, the primary structures of the proteins are obtained and characteristics are generated in the form of quantitative data using the methodologies of Amino Acid Composition (AAC), Dipeptide Composition (DPC), Composition / Transition / Distribution (CTD) and Composition of pseudo-amino acids (PAAC). To develop the models, based on these characteristics, the algorithms Support Vector Machine (SVM) and Random Forest (RF) are used. Ultimately, it is shown that the model generated by SVM, using AAC and using the Uniprot database as a source of nPPIs, is the one with the greatest prediction and robustness. La malaltia de l'Alzheimer (EA) és una malaltia neurodegenerativa que afecta una gran quantitat de persones en l'actualitat. Encara s'està treballant en multitud de teràpies, no obstant això, els estudis per a l'elaboració de nous medicaments, són processos molt costosos; pel que s'està recorrent a tècniques computacionals de machine learning per a abaratir costos. En aquest treball s'entrenaran models de machine learning per a intentar predir si dues proteïnes interaccionen o no. Per a això, es recullen dades de proteïnes que intervenen en el procés de l'EA i s'estudia que proteïnes interaccionen amb elles (PPIs); d'altra banda, també es recullen dades dels repositoris de Intact i Negatome sobre proteïnes que es tenen proves experimentals que no interaccionen (nPPIs); també, s'aparellen proteïnes a l'atzar de Uniprot i s'assumeix que són nPPIs. A partir d'aquestes bases de dades, s'obtenen les estructures primàries de les proteïnes i es generen característiques en forma de dades quantitatives emprant les metodologies de Composició d'aminoàcids (AAC), Composició de dipéptids (DPC), Composició/Transició/Distribució (CTD) i Composició de pseudoaminoácids (PAAC). Per a elaborar els models, a partir d'aquestes característiques, s'empren els algorismes Support Vector Machine (SVM) i Random Forest (RF). Finalment s'obté que el model generat mitjançant SVM, emprant AAC i emprant la base de dades de Uniprot com a font de nPPIs és el que major capacitat de predicció i robustesa presenta.
- Published
- 2020
6. Difficulties and Challenges of Anomaly Detection in Smart Cities: A Laboratory Analysis
- Author
-
Carles Garrigues, Victor Garcia-Font, Helena Rifà-Pous, Universitat Oberta de Catalunya. Internet Interdisciplinary Institute (IN3), and Universitat Rovira i Virgili
- Subjects
Computer science ,02 engineering and technology ,computer.software_genre ,lcsh:Chemical technology ,Biochemistry ,support vector machines ,Analytical Chemistry ,testbed ,detección de outliers ,bosque de aislamiento ,0202 electrical engineering, electronic engineering, information engineering ,lcsh:TP1-1185 ,seguridad de la información ,wireless sensor networks ,Instrumentation ,red de sensores inalámbricos ,Testbed ,isolation forest ,Atomic and Molecular Physics, and Optics ,anomaly detection ,020201 artificial intelligence & image processing ,Anomaly detection ,bosc d'aïllament ,Sensor networks ,xarxa de sensors sense fils ,smart cities ,detecció d'anomalia ,information security ,Context (language use) ,outlier detection ,Computer security ,Xarxes de sensors ,Article ,Smart city ,detecció de outliers ,ciudades inteligentes ,Isolation (database systems) ,Electrical and Electronic Engineering ,seguretat de la informació ,020206 networking & telecommunications ,Information security ,máquinas de vectores de soporte ,banco de pruebas ,Support vector machine ,màquines de vectors suport ,ciutats intel·ligents ,banc de proves ,detección de anomalías ,computer ,Wireless sensor network ,Redes de sensores - Abstract
Smart cities work with large volumes of data from sensor networks and other sources. To prevent data from being compromised by attacks or errors, smart city IT administrators need to apply attack detection techniques to evaluate possible incidents as quickly as possible. Machine learning has proven to be effective in many fields and, in the context of wireless sensor networks (WSNs), it has proven adequate to detect attacks. However, a smart city poses a much more complex scenario than a WSN, and it has to be evaluated whether these techniques are equally valid and effective. In this work, we evaluate two machine learning algorithms (support vector machines (SVM) and isolation forests) to detect anomalies in a laboratory that reproduces a real smart city use case with heterogeneous devices, algorithms, protocols, and network configurations. The experience has allowed us to show that, although these techniques are of great value for smart cities, additional considerations must be taken into account to effectively detect attacks. Thus, through this empiric analysis, we point out broader challenges and difficulties of using machine learning in this context, both for the technical complexity of the systems, and for the technical difficulty of configuring and implementing them in such environments.
- Published
- 2018
7. Anotación de nuevos microRNAs en el genoma porcino mediante una aproximación basada en Machine Learning
- Author
-
Mármol Sánchez, Emilio, Universitat Oberta de Catalunya, Morán Moreno, José Antonio, and Pla Planas, Albert
- Subjects
Bioinformática -- TFM ,machine learning ,microRNA ,aprendizaje automático ,support vector machine ,màquines de vectors de suport ,máquinas de vectores de soporte ,Bioinformàtica -- TFM ,aprenentatge automàtic ,Bioinformatics -- TFM - Abstract
La predicción computacional de microRNAs (miRNAs) supone un campo de investigación activo en la actualidad, sobre todo en especies no modelo cuyas anotaciones son aún limitadas y poco fiables. Mediante la utilización de una aproximación basada en algoritmos de Machine Learning como el Support Vector Machine (SVM) y Random Forest (RF), y haciendo uso de la comparación por homología en la anotación de miRNAs en humano, hemos desarrollado un proceso para la identificación y anotación de nuevos candidatos a estructuras pre-miRNA en el genoma porcino. Partiendo de la generación de un set de datos positivos y negativos, filtrados según tamaño y conformación estructural, se definieron diversos atributos estructurales para cada secuencia, con el objetivo de entrenar un modelo SVM de Machine Learning. Un conjunto de secuencias candidatas obtenidas mediante comparación por homología, fueron clasificadas como candidatos pre-miRNAs por el modelo SVM entrenado previamente, y posteriormente filtradas mediante un análisis de fiabilidad de posición genómica (Neighbouring Score). Mediante este proceso fuimos capaces de identificar un total de 26 nuevas secuencias pre-miRNA candidatas en el genoma porcino. De entre ellas destacó el miRNA ssc-miR-483, homólogo del miRNA homónimo en humano hsa-miR-483, alojado en el intrón 2 del gen IGF2, cuya función estaría ligada a la regulación de la proliferación celular y la diferenciación de adipocitos, influyendo en la capacidad de integración y depósito de lípidos en respuesta a variaciones en la ingesta de alimentos. Estos resultados podrían ampliar el conocimiento sobre la regulación del metabolismo energético y lipídico en la especie porcina. Computational discovery of microRNAs (miRNAs) poses a big research challenge nowadays, especially considering non-model species that lack accurate and reliable miRNA annotation. Through the application of a Machine Learning approach by using algorithms like Support Vector Machine (SVM) and Random Forest (RF) and making use of a homology-based comparison with miRNA annotation un humans, we developed a pipeline for identifying and annotating new pre-miRNA candidates in the porcine genome. We generated a set of positive and negative data, filtered considering size and structural folding, and then calculated a series of structural features for each considered sequence that where subsequently used for training a Machine Learning-based SVM classifier. We extracted a set of candidate sequences in the porcine genome that showed to be homologous from human miRNA annotation and classified them by using the previously trained SVM model. These candidate pre-miRNAs sequences were then filtered according to a neighbouring feasibility analysis. Our approach allowed us to identify 26 putative non-annotated pre miRNA sequences in the porcine genome. Among them, we highlighted the putative candidate ssc-miR-483, homologous of human hsa-miR-483 and located at intron 2 of IGF2 gene. This miRNA has been associated to the regulation of cellular proliferation and adipocyte differentiation, modulating lipid integration and storage in response to food intake. These results could enhance our understanding of energy and lipid metabolism regulation in the porcine species. La predicció computacional de microRNAs (miRNAs) suposa un camp de recerca actiu en l'actualitat, sobretot en espècies no model les anotacions de les quals són encara limitades i poc fiables. Mitjançant la utilització d'una aproximació basada en algorismes de Machine Learning com el Support Vector Machine (SVM) i Random Forest (RF), i fent ús de la comparació per homologia en l'anotació de miRNAs en humà, hem desenvolupat un procés per a la identificació i anotació de nous candidats a estructures pre-miRNA en el genoma porcí. Partint de la generació d'un set de dades positives i negatius, filtrats segons grandària i conformació estructural, es van definir diversos atributs estructurals per a cada seqüència, amb l'objectiu d'entrenar un model SVM de Machine Learning. Un conjunt de seqüències candidates obtingudes mitjançant comparació per homologia, van ser classificades com a candidats pre-miRNAs pel model SVM entrenat prèviament, i posteriorment filtrades mitjançant una anàlisi de fiabilitat de posició genòmica (Neighbouring Score). Mitjançant aquest procés vam ser capaços d'identificar un total de 26 noves seqüències pre-miRNA candidates en el genoma porcí. D'entre elles va destacar el miRNA ssc-miR-483, homòleg del miRNA homònim en humà hsa-miR-483, allotjat en el intrón 2 del gen IGF2, la funció del qual estaria lligada a la regulació de la proliferació cel·lular i la diferenciació d'adipòcits, influint en la capacitat d'integració i dipòsit de lípids en resposta a variacions en la ingesta d'aliments. Aquests resultats podrien ampliar el coneixement sobre la regulació del metabolisme energètic i lipídic en l'espècie porcina.
- Published
- 2018
8. Predicción de la toxicidad y de la actividad antimicrobiana a partir de la secuencia aminoacídica
- Author
-
Mariño Solís, Ramón, Universitat Oberta de Catalunya, and Sánchez Martínez, Melchor
- Subjects
màquina de vector de suport ,bacterial resistance ,máquinas de vectores de soporte ,aprenentatge automàtic ,Bioinformática -- TFM ,antimicrobial peptides ,péptidos antimicrobianos ,resistència bacteriana ,machine learning ,aprendizaje automático ,support vector machine ,pèptids antimicrobians ,resistencia bacteriana ,Bioinformàtica -- TFM ,Bioinformatics -- TFM - Abstract
Vimos la necesidad de crear una herramienta informática que pudiera predecir la actividad antimicrobiana y si pudiera causar toxicidad de un péptido. ¿Por qué era importante? Porque hay un creciente problema con la resistencia bacteriana a los antibióticos, que conlleva que cada vez hay menos moléculas que podrán utilizarse contra las infecciones problemáticas y, por lo tanto, es importante crear o descubrir nuevos fármacos con una fuerte actividad antibacteriana. Para ello, creamos dos modelos SVM, uno que clasifique entre péptidos tóxicos y no tóxicos, y otro que puede detectar si un péptido tiene actividad antimicrobiana, o no. We saw a necessity to create a informatic tool which it could predict the antimicrobial activity and if it could cause a toxic effect. Why it was important? Because there is problem with the bacterial resistance to antibiotics. Actually, there are less molecules that it could be used in the problematic infections and it is hardly important to create or discover new drugs with a strong antibacterial activity. Vam veure la necessitat de crear una eina informàtica que pogués predir l'activitat antimicrobiana i si pogués causar toxicitat d'un pèptid. Per què era important? Perquè hi ha un creixent problema amb la resistència bacteriana als antibiòtics, que comporta que cada vegada hi ha menys molècules que podran utilitzar-se contra les infeccions problemàtiques i, per tant, és important crear o descobrir nous fàrmacs amb una forta activitat antibacteriana. Per a això, vam crear dos models SVM, un que classifiqui entre pèptids tòxics i no tòxics, i un altre que pot detectar si un pèptid té activitat antimicrobiana, o no.
- Published
- 2017
9. Classificação fractográfica de materiais metálicos usando técnicas 3D de processamento e visualização em computador
- Author
-
Bastidas-Rodríguez, Maria Ximena, Prieto-Ortíz, Flavio A., and Espejo-Mora, Édgar
- Subjects
Artificial Neural Network ,ductile fracture ,Support Vector Machine ,fratura frágil ,Red Neuronal Artificial ,fractura por fatiga ,brittle fracture ,Máquinas de Vetores de Suporte ,Rede Neuronal Artificial ,fractura frágil ,dados 3D ,fratura por fadiga ,3D data ,fracture due to fatigue ,datos 3D ,fractura dúctil ,fratura dúctil ,Máquinas de Vectores de Soporte - Abstract
Failure analysis aims at collecting information about how and why a failure is produced. The first step in this process is a visual inspection on the flaw surface that will reveal the features, marks, and texture, which characterize each type of fracture. This is generally carried out by personnel with no experience that usually lack the knowledge to do it. This paper proposes a classification method for three kinds of fractures in crystalline materials: brittle, fatigue, and ductile. The method uses 3D vision, and it is expected to support failure analysis. The features used in this work were: i) Haralick’s features and ii) the fractal dimension. These features were applied to 3D images obtained from a confocal laser scanning microscopy Zeiss LSM 700. For the classification, we evaluated two classifiers: Artificial Neural Networks and Support Vector Machine. The performance evaluation was made by extracting four marginal relations from the confusion matrix: accuracy, sensitivity, specificity, and precision, plus three evaluation methods: Receiver Operating Characteristic space, the Individual Classification Success Index, and the Jaccard’s coefficient. Despite the classification percentage obtained by an expert is better than the one obtained with the algorithm, the algorithm achieves a classification percentage near or exceeding the 60% accuracy for the analyzed failure modes. The results presented here provide a good approach to address future research on texture analysis using 3D data. El análisis de falla tiene como objetivo recolectar información sobre cómo y porqué una falla es generada. El primer paso en este proceso consiste en una inspección visual en la superficie de la falla que revelará las características, marcas y textura que distinguen cada tipo de fractura. Esta inspección es generalmente llevada a cabo por personal que usualmente no cuenta con el suficiente conocimiento o experiencia necesaria. Este artículo propone un método de clasificación para tres modos de fracturas en materiales cristalinos: súbita frágil, progresiva por fatiga y súbita dúctil. El método propuesto usa visión en 3D, y busca ser un apoyo en el análisis de falla. Las características usadas en este estudio fueron i) las características de Haralick y ii) la dimensión fractal. La adquisición de imágenes 3D se realizó con un microscopio confocal de escaneo laser Zeiss LSM 700. Para llevar a cabo la clasificación, dos clasificadores fueron evaluados: Redes de Neuronas Artificiales y Máquinas de Vectores de Soporte. La evaluación de desempeño se logró extrayendo cuatro relaciones marginales de la matriz de confusión: exactitud, sensibilidad, especificidad y precisión, y los siguientes tres métodos de evaluación: Característica Operativa del Receptor o espacio ROC, el índice individual de éxito en la clasificación ICSI y el coeficiente de Jaccard. A pesar que el porcentaje de clasificación obtenida por un experto es mejor que la obtenida por el algoritmo, este último logra obtener porcentajes de clasificación cerca o superior al 60% en exactitud para los tres modos de falla analizados. Los resultados que aquí se presentan representan un buen acercamiento para estructurar investigaciones futuras en análisis de textura usando datos 3D. A análise de falha tem como objetivo recolher informação sobre como e por que uma falha é gerada. O primeiro passo neste processo consiste em uma inspeção visual na superfície da falha que revelará as características, marcas e textura que distinguem cada tipo de fratura. Esta inspeção é geralmente realizada por pessoas que usualmente não contam com o suficiente conhecimento ou experiência necessária. Este artigo propõe um método de classificação para três modos de fraturas em materiais cristalinos: súbita frágil, progressiva por fadiga e súbita dúctil. O método proposto usa visão em 3D, e busca ser um apoio na análise de falha. As características usadas neste estudo foram i) as características de Haralick e ii) a dimensão fractal. A aquisição de imagens 3D se realizou com um microscópio confocal de varredura laser Zeiss LSM 700. Para levar a cabo a classificação, dois classificadores foram avaliados: Redes de Neurônios Artificiais e Máquinas de Vetores de Suporte. A avaliação de desempenho logrou-se extraindo quatro relações marginais da matriz de confusão: exatidão, sensibilidade, especificidade e precisão, e os seguintes três métodos de avaliação: Característica Operativa do Receptor ou espaço ROC, o índice individual de êxito na classificação ICSI e o coeficiente de Jaccard. Apesar de que a porcentagem de classificação obtida por um experto é melhor que a obtida pelo algoritmo, este último logra obter porcentagens de classificação perto ou superior aos 60% em exatidão para os três modos de falha analisados. Os resultados que apresentam-se aqui representam uma boa aproximação para estruturar pesquisas futuras em análise de textura usando dados 3D.
- Published
- 2016
10. Methodology for predicting semantic annotations of protein sequences by feature extraction derived of statistical contact potentials and continuous wavelet transform
- Author
-
Arango Argoty, Gustavo Alonso and Castellanos Domínguez, César Germán (Thesis advisor)
- Subjects
Máquinas de vectores de soporte ,54 Química y ciencias afines / Chemistry ,Prediccion de proteínas ,Support vector machine ,Sequence alignment ,51 Matemáticas / Mathematics ,62 Ingeniería y operaciones afines / Engineering ,Protein prediction ,Statistical contact potentials ,Alineamiento de secuencias ,Transformada wavelet continua ,Potenciales de contacto estadísticos ,Continuous wavelet transform - Abstract
En esta tesis se propone un método para la predicción de anotaciones de proteínas a partir de la estimación de características en secuencias biológicas. Dicha estimación emplea información sobre la estructura de las proteínas a partir de las estadísticas de contactos potenciales entre pares de aminoácidos. Inicialmente, una proteína es transformada a una serie numérica por medio de estos contactos potenciales. Debido a las interacciones entre aminoácidos cercanos, la transformada wavelet puede fácilmente detectar las subsecuencias pertenecientes a posiciones específicas a lo largo de la proteína. Así, todas las subsecuencias son agrupadas de acuerdo a su distribución y estos grupos son modelados empleando perfiles de Modelos Ocultos de Markov. Finalmente, los perfiles son usados como características donde proteínas de análisis son mapeadas generando así un espacio de representación que es usado para entrenar un clasificador basado en vectores de soporte. La metodología ha sido rigurosamente evaluada y comparada con tres diferentes criterios de caracterización: 1) características globales comúnmente usadas para representar proteínas, 2) características específicas como motivos y dominios, y por último 3) evaluación de el rendimiento de varios programas construidos para la predicción de anotación de proteínas. Como resultado el método propuesto ha logrado los mas altos puntajes de predicción en la mayoría de los casos de estudio. De manera que estas predicciones sugieren a nuestro método como una alternativa a los comúnmente usados algoritmos de caracterización. Por otra parte, a pesar de que el enfoque de la metodología esta diseñada para resolver problemas de clasificación, la comunidad científica puede hacer uso de ella en dos diferentes enfoques: 1) como un predictor de anotaciones en proteínas y 2) como una herramienta para encontrar motivos. Por último, el código fuente del método se encuentra para libre descarga en: http://sourceforge.net/projects/wamofi/?source=navbar Abstract : In this thesis, a method to predict semantic annotations of the proteins from its primary structure is proposed. The main contribution of this thesis lies in the implementation of a novel protein feature representation, which makes use of the pairwise statistical contact potentials describing the protein interactions and geometry at the atomic level. Initially, a protein sequence is decomposed into a numerical series by a contact potential. From the interactions between adjacent amino acids, the wavelet transform can easily detect and characterize subsequences at specific position along the protein sequence. Then, all subsequences are grouped into clusters and a Hidden Markov Model (HMM) profile is built for each one of the groups. Finally, the modeled profiles HMM are used as features in order to build a feature space with the aim to train and evaluate a support vector machine classifier. Evaluations of the proposed methodology are driven against three different views 1) known protein features 2) motif-domain based features (PFam terms) and 3) performance evaluation over several methods for protein annotation prediction. As result, The method have acquired the highest performance prediction in most of the study cases. Thus, this efficiency suggest our approach as an alternative method for the characterization of protein sequences. Although, the research in this thesis focuses on the classification problem, the scientific community can make use of the methodology in two different ways: 1) as a protein predictor and 2) as a motif finding tool. Finally, the source code of the method is free available for download at SourceForge http://sourceforge.net/projects/wamofi/?source=navbar Maestría
- Published
- 2014
11. Geometric modeling and characterization of the circle of willis
- Author
-
Bogunovic, Hrvoje, Frangi Caregnato, Alejandro, Pozo Soler, José Ma. (José María), and Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
- Subjects
Método del conjunto de nivel ,Support vector machine ,Análisis geométrico ,Angiography ,Maximum a posteriori ,616.1 ,Etiquetado anatómico ,Máquinas de vectores de soporte ,Anatomical labeling ,Circulo de Willis ,Segmentation validation ,Geometric characterization ,Circle of Willis ,Level set method ,Arteria carótida interna ,Segmentación vascular ,Máximum a posteriori ,Internal carotid artery ,Vessel segmentation ,Angiografía - Abstract
Los derrames cerebrales son una de las causas principales de morbilidad y mortalidad en los países desarrollados. Esto ha motivado una búsqueda de configuraciones del sistema vascular que se cree que están asociadas con el desarrollo de enfermedades vasculares. En la primera contribución se ha mejorado un método de segmentación vascular para lograr robustez en la segmentación de imágenes procedentes de diferentes modalidades y centros clínicos, con una validación exhaustiva. Una vez que el sistema vascular está correctamente segmentado, en la segunda contribución se ha propuesto una metodología para caracterizar ampliamente la geometría de la arteria carótida interna (ACI). Esto ha incluido el desarrollo de un método para identificar automáticamente la ACI a partir del árbol vascular segmentado. Finalmente, en la tercera contribución, esta identificación automática se ha generalizado a una colección de arterias incluyendo su conectividad y sus relaciones topológicas. Finalmente, la identificación de las arterias en un conjunto de individuos puede permitir la comparación geométrica de sus árboles arteriales utilizando la metodología introducida para la caracterización de la ACI., Stroke is among the leading causes of morbidity and mortality in the developed countries. This motivated a search for the configurations of vasculature that is assumed to be associated with the development of vascular diseases. In the first contribution we improve a vascular segmentation method to achieve robustness in segmenting images coming from different imaging modalities and clinical centers and we provide exhaustive segmentation validation. Once the vasculature is successfully segmented, in the second contribution we propose a methodology to extensively characterize the geometry of the internal carotid artery (ICA). This includes the development of a method to automatically identify the ICA from the segmented vascular tree. Finally in the third contribution, this automatic identification is generalized to a collection of vessels including their connectivity and topological relationships. Identifying the corresponding vessels in a population enables comparison of their geometry using the methodology introduced for the characterization of the ICA.
- Published
- 2012
12. Development of a Software Sensor based on a NARMAX-Support Vector Machine Model for Semi-Autogenous Grinding
- Author
-
Francisco A. Cubillos, Gonzalo Acuña, and Millaray Curilem
- Subjects
Artificial Neural Network ,State variable ,Support Vector Machine ,General Computer Science ,Process (engineering) ,Computer science ,NARMAX ,lcsh:Control engineering systems. Automatic machinery (General) ,Machine learning ,computer.software_genre ,Sensor Virtual ,lcsh:TJ212-225 ,Máquinas de Vectores de Soporte ,Grinding Process ,Nonlinear autoregressive exogenous model ,Artificial neural network ,business.industry ,Copper mining ,Estimator ,Redes Neuronales Artificiales ,Proceso de Molienda ,Support vector machine ,ComputingMethodologies_PATTERNRECOGNITION ,Control and Systems Engineering ,NARX ,State (computer science) ,Artificial intelligence ,Software Sensor ,business ,computer ,Computer Science(all) - Abstract
[EN] State estimation in complex processes such as the semi- autogenous grinding process (SAG) in copper mining is an important and difficult task due to difficulties for real-time and on-line measuring of some relevant process variables. This paper extends a comparison, initiated in previous work of the same authors, between NARX and NARMAX dynamic models built using Artificial Neural Networks (ANN) and Support Vector Machines (SVM), when acting as estimators of one of the most important state variables for SAG milling operation. To accomplish this comparison we propose a simple and original methodology to develop NARMAX models with SVM. The results show that SVM-NARMAX models outperform SVM- NARX models because they incorporate previous prediction errors in order to improve prediction of the future evolution of the process. Advantages of SVM over those RNA models are also highlighted. NARMAX-SVM has a significantly lower MSE than all other models. In terms of the milling process, it provides a useful tool for estimating important state variables that are not easily available on-line and in real time thus aiding control and monitoring of the process., [ES] La estimación de estados, en procesos complejos como el proceso de molienda semiautógena (SAG) en la minería del cobre, es una tarea difícil debido a las dificultades para medir directamente ciertas variables relevantes en línea y tiempo real. En este trabajo se amplía una comparación, iniciada en trabajos anteriores de estos mismos autores, entre modelos dinámicos NARX y NARMAX construidos con el uso de Redes Neuronales Artificiales (RNA) y Máquinas de Vectores de Soporte (SVM), cuando actúan como estimadores de una de las variables de estado más importantes para la operación de molienda SAG. Para lograr esta comparación se propone una metodología simple y original para desarrollar modelos NARMAX confeccionados con SVM. Los resultados muestran la potencia predictiva de los modelos NARMAX, que incorporan los errores de predicción en tiempos anteriores para predecir la evolución futura del proceso y la ventaja de aquellos elaborados mediante SVM por sobre los confeccionados con RNA. NARMAX-SVM presenta un MSE significativamente inferior al de todos los otros modelos. En términos del proceso de molienda, se proporciona una herramienta útil para la estimación en línea y tiempo real de una variable que permite controlar y optimizar el proceso y que no puede ser medida mediante instrumentos fácilmente disponibles., Se agradece apoyo de Fondecyt 1090316 y 1090062, DICYT-USACH 06-1219AL y a la Dirección de Investigación de la Universidad de La Frontera.
- Full Text
- View/download PDF
13. Applicability of semi-supervised learning assumptions for gene ontology terms prediction
- Author
-
Jorge Alberto Jaramillo Garzon, Alexandre Perera I Lluna, César Germán Castellanos Domínguez, Universitat Politècnica de Catalunya. Departament d'Enginyeria de Sistemes, Automàtica i Informàtica Industrial, Universitat Politècnica de Catalunya. SISBIO - Senyals i Sistemes Biomèdics, and Universidad de Antioquia
- Subjects
0301 basic medicine ,ontología genética ,semi-supervised learning ,Informàtica::Intel·ligència artificial::Aprenentatge automàtic [Àrees temàtiques de la UPC] ,Computer science ,predicción de funciones proteicas ,Semi-supervised learning ,computer.software_genre ,Machine learning ,lcsh:Technology ,Task (project management) ,03 medical and health sciences ,Annotation ,Aprenentatge automàtic ,Protein function prediction ,aprendizaje semisupervisado ,business.industry ,Gene ontology ,Unlabelled data ,lcsh:T ,General Engineering ,Online machine learning ,bioinformatics ,máquinas de vectores de soporte ,Semi-supervised learning, gene ontology, support vector machines, protein function prediction. Aprendizaje semisupervisado, ontología genética, máquinas de vectores de soporte, predicción de funciones proteicas ,Support vector machine ,030104 developmental biology ,ComputingMethodologies_PATTERNRECOGNITION ,lcsh:TA1-2040 ,gene ontology ,Artificial intelligence ,Data mining ,business ,lcsh:Engineering (General). Civil engineering (General) ,computer - Abstract
La Ontología Genética (GO) es uno de los recursos más importantes en la bioinformática, el cual busca proporcionar un marco de trabajo unificado para la anotación biológica de genes y proteínas de todas las especies. La predicción de términos GO es una tarea esencial en bioinformática, pero el número de secuencias etiquetadas que se encuentran disponibles es insuficiente en muchos casos para entrenar sistemas confiables de aprendizaje de máquina. El aprendizaje semi-supervisado aparece entonces como una poderosa solución que explota la información contenida en los datos no etiquetados, con el fin de mejorar las estimaciones de las aplicaciones supervisadas tradicionales. Sin embargo, los métodos semi-supervisados deben hacer suposiciones fuertes sobre la naturaleza de los datos de entrenamiento y, por lo tanto, el desempeño de los predictores es altamente dependiente de estas suposiciones. En este artículo se presenta un análisis de la aplicabilidad de las diferentes suposiciones del aprendizaje semi-supervisado en la tarea específica de predicción de términos GO, con el fin de proveer elementos de juicio que permitan escoger las herramientas más adecuadas para términos GO específicos. Los resultados muestran que los métodos semi-supervisados superan significativamente a los métodos tradicionales supervisados y que los desempeños más altos son alcanzados cuando se implementa la suposición de cluster. Además se comprueba experimentalmente que las suposiciones de cluster y manifold son complementarias entre sí y se realiza un análisis de cuáles términos GO pueden ser más susceptibles de ser correctamente predichos usando cada una de éstas.
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.