86 results on '"máquinas de vectores de soporte"'
Search Results
2. Detección de fallas incipientes en rodamientos de Generadores Sincrónicos utilizando máquinas de vectores de soporte
- Author
-
Aniello Sparano, Jesús Ramírez, Ledy Guerra, and Rubén Terán
- Subjects
generador sincrónico ,fallas ,rodamientos ,corriente de armadura ,máquinas de vectores de soporte ,mantenimiento predictivo ,Engineering (General). Civil engineering (General) ,TA1-2040 ,Technology (General) ,T1-995 - Abstract
Dado que la máquina sincrónica en su funcionamiento como generador constituye un elemento vital en los sistemas eléctricos de potencia, el desarrollo de programas y técnicas de mantenimiento predictivo, a fin de identificar y solucionar problemas en la máquina antes de que se produzcan daños irreversibles en la misma es prioridad. A continuación se establece una metodología para detectar fallas incipientes en rodamientos de un generador sincrónico de prueba a través de máquinas de vectores de soporte (SVM por sus siglas en inglés). Se presenta el análisis de las corrientes de fase, utilizando métodos variados para la reducción de los datos y algoritmos de aprendizaje automático basados en las máquinas de vectores de soporte como elemento clasificador de datos; a fin de obtener un modelo que sea capaz de discriminar la condición de una máquina, en cuanto a fallas mecánicas se refiere. El entrenamiento de las máquinas de vectores de soporte para obtener los criterios de clasificación se ejecutó utilizando los comandos para SVM de MatLab, las funciones que brinda este software permitieron: el entrenamiento, la optimización y la posterior validación de los clasificadores. Los resultados obtenidos demostraron que el método aplicado basado en la SVM posee una buena capacidad de reconocimiento de fallas presentadas en los diferentes componentes del rodamiento, para distintas condiciones de operación.
- Published
- 2023
- Full Text
- View/download PDF
3. Support Vector Machines for Biomarkers Detection in in vitro and in vivo Experiments of Organochlorines Exposure.
- Author
-
Alejandro Lopera-Rodríguez, Jorge, Zuluaga, Martha, and Alberto Jaramillo-Garzón, Jorge
- Published
- 2021
- Full Text
- View/download PDF
4. Métodos de aprendizaje automático en los estudios prospectivos desde un ejemplo de la financiación de la innovación en Colombia
- Author
-
Ana Milena Padilla-Ospina, Javier Enrique Medina-Vásquez, and Javier Humberto Ospina-Holguín
- Subjects
regresión logística ,máquinas de vectores de soporte ,máquinas de gradiente potencia ,bosques aleatorios ,redes neuronales ,Social Sciences ,Industries. Land use. Labor ,HD28-9999 ,Management. Industrial management ,HD28-70 ,Technological innovations. Automation ,HD45-45.2 - Abstract
El propósito de este artículo es hacer una breve introducción a cinco métodos avanzados de predicción de aprendizaje automático, que pueden ser de utilidad para el desarrollo de estudios prospectivos: la regresión logística, las máquinas de vectores de soporte, las máquinas de gradiente potenciado, los bosques aleatorios y las redes neuronales. Además, se explica qué metodología se puede llevar a cabo para asegurar la robustez y validar dichos modelos de predicción. A manera de ejemplo, se presenta cómo el uso de estos métodos permitió identificar las variables financieras más importantes para predecir el desarrollo de actividades de innovación en pymes colombianas. Los resultados del uso de estos métodos pueden permitir la generación de pronósticos al corto y mediano plazo, que sirvan para la realización de estudios prospectivos con métodos más amplios, como la construcción de escenarios, con el propósito de generar propuestas basadas en la evidencia, como hoja de ruta para la planeación y política pública al largo plazo.
- Published
- 2020
- Full Text
- View/download PDF
5. Machine learning for carbon stock prediction in a tropical forest in Southeastern Brazil.
- Author
-
Dantas, Daniel, Nunes Santos Terra, Marcela de Castro, Baldissera Schorr, Luis Paulo, and Calegario, Natalino
- Subjects
- *
TROPICAL forests , *CARBON sequestration in forests , *MACHINE learning , *ARTIFICIAL neural networks , *SUPPORT vector machines - Abstract
The increasing awareness of global climate change has drawn attention to the role of forests as mitigators of this process as they act as carbon sinks to the atmosphere. Understanding the process of carbon storage in forests and its drivers, as well as presenting consistent models for their estimation, is a current demand. In this sense, the aim of this study was to evaluate the performance of machine learning techniques: support vector machines (SVM) and to propose a new nonlinear model extracted from the training of an artificial neural network (ANN) in the modeling of above ground carbon stock in a secondary semideciduous forest. SVM and ANN construction and training process considered independent variables selected by stepwise: minimum DBH (diameter of breast height - 1.3 m), maximum DBH, mean DBH, total height and number of trees, all by plot. SVM and the model extracted from ANN were applied to the data set intended for validation. Both techniques presented satisfactory performance in modeling carbon stock by plot, with homogeneous distribution and low dispersion of residues and predicted values close to those observed. Analysis criteria indicated superior performance of the model extracted from the artificial neural network, which presented a mean relative error of 6.94 %, while the support vector machine presented 13.52 %, combined with lower bias values and higher correlation between predictions and observations. [ABSTRACT FROM AUTHOR]
- Published
- 2021
- Full Text
- View/download PDF
6. Métodos de aprendizaje automático en los estudios prospectivos desde un ejemplo de la financiación de la innovación en Colombia.
- Author
-
Milena Padilla-Ospina, Ana, Enrique Medina-Vásquez, Javier, and Humberto Ospina-Holguín, Javier
- Subjects
SUPPORT vector machines ,FORECASTING ,PREDICTION models ,MACHINE learning ,LONGITUDINAL method ,RANDOM forest algorithms ,LOGISTIC regression analysis - Abstract
Copyright of Revista de Investigación Desarrollo e Innovación is the property of Universidad Pedagogica y Tecnologica de Colombia and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2020
- Full Text
- View/download PDF
7. Clasificación Automática del Avance de Megaproyectos de Inversión Pública en Colombia, desde un Enfoque Técnico, Organizacional y Ambiental
- Author
-
Hugo Gutierrez and Miguel Melgarejo
- Subjects
Complejidad ,Gestión ,Máquinas de vectores de soporte ,Megaproyectos ,Redes ,Engineering (General). Civil engineering (General) ,TA1-2040 - Abstract
Contexto: se considera el marco técnico, organizacional y ambiental (TOE, por sus siglas en inglés) para el análisis de proyectos de gran escala como contexto para el desarrollo de clasificadores de avance de megaproyectos, según las necesidades del Departamento Nacional de Planeación, Colombia. Método: se establecen algunas características para la clasificación del avance de proyectos de inversión pública, tomadas del marco TOE; a partir de estas, se construye una base de datos que se utiliza para entrenar dos clasificadores del avance de los proyectos reportados en la plataforma de seguimiento de proyectos de inversión del departamento de planeación nacional. Se empleó la información de cerca de 3200 proyectos registrados entre el 2008 y 2012, correspondientes a cuatro sectores económicos (medio ambiente y desarrollo sostenible, minas y energía, salud y protección social y transporte). La base de datos fue depurada siguiendo un enfoque analítico y cuantitativo. Se empleó el 70% de los datos para entrenamiento y el 30% para validación. Resultados: se obtienen algunos modelos con tasas de clasificación superiores al 70%, lo que valida la elección de características a partir del análisis del marco TOE. Conclusiones: este trabajo es un punto de partida para la configuración de una herramienta que pueda ser usada por el departamento nacional de planeación en la evaluación a priori del retraso de megaproyectos de inversión pública.
- Published
- 2017
- Full Text
- View/download PDF
8. Sentiment Analysis of News Articles in Spanish using Predicate Features.
- Author
-
Tamayo, Antonio, Londoño, Julián Arias, Burgos, Diego, and Quiroz, Gabriel
- Published
- 2019
- Full Text
- View/download PDF
9. Applicability of semi-supervised learning assumptions for gene ontology terms prediction
- Author
-
Jorge Alberto Jaramillo-Garzón, César Germán Castellanos-Domínguez, and Alexandre Perera-Lluna
- Subjects
aprendizaje semisupervisado ,ontología genética ,máquinas de vectores de soporte ,predicción de funciones proteicas ,Engineering (General). Civil engineering (General) ,TA1-2040 - Abstract
La Ontología Genética (GO) es uno de los recursos más importantes en la bioinformática, el cual busca proporcionar un marco de trabajo unificado para la anotación biológica de genes y proteínas de todas las especies. La predicción de términos GO es una tarea esencial en bioinformática, pero el número de secuencias etiquetadas que se encuentran disponibles es insuficiente en muchos casos para entrenar sistemas confiables de aprendizaje de máquina. El aprendizaje semi-supervisado aparece entonces como una poderosa solución que explota la información contenida en los datos no etiquetados, con el fin de mejorar las estimaciones de las aplicaciones supervisadas tradicionales. Sin embargo, los métodos semi-supervisados deben hacer suposiciones fuertes sobre la naturaleza de los datos de entrenamiento y, por lo tanto, el desempeño de los predictores es altamente dependiente de estas suposiciones. En este artículo se presenta un análisis de la aplicabilidad de las diferentes suposiciones del aprendizaje semi-supervisado en la tarea específica de predicción de términos GO, con el fin de proveer elementos de juicio que permitan escoger las herramientas más adecuadas para términos GO específicos. Los resultados muestran que los métodos semi-supervisados superan significativamente a los métodos tradicionales supervisados y que los desempeños más altos son alcanzados cuando se implementa la suposición de cluster. Además se comprueba experimentalmente que las suposiciones de cluster y manifold son complementarias entre sí y se realiza un análisis de cuáles términos GO pueden ser más susceptibles de ser correctamente predichos usando cada una de éstas.
- Published
- 2016
10. Modelado de Tumores Cerebrales en la Planificación de Neurocirugías
- Author
-
Villegas, Ricardo A., Montilla, Guillermo, Jara, Luis Iván, Magjarevic, R., editor, Nagel, J. H., editor, Müller-Karger, Carmen, editor, Wong, Sara, editor, and La Cruz, Alexandra, editor
- Published
- 2008
- Full Text
- View/download PDF
11. Modelos de machine learning para clasificar la cartera en un fondo de pensiones
- Author
-
Gil Rubio, Ricardo, Cruz Pérez, Edwin Andrés, Perdomo Charry, Oscar, and Universidad Santo Tomás
- Subjects
máquinas de vectores de soporte ,redes neuronales ,regresión logística ,Pensionados ,Machine learning ,cartera ,Trabajadores ,Estadísticas ,mora ,fondos de pensiones ,árboles de decisión ,redes bayesianas - Abstract
El presente trabajo tiene como objetivo, a través de la aplicación de diferentes técnicas de Machine Learning y diagnósticos estadísticos e inferenciales, proponer modelos de análisis predictivos que permitan identificar, clasificar y procesar oportunamente cuáles son las empresas que no pagan los aportes de pensión a sus trabajadores afiliados al fondo de pensiones, y así implementar diferentes estrategias de cobro encaminadas a recuperar los dineros adeudados. En el proceso de evaluación de rendimiento de los modelos se logró evidenciar que la técnica Árboles de Decisión presenta excelentes resultados: no requirió estandarización de los datos al lograr un porcentaje de certeza excelente y clasificó de forma rápida y eficiente la variable predictora en una base de datos con un número adecuado de registros. Las demás técnicas mostraron buenos resultados en la clase tipo 0, 3 y 4 con porcentajes superiores al 96,8% tanto en exhaustividad como en medida-F, mientras se redujo el desempeño para las técnicas Regresión Logística 71,8% y Máquinas de Vectores de Soporte 69,2% en exhaustividad y Redes Bayesianas 18,5% en medida-F, lo anterior para la clase tipo 1. En la técnica Redes Bayesianas para la clase tipo 2 se redujo en 24,7% y 29,3% tanto en exhaustividad como en medida-F y Máquinas de Vectores de Soporte en 59,4% para medida-F. Lo anterior se abordo con el tratamiento de clases desbalanceadas y con los algoritmos de refuerzo o conjunto. El desequilibrio de clases es una problema bastante frecuente cuando se trabaja con datos reales; cuando muestras de una o de múltiples clases están sobre representadas en un conjunto de datos. Existen varios ámbitos en los que puede ocurrir, como el filtrado de spam, detección de cáncer, la identificación de fraude o la detección de enfermedades. Las estrategias para tratar el desequilibrio de clases incluyen el muestreo ascendente de la clase minoritaria, el muestreo descendente de la clase mayoritaria y la generación de muestras de entrenamiento sintéticas mediante el algoritmo más utilizado (SMOTE, por sus siglas en Inglés). Una vez evaluados los modelos con la segmentación propuesta se generaron las estrategias que permitieron identificar los mecanismos de gestión de cobro dependiente del tipo de deudor, esto va, desde una visita comercial, gestión de contact center para cobro preventivo o un extracto con información de pagos, para deudores de baja criticidad, pasando por una carta de cobro persuasivo, asesoramiento en los puntos de atención o mensajes de texto para deudores de criticidad media, hasta el proceso de cobro coactivo, embargos y demás medidas para los deudores que son renuentes al pago. The present paper has as objective, the application of different Machine Learning techniques as well as statistical and inferential diagnostics, to propose predictive analysis models that allow to in due time identify, classify and process the companies that are not paying pension contributions to their employees affiliated to the pension fund, and thus to implement different collection strategies to recover contributions owed. In the process of evaluating the performance of the models, it was possible to show that the Decision Trees technique presents excellent results: it did not require standardization of the data by achieving an excellent percentage of certainty and it quickly and efficiently classified the predictor variable in a database with an adequate number of records. The other techniques showed good results in class type 0, 3 and 4 with percentages above 96.8\% both in completeness and in measure-F, while the performance decreased for Logistic Regression 71.8\% and Support Vector Machines 69.2\% in completeness and Bayesian Networks 18.5\% in measure-F, the above for class type 1. In the Bayesian Networks technique for class type 2 it was reduced by 24.7\% and 29.3\% both in completeness and F-measure and Support Vector Machines at 59.4\% for F-measure. This was addressed with the treatment of unbalanced classes and with the reinforcement or ensemble algorithms. Class imbalance is a fairly common problem when working with real data; when samples from one or multiple classes are over represented in a data set. There are several areas in which it can occur, such as spam filtering, cancer detection, fraud identification or disease detection. Strategies to deal with class imbalance include minority class up sampling, majority class down sampling, and generation of synthetic training samples using the most commonly used algorithm (SMOTE). Once the models with the proposed segmentation were evaluated, the strategies were generated that allowed identifying the collection management mechanisms depending on the type of debtor, this ranges from a commercial visit, contact center management for preventive collection or an extract with payment information, for debtors of low criticality, going through a persuasive collection letter, advice at service points or text messages for debtors of medium criticality, to the coercive collection process, embargoes and other measures for debtors who are reluctant to pay. Magister en Estadística Aplicada Maestría
- Published
- 2022
12. Clasificación Automática del Avance de Megaproyectos de Inversión Pública en Colombia, desde un Enfoque Técnico, Organizacional y Ambiental.
- Author
-
Gutiérrez Vanegas, Hugo Ernesto and Melgarejo Rey, Miguel Alberto
- Abstract
Copyright of Ingeniería (0121-750X) is the property of Ingenieria and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2017
- Full Text
- View/download PDF
13. Method for the classification of driving behaviors based on machine learning techniques, using physiological signals and sensors captured by wearable devices. Case of Study: Metropolitan Area Drivers of Aburrá Valley
- Author
-
Lombana Martinez, Juan Manuel and Espinosa Bedoya, Albeiro
- Subjects
aprendizaje de máquina ,Muertes en accidentes de transito ,svm ,Driving behavior ,004 - Procesamiento de datos Ciencia de los computadores [000 - Ciencias de la computación, información y obras generales] ,naive-bayes ,Road traffic deaths ,Enseñanza para conducción de automóviles ,machine learning ,Aprendizaje automático (Inteligencia artificial) ,Estilo de Conducción ,maquinas de vectores de soporte ,Automobile driver education ,árbol de decisión ,decision tree ,conjunto de datos ,dataset - Abstract
diagramas, tablas La clasificación de los estilos de conducción usando aprendizaje de máquina es una propuesta novedosa al problema de salud pública y los impactos macroeconómicos que representa la pérdida de vidas debido a la accidentalidad vial. En este trabajo se propone el uso de relojes inteligentes para monitorear diversos aspectos del conductor y para las tareas de clasificación se han implementado algoritmos de máquinas de vectores de soporte (SVM), árboles de decisión y clasificador ingenuo de bayes. Como conclusión principal se muestra la correlación que tienen los patrones de sueño con el estilo de conducción, así como la pertinencia del uso de estos dispositivos para la construcción de un conjunto de datos de buena calidad. (Texto tomado de la fuente) Machine learning driving behavior classification is a novel proposal to face public health problems and macroeconomy impacts that suppose road traffic injury deaths. This project proposes the use of smart watches to monitor different aspects of drivers, for classification tasks we had implemented support vector machines (SVM), decision trees and naïve bayes classificator. We show strong correlation between sleep patterns and driving behavior as main conclusion, also the relevance of using wearable devices to build high quality datasets. Maestría Magíster en Ingeniería - Ingeniería de Sistemas Área Curricular de Ingeniería de Sistemas e Informática
- Published
- 2022
14. Factores que afectan los umbrales topográficos en la ocurrencia de erosión y su manejo a través de modelos predictivos de aprendizaje automático
- Author
-
Mahdieh Valipour, Neda Mohseni, and Seyed Reza Hosseinzadeh
- Subjects
confiabilidad ,reliability ,General Earth and Planetary Sciences ,árbol de regresión optimizado ,erosión ,support vector machine ,prediction ,predición ,máquinas de vectores de soporte ,erosion ,boosted regression tree - Abstract
Soil degradation induced by gully erosion represents a worldwide problem in the many arid and semi-arid countries, such as Iran. This study assessed: (1) the importance of variables that control gully erosion using the Boruta algorithm, (2) the relationship among causative variables and gullied locations using the evidential belief function model (EBF), and (3) gully erosion development using the algorithms of boosted regression tree (BRT) and support vector machine (SVM). Based on the results of the Boruta algorithm, slope, land use, lithology, plan curvature, and elevation were the most important factors controlling gully erosion. The results of the EBF model showed the predominance of gully erosion on rangeland and loess-marl deposition. The predominance of gullied locations on the concave positions, with the slope of 5°-20° in the vicinity of drainage lines, illustrates a preferential topographic zone and, therefore, a terrain threshold for gullying. The correlation of gullied locations with rangelands and weak soils in concave positions demonstrates that the interactions among soil characteristics, topography, and land use stimulate a low topographic threshold for gullies development. These relationships are consistent with the threshold concept that a given soil, land use, and climate within a given landscape encourage a given drainage area and a critical soil surface slope that are necessary for gully incision. Furthermore, the BRF-SVM had the highest efficiency and the lowest root mean square error, followed by BRT for predicting gully development, compared with LN-SVM algorithm. The application of two machine learning methods for predicting the gully head cut susceptibility in northern Iran showed that the maps generated by these algorithms could provide an appropriate strategy for geo-conservation and restoration efforts in gullying-prone areas. RESUMEN La degradación del suelo por erosión representa un problema generalizado para aquellos países con suelos áridos y semiáridos como Iran. En este estudio se miden los siguientes aspectos: 1. La importancia de las variables que controlan la erosión a través del algoritmo de Boruta; 2. La relación entre causales y los lugares erosionados a través del modelo de confianza (EBF, del inglés evidential belief function model), y 3. desarrollo de la erosión a través de los algoritmos árboles de regresión potenciado (BRT, Boosted Regression Tree) y máquinas de vectores de soporte (SVM, support vector machine). Con base en los resultados del algoritmo de Boruta, la inclinación, el uso del suelo, la litología, la curvatura y la elevación son los factores más importantes en el control de la erosión. Los resultados del modelo de confianza muestran la predominancia de la erosión en los pastizales y en las deposiciones de marga de loess. La predominancia de lugares erosionados en puntos cóncavos, con una pendiente de entre 5 y 20 grados junto a líneas de drenaje, ejemplifica una zona topográfica preferencial y, además, un umbral en el terreno para la erosión. La correlación de zonas erosionadas con pastizales y suelos débiles en posiciones cóncavas demuestra que las interacciones entre las características del suelo, la topografía, y el estudio del suelo estimulan un umbral bajo para el desarrollo de la erosión. Estas relaciones se enmarcan en el concepto de que ante un tipo de suelo dado, el uso que se le brinde y el clima en un paisaje específico se crea una área de drenaje y una pendiente con superficie de suelo crítico, necesarios para un corte erosionado. Además, los algoritmos BRF-SVM tuvieron la mayor eficiencia y el menor error cuadrático medio, seguido por el BRT en la predicción del desarrollo de erosión frente al algortimo LN-SVM. La aplicación de dos métodos de aprendizaje automático para para predecir la susceptibilidad de corte en el norte de Irán muestra que los mapas generados por estos algortimos pueden proveer una estrategia apropiada para la geoconservación y los esfuerzos de restauración en zonas propensas a la erosión.
- Published
- 2022
15. PREDICCIÓN DE SERIES TEMPORALES USANDO MÁQUINAS DE VECTORES DE SOPORTE TIME SERIES PREDICTION USING SUPPORT VECTOR MACHINES
- Author
-
Juan D Velásquez, Yris Olaya, and Carlos J Franco
- Subjects
Series de tiempo ,predicción ,redes neuronales artificiales ,máquinas de vectores de soporte ,Time series ,forecasting ,artificial neural networks ,support vector machines ,Mechanical engineering and machinery ,TJ1-1570 ,Industrial engineering. Management engineering ,T55.4-60.8 - Abstract
La predicción de series de tiempo es un importante problema de investigación debido a sus implicaciones en ingeniería, economía, finanzas y ciencias sociales. Un importante tópico de esta problemática es el desarrollo de nuevos modelos y su comparación con aproximaciones previas en términos de la precisión del pronóstico. Recientemente, las máquinas de vectores de soporte (SVM) han sido usadas para la predicción de series de tiempo, pero las experiencias reportadas son limitadas y hay algunos problemas relacionados con su especificación. El objetivo de este artículo es proponer una técnica novedosa para estimar algunas constantes en las SVM que usualmente son fijadas en forma empírica por el modelador. La técnica propuesta es usada para estimar varias SVM con el fin de pronosticar cinco series benchmark; los resultados obtenidos son comparados con las estadísticas reportadas en otros artículos. La metodología propuesta permite obtener SVM competitivas para las series pronosticadas en comparación con los resultados obtenidos usando otros modelos más tradicionales.Time series prediction is an important research problem due to its implications in engineering, economics, finance and social sciences. An important topic about this problematic is the development of new models and its comparison with previous approaches in terms of forecast accuracy. Recently, support vector machines (SVM) have been used for time series prediction, but the reported experiences are limited and there are some problems related to its specification. The aim of this paper is to propose a novel technique for estimating some constants of the SVM usually fixed empirically by the modeler. The proposed technique is used to estimate several SVM with the aim of forecast five benchmark time series; the obtained results are compared with the statistics reported in other papers. The proposed method allow us to obtain competitive SVM for the time series forecasted in comparison with the results obtained using other most traditional models.
- Published
- 2010
16. Relación de la escala de intensidad de Mercalli y la información instrumental como una tarea de clasificación de patrones The relationships of Mercalli intensity to instrumental information as a pattern classification task
- Author
-
Jorge E. Hurtado and Daniel Bedoya R.
- Subjects
Intensidad de Mercalli ,daño estructural ,aprendizaje estadístico ,máquinas de vectores de soporte ,reconocimiento de modelo ,Mercalli Intensity ,earthquake damage ,statistical learning ,support vector machines ,pattern recognition ,Technology ,Engineering (General). Civil engineering (General) ,TA1-2040 - Abstract
A pesar de los progresos ocurridos en la instrumentación sísmica, la valoración de vulnerabilidad sísmica y el daño con índices cualitativos, tal como los proporcionados por Intensidad de Mercalli Modificada (IMM), siguen siendo altamente favorables y útiles para los propósitos prácticos. Para vincular las medidas cualitativas de acción del terremoto y sus efectos, es habitualmente aplicada la regresión estadística. En este artículo, se adopta un planteamiento diferente, el cual consiste en expresar la Intensidad de Mercalli, como una clase en vez de un valor numérico. Una herramienta de clasificación estadística moderna, conocida como máquina de vectores de soporte, se usa para clasificar la información instrumental con el fin de evaluar la intensidad de Mercalli correspondiente. Se muestra que el método da resultados satisfactorios con respecto a las altas incertidumbres y a la medida del daño sísmico cualitativo.Despite the progress occurred in seismic instrumentation, the assessment of seismic vulnerability and damage qualitative indexes, such as that provided by Mercalli intensity is highly valuable and useful for practical purposes. In order to link the qualitative measures of earthquake action and its effects, statistical regression is commonly applied. in the paper, a different approach is adopted. It consisten in regarding the Mercalli intensity as a class rather that a numerical value. A modern statistical classification tool known as Support Vector Machine is used for classifying the la instrumental information in order to assess the corresponding Mercalli intensity. It is shown that the method gives satisfactory results with regardto the high uncertainties linked to such a qualitative seismic damage measure.
- Published
- 2008
17. Applicability of semi-supervised learning assumptions for gene ontology terms prediction.
- Author
-
Jaramillo-Garzón, Jorge Alberto, Castellanos-Domínguez, César Germán, and Perera-Lluna, Alexandre
- Subjects
- *
SUPERVISED learning , *GENE ontology , *MACHINE learning , *SUPPORT vector machines , *BIOINFORMATICS - Abstract
Gene Ontology (GO) is one of the most important resources in bioinformatics, aiming to provide a unified framework for the biological annotation of genes and proteins across all species. Predicting GO terms is an essential task for bioinformatics, but the number of available labelled proteins is in several cases insufficient for training reliable machine learning classifiers. Semi-supervised learning methods arise as a powerful solution that explodes the information contained in unlabelled data in order to improve the estimations of traditional supervised approaches. However, semi-supervised learning methods have to make strong assumptions about the nature of the training data and thus, the performance of the predictor is highly dependent on these assumptions. This paper presents an analysis of the applicability of semi-supervised learning assumptions over the specific task of GO terms prediction, focused on providing judgment elements that allow choosing the most suitable tools for specific GO terms. The results show that semi-supervised approaches significantly outperform the traditional supervised methods and that the highest performances are reached when applying the cluster assumption. Besides, it is experimentally demonstrated that cluster and manifold assumptions are complementary to each other and an analysis of which GO terms can be more prone to be correctly predicted with each assumption, is provided. [ABSTRACT FROM AUTHOR]
- Published
- 2016
- Full Text
- View/download PDF
18. Development of a web application for vocational guidance and promotion of STEM careers implementing Data Mining techniques
- Author
-
Zambrano Vizcaino, Yulieth Paola, Osorio Salcedo, Valeria, Barbosa Gutierrez, Victor Manuel, García Ramos, Lucy Esther, and Nieto Bernal, Wilson
- Subjects
Máquinas de vectores de soporte ,orientación vocacional ,minería de datos ,data mining ,STEM ,k-neighbors ,vocational guidance ,árboles de decisión - Abstract
La elección de una carrera es una decisión importante a las que se enfrentan los jóvenes en su proceso de formación, no es una tarea sencilla, y en muchas ocasiones el estudiante no cuenta con las herramientas o con la asistencia en orientación vocacional que permitan la toma de decisión de una carrera. De esta forma, el presente proyecto aborda la problemática de la poca orientación vocacional y a su vez la poca promoción de las áreas STEM. A partir de esta necesidad identificada la propuesta central del proyecto es diseñar e implementar un prototipo de una aplicación web empleando técnicas de Data Mining para la orientación vocacional y promoción de carreras STEM. Para el desarrollo del prototipo se implementó la metodología SCRUM, la cual fue seleccionada debido a la flexibilidad, la obtención oportuna de resultados y rápido aprendizaje, que permitieron desarrollar de forma integral las fases de requerimientos e investigación, construcción del modelo, diseño del prototipo y de la encuesta, implementación de las técnicas, despliegue y pruebas. En síntesis, se alcanzó el objetivo propuesto de diseñar un prototipo de una aplicación web capaz de analizar los datos y recomendar un área vocacional STEM a uno o varios individuos, esto utilizando algoritmos de clasificación como Decision Tree, KNN y SMV. En cuanto a los resultados el algoritmo SVM dio un 72,41% de accuracy, Decision tree y KNN 62% Es importante resaltar, que para generar esta recomendación el sistema tiene en cuenta una serie de variables de entrada que estiman el interés que posee el estudiante para desempeñarse en determinadas áreas STEM, sin embargo, no se contemplan otros factores que también tienen influencia en la decisión de una carrera profesional y que pueden ser de carácter psicológico, económico o de otra índole. choose a career it is an important decision that young people face when they finish school, it is not an easy task, and in many cases the student does not have the tools or the assistance in vocational guidance to allow them to choose a career. Based on this identified need, the central proposal of the project is to design and implement a prototype of a web application using Data Mining techniques for vocational guidance and promotion of STEM careers. For the development of the prototype, the SCRUM methodology was implemented, which was selected due to its flexibility, the timely obtaining of results and rapid learning, which allowed the comprehensive development of the requirements and research phases, model construction, prototype design and of the survey, implementation of techniques, deployment and testing. In summary, the proposed objective of designing a prototype of a web application capable of analyzing the data and recommending a STEM vocational area to one or more individuals was achieved, using classification algorithms such as Decision Tree, KNN and SMV. Regarding the results, the SVM algorithm gave a 72.41% accuracy, Decision tree and KNN 62% It is important to highlight that to generate this recommendation the system takes into account a series of input variables that estimate the interest that the student has to perform in certain STEM areas, however, other factors that influence the decision of a professional career such as psychological, economic or social are not taken into account.
- Published
- 2021
19. Contributions to perturbation analysis using machine learning and time-frequency analysis
- Author
-
Miramont, Juan Manuel, Schlotthauer, Gastón, Torres, Humberto Maximiliano, Vanrell, Sebastián Rodrigo, Gómez, Juan Carlos, and Martínez, César
- Subjects
Máquinas de vectores de soporte ,Jitter relativo vocal ,Support vector machines ,Synchrosqueezing operators ,Voice perturbation analisys ,Operadores de synchrosqueezing ,Análisis de perturbaciones ,Voice relative jitter - Abstract
Fil: Miramont, Juan Manuel. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina. Las perturbaciones en la señal de la voz son pequeñas modificaciones de corto plazo en parámetros de la señal, cuya cuantificación resulta de importancia para el diagnóstico de patologías laríngeas, nerviosas o respiratorias. Las medidas utilizadas con este fin requieren cierta periodicidad de la señal y suelen ser insensibles a a grandes fluctuaciones de los parámetros medidos, como la duración de los ciclos. En esta tesis se presenta, en primer lugar, una herramienta para la clasificación automática de voces basada en máquinas de vectores de soporte con el objetivo de evitar la cuantificación de perturbaciones sobre señales no aptas para ese fin, que supera el estado del arte. En segundo lugar, se presenta un método para la cuantificación de la perturbación del periodo de la señal, basado en operadores de synchrosqueezing de cuarto orden, que resulta más robusto frente a grandes variaciones de la duración de los ciclos que los métodos tradicionales. Voice perturbations are smal cycle-to-cycle deviations of the voice signal parameters, and measuring their level is an important task for diagnostics of pathologies associated with the phonatory system. Perturbation measures used with this purpose require some degree of periodicity and they usually underestimate the true value of the perturbation when mayor fluctuations of the parameter under study, such as the cycle duration, ocurr. In this thesis, a method for automatic classification of signals based on support vector machines is introduced, the aim of which is to avoid the use of perturbation measures on signals that are not suitable for this kind of analysis. Following this, a novel method for voice jitter estimation, based on fourth-order synchrosqueezing operators, is introduced. This new method is more robust to large variations on the cycle duration of the signal than traditional methods. Consejo Nacional de Investigaciones Científicas y Técnicas
- Published
- 2021
20. Analyse de sentiments dans des articles de presse en espagnol en utilisant des prédicats en tant que caractéristiques
- Author
-
Gabriel Quiroz, Antonio Tamayo, Diego A. Burgos, and Julián David Arias Londoño
- Subjects
réduction des dimension ,linguistic features ,machines à vecteurs de support ,dimension reduction ,Computer science ,Feature vector ,artículos de noticias ,socio-politics ,Feature selection ,computer.software_genre ,lcsh:P1-1091 ,Support Vector Machines ,sociopolítica ,analyse des sentiments ,análisis de sentimientos ,articles de presse ,Transitive relation ,características lingüísticas ,business.industry ,sentiment analysis ,news articles ,support vector machines ,naïve bayes ,Sentiment analysis ,máquinas de vectores de soporte ,Naïve Bayes ,Predicate (grammar) ,Weighting ,caractéristiques linguistiques ,Support vector machine ,lcsh:Philology. Linguistics ,reducción de dimensión ,lcsh:PC1-5498 ,lcsh:Romanic languages ,Artificial intelligence ,sociopolitique ,business ,computer ,Natural language processing ,Sentence - Abstract
The automatic prediction of the course of action of agents involved in social or economic trends is an imperative challenge nowadays. However, it is a difficult task because stance or opinion is often spread throughout long, complex texts, such as news articles. The current study tests sentence predicates as features to automatically determine the writer’s stance in news articles. We capture the semantics and stance of the text by encoding features such as the attribute of copulative sentences, the predicate of transitive sentences, adjectival phrases, and the section of the article. Under the assumption that these features are informative enough to model the semantics of the text, each word sequence is disambiguated and assigned a sentiment value using weighting rules. Different experiments were run using either SentiWordNet and ML-Senticon to determine words’ sentiment. Feature vectors are automatically built to populate a database that is tested using two machine learning algorithms. An efficiency of 69% was achieved using a SVM with Gaussian kernel along with a feature selection strategy. This score outperformed the bag-of-words baseline in 12%. These results are promising considering that the sentiment analysis is performed on very complex texts written in Spanish. Resumen La predicción automática del modo de proceder de los agentes involucrados en las tendencias sociales o económicas es un desafío preponderante en la actualidad. Sin embargo, es una tarea difícil debido al hecho de que la postura u opinión a menudo se extiende a través de documentos extensos y complejos, como los artículos de noticias. El presente trabajo evalúa los predicados de oraciones como características para determinar automáticamente la postura del escritor en los artículos de noticias. Capturamos la semántica y la postura del texto codificando características como el atributo de oraciones copulativas, el predicado de oraciones transitivas, sintagmas adjetivales y la sección del artículo. Bajo el supuesto de que estas características son lo suficientemente informativas para modelar la semántica del texto, cada secuencia de palabras se desambigua y se le asigna un valor de sentimiento con reglas de ponderación. Se realizaron diferentes experimentos empleando SentiWordNet y ML-Senticon para determinar la opinión de las palabras. Los vectores de características se construyen automáticamente para completar una base de datos que se prueba mediante el uso de dos algoritmos de aprendizaje automático. Se logró una eficiencia del 69 % utilizando una SVM con kernel gaussiano junto con una estrategia de selección de características. Esta puntuación superó la línea de base de la técnica de "bag of words" en un 12 %. Estos resultados son prometedores si tenemos en cuenta que el análisis de sentimientos se hace en documentos muy complejos en español. Résumé La prédiction automatique des façons d’agir des agents impliqués dans les tendances sociales ou économiques est un défi impératif de nos jours. Cependant, cette tâche s´avère difficile étant donné que les avis s’entendent dans des documents longs et complexes, tels que des articles de presse. Le présent travail évalue les prédicats de phrases en tant que caractéristiques pour déterminer systématiquement le point de vue de l’écrivain dans les articles de presse. Il s’agit de capturer la sémantique et la posture du texte en décodant des caractéristiques telles que l'attribut de phrases copulatives, le prédicat de phrases transitives, de syntagmes adjectivaux et la section de l'article. En supposant que ces fonctionnalités soient suffisamment informatives pour modéliser la sémantique du texte, chaque séquence de mots est désambiguïsée et une valeur de sentiment est attribuée à l'aide de règles de pondération. Différentes expériences ont été réalisées à l'aide de SentiWordNet et de ML-Senticon afin de déterminer l’avis des mots. Les vecteurs de fonctionnalités sont construits de façon automatique pour alimenter une base de données testée à l'aide de deux algorithmes d'apprentissage automatique. Une efficacité de 69% a été obtenue avec un SVM à noyau gaussien et une stratégie de sélection des fonctionnalités. Ce score a dépassé la base de référence de la technique «bag of words» dans 12%. Ces résultats sont prometteurs compte tenu du fait que l'analyse des sentiments est effectuée sur des documents très complexes en espagnol.
- Published
- 2019
21. Support Vector Machines for Biomarkers Detection in in vitro and in vivo Experiments of Organochlorines Exposure
- Author
-
Lopera Rodríguez, Jorge Alejandro, Zuluaga, Martha, Jaramillo Garzón, Jorge A., Lopera Rodríguez, Jorge Alejandro, Zuluaga, Martha, and Jaramillo Garzón, Jorge A.
- Abstract
Metabolomic studies generate large amounts of data, whose complexity increases if they are derived from in vivo experiments. As a result, analysis methods highly used in metabolomics, such as Partial Least Squares Discriminant Analysis (PLS-DA), can have particular difficulties with this type of data. However, there is evidence that indicates that Support Vector Machines (SVMs) can better deal with complex data. On the other hand, chronic exposure to organochlorines is a public health problem. It has been associated with diseases such as cancer. Therefore, its identification is relevant to reduce their impact on human health. This study explores the performance of SVMs in classifying metabolic profiles and identifying relevant metabolites in studies of exposure to organochlorines. For this purpose, two experiments were conducted: in the first one, organochlorine exposure was evaluated in HepG2 cells; and, in the second one, it was evaluated in serum samples of agricultural workers exposed to pesticides. The performance of SVMs was compared with that of PLS-DA. Four kernel functions were assessed in SVMs, and the accuracy of both methods was evaluated using a k-fold cross-validation test. In order to identify the most relevant metabolites, Recursive Feature Elimination (RFE) was used in SVMs and Variable Importance in Projection (VIP) in PLS-DA. The results show that SVMs exhibit a higher percentage of accuracy with fewer training samples and better performance in classifying the samples from the exposed agricultural workers. Finally, a workflow based on SVMs for the identification of biomarkers in samples with high biological complexity is proposed., Los estudios en metabolómica generan gran cantidad de datos cuya complejidad aumenta si surgen de experimentos in vivo. A pesar de esto, métodos ampliamente usados en metabolómica como el análisis discriminante por mínimos cuadrados parciales (PLS-DA) tienen dificultades con este tipo de datos, sin embargo, hay evidencia que las máquinas de vectores de soporte (SVM) pueden tener un mejor desempeño. Por otro lado, la exposición crónica a organoclorados es un problema de salud pública. Esta se asocia a enfermedades como el cáncer. Identificarla exposición es relevante para disminuir su impacto. Este estudio tuvo como objetivo explorar el rendimiento de las SVM en la clasificación de perfiles metabolómicos e identificación de metabolitos relevantes en estudios de exposición a organoclorados. Se realizaron dos experimentos: primero se evaluó la exposición a organoclorados en células HepG2. Luego, se evaluó la exposición a pesticidas en muestras de suero de trabajadores agrícolas. El rendimiento de las SVM se comparó con PLS-DA. Se evaluaron cuatro funciones kernel en SVM y la precisión de ambos métodos se evaluó mediante prueba de validación cruzada k-fold. Para identificar los metabolitos relevantes, se utilizó eliminación recursiva de características (RFE) en SVM y la proyección de importancia de variables (VIP) se usó en PLS-DA. Los resultados mostraron que las SVM tuvieron mayor precisión en la clasificación de los trabajadores agrícolas expuestos usando menos muestras de entrenamiento. Se propone un flujo de trabajo basado en SVM que permita la identificación de biomarcadores en muestras con alta complejidad biológica.
- Published
- 2021
22. Malicious URL detection using machine learning techniques
- Author
-
Céspedes Maestre, María Martha, Salcedo Parra, Octavio José, and Salazar Herrera, Carlos Alberto
- Subjects
620 - Ingeniería y operaciones afines ,Regresión logística ,Random Forest ,Localizador uniforme de recursos (URL) ,Extracción de características ,Aprendizaje automático ,Machine Learning ,Máquinas de vectores de soporte ,Uniform Resource Locator (URL) ,Support Vector Machines ,Lenguaje de programación ,Protección de datos ,Feature extraction ,Logistic Regression ,000 - Ciencias de la computación, información y obras generales ,Computer languages ,Bosque aleatorio ,Data protection - Abstract
Documento con toda la información relevante de la investigación Ilustraciones, gráficos En la actualidad, los ciberdelincuentes perpetran ataques web de forma sencilla, en los que aplican diferentes vectores para poner en peligro la seguridad de la información y en los que entienden al ser humano como un flanco fácil para lograr sus objetivos. Generalmente, los usuarios de internet deben realizar una acción que permita el éxito del ataque, por ejemplo, dar clic a alguna URL. Es por lo anterior, que muchos esfuerzos están dirigidos a encontrar técnicas que mitiguen esta problemática y se apuestan grandes cantidades de dinero en generar soluciones. Tomando como referencia el uso de listas negras, la clasificación heurística, y, prestando especial atención a las técnicas de aprendizaje automático capaces de detectar ataques de día cero, en el presente trabajo se despliega un diseño de detección de URLs maliciosas, haciendo uso de criterios léxicos y de ofuscación de la URL. Estas, clasificadas por medio de técnicas de aprendizaje automático como Logistic Regression, Support Vector Machine y Random Forest; demostrando que los tres clasificadores implementados mantienen una relación de eficacia y rendimiento con porcentajes de precisión del 98%, y, tiempos de respuesta satisfactorio. Es preciso aclarar que Random Forest puede estar sujeto a mejoras, ya que se pretende detectar de manera automática las URLs maliciosas y este clasificador tarda en promedio 16 segundos en hacerlo. Como resultado general del diseño, se obtiene un modelo de libre distribución que puede ser utilizado de forma masiva por diferentes usuarios en la red, capaz de detectar de forma precisa URLs maliciosas. Today, cybercriminals carry out web attacks in a simple way, in which they apply different vectors to endanger information security and in which they understand the human being as an easy flank to achieve their objectives. Generally, Internet users must take an action that allows the attack to succeed, for example, clicking on a URL. This is why many efforts are aimed at finding techniques that mitigate this problem and large amount of money are bet on generating solutions. Taking as a reference the use of blacklists, heuristic classification, and, paying special attention to machine learning techniques capable of detecting zero-day attacks, in this work a design for detecting malicious URLs is deployed, making use of criteria Lexical and URL obfuscation. These, classified by means of machine learning techniques such as Logistic Regression, Support Vector Machine and Random Forest; demonstrating that the three implemented classifiers maintain an efficiency and performance ratio with 98% accuracy percentages, and satisfactory response times. It should be clarified that Random Forest may be subject to improvements, since it is intended to automatically detect malicious URLs and this classifier takes an average of 16 seconds to do so. As a general result of the design, a free distribution model is obtained that can be used an masse by different users on the network, capable of accurately detecting malicious URLs. Maestría Magíster en Telecomunicaciones La metodología que se usa para el diseño del modelo es una metodología cuantitativa, la cual es un enfoque de la ingeniería de software centrada en estrategias experimentales con cumplimiento de procedimientos basados en etapa. Tomando como referencia los atributos claves para detección sólida de phishing, se construye una metodología que permita dar cumplimiento a cada uno de los objetivos trazados, las etapas usadas son: Naturaleza y origen de los datos Extracción de características Métodos de clasificación Configuración o metodología experimental Seguridad Informática
- Published
- 2021
23. Automatic sorting of peruvian Subtle Lemon (citrus aurantifolia) using support vector machines
- Author
-
Juan Carlos Callejas, Freddy Alcarazo Ibáñez, Victor Tuesta Monteza, Raciel Yera, and Heber Ivan Mejía Cabrera
- Subjects
Support vector machine ,Polymers and Plastics ,Citrus aurantifolia ,Color space ,Máquinas de vectores de soporte ,Image pre-processing ,Artificial vision ,Limón Sutil peruano ,Clasificación automática ,Automatic classification ,K-Vecinos más cercanos ,Subtle peruvian lemon ,Pre-procesamiento de imágenes ,Humanities ,Color moments ,K-Nearest neighbors ,Mathematics - Abstract
Fil: Alcarazo Ibáñez, Freddy. Universidad Señor de Sipán; Perú. Fil: Tuesta Monteza, Victor. Universidad Señor de Sipán; Perú. Fil: Mejía Cabrera, Heber Iván. Universidad Señor de Sipán; Perú. Fil: Callejas, Juan Carlos. Universidad Señor de Sipán; Perú. Fil: Yera, Raciel. Universidad de Ciego de Avila; Cuba. La clasificación manual de frutas es un proceso que requiere de personal experto y es propenso al error humano. Reviste entonces vital importancia la automatización del mismo utilizando herramientas computacionales. En esta investigación se propuso un marco de trabajo basado en la aplicación de técnicas de Pre Procesamiento de Imágenes y de Visión Artificial para clasificar de manera automática frutos del Limón Sutil Peruano (Citrus Aurantifolia) por color. Se presenta un prototipo de clasificación soportado por una plataforma de hardware para extraer las características de Momentos de Color de las imágenes de Citrus Aurantifolia con vistas a entrenar las técnicas de clasificación de Máquina de Vectores de Soporte (SVM) y K-Vecinos más Cercanos (KNN). Los resultados arrojaron que utilizando el Momento de Color de la media del canal R (rojo), SVM obtuvo una precisión del 98%. Al convertir las imágenes al espacio de color CIELAB utilizando las coordenadas a* y b* la precisión obtenida por las técnicas SVM y K-NN fue del 100%. The manual classification of fruits is a process that requires expert knowledge and is prone to human error. Therefore, the automation of such process through the use of computational tools is of high importance. This research proposes a framework based on the application of image pre-processing techniques and artificial vision for automatically classifying Citrus Aurantifolia fruits through their colors. A classification prototype is presented which is supported by a hardware platform to extract the Color Moments features from the Citrus Aurantifolia images, so as to train the Support Vector Machine (SVM) and K-nearest neighbors (KNN) classification techniques. Results conclude that using the Color Moment related to the mean of the R channel, SVM reaches a precision of 98%. When images were converted into the CIELAB color space, the use of the coordinates a* and b* leads to a precision of 100% using the classifiers SVM and KNN.
- Published
- 2020
24. Machine learning methods in prospective studies after an example of financing innovation in Colombia
- Author
-
Javier Humberto Ospina-Holguín, Javier Enrique Medina-Vásquez, and Ana Milena Padilla-Ospina
- Subjects
random forests ,Technological innovations. Automation ,redes neuronales ,máquinas de gradiente potenciado ,bosques aleatorios ,logistic regression ,HD45-45.2 ,Social Sciences ,General Medicine ,máquinas de vectores de soporte ,HD28-70 ,support vector machines ,máquinas de gradiente potencia ,Industries. Land use. Labor ,regresión logística ,Management. Industrial management ,gradient powered machines ,neuronal networks ,HD28-9999 - Abstract
Resumen El propósito de este artículo es hacer una breve introducción a cinco métodos avanzados de predicción de aprendizaje automático, que pueden ser de utilidad para el desarrollo de estudios prospectivos: la regresión logística, las máquinas de vectores de soporte, las máquinas de gradiente potenciado, los bosques aleatorios y las redes neuronales. Además, se explica qué metodología se puede llevar a cabo para asegurar la robustez y validar dichos modelos de predicción. A manera de ejemplo, se presenta cómo el uso de estos métodos permitió identificar las variables financieras más importantes para predecir el desarrollo de actividades de innovación en pymes colombianas. Los resultados del uso de estos métodos pueden permitir la generación de pronósticos al corto y mediano plazo, que sirvan para la realización de estudios prospectivos con métodos más amplios, como la construcción de escenarios, con el propósito de generar propuestas basadas en la evidencia, como hoja de ruta para la planeación y política pública al largo plazo. Abstract The purpose of this article is to make a brief introduction to five advanced machine learning prediction methods which may be useful for the development of prospective studies: logistic regression, support vector machines, gradient powered machines, random forests and neural networks. In addition, it is explained what methodology can be carried out to ensure robustness and validate these prediction models. As an example, it is presented how the use of these methods allowed to identify the most important financial variables to predict the development of innovation activities in Colombian SMEs. The results of the use of these methods may allow generating short and medium-term forecasts that serve to facilitate prospective studies with broader methods, such as the construction of scenarios, with the purpose of generating evidence-based proposals as a roadmap for long-term planning and public policy.
- Published
- 2020
25. Aplicación de Radiomics basado en TC para la detección del oncogén KRAS en pacientes con cáncer colorrectal
- Author
-
Porto Álvarez, Jacobo, Souto Bayarri, Miguel, Huelga Zapico, Emilio, Cernadas García, Eva, and Universidade de Santiago de Compostela. Facultade de Medicina e Odontoloxía
- Subjects
Oncoxén KRAS ,Support Vector Machines ,Cancro colorrectal ,Cáncer colorrectal ,Oncogén KRAS ,Máquinas de Vectores de Soporte - Abstract
Traballo de Fin de Grao en Medicina. Curso 2019-2020. En este trabajo de final de grado se intentó identificar la mutación en el oncogén KRAS partiendo del sistema clásico de visión artificial. Mediante técnicas descriptivas, se extrajeron las características de la textura de la imagen de TC de pacientes con cáncer colorrectal, y se clasificaron mediante Máquinas de Vectores de Soporte (SVM) en KRAS+ o KRAS-. El análisis de textura puede proporcionar una evaluación cuantitativa de la heterogeneidad tumoral mediante el análisis de la distribución y relación entre los pixeles de la imagen. El objetivo de este trabajo es demostrar que Radiomics basado en TC puede predecir la presencia de mutación en el oncogén KRAS en cáncer colorrectal. Se trata de un estudio transversal, con 47 pacientes del Hospital Clínico de Santiago de Compostela y del Hospital Provincial de Conxo de los que también está disponible el análisis anatomopatológico confirmatorio de dicha mutación. El hecho de poder identificar la expresión genética de un tumor sin tener que hacer una biopsia y un test genético supone una ventaja para el paciente y para el médico, ya que puede permitir tanto evitar procedimientos invasivos que supongan complicaciones y presenten sesgos en la muestra, como orientar hacia una técnica o tratamiento más personalizado y eficaz. Neste proxecto de fin de grao, intentouse identificar a mutación no oncoxen KRAS baseado no sistema clásico de visión artificial. Usando técnicas descritivas, extraéronse as características da textura da imaxe de TC de doentes con cancro colorrectal e clasificáronse mediante Máquinas de Vector de Soporte (SVM) en KRAS + ou KRAS-. A análise de textura pode proporcionar unha avaliación cuantitativa da heteroxeneidade do tumor mediante a análise da distribución e relación entre pixeles da imaxe. O obxectivo deste traballo é demostrar que a Radiómica baseada en TC pode predicir a presenza de mutación no oncoxen KRAS no cancro colorrectal. Trátase dun estudo transversal, con 47 doentes do Hospital Clínico de Santiago de Compostela e do Hospital Provincial de Conxo, dos que tamén se dispón dunha análise anatomopatolóxica confirmativa da devandita mutación. O feito de poder identificar a expresión xenética dun tumor sen ter que facer unha biopsia e unha proba xenética é unha vantaxe para o doente e para o médico, xa que tanto pode evitar procedementos invasivos que impliquen complicacións e presenten sesgos na mostra, como orientar cara a unha técnica ou tratamento máis personalizado e eficaz. In this final degree project, we tried to identify the oncogene KRAS mutation starting from the classic computer vision system. Using descriptive techniques, the characteristics of the CT image texture of patients with colorectal cancer were extracted and classified using Support Vector Machines (SVM) in KRAS+ or KRAS-. Texture analysis can provide a quantitative assessment of tumor heterogeneity by analyzing the distribution and relationship between the pixels in the image. The objective of this research is to demonstrate that CT-based Radiomics can predict the presence of mutation in the KRAS gene in colorectal cancer. This is a retrospective study, with 47 patients from the Clinical Hospital of Santiago de Compostela and the Provincial Hospital of Conxo, from whom we also had available the confirmatory pathological analysis of KRAS mutation. The fact of being able to identify the genetic expression of a tumor without having to do a biopsy and a genetic test is an advantage, both for the patient and the doctor. It prevents invasive procedures that involve complications and presenting biases in the sample. As well, it leads towards a more personalized and effective treatment.
- Published
- 2020
26. Support Vector Machines for Biomarkers Detection in in vitro and in vivo Experiments of Organochlorines Exposure
- Author
-
Jorge Alejandro Lopera-Rodríguez, Jorge Alberto Jaramillo-Garzón, and Martha Zuluaga
- Subjects
Technology ,Support vector machines ,Eliminación Recursiva de Características ,Metabolómica ,Engineering (General). Civil engineering (General) ,metabolomics ,support vector machines ,Recursive feature elimination ,Organoclorados ,multivariate statistical methods ,recursive feature elimination ,Organochlorines ,Estadística Multivariada ,Metabolomics ,organochlorines ,TA1-2040 ,Multivariate statistical methods ,Máquinas de Vectores de Soporte - Abstract
Metabolomic studies generate large amounts of data, whose complexity increases if they are derived from in vivo experiments. As a result, analysis methods highly used in metabolomics, such as Partial Least Squares Discriminant Analysis (PLS-DA), can have particular difficulties with this type of data. However, there is evidence that indicates that Support Vector Machines (SVMs) can better deal with complex data. On the other hand, chronic exposure to organochlorines is a public health problem. It has been associated with diseases such as cancer. Therefore, its identification is relevant to reduce their impact on human health. This study explores the performance of SVMs in classifying metabolic profiles and identifying relevant metabolites in studies of exposure to organochlorines. For this purpose, two experiments were conducted: in the first one, organochlorine exposure was evaluated in HepG2 cells; and, in the second one, it was evaluated in serum samples of agricultural workers exposed to pesticides. The performance of SVMs was compared with that of PLS-DA. Four kernel functions were assessed in SVMs, and the accuracy of both methods was evaluated using a k-fold cross-validation test. In order to identify the most relevant metabolites, Recursive Feature Elimination (RFE) was used in SVMs and Variable Importance in Projection (VIP) in PLS-DA. The results show that SVMs exhibit a higher percentage of accuracy with fewer training samples and better performance in classifying the samples from the exposed agricultural workers. Finally, a workflow based on SVMs for the identification of biomarkers in samples with high biological complexity is proposed. Resumen Los estudios en metabolómica generan gran cantidad de datos cuya complejidad aumenta si surgen de experimentos in vivo. A pesar de esto, métodos ampliamente usados en metabolómica como el análisis discriminante por mínimos cuadrados parciales (PLS-DA) tienen dificultades con este tipo de datos, sin embargo, hay evidencia que las máquinas de vectores de soporte (SVM) pueden tener un mejor desempeño. Por otro lado, la exposición crónica a organoclorados es un problema de salud pública. Esta se asocia a enfermedades como el cáncer. Identificarla exposición es relevante para disminuir su impacto. Este estudio tuvo como objetivo explorar el rendimiento de las SVM en la clasificación de perfiles metabolómicos e identificación de metabolitos relevantes en estudios de exposición a organoclorados. Se realizaron dos experimentos: primero se evaluó la exposición a organoclorados en células HepG2. Luego, se evaluó la exposición a pesticidas en muestras de suero de trabajadores agrícolas. El rendimiento de las SVM se comparó con PLS-DA. Se evaluaron cuatro funciones kernel en SVM y la precisión de ambos métodos se evaluó mediante prueba de validación cruzada k-fold. Para identificar los metabolitos relevantes, se utilizó eliminación recursiva de características (RFE) en SVM y la proyección de importancia de variables (VIP) se usó en PLS-DA. Los resultados mostraron que las SVM tuvieron mayor precisión en la clasificación de los trabajadores agrícolas expuestos usando menos muestras de entrenamiento. Se propone un flujo de trabajo basado en SVM que permita la identificación de biomarcadores en muestras con alta complejidad biológica.
- Published
- 2021
- Full Text
- View/download PDF
27. Clasificación automática de limón sutil peruano (citrus aurantifolia) usando máquinas de vectores de soporte
- Author
-
Alcarazo Ibáñez, Freddy, Tuesta Monteza, Víctor, Mejía Cabrera, Heber Iván, Callejas, Juan Carlos, Yera, Raciel, Alcarazo Ibáñez, Freddy, Tuesta Monteza, Víctor, Mejía Cabrera, Heber Iván, Callejas, Juan Carlos, and Yera, Raciel
- Abstract
The manual classification of fruits is a process that requires expert knowledge and is prone to human error. Therefore, the automation of such process through the use of computational tools is of high importance. This research proposes a framework based on the application of image pre-processing techniques and artificial vision for automatically classifying Citrus Aurantifolia fruits through their colors. A classification prototype is presented which is supported by a hardware platform to extract the Color Moments features from the Citrus Aurantifolia images, so as to train the Support Vector Machine (SVM) and K-nearest neighbors (KNN) classification techniques. Results conclude that using the Color Moment related to the mean of the R channel, SVM reaches a precision of 98%. When images were converted into the CIELAB color space, the use of the coordinates a* and b* leads to a precision of 100% using the classifiers SVM and KNN., La clasificación manual de frutas es un proceso que requiere de personal experto y es propenso al error humano. Reviste entonces vital importancia la automatización del mismo utilizando herramientas computacionales. En esta investigación se propuso un marco de trabajo basado en la aplicación de técnicas de Pre-Procesamiento de Imágenes y de Visión Artificial para clasificar de manera automática frutos del Limón Sutil Peruano (Citrus Aurantifolia) por color. Se presenta un prototipo de clasificación soportado por una plataforma de hardware para extraer las características de Momentos de Color de las imágenes de Citrus Aurantifolia con vistas a entrenar las técnicas de clasificación de Máquina de Vectores de Soporte (SVM) y K-Vecinos más Cercanos (KNN). Los resultados arrojaron que utilizando el Momento de Color de la media del canal R (rojo), SVM obtuvo una precisión del 98%. Al convertir las imágenes al espacio de color CIELAB utilizando las coordenadas a* y b* la precisión obtenida por las técnicas SVM y K-NN fue del 100%.
- Published
- 2020
28. Métodos de aprendizaje automático en los estudios prospectivos desde un ejemplo de la financiación de la innovación en Colombia
- Author
-
Padilla Ospina, Ana Milena, Medina Vásquez, Javier Enrique, Ospina Holguín, Javier Humberto, Padilla Ospina, Ana Milena, Medina Vásquez, Javier Enrique, and Ospina Holguín, Javier Humberto
- Abstract
The purpose of this article is to make a brief introduction to five advanced machine learning prediction methods which may be useful for the development of prospective studies: logistic regression, support vector machines, gradient powered machines, random forests and neural networks. In addition, it is explained what methodology can be carried out to ensure robustness and validate these prediction models. As an example, it is presented how the use of these methods allowed to identify the most important financial variables to predict the development of innovation activities in Colombian SMEs. The results of the use of these methods may allow generating short and medium-term forecasts that serve to facilitate prospective studies with broader methods, such as the construction of scenarios, with the purpose of generating evidence-based proposals as a roadmap for long-term planning and public policy., El propósito de este artículo es hacer una breve introducción a cinco métodos avanzados de predicción de aprendizaje automático, que pueden ser de utilidad para el desarrollo de estudios prospectivos: la regresión logística, las máquinas de vectores de soporte, las máquinas de gradiente potenciado, los bosques aleatorios y las redes neuronales. Además, se explica qué metodología se puede llevar a cabo para asegurar la robustez y validar dichos modelos de predicción. A manera de ejemplo, se presenta cómo el uso de estos métodos permitió identificar las variables financieras más importantes para predecir el desarrollo de actividades de innovación en pymes colombianas. Los resultados del uso de estos métodos pueden permitir la generación de pronósticos al corto y mediano plazo, que sirvan para la realización de estudios prospectivos con métodos más amplios, como la construcción de escenarios, con el propósito de generar propuestas basadas en la evidencia, como hoja de ruta para la planeación y política pública al largo plazo.
- Published
- 2020
29. Aplicación de Radiomics basado en TC para la detección del oncogén KRAS en pacientes con cáncer colorrectal
- Author
-
Souto Bayarri, Miguel, Huelga Zapico, Emilio, Cernadas García, Eva, Universidade de Santiago de Compostela. Facultade de Medicina e Odontoloxía, Porto Álvarez, Jacobo, Souto Bayarri, Miguel, Huelga Zapico, Emilio, Cernadas García, Eva, Universidade de Santiago de Compostela. Facultade de Medicina e Odontoloxía, and Porto Álvarez, Jacobo
- Abstract
En este trabajo de final de grado se intentó identificar la mutación en el oncogén KRAS partiendo del sistema clásico de visión artificial. Mediante técnicas descriptivas, se extrajeron las características de la textura de la imagen de TC de pacientes con cáncer colorrectal, y se clasificaron mediante Máquinas de Vectores de Soporte (SVM) en KRAS+ o KRAS-. El análisis de textura puede proporcionar una evaluación cuantitativa de la heterogeneidad tumoral mediante el análisis de la distribución y relación entre los pixeles de la imagen. El objetivo de este trabajo es demostrar que Radiomics basado en TC puede predecir la presencia de mutación en el oncogén KRAS en cáncer colorrectal. Se trata de un estudio transversal, con 47 pacientes del Hospital Clínico de Santiago de Compostela y del Hospital Provincial de Conxo de los que también está disponible el análisis anatomopatológico confirmatorio de dicha mutación. El hecho de poder identificar la expresión genética de un tumor sin tener que hacer una biopsia y un test genético supone una ventaja para el paciente y para el médico, ya que puede permitir tanto evitar procedimientos invasivos que supongan complicaciones y presenten sesgos en la muestra, como orientar hacia una técnica o tratamiento más personalizado y eficaz., Neste proxecto de fin de grao, intentouse identificar a mutación no oncoxen KRAS baseado no sistema clásico de visión artificial. Usando técnicas descritivas, extraéronse as características da textura da imaxe de TC de doentes con cancro colorrectal e clasificáronse mediante Máquinas de Vector de Soporte (SVM) en KRAS + ou KRAS-. A análise de textura pode proporcionar unha avaliación cuantitativa da heteroxeneidade do tumor mediante a análise da distribución e relación entre pixeles da imaxe. O obxectivo deste traballo é demostrar que a Radiómica baseada en TC pode predicir a presenza de mutación no oncoxen KRAS no cancro colorrectal. Trátase dun estudo transversal, con 47 doentes do Hospital Clínico de Santiago de Compostela e do Hospital Provincial de Conxo, dos que tamén se dispón dunha análise anatomopatolóxica confirmativa da devandita mutación. O feito de poder identificar a expresión xenética dun tumor sen ter que facer unha biopsia e unha proba xenética é unha vantaxe para o doente e para o médico, xa que tanto pode evitar procedementos invasivos que impliquen complicacións e presenten sesgos na mostra, como orientar cara a unha técnica ou tratamento máis personalizado e eficaz., In this final degree project, we tried to identify the oncogene KRAS mutation starting from the classic computer vision system. Using descriptive techniques, the characteristics of the CT image texture of patients with colorectal cancer were extracted and classified using Support Vector Machines (SVM) in KRAS+ or KRAS-. Texture analysis can provide a quantitative assessment of tumor heterogeneity by analyzing the distribution and relationship between the pixels in the image. The objective of this research is to demonstrate that CT-based Radiomics can predict the presence of mutation in the KRAS gene in colorectal cancer. This is a retrospective study, with 47 patients from the Clinical Hospital of Santiago de Compostela and the Provincial Hospital of Conxo, from whom we also had available the confirmatory pathological analysis of KRAS mutation. The fact of being able to identify the genetic expression of a tumor without having to do a biopsy and a genetic test is an advantage, both for the patient and the doctor. It prevents invasive procedures that involve complications and presenting biases in the sample. As well, it leads towards a more personalized and effective treatment.
- Published
- 2020
30. PREDICCIÓN DE SERIES TEMPORALES USANDO MÁQUINAS DE VECTORES DE SOPORTE.
- Author
-
Velásquez, Juan D., Olaya, Yris, and Franco, Carlos J.
- Subjects
- *
TIME series analysis , *SUPPORT vector machines , *MATHEMATICAL statistics , *ARTIFICIAL neural networks , *MATHEMATICAL models , *NONLINEAR statistical models - Abstract
Time series prediction is an important research problem due to its implications in engineering, economics, finance and social sciences. An important topic about this problematic is the development of new models and its comparison with previous approaches in terms of forecast accuracy. Recently, support vector machines (SVM) have been used for time series prediction, but the reported experiences are limited and there are some problems related to its specification. The aim of this paper is to propose a novel technique for estimating some constants of the SVM usually fixed empirically by the modeler. The proposed technique is used to estimate several SVM with the aim of forecast five benchmark time series; the obtained results are compared with the statistics reported in other papers. The proposed method allow us to obtain competitive SVM for the time series forecasted in comparison with the results obtained using other most traditional models. [ABSTRACT FROM AUTHOR]
- Published
- 2010
31. LA AUTENTICACIÓN POR VOZ APLICADA A LA BANCA TELEFÓNICA.
- Author
-
Javier Silva Sánchez and Sergio Cano Ortiz
- Subjects
TELEPHONE bill paying services ,TELEPHONE systems ,TELEPHONE calls ,GAUSSIAN distribution ,SUPPORT vector machines ,SECURITY systems - Abstract
Copyright of Ciencia en su PC is the property of Instituto de Informacion Cientifica y Tecnologica and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2010
32. Clasificación Automática del Avance de Megaproyectos de Inversión Pública en Colombia, desde un Enfoque Técnico, Organizacional y Ambiental
- Author
-
Miguel Melgarejo and Hugo Gutierrez
- Subjects
Máquinas de vectores de soporte ,lcsh:TA1-2040 ,Complejidad ,Redes ,Megaproyectos ,Gestión ,lcsh:Engineering (General). Civil engineering (General) - Abstract
Contexto : se considera el marco tecnico, organizacional y ambiental (TOE, por sus siglas en ingles) para el analisis de proyectos de gran escala como contexto para el desarrollo de clasificadores de avance de megaproyectos, segun las necesidades del Departamento Nacional de Planeacion, Colombia. Metodo : se establecen algunas caracteristicas para la clasificacion del avance de proyectos de inversion publica, tomadas del marco TOE; a partir de estas, se construye una base de datos que se utiliza para entrenar dos clasificadores del avance de los proyectos reportados en la plataforma de seguimiento de proyectos de inversion del departamento de planeacion nacional. Se empleo la informacion de cerca de 3200 proyectos registrados entre el 2008 y 2012, correspondientes a cuatro sectores economicos (medio ambiente y desarrollo sostenible, minas y energia, salud y proteccion social y transporte). La base de datos fue depurada siguiendo un enfoque analitico y cuantitativo. Se empleo el 70% de los datos para entrenamiento y el 30% para validacion. Resultados: se obtienen algunos modelos con tasas de clasificacion superiores al 70%, lo que valida la eleccion de caracteristicas a partir del analisis del marco TOE. Conclusiones: este trabajo es un punto de partida para la configuracion de una herramienta que pueda ser usada por el departamento nacional de planeacion en la evaluacion a priori del retraso de megaproyectos de inversion publica.
- Published
- 2017
33. Predicción de la interacción de proteínas relacionadas con el Alzheimer a partir de su estructura primaria
- Author
-
Pérez López, Carlos, Cánovas Izquierdo, Javier Luis, and Sánchez Martínez, Melchor
- Subjects
Bioinformática -- TFM ,interacció entre proteïnes ,support vector machine ,màquines de vectors de suport ,interacción entre proteínas ,protein interaction ,máquinas de vectores de soporte ,random forest ,Bioinformàtica -- TFM ,Bioinformatics -- TFM - Abstract
La enfermedad del Alzheimer (EA) es una enfermedad neurodegenerativa que afecta a una gran cantidad de personas en la actualidad. Todavía se está trabajando en multitud de terapias, sin embargo, los estudios para la elaboración de nuevos medicamentos, son procesos muy costosos; por lo que se está recurriendo a técnicas computacionales de machine learning para abaratar costes. En este trabajo se van a entrenar modelos de machine learning para intentar predecir si dos proteínas interaccionan o no. Para ello, se recogen datos de proteínas que intervienen en el proceso de la EA y se estudia que proteínas interaccionan con ellas (PPIs); por otra parte, también se recogen datos de los repositorios de Intact y Negatome sobre proteínas que se tienen pruebas experimentales de que no interaccionan (nPPIs); también, se emparejan proteínas al azar de Uniprot y se asume que son nPPIs. A partir de estas bases de datos, se obtienen las estructuras primarias de las proteínas y se generan características en forma de datos cuantitativos empleando las metodologías de Composición de aminoácidos (AAC), Composición de dipéptidos (DPC), Composición/Transición/Distribución (CTD) y Composición de pseudoaminoácidos (PAAC). Para elaborar los modelos, a partir de estas características, se emplean los algoritmos Support Vector Machine (SVM) y Random Forest (RF). Finalmente se obtiene que el modelo generado mediante SVM, empleando AAC y empleando la base de datos de Uniprot como fuente de nPPIs es el que mayor capacidad de predicción y robustez presenta. Alzheimer's disease (AD) is a neurodegenerative disease that affects a large number of people at this time. Nowadays, numerous therapies are being used to treat it. However, studies on the development of new medications turn out to be expensive processes; therefore, machine learning techniques are being used to reduce costs. In this thesis, machine learning models will be trained to try to predict whether two proteins interact or not. In order to do this, protein data involved in the AD process are collected, and it is then studied which proteins interact with them (PPIs). Data are also collected from the Intact and Negatome repositories on proteins that have experimental evidence showing that they don't have interactions (nPPIs); while random proteins from Uniprot are paired and assumed to be nPPIs. Drawing from these databases, the primary structures of the proteins are obtained and characteristics are generated in the form of quantitative data using the methodologies of Amino Acid Composition (AAC), Dipeptide Composition (DPC), Composition / Transition / Distribution (CTD) and Composition of pseudo-amino acids (PAAC). To develop the models, based on these characteristics, the algorithms Support Vector Machine (SVM) and Random Forest (RF) are used. Ultimately, it is shown that the model generated by SVM, using AAC and using the Uniprot database as a source of nPPIs, is the one with the greatest prediction and robustness. La malaltia de l'Alzheimer (EA) és una malaltia neurodegenerativa que afecta una gran quantitat de persones en l'actualitat. Encara s'està treballant en multitud de teràpies, no obstant això, els estudis per a l'elaboració de nous medicaments, són processos molt costosos; pel que s'està recorrent a tècniques computacionals de machine learning per a abaratir costos. En aquest treball s'entrenaran models de machine learning per a intentar predir si dues proteïnes interaccionen o no. Per a això, es recullen dades de proteïnes que intervenen en el procés de l'EA i s'estudia que proteïnes interaccionen amb elles (PPIs); d'altra banda, també es recullen dades dels repositoris de Intact i Negatome sobre proteïnes que es tenen proves experimentals que no interaccionen (nPPIs); també, s'aparellen proteïnes a l'atzar de Uniprot i s'assumeix que són nPPIs. A partir d'aquestes bases de dades, s'obtenen les estructures primàries de les proteïnes i es generen característiques en forma de dades quantitatives emprant les metodologies de Composició d'aminoàcids (AAC), Composició de dipéptids (DPC), Composició/Transició/Distribució (CTD) i Composició de pseudoaminoácids (PAAC). Per a elaborar els models, a partir d'aquestes característiques, s'empren els algorismes Support Vector Machine (SVM) i Random Forest (RF). Finalment s'obté que el model generat mitjançant SVM, emprant AAC i emprant la base de dades de Uniprot com a font de nPPIs és el que major capacitat de predicció i robustesa presenta.
- Published
- 2020
34. Comparativo de kernels sobre predicción de oferta de fuentes alternativas de energía
- Author
-
Mora-Paz, Héctor Andrés
- Subjects
photovoltaic energy ,Máster Universitario en Inteligencia Artificial ,maquinas de vectores de soporte ,kernel function ,energía fotovoltaica ,función kernel ,artificial neural networks ,imágenes satelitales ,support vector machines ,satellite images ,redes neuronales artificiales - Abstract
The need to mitigate the climate change crisis and meet the energy demand has turned attention to clean energy sources, such as photovoltaics. Promoting studies focused on supply as in (Cabrera, 2016), where large databases of NASA from Landsat and MODIS satellite images were structured for a given geographical area, producing good patterns in both Artificial Neural Networks (ANN) and Support Vector Machines (SVM). However, the performance of these algorithms has not yet been evaluated using kernel functions such as those proposed by Belanche (2015). To solve this in this research, it is contributed with the efficient acquisition of training data from Big data, specialization of the ANN and SVM algorithms with kernels coupled to scikit-learn, experimental framework for hyperparameter tuning and discussion, where it is shown that the functions kernel manage to improve the results of the state of the art. La necesidad de mitigar la crisis del cambio climático y suplir la demanda energética, ha girado la atención hacia las fuentes de energías limpias, como la fotovoltaica. Promoviendo estudios enfocados en la oferta como en (Cabrera, 2016), donde se estructuraron para una superficie geográfica determinada, grandes bases de datos desde imágenes satelitales Landsat y MODIS de NASA, produciendo buenos patrones tanto en Redes Neuronales Artificiales (ANN) como en Máquinas de Soporte Vectorial (SVM). No obstante aún no se ha evaluado el desempeño de estos algoritmos haciendo uso de funciones kernel como las propuestas por Belanche (2015). Para solventar esto en esta investigación se aporta con la adquisición eficiente de datos de entrenamiento desde Big data, especialización de los algoritmos ANN y SVM con kernels acoplados a scikit-learn, marco experimental para sintonización de hiperparámetros y discusión, donde se muestra que las funciones kernel consiguen mejorar los resultados del estado del arte.
- Published
- 2019
35. Detección de peatones en video usando algoritmos de aprendizaje automático
- Author
-
Camele, Genaro, Hasperué, Waldo, and Ronchetti, Franco
- Subjects
Machine Learning ,Máquinas de vectores de soporte ,Deep Learning ,Ciencias Informáticas ,Redes neuronales ,Clasificación y detección de peatones ,Transferencia de aprendizaje - Abstract
La detección de peatones utilizando algoritmos de Machine Learning es un tema ampliamente abordado. En esta tesis se hará uso de SVM y redes neuronales como clasificadores, utilizando combinaciones de diferentes descriptores para esta tarea. Se analizaran varias métricas obtenidas por ambos modelos, esto permitirá determinar si los clasificadores propuestos alcanzan resultados aceptables en un contexto tan diverso como lo es un ambiente urbano. Usando SVM se realizará un análisis de la transferencia de aprendizaje, midiendo si al evaluar un conjunto de datos diferentes del que se entrenó alcanza métricas similares., Facultad de Informática
- Published
- 2019
36. Caracterización del trastorno del espectro autista basado en técnicas de aprendizaje automático a partir de características extraídas de la conectividad funcional del cerebro en estado de reposo
- Author
-
Pascual Belda, Aitana
- Subjects
correlación ,redes neuronales artificiales ,trastorno del espectro autista ,métodos de clasificación ,neuroimagen ,resonancia magnética funcional ,conectividad funcional ,máquinas de vectores de soporte ,TECNOLOGIA ELECTRONICA ,Máster Universitario en Ingeniería Biomédica-Màster Universitari en Enginyeria Biomèdica ,aprendizaje automático ,k-vecinos más próximos ,análisis supervisado ,conectividad cerebral - Abstract
[ES] El trastorno del espectro autista (TEA) es un desorden de tipo neurológico cuya prevalencia se ha visto enormemente incrementada en los últimos años, hecho probablemente condicionado a las mejoras en las metodologías diagnósticas, pero que no deja de resultar alarmante. A pesar de su prevalencia, y al igual que ocurre con muchos otros trastornos de tipo neurológico o psiquiátrico, las bases neurológicas del TEA aún no han sido completamente esclarecidas. El objetivo del presente Trabajo Final de Máster es evaluar el potencial de distintas técnicas de aprendizaje automático en el diagnóstico del TEA a partir del análisis de imagen de resonancia magnética funcional en estado de reposo. Dicho de otra manera, dado un conjunto de imágenes cerebrales, deseamos conocer si es posible discriminar aquellos sujetos con TEA de aquellos sujetos de referencia o controles. Para ello se analizarán un total de 157 sujetos (75 sujetos con TEA y 82 controles) de la base de datos ABIDE (Autism Brain Imaging Data Exchange). Para llevar a cabo este estudio, la herramienta de software escogida ha sido Matlab®. Para abordar dicho objetivo, en primer lugar, y para cada uno de los sujetos incluidos en el estudio, se calculará la conectividad funcional, cuantificada a partir del coeficiente de correlación de Pearson, entre cada par de regiones cerebrales a partir de la señal temporal BOLD. Después se llevará a cabo un análisis comparativo previo en un subconjunto de sujetos haciendo uso de la Network-Based Statistic Toolbox (NBS). Este análisis de la conectividad nos proporcionará una serie de enlaces entre regiones que muestran diferencias significativas entre grupos y que, por tanto, resultan clave para determinar el patrón de conectividad funcional asociado al TEA. Los valores de conectividad funcional de cada uno de los enlaces que muestran diferencias significativas entre los dos grupos se utilizarán como características para la clasificación del subconjunto restante de sujetos. Así, se aplicarán diversas técnicas de clasificación, como los k-vecinos más próximos, las máquinas de vectores de soporte o las redes neuronales artificiales, para producir un modelo predictivo que permita distinguir entre las imágenes pertenecientes a sujetos con TEA y sujetos control. También se aplicará la técnica de validación cruzada (cross-validation) para una correcta evaluación del modelo generado. Los resultados obtenidos muestran que las redes neuronales artificiales (y más concretamente, el perceptrón multicapa, que ha sido la arquitectura escogida en este trabajo) proporcionan el modelo con una mayor capacidad predictiva de entre los cuatro elaborados, con un porcentaje de acierto en la clasificación en torno al 80% en el conjunto de validación. Se espera que los resultados obtenidos puedan contribuir al desarrollo de herramientas de apoyo al diagnóstico de TEA, y que puedan ser también extrapolables a otras patologías de origen neurológico, como el alcoholismo o la enfermedad de Alzheimer., [EN] The Autism Spectrum Disorder (ASD) is a neurological disorder with an increasing prevalence, and even though this growth is probably related to the improvements in diagnostic methodologies, the increase in the number of ASD diagnosed patients is an alarming fact. Despite its prevalence, and as it happens in many other neurological and psychiatric disorders, the neurological basis of the ASD have not been completely established yet. The aim of this work is to evaluate the potential of machine learning techniques in ASD diagnosis based on the analysis of resting state functional magnetic resonance images. In other words, we want to determine if it is possible, having a set of brain images, to determine which subjects have ASD, and which ones are subjects with a neurotypical development, or control subjects. In order to address this problem, we have analyzed images pertaining to 157 subjects (75 with ASD and 82 controls) obtained from ABIDE (Autism Brain Imaging Data Exchange). The analysis of these images has been performed using Matlab. To achieve this target, the first step is to obtain the functional brain connectivity for each one of the subjects in the study, using Pearson¿s correlation coefficient of BOLD signal between every pair of regions of the brain. Then, we will perform a comparative analysis in a subset of patients using the Network-Based Statistic Toolbox (NBS). This connectivity analysis will provide us with a group of connections among different regions that usually appear significantly altered in one of the groups, and that are therefore key brain alterations in order to determine the ASD characteristic pattern. The obtained set of altered connections will be used as features to classify the remaining subset of patients. Therefore, we will apply several classification techniques, such as k-Nearest Neighbors (KNN), Support Vector Machines (SVMs) or Artificial Neural Networks, to produce a predictive model that distinguishes between images pertaining to ASD subjects, and images pertaining to control subjects. The obtained results show that artificial neural networks (and more concretely, the multilayer perceptron, which is the architecture that has been chosen in this work) provide us with the model with de highest predictive power among the four tested model, with an accuracy near 80% in the validation data. It is expected that the obtained results may contribute to the development of diagnosis support tools in ASD, and that can also be extrapolated to other neurological disorders, such as alcoholism or Alzheimer disease.
- Published
- 2018
37. Difficulties and Challenges of Anomaly Detection in Smart Cities: A Laboratory Analysis
- Author
-
Carles Garrigues, Victor Garcia-Font, Helena Rifà-Pous, Universitat Oberta de Catalunya. Internet Interdisciplinary Institute (IN3), and Universitat Rovira i Virgili
- Subjects
Computer science ,02 engineering and technology ,computer.software_genre ,lcsh:Chemical technology ,Biochemistry ,support vector machines ,Analytical Chemistry ,testbed ,detección de outliers ,bosque de aislamiento ,0202 electrical engineering, electronic engineering, information engineering ,lcsh:TP1-1185 ,seguridad de la información ,wireless sensor networks ,Instrumentation ,red de sensores inalámbricos ,Testbed ,isolation forest ,Atomic and Molecular Physics, and Optics ,anomaly detection ,020201 artificial intelligence & image processing ,Anomaly detection ,bosc d'aïllament ,Sensor networks ,xarxa de sensors sense fils ,smart cities ,detecció d'anomalia ,information security ,Context (language use) ,outlier detection ,Computer security ,Xarxes de sensors ,Article ,Smart city ,detecció de outliers ,ciudades inteligentes ,Isolation (database systems) ,Electrical and Electronic Engineering ,seguretat de la informació ,020206 networking & telecommunications ,Information security ,máquinas de vectores de soporte ,banco de pruebas ,Support vector machine ,màquines de vectors suport ,ciutats intel·ligents ,banc de proves ,detección de anomalías ,computer ,Wireless sensor network ,Redes de sensores - Abstract
Smart cities work with large volumes of data from sensor networks and other sources. To prevent data from being compromised by attacks or errors, smart city IT administrators need to apply attack detection techniques to evaluate possible incidents as quickly as possible. Machine learning has proven to be effective in many fields and, in the context of wireless sensor networks (WSNs), it has proven adequate to detect attacks. However, a smart city poses a much more complex scenario than a WSN, and it has to be evaluated whether these techniques are equally valid and effective. In this work, we evaluate two machine learning algorithms (support vector machines (SVM) and isolation forests) to detect anomalies in a laboratory that reproduces a real smart city use case with heterogeneous devices, algorithms, protocols, and network configurations. The experience has allowed us to show that, although these techniques are of great value for smart cities, additional considerations must be taken into account to effectively detect attacks. Thus, through this empiric analysis, we point out broader challenges and difficulties of using machine learning in this context, both for the technical complexity of the systems, and for the technical difficulty of configuring and implementing them in such environments.
- Published
- 2018
38. Análisis Predictivo de Muerte y Sobrevida de Pacientes Hospitalizados Mediante Clasificadores Supervisados
- Author
-
Cordova Roque, Edward Gonzalo and Cordova Roque, Edward Gonzalo
- Abstract
En la actualidad el área de aprendizaje automático viene siendo utilizada en la extracción del conocimiento e información en grandes volúmenes de datos, posibilitando muchas aplicaciones en diferentes sectores productivos, un área de vital importancia en nuestro país es el sector salud, en ese sentido, desarrollar aplicaciones en salud son de suma importancia para prever situaciones que puedan ocurrir, como por ejemplo, en un hospital se registran ingreso de pacientes día a día y dicha información puede ser usada para apoyar a la toma de decisiones. En ese sentido, este trabajo propone el análisis predictivo de muerte y sobrevida de pacientes hospitalizados mediante clasificadores supervisados, el cual desarrolla las etapas de minería de datos y KDD para el tratamiento de la información de los datos registrados de un sistema de información del Hospital Regional Honorio Delgado, para tal objetivo se utilizan tres técnicas: redes neuronales de tipo Backpropagation, clasificador bayesiano y máquinas de vectores de soporte, a pesar que los registros de las personas que fallecen es mínima comparada con la gente que normalmente se trata, el modelo consiguió llegar a un 99.00 % de acierto siendo este un nivel de exactitud y confiabilidad adecuado para que pueda ser útil en la prevención de recursos del hospital entre otras cosas que puedan hacerse. Palabras claves: Máquinas de vectores de soporte, redes neuronales, clasificador bayesiano, predicción de muerte y sobre vida.
- Published
- 2018
39. Caracterización del trastorno del espectro autista basado en técnicas de aprendizaje automático a partir de características extraídas de la conectividad funcional del cerebro en estado de reposo
- Author
-
Moratal Pérez, David, Díaz Parra, Antonio, Universitat Politècnica de València. Departamento de Ingeniería Electrónica - Departament d'Enginyeria Electrònica, Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros Industriales - Escola Tècnica Superior d'Enginyers Industrials, Pascual Belda, Aitana, Moratal Pérez, David, Díaz Parra, Antonio, Universitat Politècnica de València. Departamento de Ingeniería Electrónica - Departament d'Enginyeria Electrònica, Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros Industriales - Escola Tècnica Superior d'Enginyers Industrials, and Pascual Belda, Aitana
- Abstract
[ES] El trastorno del espectro autista (TEA) es un desorden de tipo neurológico cuya prevalencia se ha visto enormemente incrementada en los últimos años, hecho probablemente condicionado a las mejoras en las metodologías diagnósticas, pero que no deja de resultar alarmante. A pesar de su prevalencia, y al igual que ocurre con muchos otros trastornos de tipo neurológico o psiquiátrico, las bases neurológicas del TEA aún no han sido completamente esclarecidas. El objetivo del presente Trabajo Final de Máster es evaluar el potencial de distintas técnicas de aprendizaje automático en el diagnóstico del TEA a partir del análisis de imagen de resonancia magnética funcional en estado de reposo. Dicho de otra manera, dado un conjunto de imágenes cerebrales, deseamos conocer si es posible discriminar aquellos sujetos con TEA de aquellos sujetos de referencia o controles. Para ello se analizarán un total de 157 sujetos (75 sujetos con TEA y 82 controles) de la base de datos ABIDE (Autism Brain Imaging Data Exchange). Para llevar a cabo este estudio, la herramienta de software escogida ha sido Matlab®. Para abordar dicho objetivo, en primer lugar, y para cada uno de los sujetos incluidos en el estudio, se calculará la conectividad funcional, cuantificada a partir del coeficiente de correlación de Pearson, entre cada par de regiones cerebrales a partir de la señal temporal BOLD. Después se llevará a cabo un análisis comparativo previo en un subconjunto de sujetos haciendo uso de la Network-Based Statistic Toolbox (NBS). Este análisis de la conectividad nos proporcionará una serie de enlaces entre regiones que muestran diferencias significativas entre grupos y que, por tanto, resultan clave para determinar el patrón de conectividad funcional asociado al TEA. Los valores de conectividad funcional de cada uno de los enlaces que muestran diferencias significativas entre los dos grupos se utilizarán como características para la clasificación del subconjunto restante de sujetos. Así, [EN] The Autism Spectrum Disorder (ASD) is a neurological disorder with an increasing prevalence, and even though this growth is probably related to the improvements in diagnostic methodologies, the increase in the number of ASD diagnosed patients is an alarming fact. Despite its prevalence, and as it happens in many other neurological and psychiatric disorders, the neurological basis of the ASD have not been completely established yet. The aim of this work is to evaluate the potential of machine learning techniques in ASD diagnosis based on the analysis of resting state functional magnetic resonance images. In other words, we want to determine if it is possible, having a set of brain images, to determine which subjects have ASD, and which ones are subjects with a neurotypical development, or control subjects. In order to address this problem, we have analyzed images pertaining to 157 subjects (75 with ASD and 82 controls) obtained from ABIDE (Autism Brain Imaging Data Exchange). The analysis of these images has been performed using Matlab. To achieve this target, the first step is to obtain the functional brain connectivity for each one of the subjects in the study, using Pearson¿s correlation coefficient of BOLD signal between every pair of regions of the brain. Then, we will perform a comparative analysis in a subset of patients using the Network-Based Statistic Toolbox (NBS). This connectivity analysis will provide us with a group of connections among different regions that usually appear significantly altered in one of the groups, and that are therefore key brain alterations in order to determine the ASD characteristic pattern. The obtained set of altered connections will be used as features to classify the remaining subset of patients. Therefore, we will apply several classification techniques, such as k-Nearest Neighbors (KNN), Support Vector Machines (SVMs) or Artificial Neural Networks, to produce a predictive model that distinguishes between images pertain
- Published
- 2018
40. Anotación de nuevos microRNAs en el genoma porcino mediante una aproximación basada en Machine Learning
- Author
-
Mármol Sánchez, Emilio, Universitat Oberta de Catalunya, Morán Moreno, José Antonio, and Pla Planas, Albert
- Subjects
Bioinformática -- TFM ,machine learning ,microRNA ,aprendizaje automático ,support vector machine ,màquines de vectors de suport ,máquinas de vectores de soporte ,Bioinformàtica -- TFM ,aprenentatge automàtic ,Bioinformatics -- TFM - Abstract
La predicción computacional de microRNAs (miRNAs) supone un campo de investigación activo en la actualidad, sobre todo en especies no modelo cuyas anotaciones son aún limitadas y poco fiables. Mediante la utilización de una aproximación basada en algoritmos de Machine Learning como el Support Vector Machine (SVM) y Random Forest (RF), y haciendo uso de la comparación por homología en la anotación de miRNAs en humano, hemos desarrollado un proceso para la identificación y anotación de nuevos candidatos a estructuras pre-miRNA en el genoma porcino. Partiendo de la generación de un set de datos positivos y negativos, filtrados según tamaño y conformación estructural, se definieron diversos atributos estructurales para cada secuencia, con el objetivo de entrenar un modelo SVM de Machine Learning. Un conjunto de secuencias candidatas obtenidas mediante comparación por homología, fueron clasificadas como candidatos pre-miRNAs por el modelo SVM entrenado previamente, y posteriormente filtradas mediante un análisis de fiabilidad de posición genómica (Neighbouring Score). Mediante este proceso fuimos capaces de identificar un total de 26 nuevas secuencias pre-miRNA candidatas en el genoma porcino. De entre ellas destacó el miRNA ssc-miR-483, homólogo del miRNA homónimo en humano hsa-miR-483, alojado en el intrón 2 del gen IGF2, cuya función estaría ligada a la regulación de la proliferación celular y la diferenciación de adipocitos, influyendo en la capacidad de integración y depósito de lípidos en respuesta a variaciones en la ingesta de alimentos. Estos resultados podrían ampliar el conocimiento sobre la regulación del metabolismo energético y lipídico en la especie porcina. Computational discovery of microRNAs (miRNAs) poses a big research challenge nowadays, especially considering non-model species that lack accurate and reliable miRNA annotation. Through the application of a Machine Learning approach by using algorithms like Support Vector Machine (SVM) and Random Forest (RF) and making use of a homology-based comparison with miRNA annotation un humans, we developed a pipeline for identifying and annotating new pre-miRNA candidates in the porcine genome. We generated a set of positive and negative data, filtered considering size and structural folding, and then calculated a series of structural features for each considered sequence that where subsequently used for training a Machine Learning-based SVM classifier. We extracted a set of candidate sequences in the porcine genome that showed to be homologous from human miRNA annotation and classified them by using the previously trained SVM model. These candidate pre-miRNAs sequences were then filtered according to a neighbouring feasibility analysis. Our approach allowed us to identify 26 putative non-annotated pre miRNA sequences in the porcine genome. Among them, we highlighted the putative candidate ssc-miR-483, homologous of human hsa-miR-483 and located at intron 2 of IGF2 gene. This miRNA has been associated to the regulation of cellular proliferation and adipocyte differentiation, modulating lipid integration and storage in response to food intake. These results could enhance our understanding of energy and lipid metabolism regulation in the porcine species. La predicció computacional de microRNAs (miRNAs) suposa un camp de recerca actiu en l'actualitat, sobretot en espècies no model les anotacions de les quals són encara limitades i poc fiables. Mitjançant la utilització d'una aproximació basada en algorismes de Machine Learning com el Support Vector Machine (SVM) i Random Forest (RF), i fent ús de la comparació per homologia en l'anotació de miRNAs en humà, hem desenvolupat un procés per a la identificació i anotació de nous candidats a estructures pre-miRNA en el genoma porcí. Partint de la generació d'un set de dades positives i negatius, filtrats segons grandària i conformació estructural, es van definir diversos atributs estructurals per a cada seqüència, amb l'objectiu d'entrenar un model SVM de Machine Learning. Un conjunt de seqüències candidates obtingudes mitjançant comparació per homologia, van ser classificades com a candidats pre-miRNAs pel model SVM entrenat prèviament, i posteriorment filtrades mitjançant una anàlisi de fiabilitat de posició genòmica (Neighbouring Score). Mitjançant aquest procés vam ser capaços d'identificar un total de 26 noves seqüències pre-miRNA candidates en el genoma porcí. D'entre elles va destacar el miRNA ssc-miR-483, homòleg del miRNA homònim en humà hsa-miR-483, allotjat en el intrón 2 del gen IGF2, la funció del qual estaria lligada a la regulació de la proliferació cel·lular i la diferenciació d'adipòcits, influint en la capacitat d'integració i dipòsit de lípids en resposta a variacions en la ingesta d'aliments. Aquests resultats podrien ampliar el coneixement sobre la regulació del metabolisme energètic i lipídic en l'espècie porcina.
- Published
- 2018
41. Predicción de la toxicidad y de la actividad antimicrobiana a partir de la secuencia aminoacídica
- Author
-
Mariño Solís, Ramón, Universitat Oberta de Catalunya, and Sánchez Martínez, Melchor
- Subjects
màquina de vector de suport ,bacterial resistance ,máquinas de vectores de soporte ,aprenentatge automàtic ,Bioinformática -- TFM ,antimicrobial peptides ,péptidos antimicrobianos ,resistència bacteriana ,machine learning ,aprendizaje automático ,support vector machine ,pèptids antimicrobians ,resistencia bacteriana ,Bioinformàtica -- TFM ,Bioinformatics -- TFM - Abstract
Vimos la necesidad de crear una herramienta informática que pudiera predecir la actividad antimicrobiana y si pudiera causar toxicidad de un péptido. ¿Por qué era importante? Porque hay un creciente problema con la resistencia bacteriana a los antibióticos, que conlleva que cada vez hay menos moléculas que podrán utilizarse contra las infecciones problemáticas y, por lo tanto, es importante crear o descubrir nuevos fármacos con una fuerte actividad antibacteriana. Para ello, creamos dos modelos SVM, uno que clasifique entre péptidos tóxicos y no tóxicos, y otro que puede detectar si un péptido tiene actividad antimicrobiana, o no. We saw a necessity to create a informatic tool which it could predict the antimicrobial activity and if it could cause a toxic effect. Why it was important? Because there is problem with the bacterial resistance to antibiotics. Actually, there are less molecules that it could be used in the problematic infections and it is hardly important to create or discover new drugs with a strong antibacterial activity. Vam veure la necessitat de crear una eina informàtica que pogués predir l'activitat antimicrobiana i si pogués causar toxicitat d'un pèptid. Per què era important? Perquè hi ha un creixent problema amb la resistència bacteriana als antibiòtics, que comporta que cada vegada hi ha menys molècules que podran utilitzar-se contra les infeccions problemàtiques i, per tant, és important crear o descobrir nous fàrmacs amb una forta activitat antibacteriana. Per a això, vam crear dos models SVM, un que classifiqui entre pèptids tòxics i no tòxics, i un altre que pot detectar si un pèptid té activitat antimicrobiana, o no.
- Published
- 2017
42. Using machine learning techniques for sentiment analysis
- Author
-
Romero Llombart, Òscar, Universitat Autònoma de Barcelona. Escola d'Enginyeria, and Duran Cals, Jordi
- Subjects
Arbres de decisió ,Análisis de sentimientos ,Support vector machines ,Decision trees ,Lenguaje natural ,Xarxes neurals recurrents ,Minería de datos ,Redes neuronales recurrentes ,Aprendizaje automático ,Llenguatge natural ,Sentiment analysis ,Natural language ,Recurrent neural networks ,Aprenentatge automàtic ,Machine learning ,Mineria de dades ,Maquinas de vectores de soporte ,Anàlisi de sentiments ,Màquines de vectors de suport ,Naive bayes ,Arboles de decisión ,Data mining - Abstract
The Natural language processing is the discipline that studies how to make the machines read and interpret the language that the people use, the natural language. But in the machines world, the words not exist and they are represented by sequences of numbers that the machine represents with a character when displaying them on screen. The Sentiment Analysis is the name of the problem that with a sentence or text the machine gets capable to analyze and predict with the maximum precision possible the sentiment that will be obtained by a person when reads it or the contextual opinion related to something. This document wants to show what we can obtain using the most used machine learning tools. El processament de llenguatge natural és la disciplina que estudia com fer que les màquines aprenguin a llegir i interpretar el llenguatge que usem les persones, el llenguatge natural. Però, en el món de la computació, les paraules no existeixen i són representades per seqüències de números que a l'hora de mostrar-los per pantalla són convertits en lletres. L'anàlisi de sentiments és el nom que obté el problema que donada una sentència o text una computadora sigui capaç d'avaluar-lo i predir amb la màxima precisió possible el sentiment que obtindria una persona en llegir-lo o l'opinió contextual en vers a alguna cosa. Aquest article pretén mostrar el que es pot obtenir, en aquest àmbit, usant les eines d'aprenentatge automàtic més usades. El procesamiento de lenguaje natural es la disciplina que estudia cómo hacer que las máquinas aprendan a leer e interpretar el lenguaje que usamos las personas, el lenguaje natural. Pero, en el mundo de la computación, las palabras no existen y son representadas por secuencias de números que a la hora de mostrarlos por pantalla son convertidos en letras. El análisis de sentimientos es el nombre que obtiene el problema que dada una sentencia o texto una computadora sea capaz de evaluarlo y predecir con la máxima precisión posible el sentimiento que obtendría una persona en leerlo o la opinión contextual hacia algo. Este artículo pretende mostrar lo que se puede obtener, en este ámbito, usando las herramientas de aprendizaje automático más usadas.
- Published
- 2017
43. Clasificación de subjetividad utilizando técnicas de aprendizaje automático
- Author
-
Coria, Juan Manuel, Pons, Claudia Fabiana, and Hasperué, Waldo
- Subjects
Subjetividad ,Minería de Texto ,Ciencias Informáticas ,Redes Neuronales ,Objetividad ,Aprendizaje Automático ,Máquinas de Vectores de Soporte - Abstract
La clasificación de subjetividad es un ámbito de la minería de texto poco estudiado en el idioma español, y sin embargo sus aplicaciones son extensas. Su estudio permite comprender mejor la semántica de un texto y la intención de su autor, sin mencionar las implicaciones de su uso en la inteligencia de negocios, para identificar las necesidades de los clientes y obtener métricas valiosas a partir de sus críticas. En este trabajo se intenta aplicar técnicas conocidas de análisis de subjetividad en inglés, adaptadas al español, construyendo en el proceso una base de datos y un sistema clasificador de oraciones., Facultad de Informática
- Published
- 2017
44. Classificação fractográfica de materiais metálicos usando técnicas 3D de processamento e visualização em computador
- Author
-
Bastidas-Rodríguez, Maria Ximena, Prieto-Ortíz, Flavio A., and Espejo-Mora, Édgar
- Subjects
Artificial Neural Network ,ductile fracture ,Support Vector Machine ,fratura frágil ,Red Neuronal Artificial ,fractura por fatiga ,brittle fracture ,Máquinas de Vetores de Suporte ,Rede Neuronal Artificial ,fractura frágil ,dados 3D ,fratura por fadiga ,3D data ,fracture due to fatigue ,datos 3D ,fractura dúctil ,fratura dúctil ,Máquinas de Vectores de Soporte - Abstract
Failure analysis aims at collecting information about how and why a failure is produced. The first step in this process is a visual inspection on the flaw surface that will reveal the features, marks, and texture, which characterize each type of fracture. This is generally carried out by personnel with no experience that usually lack the knowledge to do it. This paper proposes a classification method for three kinds of fractures in crystalline materials: brittle, fatigue, and ductile. The method uses 3D vision, and it is expected to support failure analysis. The features used in this work were: i) Haralick’s features and ii) the fractal dimension. These features were applied to 3D images obtained from a confocal laser scanning microscopy Zeiss LSM 700. For the classification, we evaluated two classifiers: Artificial Neural Networks and Support Vector Machine. The performance evaluation was made by extracting four marginal relations from the confusion matrix: accuracy, sensitivity, specificity, and precision, plus three evaluation methods: Receiver Operating Characteristic space, the Individual Classification Success Index, and the Jaccard’s coefficient. Despite the classification percentage obtained by an expert is better than the one obtained with the algorithm, the algorithm achieves a classification percentage near or exceeding the 60% accuracy for the analyzed failure modes. The results presented here provide a good approach to address future research on texture analysis using 3D data. El análisis de falla tiene como objetivo recolectar información sobre cómo y porqué una falla es generada. El primer paso en este proceso consiste en una inspección visual en la superficie de la falla que revelará las características, marcas y textura que distinguen cada tipo de fractura. Esta inspección es generalmente llevada a cabo por personal que usualmente no cuenta con el suficiente conocimiento o experiencia necesaria. Este artículo propone un método de clasificación para tres modos de fracturas en materiales cristalinos: súbita frágil, progresiva por fatiga y súbita dúctil. El método propuesto usa visión en 3D, y busca ser un apoyo en el análisis de falla. Las características usadas en este estudio fueron i) las características de Haralick y ii) la dimensión fractal. La adquisición de imágenes 3D se realizó con un microscopio confocal de escaneo laser Zeiss LSM 700. Para llevar a cabo la clasificación, dos clasificadores fueron evaluados: Redes de Neuronas Artificiales y Máquinas de Vectores de Soporte. La evaluación de desempeño se logró extrayendo cuatro relaciones marginales de la matriz de confusión: exactitud, sensibilidad, especificidad y precisión, y los siguientes tres métodos de evaluación: Característica Operativa del Receptor o espacio ROC, el índice individual de éxito en la clasificación ICSI y el coeficiente de Jaccard. A pesar que el porcentaje de clasificación obtenida por un experto es mejor que la obtenida por el algoritmo, este último logra obtener porcentajes de clasificación cerca o superior al 60% en exactitud para los tres modos de falla analizados. Los resultados que aquí se presentan representan un buen acercamiento para estructurar investigaciones futuras en análisis de textura usando datos 3D. A análise de falha tem como objetivo recolher informação sobre como e por que uma falha é gerada. O primeiro passo neste processo consiste em uma inspeção visual na superfície da falha que revelará as características, marcas e textura que distinguem cada tipo de fratura. Esta inspeção é geralmente realizada por pessoas que usualmente não contam com o suficiente conhecimento ou experiência necessária. Este artigo propõe um método de classificação para três modos de fraturas em materiais cristalinos: súbita frágil, progressiva por fadiga e súbita dúctil. O método proposto usa visão em 3D, e busca ser um apoio na análise de falha. As características usadas neste estudo foram i) as características de Haralick e ii) a dimensão fractal. A aquisição de imagens 3D se realizou com um microscópio confocal de varredura laser Zeiss LSM 700. Para levar a cabo a classificação, dois classificadores foram avaliados: Redes de Neurônios Artificiais e Máquinas de Vetores de Suporte. A avaliação de desempenho logrou-se extraindo quatro relações marginais da matriz de confusão: exatidão, sensibilidade, especificidade e precisão, e os seguintes três métodos de avaliação: Característica Operativa do Receptor ou espaço ROC, o índice individual de êxito na classificação ICSI e o coeficiente de Jaccard. Apesar de que a porcentagem de classificação obtida por um experto é melhor que a obtida pelo algoritmo, este último logra obter porcentagens de classificação perto ou superior aos 60% em exatidão para os três modos de falha analisados. Os resultados que apresentam-se aqui representam uma boa aproximação para estruturar pesquisas futuras em análise de textura usando dados 3D.
- Published
- 2016
45. Sorter of pornographic web pages based on the content of the images
- Author
-
Ceballos, William Armando, Salazar, Luis Eduardo, Oviedo Carrascal, Ana Isabel, Oviedo Carrascal, Ana Isabel [0000636550], Oviedo Carrascal, Ana Isabel [8P8UdrgAAAAJ], Oviedo Carrascal, Ana Isabel [0000-0002-7105-7819], and Oviedo Carrascal, Ana Isabel [Ana-Oviedo-Carrascal]
- Subjects
Support vector machines ,lcsh:Computer engineering. Computer hardware ,Espacios de color ,Pornografía ,Vector support machines ,Rating of pornographic websites ,Paginas web ,máquinas de soporte vectorial ,Detection of pornography ,lcsh:TK7885-7895 ,Máquinas de soporte vectorial ,aprendizaje supervisado ,lcsh:QA75.5-76.95 ,detección de pornografía ,Máquinas de vectores de soporte ,Colour spaces ,Clasificación de páginas web pornográficas ,Color spaces ,Pornographic web pages classification ,lcsh:Electronic computers. Computer science ,Aprendizaje supervisado ,Detección de pornografía ,Supervised learning ,espacios de color - Abstract
La World Wide Web, o simplemente web, es un sistema lógico de acceso y búsqueda de información disponible en Internet cuyas unidades informativas son las páginas web. La web ha facilitado la publicación de gran cantidad de información accesible desde cualquier lugar del mundo; sin embargo, parte del contenido ofrecido como la pornografía, es considerado inapropiado para algunos usuarios. Para aportar al filtrado de pornografía en la web, este trabajo propone el desarrollo de un clasificador de páginas web basado en la evaluación de las imágenes presentes en el contenido de la página. La evaluación de las imágenes es realizada en tres vías: extracción de características de las regiones de piel, análisis de textura y descriptores de forma de la imagen. Los tres tipos de evaluación del contenido de las imágenes son utilizados para entrenar tres clasificadores con máquinas de soporte vectorial (SVM). Los resultados de clasificación son unidos en un ensamble realizado por un metaclasificador por medio de la siguiente política: si al menos uno de los tres clasificadores concluye que la imagen es pornográfica, entonces la imagen es considerada como tal. Al evaluar todas las imágenes contenidas en una página web, se utiliza la siguiente política: si la página web presenta un porcentaje de imágenes pornográficas superior al 30%, entonces la página es considerada como pornográfica. La implementación realizada es evaluada sobre un conjunto de 5000 páginas web diversas, obteniendo una exactitud del 84.6 % en el reconocimiento de contenido pornográfico a través del contenido de las imágenes. The World Wide Web, or web, is an information access and search logic system available on the Internet whose informative units are web pages. The web has facilitated the publication of big amount of information accessible from anywhere in the world; however, part of this content such as pornography is regarded inappropriate for some users. To contribute to the pornography filtering on web, this paper proposes the development of a web pages classifier based on the evaluation of the images present in the webpage content. The images evaluation is done in three ways: features extraction of skin regions, texture analysis and by the shape descriptors of the image. The three types of the images content evaluation are used to train three classifiers with Support Vector Machines (SVM). The results of the SVM classification are put together in an assembly made by a metaclassifier through the following policy: if at least one of the classifiers finds that the image is pornographic, then the image is regarded as such. When assessing all the images contained in a webpage, the next policy is applied: if the webpage present a percentage above 30%, then the webpage is regarded as pornographic. The implementation done is evaluated on a set of 5000 web pages with some information kinds, getting an accuracy of 84.6% in the recognition of pornographic content through the content of the images.
- Published
- 2009
46. Fractographic classification in metallic materials by using 3D processing and computer vision techniques
- Author
-
Bastidas Rodríguez, Maria Ximena, Prieto, Flavio, Espejo Mora, Edgar, Bastidas Rodríguez, Maria Ximena, Prieto, Flavio, and Espejo Mora, Edgar
- Abstract
Failure analysis aims at collecting information about how and why a failure is produced. The first step in this process is a visual inspection on the flaw surface that will reveal the features, marks, and texture, which characterize each type of fracture. This is generally carried out by personnel with no experience that usually lack the knowledge to do it. This paper proposes a classification method for three kinds of fractures in crystalline materials: brittle, fatigue, and ductile. The method uses 3D vision, and it is expected to support failure analysis. The features used in this work were: i) Haralick’s features and ii) the fractal dimension. These features were applied to 3D images obtained from a confocal laser scanning microscopy Zeiss LSM 700. For the classification, we evaluated two classifiers: Artificial Neural Networks and Support Vector Machine. The performance evaluation was made by extracting four marginal relations from the confusion matrix: accuracy, sensitivity, specificity, and precision, plus three evaluation methods: Receiver Operating Characteristic space, the Individual Classification Success Index, and the Jaccard’s coefficient. Despite the classification percentage obtained by an expert is better than the one obtained with the algorithm, the algorithm achieves a classification percentage near or exceeding the 60 % accuracy for the analyzed failure modes. The results presented here provide a good approach to address future research on texture analysis using 3D data., El análisis de falla tiene como objetivo recolectar información sobre cómo y porqué una falla es generada. El primer paso en este proceso consiste en una inspección visual en la superficie de la falla que revelará las características, marcas y textura que distinguen cada tipo de fractura. Esta inspección es generalmente llevada a cabo por personal que que usualmente no cuenta con el suficiente conocimiento o experiencia necesaria. Este artículo propone un método de clasificación para tres modos de fracturas en materiales cristalinos: súbita frágil, progresiva por fatiga y súbita dúctil. El método propuesto usa visión en 3D, y busca ser un apoyo en el análisis de falla. Las características usadas en este estudio fueron i) las características de Haralick y ii) la dimensión fractal. La adquisición de imágenes 3D se realizó con un microscopio confocal de escaneo laser Zeiss LSM 700. Para llevar a cabo la clasificación, dos clasificadores fueron evaluados: Redes de Neuronas Artificiales y Máquinas de Vectores de Soporte. La evaluación de desempeño se logró extrayendo cuatro relaciones marginales de la matriz de confusión: exactitud, sensibilidad, especificidad y precisión, y los siguientes tres métodos de evaluación: Característica Operativa del Receptor o espacio ROC, el iíndice individual de éxito en la clasificación ICSI y el coeficiente de Jaccard. A pesar que el porcentaje de clasificación obtenida por un experto es mejor que la obtenida por el algoritmo, este último logra obtener porcentajes de clasificación cerca o superior al 60% en exactitud para los tres modos de falla analizados. Los resultados que aquí se presentan representan un buen acercamiento para estructurar investigaciones futuras en análisis de textura usando datos 3D.
- Published
- 2016
47. Early warning in egg production curves from commercial hens. A SVM approach
- Author
-
Ramírez Morales, Iván
- Subjects
COMPUTERS AND ELECTRONIC IN AGRICULTURE ,ADVERTENCIA TEMPRANA ,APRENDIZAJE AUTOMATICO ,MAQUINAS DE VECTORES DE SOPORTE - Abstract
Artificial Intelligence allows the improvement of our daily life, for instance, speech and handwritten text recognition, real time translation and weather forecasting are common used applications. In the livestock sector, machine learning algorithms have the potential for early detection and warning of problems, which represents a significant milestone in the poultry industry. Production problems generate economic loss that could be avoided by acting in a timely manner. In the current study, training and testing of support vector machines are addressed, for an early detection of problems in the production curve of commercial eggs, using farm’s egg production data of 478,919 laying hens grouped in 24 flocks. Experiments using support vector machines with a 5 k fold cross validation were performed at different previous time intervals, to alert with up to 5 days of forecasting interval, whether a flock will experience a problem in production curve. Performance metrics such as accuracy, specificity, sensitivity, and positive predictive value were evaluated, reaching 0 day values of 0.9874, 0.9876, 0.9783 and 0.6518 respectively on unseen data (test-set). The optimal forecasting interval was from zero to three days, performance metrics decreases as the forecasting interval is increased. It should be emphasized that this technique was able to issue an alert a day in advance, achieving an accuracy of 0.9854, a specificity of 0.9865, a sensitivity of 0.9333 and a positive predictive value of 0.6135. This novel application embedded in a computer system of poultry management is able to provide significant improvements in early detection and warning of problems related to the production curve.
- Published
- 2015
48. Detección de TOC en escenarios multicéntricos mediante el uso de PRoNTo
- Author
-
Muñoz Pérez, Patricia, Gómez Verdejo, Vanessa, and Universidad Carlos III de Madrid. Departamento de Teoría de la Señal y Comunicaciones
- Subjects
Máquinas de vectores de soporte ,Trastorno Obsesivo Compulsivo ,Enfermedades neurológicas ,Resonancia magnética ,Aprendizaje máquina ,Clasificación binaria ,Proceso gaussiano ,Proceso de imágenes - Abstract
Este Trabajo Fin de Grado pretende detectar, a través de imágenes de resonancia magnética estructural, la enfermedad neurológica del Trastorno Obsesivo Compulsivo (TOC). Para ello, se utiliza la herramienta de aprendizaje máquina PRoNTo (v.1.1), basada en Matlab. Se trata de un problema de clasificación binaria donde tenemos datos de pacientes enfermos de TOC y datos de controles sanos. Como el objetivo es encontrar la mejor solución para nuestro problema, se han realizado diversos experimentos. En primer lugar, tratando de encontrar el modelo de clasificación más adecuado para nuestro caso. Los experimentos se han realizado con dos modelos de aprendizaje máquina: la máquina de vectores de soporte y el proceso gaussiano. Además, se ha tratado de evaluar las consecuencias de incluir algunos preprocesados de datos, ofrecidos por PRoNTo, y alguna máscara de selección de vóxeles que delimite las regiones de interés. En este documento se describen todos los experimentos mencionados anteriormente, con base teórica, junto a sus resultados correspondientes. Ingeniería de Sistemas Audiovisuales
- Published
- 2015
49. Methodology for predicting semantic annotations of protein sequences by feature extraction derived of statistical contact potentials and continuous wavelet transform
- Author
-
Arango Argoty, Gustavo Alonso and Castellanos Domínguez, César Germán (Thesis advisor)
- Subjects
Máquinas de vectores de soporte ,54 Química y ciencias afines / Chemistry ,Prediccion de proteínas ,Support vector machine ,Sequence alignment ,51 Matemáticas / Mathematics ,62 Ingeniería y operaciones afines / Engineering ,Protein prediction ,Statistical contact potentials ,Alineamiento de secuencias ,Transformada wavelet continua ,Potenciales de contacto estadísticos ,Continuous wavelet transform - Abstract
En esta tesis se propone un método para la predicción de anotaciones de proteínas a partir de la estimación de características en secuencias biológicas. Dicha estimación emplea información sobre la estructura de las proteínas a partir de las estadísticas de contactos potenciales entre pares de aminoácidos. Inicialmente, una proteína es transformada a una serie numérica por medio de estos contactos potenciales. Debido a las interacciones entre aminoácidos cercanos, la transformada wavelet puede fácilmente detectar las subsecuencias pertenecientes a posiciones específicas a lo largo de la proteína. Así, todas las subsecuencias son agrupadas de acuerdo a su distribución y estos grupos son modelados empleando perfiles de Modelos Ocultos de Markov. Finalmente, los perfiles son usados como características donde proteínas de análisis son mapeadas generando así un espacio de representación que es usado para entrenar un clasificador basado en vectores de soporte. La metodología ha sido rigurosamente evaluada y comparada con tres diferentes criterios de caracterización: 1) características globales comúnmente usadas para representar proteínas, 2) características específicas como motivos y dominios, y por último 3) evaluación de el rendimiento de varios programas construidos para la predicción de anotación de proteínas. Como resultado el método propuesto ha logrado los mas altos puntajes de predicción en la mayoría de los casos de estudio. De manera que estas predicciones sugieren a nuestro método como una alternativa a los comúnmente usados algoritmos de caracterización. Por otra parte, a pesar de que el enfoque de la metodología esta diseñada para resolver problemas de clasificación, la comunidad científica puede hacer uso de ella en dos diferentes enfoques: 1) como un predictor de anotaciones en proteínas y 2) como una herramienta para encontrar motivos. Por último, el código fuente del método se encuentra para libre descarga en: http://sourceforge.net/projects/wamofi/?source=navbar Abstract : In this thesis, a method to predict semantic annotations of the proteins from its primary structure is proposed. The main contribution of this thesis lies in the implementation of a novel protein feature representation, which makes use of the pairwise statistical contact potentials describing the protein interactions and geometry at the atomic level. Initially, a protein sequence is decomposed into a numerical series by a contact potential. From the interactions between adjacent amino acids, the wavelet transform can easily detect and characterize subsequences at specific position along the protein sequence. Then, all subsequences are grouped into clusters and a Hidden Markov Model (HMM) profile is built for each one of the groups. Finally, the modeled profiles HMM are used as features in order to build a feature space with the aim to train and evaluate a support vector machine classifier. Evaluations of the proposed methodology are driven against three different views 1) known protein features 2) motif-domain based features (PFam terms) and 3) performance evaluation over several methods for protein annotation prediction. As result, The method have acquired the highest performance prediction in most of the study cases. Thus, this efficiency suggest our approach as an alternative method for the characterization of protein sequences. Although, the research in this thesis focuses on the classification problem, the scientific community can make use of the methodology in two different ways: 1) as a protein predictor and 2) as a motif finding tool. Finally, the source code of the method is free available for download at SourceForge http://sourceforge.net/projects/wamofi/?source=navbar Maestría
- Published
- 2014
50. Agrupamiento espectral de datos dinamicos
- Author
-
Peluffo Ordoñez, Diego Hernán and Castellanos Domínguez, César Germán
- Subjects
Aprendizaje automático (inteligencia artificial) ,Optical pattern recognition ,primal-dual formulation ,0 Generalidades / Computer science, information and general works ,máquinas de vectores de soporte ,datos dinámicos o variantes en el tiempo ,kernels ,dynamic or time-varying data ,support vector machines ,análisis ,formulación primal-dual ,Machine learning ,Spectral clustering ,Reconocimiento óptico de modelos ,Agrupamiento espectral ,cluster analysis - Abstract
El análisis de datos dinámicos o variantes en el tiempo es un tema de gran interés actual para la comunidad científica, especialmente, en los campos de reconocimiento de patrones y aprendizaje de máquina. Existe un amplio espectro de aplicaciones en donde el análisis de datos dinámicos toma lugar, tales como el análisis de video, la identificación de movimiento, la segmentación de movimientos de personas y el seguimiento de naves aéreas, entre otras. Una de las alternativas para desarrollar métodos dinámicos es el análisis matricial espectral. Las técnicas espectrales, principalmente aquellas basadas en kernels, han demostrado su alta aplicabilidad en diversos aspectos del reconocimiento de patrones y aprendizaje de máquina, incluso cuando los datos son variantes en el tiempo, tales como la estimación del número de grupos, agrupamiento y clasificación. La mayoría de los métodos espectrales han sido diseñados para el análisis de datos estáticos, descartando la información temporal, es decir, omitiendo el comportamiento y la evolución de los datos a lo largo del tiempo. En el estado del arte se encuentran algunos trabajos que consideran el efecto de la variación en el tiempo,sin embargo, el diseño de un método que permita seguir la dinámica de los datos y agrupar los mismos en ambientes de tiempo real, con alta fidelidad y precisión, es aún un problema abierto. En este trabajo de tesis se presenta un método de agrupamiento espectral basado en kernels diseñado a partir de un enfoque primal-dual con el fin de realizar el proceso de agrupamiento considerando la información dinámica, es decir, los cambios de secuencia de los datos a lo largo del tiempo. Para este propósito, se plantea un esquema de agrupamiento que consiste en la extensión de una formulación primal-dual al análisis de datos dinámicos a través de un kernel dinámico. El esquema se basa en un aprendizaje de múltiples kernels (MKL) y se denomina dynamic kernel spectral clustering (DKSC). El método DKSC usa como modelo de MKL una combinación lineal de matrices kernel. Las matrices kernel se calculan a partir de una secuencia de datos representada por un conjunto de matrices de datos. Subsecuentemente, se obtiene una matriz acumulada de kernel de tal forma que los coeficientes o factores de ponderación del modelo son considerados como valores de evaluación de cada muestra del conjunto de datos o frame. Dicha evaluación se hace a partir de un novedoso método de tracking que se basa en la descomposición espectral de una matriz kernel generalizada. Finalmente, para la obtención de las asignaciones de grupo resultantes, los datos son agrupados usando la matriz acumulada como matriz kernel. Abstract : The analysis of dynamic or time-varying data has emerged as an issue of great interest taking increasingly an important place in scientific community, especially in automation, pattern recognition and machine learning. There exists a broad range of important applications such as video analysis, motion identification, segmentation of human motion and airplane tracking, among others. Spectral matrix analysis is one of the approaches to address this issue. Spectral techniques, mainly those based on kernels, have proved to be a suitable tool in several aspects of interest in pattern recognition and machine learning even when data are time-varying, such as the estimation of the number of clusters, clustering and classification. Most of spectral clustering approaches have been designed for analyzing static data, discarding the temporal information, i.e. the evolutionary behavior along time. Some works have been developed to deal with the time varying effect. Nonetheless, an approach able to accurately track and cluster time-varying data in real time applications remains an open issue. This thesis describes the design of a kernel-based dynamic spectral clustering using a primaldual approach so as to carry out the grouping task involving the dynamic information, that is to say, the changes of data frames along time. To this end, a dynamic kernel framework aimed to extend a clustering primal formulation to dynamic data analysis is introduced. Such framework is founded on a multiple kernel learning (MKL) approach. Proposed clustering approach, named dynamic kernel spectral clustering (DKSC) uses a linear combination of kernels matrices as a MKL model. Kernel matrices are computed from an input frame sequence represented by data matrices. Then, a cumulative kernel is obtained, being the model coefficients or weighting factors obtained by ranking each sample contained in the frame. Such ranking corresponds to a novel tracking approach that takes advantages of the spectral decomposition of a generalized kernel matrix. Finally, to get the resultant cluster assignments, data are clustered using the cumulative kernel matrix. Experiments are done over real databases (human motion and moon covered by clouds)as well as artificial data (moving-Gaussian clouds). As a main result, proposed spectral clustering method for dynamic data proved to be able for grouping underlying events and movements and detecting hidden objects as well. The proposed approach may represent a contribution to the pattern recognition field, mainly, for solving problems involving dynamic information aimed to either tracking or clustering of data. Doctorado
- Published
- 2013
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.