Back to Search Start Over

Estudio de técnicas de muestreo aplicadas a la predicción del rendimiento académico

Authors :
Valverde Sanchez, Oriol
Universitat Politècnica de Catalunya. Departament de Ciències de la Computació
Talavera Méndez, Luis José
Source :
UPCommons. Portal del coneixement obert de la UPC, Universitat Politècnica de Catalunya (UPC)
Publication Year :
2020
Publisher :
Universitat Politècnica de Catalunya, 2020.

Abstract

El presente documento parte de la realización de un análisis del rendimiento de técnicas de minería de datos aplicadas en diferentes métodos de predicción, la cual se centra en la predicción de aprobados o suspensos de los estudiantes de la ETSEIB, en concreto de las asignaturas que se han cursado en el Q3. Dicha minería de datos es un proceso que se ha desarrollado durante los últimos años y se caracteriza por la extracción de información significativa que se encuentra dentro de un conjunto de datos que permite la identificación de patrones. De este modo, se hace posible la predicción de futuras situaciones. Para poderla llevar a cabo, se han utilizado diferentes técnicas de predicción, como la regresión logística y el árbol de decisión, tomando la primera como modelo predictivo base. La metodología que se ha seguido durante este proceso de análisis es la denominada CRISP-DM modelo referente en la minería de datos y compuesta por diferentes etapas, las cuales se han aplicado en este proyecto. Para la realización de dicho proyecto se ha utilizado el lenguaje de programación Python y, en concreto, las librerías Pandas y SciKit-Learn incluidas en Python que han permitido la creación de modelos predictivos. Además, a través de la plataforma Anaconda y mediante Spyder, se ha conseguido dinamizar la programación en Python con el objetivo de poder observar los resultados de una forma más rápida.

Details

Database :
OpenAIRE
Journal :
UPCommons. Portal del coneixement obert de la UPC, Universitat Politècnica de Catalunya (UPC)
Accession number :
edsair.dedup.wf.001..4de863a8073894e42ac6cddcf5e50d20