Back to Search Start Over

Detection of respiratory changes in sarcoidosis by forced oscillation technique and machine learning algorithms

Authors :
Lima, Allan Danilo de
Amaral, Jorge Luís Machado do
Melo, Pedro Lopes de
Dias, Douglas Mota
Ferreira, Arthur de Sá
Source :
Biblioteca Digital de Teses e Dissertações da UERJ, Universidade do Estado do Rio de Janeiro (UERJ), instacron:UERJ
Publication Year :
2020
Publisher :
Universidade do Estado do Rio de Janeiro, 2020.

Abstract

Submitted by Julia CTC/B (julia.vieira@uerj.br) on 2021-08-19T20:38:19Z No. of bitstreams: 1 Dissertação - Allan Danilo de Lima - 2020 - Completo.pdf: 1253998 bytes, checksum: 04b3e1ae92ec1d84e7e86b1e59f68333 (MD5) Made available in DSpace on 2021-08-19T20:38:19Z (GMT). No. of bitstreams: 1 Dissertação - Allan Danilo de Lima - 2020 - Completo.pdf: 1253998 bytes, checksum: 04b3e1ae92ec1d84e7e86b1e59f68333 (MD5) Previous issue date: 2020-11-10 Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES In this work, many machine learning classifiers are developed to assist the diagnosis of respiratory changes associated to sarcoidosis, based on results from the Forced Oscillation Technique (FOT), which is a non-invasive method used to assess pulmonary mechanics. In addition to accurate results, there is a special interest in their interpretability, so several forms of Genetic Programming are used since the classification is made with intelligible expressions. Its traditional tree form, grammar-based form, and also quantum-inspired linear (QILGP) are used. To check if interpretable results are com- petitive, they are compared to performance with K-Nearest Neighbors, Support Vector Machine, AdaBoost, Random Forest, LightGBM, XGBoost, and Logistic Regressor. To bring even more interpretability, the experiments are also performed with fuzzy features. The use of a feature selection technique and a synthetic oversampling technique is also tested. Besides using QILGP directly for classification, it is also tested to use it to build features to be used by other methods. The data used to feed the classifiers come from the FOT exams in 72 individuals, from which 25 were healthy and 47 were diagnosed with sarcoidosis. Among the latter, it was verified by spirometry that 24 showed normal con- ditions and 23 showed respiratory changes. The results achieved high accuracy (AUC ≥ 0.90) in the three analyzes performed (controls vs. individuals with sarcoidosis, controls vs. individuals with sarcoidosis and altered spirometry, and controls vs. individuals with sarcoidosis and normal spirometry). Nesta dissertação são desenvolvidos diversos classificadores baseados em aprendizado de máquina para auxiliar no diagnóstico de alterações respiratórias associadas à sarcoidose, a partir de resultados provenientes da Técnica de Oscilações Forçadas (do inglês Forced Oscillation Technique, ou FOT), que é um método não invasivo utilizado para avaliação da mecânica pulmonar. Além de resultados acurados, há especial interesse na interpretabilidade dos mesmos, portanto são utilizadas diversas formas de Programação Genética, devido à classificação ser feita por meio de expressões inteligíveis. É usada a sua forma tradicional em árvores, à orientada, à gramática e, também, a linear com inspiração quântica (PGLIQ). A fim de verificar se os resultados interpretáveis são competitivos, os mesmos são comparados ao desempenho com K-Vizinhos mais Próximos, Support Vector Machine, AdaBoost, Random Forest, LightGBM, XGBoost e Regressor Logístico. Para trazer ainda mais interpretabilidade, os experimentos também são realizados com atributos “fuzzificados”. Ainda é experimentado um método de seleção de atributos e outro de aumento sintético do conjunto de dados. Quanto à PGLIQ, além de utilizá-la diretamente para a classificação, também é experimentado usá-la para construir atributos a serem utilizados por outros métodos. Os dados utilizados para alimentar os classificadores são provenientes da execução da FOT em 72 indivíduos, sendo 25 saudáveis e 47 diagnosticados com sarcoidose. Nesses últimos, foi verificado pela espirometria que 24 apresentaram condições normais e 23 mostraram alterações respiratórias. Os resultados obtidos apresentam alta acurácia (AUC ≥ 0.90) nas três análises realizadas (controle × indivíduos com sarcoidose, controle × indivíduos com sarcoidose e espirometria alterada e controle × indivíduos com sarcoidose e espirometria normal).

Details

Language :
Portuguese
Database :
OpenAIRE
Journal :
Biblioteca Digital de Teses e Dissertações da UERJ, Universidade do Estado do Rio de Janeiro (UERJ), instacron:UERJ
Accession number :
edsair.od......3056..2f8cda7f760bfb3bde26b0109ddf3bcb