1. An explainable model of host genetic interactions linked to COVID-19 severity
- Author
-
Onoja, A., Picchiotti, N., Fallerini, C., Baldassarri, M., Fava, F., Mari, F., Daga, S., Benetti, E., Bruttini, M., Palmieri, Marco, Croci, S., Amitrano, S., Meloni, I., Frullanti, E., Doddato, G., Lista, Maddalena, Beligni, G., Valentino, Francesca, Zguro, K., Tita, R., Giliberti, A., Mencarelli, Marta, Rizzo, C. L., Pinto, A. M., Ariani, F., Di Sarno, Lorenzo, Montagnani, F., Tumbarello, Mario, Rancan, I., Fabbiani, M., Rossetti, Barbara, Bergantini, L., D'Alessandro, Michele, Cameli, P., Bennett, D., Anedda, F., Marcantonio, S., Scolletta, S., Franchi, Francesca, Mazzei, M. A., Guerrini, S., Conticini, E., Cantarini, L., Frediani, B., Tacconi, D., Raffaelli, C. S., Feri, M., Donati, Andrea, Scala, R., Guidelli, L., Spargi, G., Corridi, M., Nencioni, C., Croci, L., Caldarelli, G. P., Romani, D., Piacentini, P., Bandini, M., Desanctis, E., Cappelli, S., Canaccini, A., Verzuri, A., Anemoli, V., Pisani, M., Ognibene, A., Pancrazzi, A., Lorubbio, M., Vaghi, M., D'Arminio Monforte, A., Miraglia, F. G., Bruno, R., Vecchia, M., Girardis, M., Venturelli, S., Busani, S., Cossarizza, A., Antinori, Armando, Vergori, A., Emiliozzi, A., Rusconi, S., Siano, M., Gabrieli, A., Riva, A., Francisci, D., Schiaroli, E., Paciosi, F., Tommasi, A., Zuccon, U., Vietri, L., Scotton, P. G., Andretta, F., Panese, S., Baratti, S., Scaggiante, R., Gatti, F., Parisi, S. G., Castelli, F., Quiros-Roldan, E., Antoni, M. D., Zanella, I., Della Monica, M., Piscopo, C., Capasso, Monica, Russo, R., Andolfo, I., Iolascon, A., Fiorentino, Giuseppe, Carella, M., Castori, M., Aucella, F., Raggi, P., Perna, Raffaella, Bassetti, M., Di Biagio, Anna, Sanguinetti, Maurizio, Masucci, Luca, Guarnaccia, A., Valente, S., De Vivo, O., Bargagli, E., Mandala, M., Giorli, A., Salerni, L., Zucchi, P., Parravicini, P., Menatti, E., Trotta, T., Giannattasio, F., Coiro, G., Lena, Francesco, Lacerenza, G., Coviello, D. A., Mussini, C., Martinelli, E., Tavecchia, L., Belli, M. A., Crotti, L., Parati, G., Sanarico, M., Biscarini, F., Stella, A., Rizzi, M., Maggiolo, F., Ripamonti, D., Suardi, C., Bachetti, T., La Rovere, M. T., Sarzi-Braga, S., Bussotti, M., Capitani, K., Dei, S., Ravaglia, S., Artuso, R., Andreucci, E., Gori, Giovanni Cristiano, Pagliazzi, A., Fiorentini, E., Perrella, A., Bianchi, F., Bergomi, P., Catena, E., Colombo, R., Luchi, S., Morelli, G., Petrocelli, Paolo, Iacopini, S., Modica, S., Baroni, Silvia, Segala, F. V., Menichetti, F., Falcone, M., Tiseo, G., Barbieri, Cristiano, Matucci, T., Grassi, D., Ferri, C., Marinangeli, F., Brancati, F., Vincenti, A., Borgo, V., Lombardi, S., Lenzi, M., Di Pietro, Maria Luisa, Vichi, F., Romanin, B., Attala, L., Costa, C., Gabbuti, A., Mene, R., Colaneri, M., Casprini, P., Merla, G., Squeo, G. M., Maffezzoni, M., Mantovani, Susanna, Mondelli, M. U., Ludovisi, S., Colombo, F., Chiaromonte, F., Renieri, A., Furini, S., Raimondi, F., Palmieri M. (ORCID:0000-0001-8263-336X), Lista M., Valentino F., Mencarelli M. A., Di Sarno L., Tumbarello M. (ORCID:0000-0002-9519-8552), Rossetti B., D'Alessandro M., Franchi F., Donati A., Antinori A. (ORCID:0000-0002-6019-2417), Capasso M., Fiorentino G., Perna R., Di Biagio A., Sanguinetti M. (ORCID:0000-0002-9780-7059), Masucci L. (ORCID:0000-0002-8358-6726), Lena F. (ORCID:0000-0001-5528-319X), Gori G. (ORCID:0000-0002-3308-5309), Petrocelli P., Barbieri C., Di Pietro M. A. (ORCID:0000-0002-3893-8788), Mantovani S., Onoja, A., Picchiotti, N., Fallerini, C., Baldassarri, M., Fava, F., Mari, F., Daga, S., Benetti, E., Bruttini, M., Palmieri, Marco, Croci, S., Amitrano, S., Meloni, I., Frullanti, E., Doddato, G., Lista, Maddalena, Beligni, G., Valentino, Francesca, Zguro, K., Tita, R., Giliberti, A., Mencarelli, Marta, Rizzo, C. L., Pinto, A. M., Ariani, F., Di Sarno, Lorenzo, Montagnani, F., Tumbarello, Mario, Rancan, I., Fabbiani, M., Rossetti, Barbara, Bergantini, L., D'Alessandro, Michele, Cameli, P., Bennett, D., Anedda, F., Marcantonio, S., Scolletta, S., Franchi, Francesca, Mazzei, M. A., Guerrini, S., Conticini, E., Cantarini, L., Frediani, B., Tacconi, D., Raffaelli, C. S., Feri, M., Donati, Andrea, Scala, R., Guidelli, L., Spargi, G., Corridi, M., Nencioni, C., Croci, L., Caldarelli, G. P., Romani, D., Piacentini, P., Bandini, M., Desanctis, E., Cappelli, S., Canaccini, A., Verzuri, A., Anemoli, V., Pisani, M., Ognibene, A., Pancrazzi, A., Lorubbio, M., Vaghi, M., D'Arminio Monforte, A., Miraglia, F. G., Bruno, R., Vecchia, M., Girardis, M., Venturelli, S., Busani, S., Cossarizza, A., Antinori, Armando, Vergori, A., Emiliozzi, A., Rusconi, S., Siano, M., Gabrieli, A., Riva, A., Francisci, D., Schiaroli, E., Paciosi, F., Tommasi, A., Zuccon, U., Vietri, L., Scotton, P. G., Andretta, F., Panese, S., Baratti, S., Scaggiante, R., Gatti, F., Parisi, S. G., Castelli, F., Quiros-Roldan, E., Antoni, M. D., Zanella, I., Della Monica, M., Piscopo, C., Capasso, Monica, Russo, R., Andolfo, I., Iolascon, A., Fiorentino, Giuseppe, Carella, M., Castori, M., Aucella, F., Raggi, P., Perna, Raffaella, Bassetti, M., Di Biagio, Anna, Sanguinetti, Maurizio, Masucci, Luca, Guarnaccia, A., Valente, S., De Vivo, O., Bargagli, E., Mandala, M., Giorli, A., Salerni, L., Zucchi, P., Parravicini, P., Menatti, E., Trotta, T., Giannattasio, F., Coiro, G., Lena, Francesco, Lacerenza, G., Coviello, D. A., Mussini, C., Martinelli, E., Tavecchia, L., Belli, M. A., Crotti, L., Parati, G., Sanarico, M., Biscarini, F., Stella, A., Rizzi, M., Maggiolo, F., Ripamonti, D., Suardi, C., Bachetti, T., La Rovere, M. T., Sarzi-Braga, S., Bussotti, M., Capitani, K., Dei, S., Ravaglia, S., Artuso, R., Andreucci, E., Gori, Giovanni Cristiano, Pagliazzi, A., Fiorentini, E., Perrella, A., Bianchi, F., Bergomi, P., Catena, E., Colombo, R., Luchi, S., Morelli, G., Petrocelli, Paolo, Iacopini, S., Modica, S., Baroni, Silvia, Segala, F. V., Menichetti, F., Falcone, M., Tiseo, G., Barbieri, Cristiano, Matucci, T., Grassi, D., Ferri, C., Marinangeli, F., Brancati, F., Vincenti, A., Borgo, V., Lombardi, S., Lenzi, M., Di Pietro, Maria Luisa, Vichi, F., Romanin, B., Attala, L., Costa, C., Gabbuti, A., Mene, R., Colaneri, M., Casprini, P., Merla, G., Squeo, G. M., Maffezzoni, M., Mantovani, Susanna, Mondelli, M. U., Ludovisi, S., Colombo, F., Chiaromonte, F., Renieri, A., Furini, S., Raimondi, F., Palmieri M. (ORCID:0000-0001-8263-336X), Lista M., Valentino F., Mencarelli M. A., Di Sarno L., Tumbarello M. (ORCID:0000-0002-9519-8552), Rossetti B., D'Alessandro M., Franchi F., Donati A., Antinori A. (ORCID:0000-0002-6019-2417), Capasso M., Fiorentino G., Perna R., Di Biagio A., Sanguinetti M. (ORCID:0000-0002-9780-7059), Masucci L. (ORCID:0000-0002-8358-6726), Lena F. (ORCID:0000-0001-5528-319X), Gori G. (ORCID:0000-0002-3308-5309), Petrocelli P., Barbieri C., Di Pietro M. A. (ORCID:0000-0002-3893-8788), and Mantovani S.
- Abstract
We employed a multifaceted computational strategy to identify the genetic factors contributing to increased risk of severe COVID-19 infection from a Whole Exome Sequencing (WES) dataset of a cohort of 2000 Italian patients. We coupled a stratified k-fold screening, to rank variants more associated with severity, with the training of multiple supervised classifiers, to predict severity based on screened features. Feature importance analysis from tree-based models allowed us to identify 16 variants with the highest support which, together with age and gender covariates, were found to be most predictive of COVID-19 severity. When tested on a follow-up cohort, our ensemble of models predicted severity with high accuracy (ACC = 81.88%; AUCROC = 96%; MCC = 61.55%). Our model recapitulated a vast literature of emerging molecular mechanisms and genetic factors linked to COVID-19 response and extends previous landmark Genome-Wide Association Studies (GWAS). It revealed a network of interplaying genetic signatures converging on established immune system and inflammatory processes linked to viral infection response. It also identified additional processes cross-talking with immune pathways, such as GPCR signaling, which might offer additional opportunities for therapeutic intervention and patient stratification. Publicly available PheWAS datasets revealed that several variants were significantly associated with phenotypic traits such as “Respiratory or thoracic disease”, supporting their link with COVID-19 severity outcome.
- Published
- 2022