1. Explainable machine learning in pathology - biomedical research and diagnostic application
- Author
-
Seegerer, Philipp Erwin
- Subjects
machine learning ,610 Medizin und Gesundheit ,004 Datenverarbeitung ,Informatik ,computational pathology ,explainable machine learning - Abstract
Pathology is the final diagnostic step for a variety of diseases, such as cancer or neurological disorders. Driven by advances in deep learning-based computer vision paired with an increased digitalization of workflows, computational pathology has recently attracted interest by the machine learning community. This thesis develops several machine learning systems applied to pathology, ranging from biomedical research to its application in routine diagnostics. Here, a focus is put on explainable machine learning that aims at uncovering the intrinsic decision processes that learning machines infer from data. First, a method is proposed to learn the estrogen receptor status—an important biomarker for prognosis and therapy selection in breast cancer—from routine Haematoxylin-Eosin images, showing that an end-to-end feature learning approach outperforms state-of-the-art methods. By using explanation techniques, we are able to link the estrogen receptor status, that is usually measured with an additional immunohistochemical procedure, to the tumor morphology observed in the Haematoxylin-Eosin images. Our experiments show the model’s predictions are based on biologically meaningful morphological features, such as the histological subtype of the tumor. Moreover, the model also responds to unexpected features, e. g. the morphology of tumor stroma, thereby generating hypotheses for novel biomarkers. Secondly, we collect a large and diverse image dataset of diagnostically relevant cells and objects in cerebrospinal fluid samples, that are routinely used to diagnose neurological disorders. We show that an ensemble of convolutional neural networks is able to reliably classify these data and performs on par with 7 human raters without access to clinical information. Furthermore, we propose a novel data partitioning scheme for cross-validation with grouped, imbalanced datasets and apply it to develop our model. A thorough analysis of the model’s representation space and learned cytological features with the help of explanation methods suggests that the model employs plausible, generalizable decision strategies similar to humans. Lastly, we examine the diagnostic problem of discriminating primary lung cancer from metastases of head-and-neck cancer. This discrimination is crucial for prognosis and treatment but has been previously impossible for the majority of patients. Using DNA methylation profiles, we are able to solve this dilemma with high accuracy by machine learning classifiers and use explanation methods to show that the model focuses its prediction on plausible biological processes. In conclusion, this thesis contributes machine learning systems for the solution of research problems as well as clinically relevant diagnostic tasks in diverse branches of pathology. For all these applications, explainable machine learning is employed and used to validate the models and propose novel biomarkers., Der finale Schritt in der Diagnose verschiedenster Krankheiten wie Krebs oder neurologischer Leiden ist deren pathologische Einschätzung. Fortschritte auf dem Gebiet des Deep-Learning-gestützten maschinellen Sehens kombiniert mit einer fortschreitenden Digitalisierung der Arbeitsabläufe haben dazu geführt, dass die rechnerunterstützte Pathologie in den letzten Jahren das Interesse von KI-Forschern und -Entwicklern geweckt hat. Diese Dissertation entwickelt mehrere Anwendungen von maschinellem Lernen in der Pathologie und umfasst dabei den Einsatz in der biomedizinischer Forschung bis hin zur konkreten Nutzung in der Routinediagnostik. Dabei wird ein Schwerpunkt auf das erklärbare maschinelle Lernen gelegt, welches versucht, die durch Maschinen gelernten Entscheidungsprozesse für den Menschen transparent zu machen. Zunächst wird eine Methode beschrieben, wie sich der Östrogen-Rezeptor-Status – ein wichtiger Biomarker für die Prognose und Therapieauswahl bei Brustkrebs – aus Hämatoxylin-Eosin-Bildern lernen lässt. Hierbei zeigen unsere Experimente, dass ein Ende-zu-Ende trainiertes Modell anderen aktuellen Methoden überlegen ist. Erklärbarkeitsmethoden erlauben uns, die Verbindung zwischen Östrogen-Rezeptor-Status, der normalerweise durch zusätzliche immunhistochemische Verfahren bestimmt wird, und Tumormorphologie, dargestellt durch die routinemäßig verfügbaren Hämatoxylin-Eosin-Bilder, zu studieren. Unsere Analysen zeigen erstens, dass die Maschine sich bei ihrer Vorhersage auf plausible morphologische Merkmale stützt, wie z. B. den histologischen Subtypen des Tumors. Zweitens spricht die Maschine auch auf unerwartete Merkmale, wie die Morphologie des Tumorstroma, an, was eine Hypothese für die Forschung an neuartigen Biomarkern darstellt. Des Weiteren wird ein großer und diverser Datensatz diagnostisch relevanter Zellen und Objekten in Cerebrospinalflüssigkeit, die routinemäßig für die Diagnose neurologischer Symptome eingesetzt wird, akquiriert. Wir können zeigen, dass künstliche neuronale Netze diese Daten zuverlässig klassifizieren können und dabei eine ähnliche Genauigkeit aufweisen wie sieben Pathologen. Außerdem wird ein neues Verfahren vorgestellt, wie Daten für die Kreuzvalidierung aufgeteilt werden können, falls die Daten sowohl gruppiert sind als auch eine unbalancierte Klassenverteilung aufweisen, und zur Entwicklung der Maschine angewendet. Eine sorgfältige Analyse des Merkmalsraums des Modells sowie der gelernten zytologischen Merkmale mithilfe von Erklärbarkeitsmethoden zeigt, dass das Modell nachvollziehbare und generalisierbare Entscheidungsstrategien anwendet, die dem menschlichen Vorgehen nahekommen. Schließlich wird das diagnostische Problem der Unterscheidung zwischen einem primären Lungentumor und sekundären Metastasen eines Kopf-Hals-Tumors betrachtet. Diese Unterscheidung ist entscheidend für Prognose und Behandlung, jedoch war diese bisher für die Mehrheit der Patienten unmöglich. Basierend auf dem DNA-Methylierungsprofil des Tumors wird eine Lernmaschine entwickelt, die dieses Dilemma mit hoher Genauigkeit auflöst und mit Hilfe von Erklärbarkeitsmethoden kann gezeigt werden, dass die Vorhersage des Modells auf plausiblen biologischen Prozessen beruht. Der Beitrag dieser Dissertation besteht also aus mehreren intelligenten Systemen für die Lösung von sowohl forschungsnahen Fragestellungen wie auch klinisch relevanten diagnostischen Problemen in verschiedenen Zweigen der Pathologie. Alle vorgestellten Anwendungen werden dabei durch erklärbares maschinelles Lernen komplementiert, welches für die Validierung der Modelle einerseits sowie für die Suche nach neuen Biomarkern andererseits angewendet wird.
- Published
- 2023
- Full Text
- View/download PDF