Representation learning in Computational Pathology : Application to the Prediction of Molecular Cancer Features - Publications ayant eu recours aux supercalculateurs du GENCI
Theses Year : 2023

Representation learning in Computational Pathology : Application to the Prediction of Molecular Cancer Features

Apprentissage de Représentations en Pathologie Numérique : Application à la Prédiction des Caractéristiques Moléculaires du Cancer

Tristan Lazard
  • Function : Author
  • PersonId : 1414390
  • IdRef : 280179898

Abstract

Whole-slide images (WSI) are digitized versions of microscopic images that capture thin layers of stained tissue samples.These images serve multiple roles in cancer care, functioning not only as the gold standard for cancer diagnosis but also as a tool for patient stratification,disease subtyping, and guiding personalized treatment plans. They are also used for evaluating treatment efficacy and monitoring outcomes over time.Indeed, WSIs carry complex biological information, capturing data from hundreds of thousands of cells across different tissue types, and features rangingfrom nuclear texture to tissue architecture.This thesis focuses on using machine learning and deep learning to automate the extraction of meaningful information from WSIs, a process known as representation learning.Supervision for representation learning can take multiple forms, from human-generated labels to additional biological measurements such as DNA and RNA sequencing data.However, these supervision signals often present challenges; they can be weak, noisy, uncertain, and most critically, scarce in availability.The primary objective of this thesis is to address these challenges by developing robust algorithms for histopathological image representation learning that operate effectively under these supervisory constraints.The contributions of this work are of several natures, spanning from the development of new interpretability algorithms to the introduction of a novel self-supervised framework designed explicitly for WSI-level representation learning.In addition, these advancements are contextualized within WSI classification tasks that rely on molecular data and hold significant clinical importance.
Les images de lames entières (WSI) sont des versions numérisées de coupes microscopiques de tissus colorés.Ces images remplissent plusieurs fonctions dans la prise en charge du cancer. Elles servent non seulement d'outil diagnostique de référence,mais aussi pour la stratification de patient, le sous-typage de la maladie et l'orientation vers des options de traitement personnalisés.Elles sont également utilisées pour évaluer l'efficacité des traitements et suivre leurs résultats au fil du temps.En effet, les WSI contiennent des informations biologiques complexes. On peut y trouver des centaines de milliers de cellules à travers différents types de tissusainsi que des motifs visuels allant de la texture nucléaire à l'architecture des tissus.Cette thèse se concentre sur l'utilisation de l'apprentissage automatique pour extraire l'information importante contenue dans les WSI, un processus connu sous le nom d'apprentissage de représentation.La supervision pour l'apprentissage de représentation d'images d'histopathologie peut prendre plusieurs formes, allant des étiquettes générées par lesmédecins à des mesures biologiques supplémentaires telles que les données de séquençage de l'ADN et de l'ARN.Cependant, ces signaux de supervision présentent des défis : ils peuvent être faibles, bruités, incertains et surtout, rares, car difficilement accessibles.L'objectif principal de cette thèse est donc de répondre à ces défis par le développement d'algorithmes d'apprentissage de représentationqui fonctionnent efficacement sous ces contraintes de supervision.Nous y détaillerons des contributions de plusieurs natures, allant du développement de nouveaux algorithmes d'interprétabilité à l'introductiond'un nouveau cadre d'apprentissage auto-supervisé conçu spécifiquement pour l'apprentissage de représentation de WSI.Finalement, chacune de ces avancées seront présentées dans le cadre de la résolution de tâches de classification de WSI, basées sur des données moléculaires et ayant une importance clinique significative.
Fichier principal
Vignette du fichier
2023UPSLM088_archivage.pdf (77.79 Mo) Télécharger le fichier
Origin Version validated by the jury (STAR)

Dates and versions

tel-04694319 , version 1 (11-09-2024)

Identifiers

  • HAL Id : tel-04694319 , version 1

Cite

Tristan Lazard. Representation learning in Computational Pathology : Application to the Prediction of Molecular Cancer Features. Bioinformatics [q-bio.QM]. Université Paris sciences et lettres, 2023. English. ⟨NNT : 2023UPSLM088⟩. ⟨tel-04694319⟩
38 View
6 Download

Share

More