2 C
New York

Paysages spatiaux unicellulaires du microenvironnement immunitaire des tumeurs pulmonaires

- Advertisement -

Paysages spatiaux unicellulaires du microenvironnement immunitaire

Cohorte clinique

Une cohorte de 416 patients atteints de LUAD ont été inclus dans cette étude avec une période de suivi allant de février 1996 à juillet 2020. Pour la cohorte de validation, 60 patients atteints de LUAD avec une période de suivi allant de février 2012 à mai 2022 ont été inclus avec deux noyaux distincts par patient. Tous les échantillons obtenus étaient des LUAD naïfs de traitement primaire diagnostiqués par un pathologiste certifié par le conseil après une résection chirurgicale ou une biopsie.

Des informations cliniques sur tous les patients inclus peuvent être trouvées dans les tableaux supplémentaires 1 et 12. Les puces à ADN tissulaires ont été construites en sélectionnant un 1-mm2 noyau de l’échantillon tumoral chirurgical. Des échantillons de patients et des informations cliniques ont été obtenus suite au consentement éclairé écrit du patient. Les protocoles pour la biobanque d’échantillons humains ont été approuvés (éthique, scientifique et final) par la Biobanque de l’IUCPQ, numéro de protocole IRB #2022-3474, 22090, et les numéros de protocole du CUSM IRB #2014-1119 et 2019-5253.

Coloration des échantillons et IMC

- Advertisement -

Les lames de paraffine fixées au formol (FFPE) ont été déparaffinées à 70 ° C par incubation dans une solution EZ Prep (Roche Diagnostics) suivie d’une récupération d’antigène à 95 ° C dans une solution standard de conditionnement cellulaire 1 (Roche Diagnostics). La plate-forme de coloration automatique Ventana Discovery Ultra (Roche Diagnostics) a été utilisée pour la récupération de l’antigène.

Les lames ont été rincées avec du PBS 1 × et incubées pendant 45 min dans une solution de bloc de protéines sans sérum Dako (Agilent). Les lames ont été colorées avec un cocktail contenant des anticorps marqués au métal à des dilutions optimisées pendant une nuit à 4 ° C. Toutes les conjugaisons ont été réalisées par la plate-forme de cytométrie de masse à cellule unique et d’imagerie du Goodman Cancer Institute (Université McGill), à l’aide des kits de conjugaison Maxpar (Fluidigm).

- Advertisement -

Des informations sur les anticorps utilisés peuvent être trouvées dans le tableau supplémentaire 2. Les lames ont ensuite été lavées avec du Triton X à 0, 2% et du PBS 1 ×. Une dilution optimisée du cocktail d’anticorps secondaires contenant de l’anti-biotine conjuguée à un métal a été préparée dans un diluant d’anticorps Dako. Après une incubation de 1 h, les lames ont été lavées avec du Triton X à 0,2 % et du PBS 1X. Avant l’acquisition de l’IMC, Cell-ID Intercalator-Ir (Fluidigm) à une dilution de 1:400 a été utilisé pour contre-colorer les lames dans du PBS 1 × pendant 30 min à température ambiante.

Les lames ont ensuite été rincées pendant 5 min avec de l’eau distillée et séchées à l’air. Les images IMC ont été acquises à une résolution d’environ 1 μm. Les noyaux ont été ablatés au laser à une fréquence de 200 Hz à l’aide du système d’imagerie Hyperion (Fluidigm) et les données brutes ont été compilées à l’aide du logiciel d’acquisition commercial Fluidigm. Il convient de noter que dans notre cohorte de validation, nous avons coloré avec H3 clivé en alpha (176Yb) au lieu de l’histone H3 (176Yb). En conséquence, ce marqueur a été exclu de la validation de nos prédictions d’apprentissage en profondeur de la progression.

Optimisation des anticorps

Les anticorps ont été optimisés sur des tissus témoins, notamment la rate, les amygdales, l’appendice, le placenta, le thymus, le poumon normal et le LUAD. La coloration de contrôle de qualité multiplex du tissu de contrôle positif et négatif peut être vue dans les Figs de données étendues. 2–4, avec quatre images représentatives colorées pour chacun des 35 marqueurs de notre panel.

Transformation et normalisation des données

- Advertisement -

Les données présentées n’ont pas été transformées. Toutes les analyses étaient basées sur des mesures IMC brutes. Pour la visualisation de la carte thermique, les données d’expression ont été normalisées au 95e centile et z-les moyennes des grappes notées ont été tracées. Les expressions des marqueurs unicellulaires ont été résumées par les valeurs moyennes des pixels pour chaque canal.

Segmentation cellulaire et attribution de lignée

Tous les marqueurs ont subi un contrôle de la qualité de la coloration avant la segmentation cellulaire (Extended Data Figs. 2–4). Un petit nombre de marqueurs n’ont pas systématiquement coloré tous les échantillons de notre cohorte, nous avons donc choisi de ne tirer aucune conclusion sur la base de ces marqueurs (GM-CSFR, PD-1, PD-L1 et B7-H3).

Notez que CD163 (un marqueur putatif de type “M2”) a été choisi pour subdiviser les populations de macrophages sur la base que ce marqueur est souvent régulé positivement dans les macrophages associés aux tumeurs et a été utilisé pour catégoriser les macrophages dans les études d’imagerie multiplex14,42,43. Bien que les termes « M1/pro-inflammatoire » et « M2/anti-inflammatoire » aient traditionnellement été utilisés pour classer les états d’activation des macrophages, ces termes sont obsolètes et ont donc été évités.44,45.

À l’aide d’un nouveau pipeline de segmentation cellulaire qui combine des algorithmes de vision par ordinateur classiques et modernes basés sur l’apprentissage automatique, nous avons segmenté toutes les cellules contenues dans les images IMC. Le modèle utilisé est un modèle de détection de cellules hybrides entièrement automatisé qui élimine les biais subjectifs et permet une segmentation d’image à haut débit. Il nous permet de distinguer avec précision les cellules dans divers microenvironnements tissulaires et de résoudre les structures à faible résolution.

Les détails de notre approche de segmentation d’images peuvent être trouvés ici : https://biorxiv.org/cgi/content/short/2022.02.27.482183v1. En raison des défis de phénotypage existants pour l’imagerie hautement multiplexée, nous avons créé un pipeline de phénotypage cellulaire pour attribuer des phénotypes cellulaires. Notre stratégie repose sur des marqueurs de lignée canonique et utilise une approche hiérarchique supervisée qui intègre la qualité de la coloration, l’abondance de population attendue et la maturation de la lignée cellulaire pour attribuer les cellules.

Nous avons utilisé k-signifie le regroupement46 et un mélange de modèles gaussiens généralisés47 pour générer un masque ou un niveau pour chaque marqueur dans une pile d’images à plusieurs niveaux créée en fonction de l’intensité de la coloration. Cela nous a permis d’évaluer l’existence d’un marqueur à un endroit particulier. Chaque marqueur de notre panel a été évalué à l’aide de six niveaux et le masque approprié a ensuite été sélectionné manuellement pour chaque marqueur. Chaque masque est produit selon la procédure suivante :

  1. (1)Le canal d’image en niveaux de gris est convolutionné avec un filtre médian avec une taille de fenêtre particulière (3 × 3).
  2. (2)Chaque pixel de l’image est regroupé en six groupes de niveaux d’intensité à l’aide de la k-signifie algorithme.
  3. (3)Pour chaque canal, nous avons ensuite sélectionné tous les groupes jusqu’à un niveau particulier en premier plan (1) et le reste en arrière-plan (0).
  4. (4)Pour obtenir des masques binaires plus lisses, nous avons également appliqué un processus de suppression de blobs morphologiques dans lequel les blobs binaires d’une zone particulière sont supprimés des masques pour éviter les régions bruyantes.
  5. (5)Pour affiner davantage la précision des marqueurs de sélection, des opérations morphologiques supplémentaires spécifiques au canal ont été appliquées en calculant un masque binaire supplémentaire obtenu à l’aide de la méthode de binarisation adaptative avec une sensibilité de 0,4. Ce masque est ensuite fusionné avec le masque obtenu à l’étape 4.

En formule, pour chaque cellule \({c}_{i}\)nous considérons le masque organisé pour chaque marqueur de lignée \({M}_{k}\)\(k=1,\ldots ,n\) et n est le nombre de marqueurs de lignage. Supposons \({p}_{{c}_{i}}^{j}\) Soit le je pixel qui se trouve dans les environs de \({c}_{i}\) et chaque pixel a le vecteur de présence suivant basé sur les marqueurs de lignage :

$$E({p}_{{c}_{i}}^{j})=\{{p}_{{M}_{1}}^{j},{p}_{{M }_{2}}^{j},\ldots ,{p}_{{M}_{n}}^{j}\}$$

\({p}_{{M}_{i}}=\{0\,\text{or}\,1\}\)qui détermine si le pixel \({p}_{{c}_{i}}^{j}\) est positif pour un marqueur particulier. Ensuite, pour déterminer si chaque pixel d’une cellule est positif ou négatif pour un marqueur donné, nous avons déterminé le vecteur majoritaire en additionnant la présence de tous les vecteurs comme :

$${M}_{{c}_{i}}=\left\{\mathop{\sum }\limits_{j=1}^{{N}_{{c}_{i}}}{ p}_{{M}_{1}}^{j},\mathop{\sum }\limits_{j=1}^{{N}_{{c}_{i}}}{p}_ {{M}_{2}}^{j},\ldots ,\mathop{\sum }\limits_{j=1}^{{N}_{{c}_{i}}}{p}_ {{M}_{n}}^{j}\right\}$$

\({N}_{{c}_{i}}\) est le nombre de pixels dans la cellule \({c}_{i}\). La valeur maximale dans le vecteur \({M}_{{c}_{i}}\) détermine l’attribution du type de cellule. Les lignées cellulaires ont été attribuées par ordre de priorité (Extended Data Fig. 1c). Voir la section « Disponibilité des codes » pour plus de détails.

Interaction cellule-cellule par paires

Nous avons effectué une analyse basée sur des tests de permutation des interactions spatiales unicellulaires pour identifier une interaction significative par paires-évitement entre les cellules12. Les cellules en interaction ont été définies comme celles situées à moins de six pixels. P les valeurs inférieures à 0,01 ont été jugées significatives.

Identification du quartier

Pour générer des CN, nous avons utilisé une stratégie de capture « fenêtre » consistant en le nombre de cellules (n) à proximité la plus proche d’une cellule donnée, comme décrit précédemment14. Chaque fenêtre est un vecteur de fréquence composé des types de X (comme indiqué) cellules les plus proches d’une cellule donnée.

En obtenant tous les vecteurs de fenêtre pour chaque cellule, les cellules initiales (Extended Data Fig. 7a) ont été regroupées à l’aide de Scikit-learn, une bibliothèque logicielle d’apprentissage automatique pour Python, et de l’algorithme de clustering MiniBatchKMeans version 0.24.2 avec taille de lot par défaut = 100 et random_state = 0. Une analyse CN ultérieure a été effectuée à l’aide de l’algorithme de clustering MiniBatchKMeans version 1.1.2 avec une taille de lot par défaut = 1 024 et random_state = 0.

Chaque cellule a ensuite été attribuée à un CN en fonction de sa fenêtre de définition. La prévalence de chaque quartier dans chaque noyau a été normalisée de sorte que la somme de la prévalence du quartier pour ce noyau soit de 100 %. Les valeurs étaient alors z-marqué et noyaux avec un z-les scores supérieurs ou égaux à 0 et inférieurs à 0 ont été comparés pour les résultats de survie.

t-SNE

Tous t-Les tracés SNE ont été générés dans MATLAB (version 2019b) en utilisant les paramètres par défaut. Pour la visualisation, les données d’expression ont été normalisées au 95e centile.

L’apprentissage en profondeur

Toutes les étapes d’analyse d’apprentissage en profondeur ont été effectuées en Python (version 3.7.12). Nous avons utilisé le framework TensorFlow (version 2.8.0) aux côtés de Keras, qui sert désormais d’interface pour la bibliothèque TensorFlow. Nous avons deux modes de données pour nos expériences : (1) images IMC brutes et (2) fréquences cellulaires obtenues à partir du phénotypage cellulaire.

Pour les images IMC brutes, le modèle ResNet-50 préformé avec des poids préformés sur ImageNet est d’abord utilisé pour extraire les intégrations de chaque canal dans les canaux IMC multiplex. Chaque canal est alimenté vers les trois canaux de ResNet-50 et les plongements sont calculés avant l’obtention des couches de classification. Chaque canal produit une taille de vecteur d’intégration de 2 048, puis ceux-ci sont tous concaténés en un seul vecteur de caractéristiques représentant ce noyau spécifique.

Nous avons ensuite réduit la dimensionnalité des vecteurs de caractéristiques extraits à l’aide d’une analyse des composants principaux clairsemés par mini-lots à un nombre spécifique de composants principaux (pour la plupart des applications, nous avons essayé neuf composants principaux). Les composants principaux ont ensuite été utilisés pour former une machine à vecteurs de support avec un noyau de fonction de base radiale avec les paramètres spécifiés dans notre base de code.

Pour les ensembles de données déséquilibrés, nous avons utilisé un suréchantillonnage aléatoire pour obtenir un nombre égal d’échantillons pour chaque classe pendant la formation. La fonction utilisée est RandomOverSampler (version 0.9.1) et elle est disponible sur : https://imbalanced-learn.org/stable/references/generated/imblearn.over_sampling.RandomOverSampler.html. Pour comparer avec les fréquences cellulaires, nous avons imaginé que les vecteurs de fréquence cellulaire représentent également un noyau (dans lequel chaque vecteur est simplement un vecteur de prévalence cellulaire de chaque type).

Comme pour les images, nous avons réduit la dimensionnalité des vecteurs de caractéristiques extraits à neuf composants principaux, puis formé une machine à vecteurs de support avec un noyau de fonction de base radiale avec les mêmes paramètres. Diverses classes de bibliothèques d’apprentissage automatique Scikit-learn (version 1.0.2) ont été utilisées pour les tâches de fractionnement de l’ensemble de données, de réduction de la dimensionnalité et de formation des machines vectorielles de support pour les tâches de prédiction.

Toutes les étapes d’extraction et de formation des fonctionnalités ont été effectuées sur les serveurs GPU/TPU de Google Cloud. Voir la section « Disponibilité des codes » pour plus de détails.

Analyse statistique et workflow

Toutes les étapes d’analyse d’images ont été effectuées dans MATLAB (version 2019b) et Python (version 3.7.12). Les analyses statistiques ont été effectuées à l’aide du logiciel statistique RStudio version 4.2.2 et GraphPad Prism 9. Les données sont exprimées en moyenne ± sem ou en moyenne ± sd ; P< 0,05 était considéré comme significatif sauf indication contraire. Tous les tests statistiques sont indiqués dans les légendes des figures. Les données de survie ont été analysées par le test du log-rank (Mantel-Cox).

Résumé des rapports

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports sur le portefeuille Nature lié à cet article.

- Advertisement -

Related Articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Stay Connected

0FansLike
3,746FollowersFollow
0SubscribersSubscribe
- Advertisement -

Latest Articles