Sztuczna inteligencja (AI) w medycynie

Maszynowe uczenie w immunologii – jak analiza receptorów B i T może rewolucjonizować medycynę

Twój układ odpornościowy przez całe życie przechowuje informacje o napotkanych zagrożeniach – biologiczny katalog złoczyńców. Często sprawcami są wirusy i bakterie, które pokonałeś; inni to tajni agenci, tacy jak szczepionki podane w celu wywołania ochronnych odpowiedzi immunologicznych, a nawet czerwone śledzie w postaci zdrowej tkanki złapanej w immunologiczny ogień krzyżowy.

Teraz naukowcy ze Stanford Medicine opracowali sposób na wydobycie tej bogatej wewnętrznej bazy danych w celu zdiagnozowania chorób tak różnorodnych, jak cukrzyca, reakcje COVID-19 na szczepionki przeciw grypie. Chociaż przewidują oni podejście jako sposób na jednoczesne badanie wielu chorób, technika oparta na uczeniu maszynowym może być również zoptymalizowana pod kątem wykrywania złożonych, trudnych do zdiagnozowania chorób autoimmunologicznych, takich jak toczeń.

W badaniu przeprowadzonym na prawie 600 osobach – niektórych zdrowych, innych z infekcjami, w tym COVID-19 lub chorobami autoimmunologicznymi, w tym toczniem i cukrzycą typu 1 – opracowany przez naukowców algorytm, nazwany Mal-ID dla uczenia maszynowego w diagnostyce immunologicznej, był niezwykle skuteczny w identyfikowaniu, kto ma co na podstawie jedynie sekwencji i struktury receptorów komórek B i T.

„Zestawy narzędzi diagnostycznych, których używamy dzisiaj, nie wykorzystują w dużym stopniu wewnętrznego rejestru chorób, z którymi zetknął się układ odpornościowy” – powiedział doktor habilitowany Maxim Zaslavsky. „Ale nasz układ odpornościowy stale monitoruje nasze ciała za pomocą limfocytów B i T, które działają jak molekularne czujniki zagrożenia. Połączenie informacji z dwóch głównych ramion układu odpornościowego daje nam pełniejszy obraz odpowiedzi układu odpornościowego na chorobę oraz ścieżek autoimmunizacji i odpowiedzi na szczepionkę”.

Naukowcy uważają, że oprócz pomocy w diagnozowaniu trudnych chorób, Mal-ID może śledzić odpowiedzi na immunoterapie przeciwnowotworowe i podkategorie stanów chorobowych w sposób, który może pomóc w podejmowaniu decyzji klinicznych.

Kilka schorzeń, którym się przyglądaliśmy, może się znacznie różnić na poziomie biologicznym lub molekularnym, ale opisujemy je szerokimi terminami, które niekoniecznie uwzględniają wyspecjalizowaną odpowiedź układu odpornościowego” – powiedział Boyd, który współkieruje Sean N. Parker Center for Allergy and Asthma Research. „Mal-ID może pomóc nam zidentyfikować podkategorie konkretnych schorzeń, które mogą dać nam wskazówki, jaki rodzaj leczenia byłby najbardziej pomocny w przypadku danego stanu chorobowego”.

Rozszyfrowanie języka białek

W podejściu „podążaj za kropkami” naukowcy wykorzystali techniki uczenia maszynowego oparte na dużych modelach językowych, które leżą u podstaw ChatGPT, aby dotrzeć do receptorów rozpoznających zagrożenia na komórkach odpornościowych zwanych limfocytami T i końcówek biznesowych przeciwciał (zwanych również receptorami) wytwarzanych przez inny typ komórek odpornościowych zwanych limfocytami B. Te modele językowe szukają wzorców w dużych zbiorach danych, takich jak teksty z książek i stron internetowych. Po odpowiednim przeszkoleniu mogą one wykorzystywać te wzorce między innymi do przewidywania następnego słowa w zdaniu.

W przypadku tego badania naukowcy zastosowali duży model językowy wyszkolony na białkach, nakarmili model milionami sekwencji z receptorów komórek B i T i wykorzystali go do łączenia receptorów, które mają wspólne kluczowe cechy – określone przez model – które mogą sugerować podobne preferencje wiązania. Takie działanie może dać wgląd w to, co powoduje mobilizację układu odpornościowego danej osoby – wytwarzanie armii limfocytów T, limfocytów B i innych komórek odpornościowych wyposażonych do atakowania rzeczywistych i postrzeganych zagrożeń.

„Sekwencje tych receptorów immunologicznych są bardzo zmienne” – powiedział Zaslavsky. „Ta zmienność pomaga układowi odpornościowemu wykryć praktycznie wszystko, ale także utrudnia nam interpretację tego, co jest celem tych komórek odpornościowych. W tym badaniu zastanawialiśmy się, czy możemy rozszyfrować zapisy układu odpornościowego dotyczące tych spotkań z chorobami, interpretując te wysoce zmienne informacje za pomocą nowych technik uczenia maszynowego. Pomysł ten nie jest nowy, ale brakowało nam solidnego sposobu na uchwycenie wzorców w tych sekwencjach receptorów immunologicznych, które wskazują, na co reaguje układ odpornościowy”.

Limfocyty B i limfocyty T reprezentują dwa odrębne ramiona układu odpornościowego, ale sposób, w jaki wytwarzają białka rozpoznające czynniki zakaźne lub komórki, które należy wyeliminować, jest podobny. Krótko mówiąc, określone segmenty DNA w genomach komórek są losowo mieszane i dopasowywane – czasami z dodatkową szczyptą dodatkowych mutacji, aby urozmaicić sytuację – w celu utworzenia regionów kodujących, które po złożeniu struktur białkowych mogą generować biliony unikalnych przeciwciał (w przypadku limfocytów B) lub receptorów powierzchniowych komórek (w przypadku limfocytów T).

Losowość tego procesu oznacza, że te przeciwciała lub receptory komórek T nie są dostosowane do rozpoznawania żadnych konkretnych cząsteczek na powierzchni najeźdźców. Jednak ich oszałamiająca różnorodność gwarantuje, że co najmniej kilka z nich zwiąże się z niemal każdą obcą strukturą. (Autoimmunizacja, czyli atak układu odpornościowego na własne tkanki organizmu, jest zwykle – choć nie zawsze – unikana dzięki procesowi warunkowania, przez który przechodzą limfocyty T i B na wczesnym etapie rozwoju, a który eliminuje problematyczne komórki).

Akt wiązania stymuluje komórkę do wytworzenia większej ilości siebie w celu przeprowadzenia ataku na pełną skalę; późniejsza zwiększona częstość występowania komórek z receptorami, które pasują do podobnych trójwymiarowych struktur, zapewnia biologiczny odcisk palca chorób lub stanów, w które celuje układ odpornościowy.
Aby przetestować swoją teorię, naukowcy zgromadzili zbiór danych zawierający ponad 16 milionów sekwencji receptorów komórek B i ponad 25 milionów sekwencji receptorów komórek T od 593 osób z jednym z sześciu różnych stanów odpornościowych: zdrowych osób kontrolnych, osób zakażonych SARS-CoV-2 (wirusem wywołującym COVID-19) lub HIV, osób, które niedawno otrzymały szczepionkę przeciw grypie oraz osób z toczniem lub cukrzycą typu 1 (obie choroby autoimmunologiczne). Zaslavsky i jego koledzy wykorzystali następnie swoje podejście do uczenia maszynowego, aby znaleźć podobieństwa między osobami z tą samą chorobą.
„Porównaliśmy częstotliwości użycia segmentów, sekwencje aminokwasów powstałych białek i sposób, w jaki model reprezentował” język »receptorów, wśród innych cech« – powiedział Boyd.

Komórki T i B razem

Naukowcy odkryli, że sekwencje receptorów komórek T dostarczyły najbardziej istotnych informacji na temat tocznia i cukrzycy typu 1, podczas gdy sekwencje receptorów komórek B były najbardziej pouczające w identyfikacji zakażenia HIV lub SARS-CoV-2 lub niedawnego szczepienia przeciwko grypie. Jednak w każdym przypadku połączenie wyników komórek T i B zwiększyło zdolność algorytmu do dokładnego kategoryzowania ludzi według ich stanu chorobowego, niezależnie od płci, wieku czy rasy.

„Tradycyjne podejścia czasami mają trudności ze znalezieniem grup receptorów, które wyglądają inaczej, ale rozpoznają te same cele” – powiedział Zaslavsky. „Ale to właśnie tutaj wyróżniają się duże modele językowe. Mogą one nauczyć się gramatyki i specyficznych dla kontekstu wskazówek układu odpornościowego, tak jak opanowały gramatykę angielską i kontekst. W ten sposób Mal-ID może generować wewnętrzne zrozumienie tych sekwencji, które daje nam wgląd, jakiego wcześniej nie mieliśmy”.

Chociaż naukowcy opracowali Mal-ID na zaledwie sześciu stanach immunologicznych, przewidują, że algorytm można szybko dostosować do identyfikacji sygnatur immunologicznych specyficznych dla wielu innych chorób i stanów. Są oni szczególnie zainteresowani chorobami autoimmunologicznymi, takimi jak toczeń, które mogą być trudne do zdiagnozowania i skutecznego leczenia.

„Pacjenci mogą zmagać się latami, zanim otrzymają diagnozę, a nawet wtedy nazwy, które nadajemy tym chorobom, są jak terminy parasolowe, które pomijają różnorodność biologiczną stojącą za złożonymi chorobami” – powiedział Zaslavsky. „Jeśli uda nam się wykorzystać Mal-ID do rozwikłania heterogeniczności tocznia lub reumatoidalnego zapalenia stawów, będzie to miało ogromne znaczenie kliniczne”.

Mal-ID może również pomóc naukowcom zidentyfikować nowe cele terapeutyczne dla wielu schorzeń.
„Piękno tego podejścia polega na tym, że działa ono nawet wtedy, gdy początkowo nie wiemy w pełni, jakie cząsteczki lub struktury są celem układu odpornościowego” – powiedział Boyd. „Nadal możemy uzyskać informacje po prostu widząc podobne wzorce w sposobie reagowania ludzi. A zagłębiając się w te reakcje, możemy odkryć nowe kierunki badań i terapii”.

Źródło: Science
DOI: 10.1126/science.adp2407

Tygodnik Medyczny

Zdrowie, system ochrony zdrowia, opieka farmaceutyczna, farmacja, polityka lekowa, żywienie, służba zdrowia - portal medyczny

Najnowsze artykuły

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Back to top button