Sztuczna inteligencja może wykrywać wczesne stadium raka krtani na podstawie brzmienia głosu
Rak krtani stanowi istotny problem zdrowia publicznego. W 2021 roku na całym świecie odnotowano szacunkowo 1,1 miliona przypadków raka krtani, a około 100 000 osób zmarło z jego powodu. Do czynników ryzyka należą palenie tytoniu, nadużywanie alkoholu oraz zakażenie wirusem brodawczaka ludzkiego (HPV). Rokowanie przy leczeniu raka krtani waha się od 35% do 78% przeżywalności pięcioletniej w zależności od stopnia zaawansowania nowotworu i jego lokalizacji w obrębie krtani.
Wczesne wykrycie raka jest kluczowe dla rokowania pacjenta. Obecnie diagnozę stawia się na podstawie endoskopii i biopsji – procedur uciążliwych i inwazyjnych. Dostanie się do specjalisty, który może je przeprowadzić, często zajmuje czas, co powoduje opóźnienia w diagnozie. Teraz jednak badacze wykazali w czasopiśmie Frontiers in Digital Health, że nieprawidłowości fałdów głosowych można wykryć na podstawie samego brzmienia głosu. Takie „zmiany fałdów głosowych” mogą mieć charakter łagodny, np. guzki lub polipy, ale mogą również oznaczać wczesny etap raka krtani. Wyniki te stanowią dowód koncepcji i otwierają możliwość nowego zastosowania sztucznej inteligencji – rozpoznawania wczesnych sygnałów raka krtani na podstawie nagrań głosu.
„Pokazujemy, że przy użyciu tego zestawu danych można zastosować biomarkery głosowe do rozróżnienia głosów pacjentów ze zmianami fałdów głosowych od głosów osób bez takich zmian” – powiedział dr Phillip Jenkins, stypendysta podoktorski w dziedzinie informatyki klinicznej na Oregon Health & Science University i autor korespondencyjny badania.
Analiza nagrań głosowych
Jenkins i jego współpracownicy należą do projektu „Bridge2AI-Voice” w ramach amerykańskiego konsorcjum Bridge to Artificial Intelligence (Bridge2AI) Narodowego Instytutu Zdrowia USA, którego celem jest zastosowanie AI do złożonych wyzwań biomedycznych. W badaniu przeanalizowano zmienność tonu, wysokości, głośności i czystości dźwięku w pierwszej wersji publicznego zbioru danych Bridge2AI-Voice, zawierającego 12 523 nagrania głosowe 306 uczestników z Ameryki Północnej.
Część nagrań pochodziła od pacjentów z rozpoznanym rakiem krtani, łagodnymi zmianami fałdów głosowych lub innymi schorzeniami krtani, takimi jak dystonia krtaniowa (spasmodic dysphonia) czy jednostronne porażenie fałdu głosowego.
Badacze skupili się na różnicach w szeregu cech akustycznych głosu: średniej częstotliwości podstawowej (wysokości dźwięku), zmienności wysokości w mowie (jitter), zmienności amplitudy (shimmer) oraz stosunku składowych harmonicznych do szumów (harmonic-to-noise ratio, HNR).
Odkryto wyraźne różnice w HNR i częstotliwości podstawowej między mężczyznami bez zaburzeń głosu, mężczyznami z łagodnymi zmianami fałdów głosowych a mężczyznami z rakiem krtani. Nie wykryto natomiast istotnych różnic akustycznych u kobiet, choć autorzy podkreślają, że większa próba badawcza może ujawnić takie zależności.
Wnioski badaczy sugerują, że szczególnie zmienność HNR może być pomocna w monitorowaniu przebiegu klinicznego zmian fałdów głosowych oraz w wykrywaniu raka krtani na wczesnym etapie, przynajmniej u mężczyzn.
„Nasze wyniki wskazują, że etycznie pozyskane, duże, wieloinstytucjonalne zbiory danych, takie jak Bridge2AI-Voice, mogą wkrótce sprawić, że głos stanie się praktycznym biomarkerem ryzyka nowotworu w opiece klinicznej” – powiedział Jenkins.
Od koncepcji do praktyki klinicznej
Po uzyskaniu dowodu koncepcji kolejnym krokiem jest zastosowanie opracowanych algorytmów na większej liczbie danych i przetestowanie ich w warunkach klinicznych.
„Aby przejść od tego badania do narzędzia AI rozpoznającego zmiany fałdów głosowych, musimy wyszkolić modele na jeszcze większym zbiorze nagrań głosowych, oznaczonych przez ekspertów. Następnie trzeba przetestować system, aby upewnić się, że działa równie skutecznie u kobiet i mężczyzn” – wyjaśnił Jenkins.
„Narzędzia zdrowotne oparte na analizie głosu są już testowane pilotażowo. W oparciu o nasze wyniki szacuję, że przy większych zbiorach danych i walidacji klinicznej podobne narzędzia do wykrywania zmian fałdów głosowych mogą wejść w fazę testów pilotażowych w ciągu najbliższych kilku lat” – przewiduje Jenkins.
Źródło: Frontiers in Digital Health, „Voice as a Biomarker: Exploratory Analysis for Benign and Malignant Vocal Fold Lesions”
DOI: http://dx.doi.org/10.3389/fdgth.2025.1609811



