System sterowany mózgiem wzmacnia wybrany głos w hałasie. Pierwsze testy u ludzi

Komentarz redakcji

Zespół Nimy Mesgaraniego z Columbia University opisał w „Nature Neuroscience” system „brain‑controlled hearing”, testowany u czterech pacjentów z padaczką z elektrodami iEEG. Urządzenie odczytuje z kory słuchowej, na którego z dwóch rozmówców słuchacz kieruje uwagę, i automatycznie wzmacnia jego głos, poprawiając zrozumiałość mowy i zmniejszając wysiłek słuchowy. Nagrane w ten sposób „brain‑shaped audio” poprawiło także rozumienie mowy u 40 osób z niedosłuchem.

Najważniejsze

  • System sterowany sygnałami z mózgu w czasie rzeczywistym wzmacnia głos wybranego rozmówcy w hałasie, wykorzystując technikę auditory attention decoding (AAD) w zamkniętej pętli.
  • Pierwsze testy przeprowadzono u 4 pacjentów z lekooporną padaczką i wszczepionymi elektrodami iEEG nad korą słuchową; dokładność dekodowania uwagi sięgała ponad 90% u części badanych.
  • Aktywne sterowanie głośnością na podstawie sygnałów mózgowych poprawiało rozumienie mowy, zwiększało efektywny TMR średnio o ok. 12 dB i zmniejszało wysiłek poznawczy, a większość uczestników preferowała odsłuch z systemem.
  • „Brain‑shaped audio” wygenerowane z iEEG pacjentów dodatkowo poprawiało rozumienie mowy u 40 osób z ubytkiem słuchu korzystających ze standardowych urządzeń, szczególnie przy większym niedosłuchu.
  • Technologia jest na etapie proof‑of‑concept, wymaga inwazyjnych elektrod i dalszych badań nad mniej inwazyjnymi interfejsami oraz pełnej oceny bezpieczeństwa, skuteczności i ochrony danych mózgowych przed dopuszczeniem do praktyki klinicznej.
3 dni temu
·
2 min

Naukowcy z USA przedstawili w pierwszych badaniach u ludzi system, który na podstawie sygnałów z mózgu w czasie rzeczywistym wzmacnia wybrany głos w hałasie.

Źródło zdjęcia: unsplash.com - by Bhautik Patel
Źródło zdjęcia: unsplash.com - by Bhautik Patel
Zespół naukowców pod kierunkiem Nimy Mesgaraniego z Columbia University Zuckerman Institute opisał 11 maja 2026 r. w „Nature Neuroscience” pierwsze testy u ludzi systemu sterowanego sygnałami z mózgu, który w czasie rzeczywistym wzmacnia głos wybranego rozmówcy w hałaśliwym otoczeniu. Badacze twierdzą, że to pierwszy prototyp pokazujący realną poprawę rozumienia mowy w hałasie dzięki tzw. auditory attention decoding (AAD) w zamkniętej pętli. W badaniu udział wzięło czterech hospitalizowanych pacjentów z lekooporną padaczką, u których z powodów klinicznych już wcześniej wszczepiono elektrody iEEG nad korą słuchową; wszyscy zgłaszali prawidłowy słuch. Podczas eksperymentów słuchali dwóch jednoczesnych dialogów odtwarzanych z dwóch kierunków, na tle kontrolowanego hałasu. W fazie treningowej system uczył się wzorca aktywności mózgu odpowiadającego uwadze skierowanej na jednego z mówców, rekonstruując tzw. obwiednię mowy z sygnału iEEG dla każdego uczestnika. W fazie testowej algorytm w czasie rzeczywistym porównywał „przewidywaną” obwiednię z dwoma strumieniami audio i dynamicznie regulował ich głośność w pięciu krokach, w zakresie około ±9 dB. Średnia dokładność dekodowania uwagi wynosiła od ok. 72 do ponad 90 proc., w zależności od pacjenta i rozmieszczenia elektrod. Po przełączeniu uwagi na drugiego mówcę, po sygnale wizualnym, system rozpoznawał tę zmianę przeciętnie po 5,1 sekundy i przekierowywał wzmocnienie na nowy głos. Badacze mierzyli zarówno parametry akustyczne, jak i zachowanie uczestników. Włączenie systemu zwiększało efektywny stosunek sygnału do zakłóceń (TMR) dla głosu docelowego średnio o około 12 dB, także w scenariuszu, gdy na początku był on o 6 dB cichszy od głosu zakłócającego. Pacjenci lepiej rozpoznawali słowa i zdania w testach z aktywnym sterowaniem mózgowym niż bez niego. U dwóch osób mierzono szerokość źrenicy jako obiektywny wskaźnik wysiłku poznawczego – była mniejsza przy włączonym systemie. W 75–95 proc. prób uczestnicy deklarowali, że wolą odsłuch z systemem. Na podstawie sygnałów iEEG z tej grupy naukowcy wygenerowali także tzw. „brain‑shaped audio” – dźwięk już przetworzony przez algorytm AAD. Ten materiał odtworzono następnie 40 osobom z ubytkiem słuchu, korzystającym ze standardowych urządzeń. U tej grupy poprawa rozumienia mowy była jeszcze większa niż u pacjentów z padaczką, zwłaszcza u osób z większym niedosłuchem. Badanie finansowały m.in. amerykański NIDCD/NIH oraz prywatne fundacje. Autorzy umieszczają swoją pracę w kontekście tzw. „cocktail party problem” – trudności w wybieraniu jednego głosu spośród wielu, które obecne aparaty słuchowe i implanty rozwiązują tylko częściowo. WHO szacuje, że 430 mln ludzi na świecie ma istotny ubytek słuchu, a do 2050 r. liczba ta może sięgnąć około 700 mln; niedosłuch wiąże się m.in. z izolacją społeczną i zwiększonym ryzykiem demencji. Badacze podkreślają, że obecna wersja systemu jest jedynie proof‑of‑concept, testowanym u czterech osób z padaczką i prawidłowym słuchem oraz wymagającym inwazyjnych elektrod iEEG. Kolejne etapy prac mają objąć większe grupy, w tym osoby z rzeczywistym niedosłuchem, oraz próby zastosowania mniej inwazyjnych interfejsów – np. elektrod w implantach ślimakowych czy nieinwazyjnego EEG. Zanim podobne rozwiązania trafią do praktyki klinicznej, czekają je testy w bardziej złożonych warunkach akustycznych, a także pełna ścieżka oceny bezpieczeństwa, skuteczności i ochrony danych mózgowych przez regulatorów w USA i Europie.

Jak działa system brain-controlled hearing w badaniu Mesgaraniego

1. Rejestracja sygnałów z mózgu
Elektrody iEEG nad korą słuchową rejestrują aktywność mózgu pacjentów słuchających dwóch jednoczesnych rozmów.
2. Faza treningowa
Algorytm uczy się wzorca aktywności odpowiadającego uwadze skierowanej na danego mówcę, rekonstruując obwiednię mowy z iEEG.
3. Faza testowa w czasie rzeczywistym
System porównuje przewidywaną obwiednię mowy z dwoma strumieniami audio i określa, który głos jest aktualnie śledzony uwagą.
4. Dynamiczna regulacja głośności
Głośność obu rozmówców jest automatycznie regulowana w pięciu krokach (ok. ±9 dB), wzmacniając głos wybrany przez mózg.
5. Efekt percepcyjny
Poprawa rozumienia słów i zdań, zwiększenie TMR o ~12 dB, mniejszy wysiłek poznawczy i subiektywna preferencja odsłuchu z systemem.

Opracowanie na podstawie publikacji w Nature Neuroscience i komunikatów prasowych Columbii.

Klasyczne aparaty słuchowe vs prototyp brain-controlled hearing

Klasyczne aparaty słuchowe
+Wzmacniają sygnał mowy i redukują część hałasu tła (np. szum uliczny).
+Dostępne komercyjnie, nie wymagają zabiegu neurochirurgicznego.
+Sprawdzone procedury dopasowania i refundacji w wielu krajach.
Wzmacniają wszystkie głosy w polu mikrofonu, bez wyboru rozmówcy.
Ograniczona skuteczność w środowisku z wieloma mówcami (cocktail party problem).
Nie korzystają z informacji o tym, na kogo słuchacz faktycznie kieruje uwagę.
Prototyp brain-controlled hearing
+W czasie rzeczywistym wzmacnia głos, na który wskazuje aktywność mózgu (dekodowanie uwagi).
+Zwiększa efektywny TMR i poprawia rozumienie mowy oraz zmniejsza wysiłek poznawczy.
+Może szczególnie pomóc osobom z większym ubytkiem słuchu (na podstawie testów z „brain‑shaped audio”).
Obecnie wymaga inwazyjnych elektrod iEEG wszczepionych z powodów klinicznych.
Przetestowany tylko u niewielkiej liczby pacjentów, na wczesnym etapie proof‑of‑concept.
Brak jeszcze wersji komercyjnej, otwarte kwestie bezpieczeństwa, prywatności i regulacji prawnych.

Kluczowe parametry działania systemu brain-controlled hearing w pierwszych testach u ludzi

ParametrWartośćUwagi
Liczba pacjentów z padaczką4Hospitalizowani, z wszczepionymi elektrodami iEEG nad korą słuchową
Zakres regulacji głośnościokoło ±9 dBPięć kroków wzmocnienia/tłumienia dla każdego strumienia mowy
Dokładność dekodowania uwagi~72–>90%Zależna od pacjenta i rozmieszczenia elektrod
Średni czas wykrycia zmiany uwagi5,1 sOd wizualnego sygnału do przełączenia wzmocnienia na nowego mówcę
Zwiększenie efektywnego TMR~12 dBTakże gdy głos docelowy był początkowo o 6 dB cichszy
Preferencja uczestników dla systemu75–95% próbSubiektywna ocena lepszego odsłuchu z systemem

Na podstawie opisu badania w artykule i materiałach prasowych Columbia University / Nature Neuroscience.

Słownik pojęć

Auditory attention decoding (AAD)
Zestaw metod analizy sygnałów mózgowych, które pozwalają określić, na który z kilku bodźców dźwiękowych (np. głosów) słuchacz kieruje uwagę, zwykle poprzez dopasowanie aktywności neuronów do rytmu mowy.
iEEG (elektrokortykografia wewnątrzczaszkowa)
Inwazyjna technika rejestracji aktywności elektrycznej mózgu za pomocą elektrod umieszczonych bezpośrednio na powierzchni kory lub w miąższu mózgu, stosowana m.in. u pacjentów z padaczką lekooporną.
Obwiednia mowy
Powolna zmienność amplitudy sygnału mowy w czasie, odzwierciedlająca rytm sylab i akcentów; mózg silnie śledzi obwiednię, co pozwala odtworzyć ją z sygnałów EEG/iEEG.
TMR (target-to-masker ratio)
Stosunek poziomu sygnału docelowego (np. głosu rozmówcy) do poziomu bodźca maskującego (szumu lub innej mowy). Wyższy TMR zwykle oznacza łatwiejsze rozumienie mowy w hałasie.
Cocktail party problem
Klasyczne w neurobiologii słyszenia określenie trudności w wybraniu i śledzeniu jednego głosu spośród wielu mówiących jednocześnie, typowej np. na przyjęciu czy w gwarnej restauracji.
Proof‑of‑concept
Wczesny etap rozwoju technologii lub procedury, w którym w kontrolowanych warunkach pokazuje się, że zasada działania jest wykonalna i przynosi oczekiwany efekt, ale daleko jeszcze do gotowego produktu klinicznego.

Najczęstsze pytania

Dla kogo w przyszłości może być przeznaczona technologia brain-controlled hearing?
Docelowo dla osób z ubytkiem słuchu, u których tradycyjne aparaty słuchowe lub implanty ślimakowe nie radzą sobie dobrze w hałaśliwym otoczeniu. Pierwsze testy z „brain‑shaped audio” sugerują szczególną korzyść u osób z większym niedosłuchem.
Czy obecnie można wszczepić taki system w ramach leczenia niedosłuchu?
Nie. Opisany system jest prototypem proof‑of‑concept badanym u 4 pacjentów z padaczką, którzy i tak mieli wszczepione elektrody iEEG z powodów klinicznych. Nie jest to urządzenie zatwierdzone do leczenia ani dostępne komercyjnie.
Jak ta technologia różni się od klasycznych aparatów słuchowych?
Klasyczne aparaty wzmacniają dźwięk na podstawie analizy akustycznej, bez znajomości tego, na kogo słuchacz kieruje uwagę. System brain-controlled hearing wykorzystuje sygnały z mózgu (AAD), aby wykryć wybrany głos i w czasie rzeczywistym specjalnie go wzmocnić względem innych rozmówców.
Czy do działania systemu zawsze będą potrzebne inwazyjne elektrody w mózgu?
Autorzy badania zakładają, że kolejne etapy prac obejmą mniej inwazyjne interfejsy, np. elektrody w implantach ślimakowych lub nieinwazyjne EEG. Jednak skuteczność takich rozwiązań musi zostać dopiero potwierdzona w badaniach.
Jakie są główne wyzwania przed wdrożeniem tej technologii do praktyki klinicznej?
Potrzebne są większe badania u osób z realnym niedosłuchem, testy w bardziej złożonych warunkach akustycznych, opracowanie mniej inwazyjnych interfejsów, a także pełna ocena bezpieczeństwa, skuteczności, stabilności działania i kwestii ochrony prywatności danych mózgowych przez regulatorów w USA i Europie.

Komentarze (0)

0/2000
Następny artykuł

Rewolucja w wykrywaniu demencji: test krwi otwiera nowe możliwości

Wczesne wykrycie demencji u kobiet przy użyciu testu krwi może zrewolucjonizować profilaktykę choroby dzięki identyfikacji biomarkera p-tau217. Odkrycie to stawia przed nami nowe możliwości w skutecznej prewencji i leczeniu.

Czytaj dalej

Powiązane artykuły

Rewolucja w wykrywaniu demencji: test krwi otwiera nowe możliwości

Wczesne wykrycie demencji u kobiet przy użyciu testu krwi może zrewolucjonizować profilaktykę choroby dzięki identyfikacji biomarkera p-tau217. Odkrycie to stawia przed nami nowe możliwości w skutecznej prewencji i leczeniu.

rynekzdrowia.pl
16 mar

COVID-19 a mózg: nowe odkrycia i stare pytania

Zrozumienie, jak COVID-19 wpływa na mózg, może być kluczem do skuteczniejszego leczenia długotrwałych objawów neurologicznych. Nowe badania z Linköping University ujawniają różnice w strukturze mózgowej pacjentów po COVID-19, ale wymagają dalszych analiz z uwagi na ograniczenia metodologiczne.

healtheuropa.com
16 mar

SeeDB-Live: Przełom w obrazowaniu mózgu – nowa era w neurologii?

Nowa metoda obrazowania mózgu, SeeDB-Live, może zrewolucjonizować badania nad chorobami neurologicznymi, pozwalając na trzykrotnie jaśniejsze sygnały z głębokich warstw mózgu. Jednak brak danych o bezpieczeństwie i skuteczności w różnych modelach budzi pewne obawy.

alertmedyczny.pl
16 mar

Lekarze: ciche szpitale przyspieszają zdrowienie pacjentów

Cichsze oddziały szpitalne zmniejszają lęk pacjentów, poprawiają jakość snu i mogą skracać czas hospitalizacji – wynika z badania opublikowanego 21 kwietnia 2026 r.

medscape.com
alertify.io
+1
22 kwi

Nowe dane z AAN: styl życia skuteczniejszy niż leki w Alzheimerze

Interwencje stylu życia poprawiają funkcje poznawcze we wczesnym Alzheimerze skuteczniej niż przeciwciała monoklonalne – wynika z badań zaprezentowanych na zjeździe AAN w Chicago.

renalandurologynews.com
medscape.com
+3
29 kwi

Sztuczna inteligencja na straży zdrowia: VoiceAI w Evergreen Family Medicine

Wprowadzenie systemu VoiceAI w Evergreen Family Medicine znacząco zmniejszyło czas oczekiwania na linii oraz zwiększyło efektywność pracowników. Mimo początkowych obaw, rozwiązanie to przyniosło zaskakująco pozytywne efekty zarówno dla personelu, jak i dla pacjentów.

healthcareitnews.com
16 mar
StartSzukaj