System sterowany mózgiem wzmacnia wybrany głos w hałasie. Pierwsze testy u ludzi
Komentarz redakcji
Zespół Nimy Mesgaraniego z Columbia University opisał w „Nature Neuroscience” system „brain‑controlled hearing”, testowany u czterech pacjentów z padaczką z elektrodami iEEG. Urządzenie odczytuje z kory słuchowej, na którego z dwóch rozmówców słuchacz kieruje uwagę, i automatycznie wzmacnia jego głos, poprawiając zrozumiałość mowy i zmniejszając wysiłek słuchowy. Nagrane w ten sposób „brain‑shaped audio” poprawiło także rozumienie mowy u 40 osób z niedosłuchem.
Najważniejsze
•System sterowany sygnałami z mózgu w czasie rzeczywistym wzmacnia głos wybranego rozmówcy w hałasie, wykorzystując technikę auditory attention decoding (AAD) w zamkniętej pętli.
•Pierwsze testy przeprowadzono u 4 pacjentów z lekooporną padaczką i wszczepionymi elektrodami iEEG nad korą słuchową; dokładność dekodowania uwagi sięgała ponad 90% u części badanych.
•Aktywne sterowanie głośnością na podstawie sygnałów mózgowych poprawiało rozumienie mowy, zwiększało efektywny TMR średnio o ok. 12 dB i zmniejszało wysiłek poznawczy, a większość uczestników preferowała odsłuch z systemem.
•„Brain‑shaped audio” wygenerowane z iEEG pacjentów dodatkowo poprawiało rozumienie mowy u 40 osób z ubytkiem słuchu korzystających ze standardowych urządzeń, szczególnie przy większym niedosłuchu.
•Technologia jest na etapie proof‑of‑concept, wymaga inwazyjnych elektrod i dalszych badań nad mniej inwazyjnymi interfejsami oraz pełnej oceny bezpieczeństwa, skuteczności i ochrony danych mózgowych przed dopuszczeniem do praktyki klinicznej.
3 dni temu
·
2 min
Najważniejsze
•System sterowany sygnałami z mózgu w czasie rzeczywistym wzmacnia głos wybranego rozmówcy w hałasie, wykorzystując technikę auditory attention decoding (AAD) w zamkniętej pętli.
•Pierwsze testy przeprowadzono u 4 pacjentów z lekooporną padaczką i wszczepionymi elektrodami iEEG nad korą słuchową; dokładność dekodowania uwagi sięgała ponad 90% u części badanych.
•Aktywne sterowanie głośnością na podstawie sygnałów mózgowych poprawiało rozumienie mowy, zwiększało efektywny TMR średnio o ok. 12 dB i zmniejszało wysiłek poznawczy, a większość uczestników preferowała odsłuch z systemem.
•„Brain‑shaped audio” wygenerowane z iEEG pacjentów dodatkowo poprawiało rozumienie mowy u 40 osób z ubytkiem słuchu korzystających ze standardowych urządzeń, szczególnie przy większym niedosłuchu.
•Technologia jest na etapie proof‑of‑concept, wymaga inwazyjnych elektrod i dalszych badań nad mniej inwazyjnymi interfejsami oraz pełnej oceny bezpieczeństwa, skuteczności i ochrony danych mózgowych przed dopuszczeniem do praktyki klinicznej.
Naukowcy z USA przedstawili w pierwszych badaniach u ludzi system, który na podstawie sygnałów z mózgu w czasie rzeczywistym wzmacnia wybrany głos w hałasie.
Źródło zdjęcia: unsplash.com - by Bhautik Patel
Zespół naukowców pod kierunkiem Nimy Mesgaraniego z Columbia University Zuckerman Institute opisał 11 maja 2026 r. w „Nature Neuroscience” pierwsze testy u ludzi systemu sterowanego sygnałami z mózgu, który w czasie rzeczywistym wzmacnia głos wybranego rozmówcy w hałaśliwym otoczeniu. Badacze twierdzą, że to pierwszy prototyp pokazujący realną poprawę rozumienia mowy w hałasie dzięki tzw. auditory attention decoding (AAD) w zamkniętej pętli.
W badaniu udział wzięło czterech hospitalizowanych pacjentów z lekooporną padaczką, u których z powodów klinicznych już wcześniej wszczepiono elektrody iEEG nad korą słuchową; wszyscy zgłaszali prawidłowy słuch. Podczas eksperymentów słuchali dwóch jednoczesnych dialogów odtwarzanych z dwóch kierunków, na tle kontrolowanego hałasu. W fazie treningowej system uczył się wzorca aktywności mózgu odpowiadającego uwadze skierowanej na jednego z mówców, rekonstruując tzw. obwiednię mowy z sygnału iEEG dla każdego uczestnika.
W fazie testowej algorytm w czasie rzeczywistym porównywał „przewidywaną” obwiednię z dwoma strumieniami audio i dynamicznie regulował ich głośność w pięciu krokach, w zakresie około ±9 dB. Średnia dokładność dekodowania uwagi wynosiła od ok. 72 do ponad 90 proc., w zależności od pacjenta i rozmieszczenia elektrod. Po przełączeniu uwagi na drugiego mówcę, po sygnale wizualnym, system rozpoznawał tę zmianę przeciętnie po 5,1 sekundy i przekierowywał wzmocnienie na nowy głos.
Badacze mierzyli zarówno parametry akustyczne, jak i zachowanie uczestników. Włączenie systemu zwiększało efektywny stosunek sygnału do zakłóceń (TMR) dla głosu docelowego średnio o około 12 dB, także w scenariuszu, gdy na początku był on o 6 dB cichszy od głosu zakłócającego. Pacjenci lepiej rozpoznawali słowa i zdania w testach z aktywnym sterowaniem mózgowym niż bez niego. U dwóch osób mierzono szerokość źrenicy jako obiektywny wskaźnik wysiłku poznawczego – była mniejsza przy włączonym systemie. W 75–95 proc. prób uczestnicy deklarowali, że wolą odsłuch z systemem.
Na podstawie sygnałów iEEG z tej grupy naukowcy wygenerowali także tzw. „brain‑shaped audio” – dźwięk już przetworzony przez algorytm AAD. Ten materiał odtworzono następnie 40 osobom z ubytkiem słuchu, korzystającym ze standardowych urządzeń. U tej grupy poprawa rozumienia mowy była jeszcze większa niż u pacjentów z padaczką, zwłaszcza u osób z większym niedosłuchem. Badanie finansowały m.in. amerykański NIDCD/NIH oraz prywatne fundacje.
Autorzy umieszczają swoją pracę w kontekście tzw. „cocktail party problem” – trudności w wybieraniu jednego głosu spośród wielu, które obecne aparaty słuchowe i implanty rozwiązują tylko częściowo. WHO szacuje, że 430 mln ludzi na świecie ma istotny ubytek słuchu, a do 2050 r. liczba ta może sięgnąć około 700 mln; niedosłuch wiąże się m.in. z izolacją społeczną i zwiększonym ryzykiem demencji.
Badacze podkreślają, że obecna wersja systemu jest jedynie proof‑of‑concept, testowanym u czterech osób z padaczką i prawidłowym słuchem oraz wymagającym inwazyjnych elektrod iEEG. Kolejne etapy prac mają objąć większe grupy, w tym osoby z rzeczywistym niedosłuchem, oraz próby zastosowania mniej inwazyjnych interfejsów – np. elektrod w implantach ślimakowych czy nieinwazyjnego EEG. Zanim podobne rozwiązania trafią do praktyki klinicznej, czekają je testy w bardziej złożonych warunkach akustycznych, a także pełna ścieżka oceny bezpieczeństwa, skuteczności i ochrony danych mózgowych przez regulatorów w USA i Europie.
Jak działa system brain-controlled hearing w badaniu Mesgaraniego
1. Rejestracja sygnałów z mózgu
Elektrody iEEG nad korą słuchową rejestrują aktywność mózgu pacjentów słuchających dwóch jednoczesnych rozmów.
›
2. Faza treningowa
Algorytm uczy się wzorca aktywności odpowiadającego uwadze skierowanej na danego mówcę, rekonstruując obwiednię mowy z iEEG.
›
3. Faza testowa w czasie rzeczywistym
System porównuje przewidywaną obwiednię mowy z dwoma strumieniami audio i określa, który głos jest aktualnie śledzony uwagą.
4. Dynamiczna regulacja głośności
Głośność obu rozmówców jest automatycznie regulowana w pięciu krokach (ok. ±9 dB), wzmacniając głos wybrany przez mózg.
›
5. Efekt percepcyjny
Poprawa rozumienia słów i zdań, zwiększenie TMR o ~12 dB, mniejszy wysiłek poznawczy i subiektywna preferencja odsłuchu z systemem.
Opracowanie na podstawie publikacji w Nature Neuroscience i komunikatów prasowych Columbii.
Klasyczne aparaty słuchowe vs prototyp brain-controlled hearing
Klasyczne aparaty słuchowe
+Wzmacniają sygnał mowy i redukują część hałasu tła (np. szum uliczny).
+Dostępne komercyjnie, nie wymagają zabiegu neurochirurgicznego.
+Sprawdzone procedury dopasowania i refundacji w wielu krajach.
−Wzmacniają wszystkie głosy w polu mikrofonu, bez wyboru rozmówcy.
−Ograniczona skuteczność w środowisku z wieloma mówcami (cocktail party problem).
−Nie korzystają z informacji o tym, na kogo słuchacz faktycznie kieruje uwagę.
Prototyp brain-controlled hearing
+W czasie rzeczywistym wzmacnia głos, na który wskazuje aktywność mózgu (dekodowanie uwagi).
+Zwiększa efektywny TMR i poprawia rozumienie mowy oraz zmniejsza wysiłek poznawczy.
+Może szczególnie pomóc osobom z większym ubytkiem słuchu (na podstawie testów z „brain‑shaped audio”).
−Obecnie wymaga inwazyjnych elektrod iEEG wszczepionych z powodów klinicznych.
−Przetestowany tylko u niewielkiej liczby pacjentów, na wczesnym etapie proof‑of‑concept.
−Brak jeszcze wersji komercyjnej, otwarte kwestie bezpieczeństwa, prywatności i regulacji prawnych.
Kluczowe parametry działania systemu brain-controlled hearing w pierwszych testach u ludzi
Parametr
Wartość
Uwagi
Liczba pacjentów z padaczką
4
Hospitalizowani, z wszczepionymi elektrodami iEEG nad korą słuchową
Zakres regulacji głośności
około ±9 dB
Pięć kroków wzmocnienia/tłumienia dla każdego strumienia mowy
Dokładność dekodowania uwagi
~72–>90%
Zależna od pacjenta i rozmieszczenia elektrod
Średni czas wykrycia zmiany uwagi
5,1 s
Od wizualnego sygnału do przełączenia wzmocnienia na nowego mówcę
Zwiększenie efektywnego TMR
~12 dB
Także gdy głos docelowy był początkowo o 6 dB cichszy
Preferencja uczestników dla systemu
75–95% prób
Subiektywna ocena lepszego odsłuchu z systemem
Na podstawie opisu badania w artykule i materiałach prasowych Columbia University / Nature Neuroscience.
Słownik pojęć
Auditory attention decoding (AAD)
Zestaw metod analizy sygnałów mózgowych, które pozwalają określić, na który z kilku bodźców dźwiękowych (np. głosów) słuchacz kieruje uwagę, zwykle poprzez dopasowanie aktywności neuronów do rytmu mowy.
iEEG (elektrokortykografia wewnątrzczaszkowa)
Inwazyjna technika rejestracji aktywności elektrycznej mózgu za pomocą elektrod umieszczonych bezpośrednio na powierzchni kory lub w miąższu mózgu, stosowana m.in. u pacjentów z padaczką lekooporną.
Obwiednia mowy
Powolna zmienność amplitudy sygnału mowy w czasie, odzwierciedlająca rytm sylab i akcentów; mózg silnie śledzi obwiednię, co pozwala odtworzyć ją z sygnałów EEG/iEEG.
TMR (target-to-masker ratio)
Stosunek poziomu sygnału docelowego (np. głosu rozmówcy) do poziomu bodźca maskującego (szumu lub innej mowy). Wyższy TMR zwykle oznacza łatwiejsze rozumienie mowy w hałasie.
Cocktail party problem
Klasyczne w neurobiologii słyszenia określenie trudności w wybraniu i śledzeniu jednego głosu spośród wielu mówiących jednocześnie, typowej np. na przyjęciu czy w gwarnej restauracji.
Proof‑of‑concept
Wczesny etap rozwoju technologii lub procedury, w którym w kontrolowanych warunkach pokazuje się, że zasada działania jest wykonalna i przynosi oczekiwany efekt, ale daleko jeszcze do gotowego produktu klinicznego.
Najczęstsze pytania
Dla kogo w przyszłości może być przeznaczona technologia brain-controlled hearing?▼
Docelowo dla osób z ubytkiem słuchu, u których tradycyjne aparaty słuchowe lub implanty ślimakowe nie radzą sobie dobrze w hałaśliwym otoczeniu. Pierwsze testy z „brain‑shaped audio” sugerują szczególną korzyść u osób z większym niedosłuchem.
Czy obecnie można wszczepić taki system w ramach leczenia niedosłuchu?▼
Nie. Opisany system jest prototypem proof‑of‑concept badanym u 4 pacjentów z padaczką, którzy i tak mieli wszczepione elektrody iEEG z powodów klinicznych. Nie jest to urządzenie zatwierdzone do leczenia ani dostępne komercyjnie.
Jak ta technologia różni się od klasycznych aparatów słuchowych?▼
Klasyczne aparaty wzmacniają dźwięk na podstawie analizy akustycznej, bez znajomości tego, na kogo słuchacz kieruje uwagę. System brain-controlled hearing wykorzystuje sygnały z mózgu (AAD), aby wykryć wybrany głos i w czasie rzeczywistym specjalnie go wzmocnić względem innych rozmówców.
Czy do działania systemu zawsze będą potrzebne inwazyjne elektrody w mózgu?▼
Autorzy badania zakładają, że kolejne etapy prac obejmą mniej inwazyjne interfejsy, np. elektrody w implantach ślimakowych lub nieinwazyjne EEG. Jednak skuteczność takich rozwiązań musi zostać dopiero potwierdzona w badaniach.
Jakie są główne wyzwania przed wdrożeniem tej technologii do praktyki klinicznej?▼
Potrzebne są większe badania u osób z realnym niedosłuchem, testy w bardziej złożonych warunkach akustycznych, opracowanie mniej inwazyjnych interfejsów, a także pełna ocena bezpieczeństwa, skuteczności, stabilności działania i kwestii ochrony prywatności danych mózgowych przez regulatorów w USA i Europie.
Rewolucja w wykrywaniu demencji: test krwi otwiera nowe możliwości
Wczesne wykrycie demencji u kobiet przy użyciu testu krwi może zrewolucjonizować profilaktykę choroby dzięki identyfikacji biomarkera p-tau217. Odkrycie to stawia przed nami nowe możliwości w skutecznej prewencji i leczeniu.