Нейроинтерфейс, превращающий воображаемые буквы в текст, позволит парализованным людям общаться намного быстрее
Мы думаем намного быстрее, чем печатаем, — с этим малоприятным фактом сталкиваешься каждый раз, когда пытаешься набрать на клавиатуре смартфона сколько-нибудь длинное сообщение. Но для парализованных людей, пользующихся для общения специальными интерфейсами, эта разница в скоростях гораздо более мучительна. Доступные для них интерфейсы набора текста основаны на голосовых командах или на отслеживании взгляда: например, человек видит алфавит на экране и, чтобы набрать букву, должен ненадолго задержать на ней взор. Такие клавиатуры позволяют достичь скорости 47 символов в минуту, в то время как скорость печати на обычном смартфоне — 115 символов в минуту. К сожалению, даже эта скорость печати доступна далеко не всем парализованным людям: многие из них лишены возможности двигать глазами или говорить.
Таким людям может помочь только нейроинтерфейс. Современные нейроинтерфейсы для набора текста основаны чаще всего на анализе активности мозга с помощью портативного электроэнцефалографа. Работа с подобным интерфейсом тоже строится на поочередном выборе каждой нужной буквы из алфавита, только все происходит еще медленнее: на распознавание паттернов нейронной активности, соответствующих выбору правильной буквы, требуется время. Лучшие нейроинтерфейсы инвазивные, то есть основанные на имплантации электродов в мозг: они позволяют достичь скорости 40 символов в минуту.
К счастью, долгожданный прорыв в разработке нейроинтерфейсов для «чтения мыслей» все-таки произошел. В статье, опубликованной 12 мая в журнале Nature, исследователи из Стэнфордского университета рассказывают о разработанном ими новаторском инвазивном нейроинтерфейсе, увеличившем скорость печати более чем вдвое — до 90 символов в минуту, то есть почти до скорости обычной печати на смартфоне.
В исследовании участвовал 65-летний мужчина, которого парализовало в 2007 году в результате травмы спинного мозга. В 2017-м ученые вживили импланты в моторную кору его мозга, управляющую движениями. Ему не нужно было поочередно выбирать буквы из алфавита — вместо этого он просто представлял себе, как пишет их от руки в своем собственном темпе. Электроны, имплантированные в его мозг, считывали активность множества моторных нейронов, которые активируются, когда мы представляем себе, как двигаем рукой, записывая буквы.
Эту активность анализировала компьютерная нейросеть, прошедшая «глубокое обучение» и научившаяся распознавать устойчивые паттерны нейронной активности, характерные для написания того или иного символа конкретным пользователем. Пройдя обучение, она быстро распознает буквы, которые мысленно рисует пользователь, и выводит их на экран. Казалось бы, нейросеть легче научить распознавать более простые действия, связанные с управлением курсором при выборе одной буквы из алфавита. Но это интуитивное представление оказалось в корне неверным. Дело в том, что написание каждой буквы вызывает совершенно уникальный образец нейронной активности, что делает их легкоразличимыми. Это важнейший теоретический вывод из работы: многие сложные действия, оказывается, распознавать намного легче, чем простые.