Почему фМРТ видит то, чего нет
Томография мозга нередко даёт ложноположительные результаты из-за особенностей своего программного обеспечения, которое видит несуществующее сходство между разными участками мозга.
Магнитно-резонансная томография мозга стала настолько популярной в современной нейробиологии и медицине, что сейчас метод МРТ в той или иной форме можно увидеть в львиной доле исследований. Нельзя сказать, что томография не заслуживает такой популярности – ведь с её помощью мы можем заглянуть в работающий мозг безо всяких операций, да и результаты томографического сканирования, на первый взгляд, выглядят гораздо более понятными, нежели, например, серии угловатых линий, которые выдаёт электроэнцефалографический аппарат.
В случае с мозгом обычно говорят о функциональной МРТ, и принцип её достаточно прост: мозг расходует энергию, и чем активнее он работает, тем больше кислорода и питательных веществ ему требуется. И кислород, и питательные вещества приносит кровь, с другой стороны, разные части мозга решают разные задачи – то есть, если мы проследим, где кровоток интенсивнее, то поймём, как мозг справляется с той или иной проблемой. МРТ-сканер как раз тем и занимается, что оценивает мозговое кровоснабжение.
Даже для неспециалиста понятно, сколько всего мы можем таким образом узнать о живом мозге. Но со временем к методу стали накапливаться вопросы – оказалось, что иногда фМРТ видит того, чего нет. Чтобы понять, как такое возможно, нужно более детально присмотреться к тому, как работает фМРТ.
Аппарат рассматривает мозг как огромное число мельчайших точек, или вокселей (объёмных пикселей) – активность измеряется в каждом вокселе, и чем их больше, тем выше разрешающая способность метода. (Здесь стоит подчеркнуть, что воксели не равны нейронам, и в одном вокселе содержится очень много нервных клеток.)
Однако потом воксели нужно как-то сложить обратно в мозг. Этим занимаются специальные программы, которые сравнивают точечную активность, оценивая, насколько разные воксели похожи или не похожи друг на друга. Без аналитической программы никакого фМРТ не будет, но, как оказалось, именно программное обеспечение часто выступает слабым звеном. Несколько лет назад исследователи из Калифорнийского университета в Санта-Барбаре вместе с коллегами из Колледжа Вассара сообщили, что с помощью томографа им удалось обнаружить активность в мозге мертвого лосося.
Однако, по словам самих авторов, в случае с лососем было бы достаточно улучшить статистическую обработку данных. А вот авторы свежей статьи в PNAS делают более фундаментальный вывод: они полагают, что во избежание ложноположительных результатов в фМРТ следовало бы исправить сами основы обработки данных.
Андерс Эклунд (Anders Eklund) и его коллеги из Университета Линчёпинга и Уорикского университета воспользовались открытыми данными фМРТ, выполненных для самых разных целей. Обычно, когда хотят посмотреть, как, скажем, какая-нибудь болезнь влияет на работу мозга, то сканы мозга больных сравнивают со сканами мозга здоровых: особенности в работе мозга у больных людей видны в сравнении со здоровыми, и эти особенности мы считаем как-то связанными с болезнью.
Но на сей раз всё было иначе: для проверки метода брали только результаты, полученные от контрольных групп, то есть только от здоровых людей. Всего в эксперименте «участвовали» несколько сотен человек – мы ставим слово «участвовали» в кавычки, потому что, повторим, никаких новых фМРТ сканов тут уже не делали, а просто использовали открытые данные, сравнивая их друг с другом. Всего таких сравнений, при разных программных параметрах, сделали 3 млн; цель же была в том, чтобы понять, будет ли одна норма отличаться от другой.
Для анализа использовали несколько разных программных пакетов, применяемых в современных фМРТ-методиках. От программ здесь требуется не только увидеть изменения в активности вокселей (то есть «мозговых точек»), но и определить, похожим ли образом меняется их активность. То есть, например, две более-менее соседние точки могут обе одновременно наращивать активность, но одна будет это делать так, а другая – иначе, и обобщать их тогда нельзя. Если же в обоих темп, характер, рисунок изменений одинаков, то оба вокселя можно объединить вместе, а к ним потом добавить ещё один, и ещё – и в результате получится кластер.
Программные пакеты, как оказалось, вполне хорошо чувствуют изменения в отдельных вокселах, но при том слишком вольно их кластеризуют; иными словами, алгоритм, сравнивающий характер изменений разных точек на предмет их сходства, нередко совершенно напрасно объединяет их вместе. В результате на фМРТ-скане может появиться, например, активно работающая область мозга, в которой на самом никакой дружной активности нет, и случится так не потому, что мозг у разных людей работает по-разному, а потому, что так посчитала программа.
Считается, что вероятность ложноположительной ошибки тут не превышает 5%, однако на деле авторы работы видели ошибку в среднем заметно большую (в самом выдающемся случае отличия достигли 60% – именно на столько один нормальный мозг отличался от другого), и всё благодаря неточно работающему программному алгоритму.
В целом, по словам исследователей, если проблему исправить, то точность измерений возрастёт более чем на 10%. Здесь следует учесть, что на разных зонах программы работали с разной точностью, и где-то ошибка оказывалась в среднем больше, где-то меньше, в зависимости от конкретной морфологии той или иной части мозга.
Возникает вопрос, что делать со всеми теми работами, которые годами выполнялись с помощью вот таких вот странных алгоритмов, и не следует ли сейчас всё срочно перепроверить. Тут, однако, можно заметить, что в науке вообще прежние результаты часто перепроверяются новыми исследовательскими группами, которые начинают работать в том же направлении, так что коррекция фМРТ-результатов, вероятно, так или иначе произойдёт – главное, чтобы в этот метод сейчас поскорее были внесены коррективы.