Исследование методов поиска гендерных различий функциональной коннективности фМРТ покоя у здоровых людей среднего возраста © С.И. Прийменко Московский государственный университет им. М.В. Ломоносова Москва, Россия mior12@mail.ru Аннотация исследуются подходы, позволяющие находить связи отделов головного мозга [2]. Одним из направлений В настоящее время в нейрофизиологии накопились поиска связей в мозге является исследования людей, большие наборы данных, полученные с помощью находящихся в состоянии покоя. В статье [15] фМРТ. Несмотря на это, технологии для рассматривается поиск функциональной связности масштабируемого анализа больших объемов данных состояния покоя у 24 мужчин и 17 женщин, редко используются в данной сфере. В этой работе участвовавших в военных действиях и получивших описаны методы для поиска и проверки гипотез о черепно-мозговую травму. В работе [18], гендерных различиях функциональной связности проводились исследования для поиска различий фМРТ у здоровых людей среднего возраста, функциональной связности 13 людей, страдающих находящихся в состоянии покоя. Данные методы болезнью Альцгеймера и 13 здоровых людей. отличаются от стандартных методов тем, что в них Функциональная связность – это связь между используются различные способы уменьшения областями мозга, которые разделены размерности пространства данных с потерей функциональными свойствами. Она рассматривает наименьшего количества информации. В работе отклонения от статистической независимости между также представлены данные проекта Human распределенными и возможно пространственно Connectome Project (HCP) и анализ формата nifti, в удаленными нейронными единицами [13]. котором находятся эти данные. Предоставлен В работах [15, 18] анализировались относительно полный поток работ, который описывает все небольшие выборки данных, что является действия для нахождения связности участков препятствием к обобщению полученных знаний. головного мозга. Кроме того, для выполнения таких задач не Работа частично поддержана РФФИ (гранты 14- требуются большие вычислительные ресурсы и 07-00548, 16-07-01028). платформы. В работе [3] приводится всего 3 работы фМРТ (функциональная магнитно-резонансная 1 Введение томография), связанные с платформами для анализа больших объемов данных. С увеличением числа В современном мире в разных областях науки накопленных данных неминуемо потребуется наблюдается экспоненциальный рост данных [14, планирование архитектуры программного 19]. Для анализа больших объемов данных обеспечения и выбор алгоритмов эффективных по разработано множество специализированных памяти и времени выполнения. инструментов, которые в первую очередь Данная работа направлена на рассмотрение ориентированы на структурированные данные, но методов для поиска функциональной связности все чаще адаптированы и для более общих форм людей, находящихся в состоянии покоя, проекта данных. HCP. Из-за большого количества данных, В том числе это применимо и в нейрофизиологии, стандартные способы нахождения функциональных где в настоящее время активно развивается связей людей в состоянии покоя вычислительно направление нейровизуализации, которая позволяет затруднительны и нуждаются в огромных объемах визуализировать структуру, функции и памяти. Поэтому, также основной целью данной биохимические характеристики мозга. В частности работы является нахождения аппроксимирующих методов, а также полное описание потока работ. Труды XVIII Международной конференции В разделе 2 описываются данные и вводятся DAMDID/RCDL’2016 «Аналитика и управление необходимые определения. Далее в 3 представлен данными в областях с интенсивным обзор методов для поиска и проверки гипотез. В использованием данных», Ершово, 11-14 октября разделе 4 описывается формат данных проекта HCP. 2016 В 5 приводятся поток работ. И в разделе 6 266 подводится итог существующих путей решения большую связность между левыми и правыми нахождения функциональный связей мозга, а также частями мозжечка и правой верхней теменной формулируются дальнейшие шаги развития данной областью, а также между правой частью мозжечка и задачи. правой затылочной серединной областью. У мужчин была повышенная связность между левой и правой 2 ФМРТ покоя проекта HCP лобной частью и височной областью и увеличенная В 2010 году стартовал проект Human Connectome связность между правой лобной частью и левой Project [14]. Его основной целью является островковой частью. Однако, из-за маленького составление карты связности человеческого мозга с размера выборки данная гипотеза нуждается в максимально возможной точностью. Всего в проекте дальнейшей проверке на больших объемах данных. планируется исследовать более 1200 здоровых Одной из задач статьи является описать процедуру взрослых людей и разместить эти данные в проверки описанной гипотезы на данных проекта свободном доступе. На данный момент были HCP (здоровые люди среднего возраста, около 900 получены фМРТ снимки для 900 человек в возрасте человек). 20-35 лет. Далее в работе будут рассмотрены только данные ФМРТ покоя (rfMRI) [8]. 3 Обзор методов для поиска гипотез Данные rfMRI были получены в результате функциональной связности проведения четырех сессий общей длиною 60 минут. 3.1 Методы построения гипотез В каждой из сессий пациент находился в затемненной комнате с открытыми глазами в Данные каждого субьекта могут быть расслабленном состоянии. После этого, полученные представлены в виде матрицы Y(t×v) , где каждая данные были очищены от различных шумов строка представляет набор вокселей головного мозга (движение головы, дыхание, сердцебиение) и в конкретный момент времени, а каждый столбец – нормированы. В результате данные представляют из временной ряд для соответствующего вокселя. себя около 900 наборов данных, в которых Перед тем как применить пространственное содержатся информация о пространственных и разложение методом независимых компонент (ICA) временной координатах и значениях вокселей для [1], к данным применяется метод главных компонент головного мозга [20]. (PCA) или сингулярное разложение, Изображения были получены со следующими представляющие данные так: параметрами: период цикла съемки – 720 мс, 𝑇𝑇 𝑌𝑌(𝑡𝑡×𝑣𝑣) ≈ 𝑈𝑈(𝑡𝑡×𝑛𝑛) × 𝑆𝑆(𝑛𝑛×𝑛𝑛) × 𝑉𝑉(𝑛𝑛×𝑣𝑣) , толщина слоя – 2 мм и общее количество слоев – 72 где n – количество компонент, причем обычно это штуки. количество меньше, чем t, U - это набор временных ФМРТ [9, 16] позволяет представить мозг в виде собственных векторов, V - набор пространственных нарезки набора вокселей, где каждому вокселю собственных векторов и S - диагональная матрица соответствует временной ряд. ФМРТ показывает собственных значений. Метод главных компонент информацию об изменениях кровотока, которые применяется к матрице V, оценивая новый набор сопровождают нейронную активность с пространственных отображений, которые являются относительно высоким пространственным линейными комбинациями отображения в V и разрешением, поэтому хорошо подходит для поиска максимально независимы друг от друга. функциональной связности [6][21]. Этот процесс В случае анализа нескольких субъектов основан на связи мозгового кровотока и активности происходит построчная конкатенация всех s наборов и называется BOLD-сигнал [2]. испытуемых и применяется метод главных Одной из частых задач является вычисление компонент, а затем метод независимых компонент, функциональной связности между всеми элементами как описывалось выше. Полученный результат после системы, независимо от того, есть ли прямые использования метода главных компонент будет структурные связи этих элементов. Статистические таким же приближением, как и выше, но теперь закономерности между нейронными элементами набор пространственных собственных векторов колеблются от десятков или сотен миллисекунд. будет иметь размерность 𝑛𝑛 × 𝑠𝑠. В последние годы проводится большое Данные фМРТ состояния покоя проекта Human количество исследований функциональных связей Connectome Project требуют анализа, который путем измерения разности между значениями проблематично выполнять из-за большого вокселей временных рядов в разные моменты количества сложно-структурированных данных. В времени в различных областях мозга. Целью этих статье [17] представлено сравнение двух подходов исследований является получение новых выводов о для применения метода главных компонент на функциональных связях конкретных областей мозга уровне групп: MIGP — MELODIC's Incremental [10]. В статье [15] рассматривается гипотеза о Group-PCA [5] и SMIG — Small-Memory Iterative различии в паттернах орбифронтальной Group-PCA [11]. функциональной связности у женщин и мужчин- MIGP является итерационным подходом, ветеранов с черепно-мозговыми травмими. В который обеспечивает близкое приближение к результате проведенного эксперимента эта гипотеза подходу с построчной конкатенацией данных с была подтверждена, так как женщины показали последующим применением метода независимых 267 компонент, но без больших требований к памяти. сократить вычисление значения корреляции, не Высокая точность достигается за счет сокращения потеряв основную информацию о связях. наборов данных отдельных испытуемых с малым количеством главных компонент. Поэтапный подход 3.2 Статистические методы проверки гипотез сохраняет внутреннее PCA пространство m Для данной задачи нулевая гипотеза задается взвешенных пространственных собственных следующим способом: 𝐻𝐻0 : 𝜌𝜌 = 0 коэффициент векторов, где m обычно больше, чем количество корреляции равен нулю для всех областей мозга. временных точек в каждом отдельном наборе. Под После выполнения seed-based корреляции, для взвешенностью понимается то, что каждый статистической проверки гипотезы следует пространственный собственный вектор умножается выполнить преобразование Фишера (так называемое на соответствующее собственное значение. Фишер z-преобразование), применяемый к Окончательный набор m компонент может быть коэффициенту корреляции. уменьшен до требуемой размерности n отбрасыванием остальных компонент. Преобразование Фишера определяется как SMIG – метод, который поворачивает матрицу 1 1 + 𝑟𝑟 данных для каждого субъекта с помощью вращения, 𝑧𝑧 ∶= 𝑙𝑙𝑙𝑙 � � = 𝑎𝑎𝑎𝑎𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐ℎ(𝑟𝑟) 2 1 − 𝑟𝑟 полученного из корреляции исходной матрицы После использования преобразования Фишера на данных и матрицы данных усредненной группы. Для выходе получается величина, плотность всех субъектов, повернутые матрицы могут быть распределения которой приближенно является усреднены, и PCA применяется без необходимости гауссовой. В случае, когда значения входных данных конкатенации данных, но необходимо совершить два близки к среднему, масштабирующий множитель прохода по всем исходным данным. близок к единице (участок графика для |X|<0.5). С Оба метода дают близкое приближение к методу другой стороны, для нормализованных значений на главных компонент, примененному к полной границах интервала масштабирующий множитель матрице, полученной в результате конкатенации по больше и выходные значения увеличиваются больше строке всех отдельных наборов данных. После (участок для 0.5<|x|<1). применения этих алгоритмов к данным применяется После преобразования Фишера, для каждого z метод независимых компонент и seed-based. проводится однохвостовый t-test и по нему Seed-based [12] анализ функциональной принимаются или отвергаются гипотезы. Если связности между вокселями x1 и x2 можно определить значение p-value < 0.05, то нулевая гипотеза как отвергается. ∑𝑇𝑇 𝑡𝑡=1 𝑆𝑆(𝑥𝑥1 ,𝑡𝑡)×𝑆𝑆(𝑥𝑥2 ,𝑡𝑡) 𝐶𝐶𝑆𝑆𝑆𝑆 (𝑥𝑥1 , 𝑥𝑥2 ) = , �∑𝑇𝑇 2 𝑇𝑇 2 𝑡𝑡=1 𝑆𝑆 (𝑥𝑥1 ,𝑡𝑡)�∑𝑡𝑡=1 𝑆𝑆 (𝑥𝑥2 ,𝑡𝑡) 4 Данные где S(x, t) – аппроксимирует BOLD сигнал для В качестве данных используются данные фМРТ вокселя x в момент времени t и T – количество состояния покоя (rfMRI) проекта Human Connectome временных точек в эксперименте. Знаменатель – Project [14]. коэффициент нормализации, который можно в Данные представлены в формате NIFTI [4]. В нем данном случаи игнорировать. хранятся временные ряды вокселей в относительных BOLD сигнал можно разложить на компоненты координатах. Для получения мировых координат (функциональные сети), каждый из которых используется заголовок, в котором лежат содержит пространственный параметр и временную необходимые данные для преобразования. В метку заголовке nifti-формата первые три измерения 𝑆𝑆(𝑥𝑥, 𝑡𝑡) = ∑𝐾𝐾 𝑘𝑘=1 𝑀𝑀𝑘𝑘 (𝑥𝑥)𝐴𝐴𝑘𝑘 (𝑡𝑡), зарезервированы для определения трех где K – число независимых компонент, Mk – пространственных координат, в то время как пространственное отображение компоненты k-ой четвертое используется для определения моментов компоненты, Ak - временное отображение k-ой времени. Остальные измерения с 5 по 7 компоненты. В итоге, можно получить уравнение: предназначены для других целей. Для ∑𝑘𝑘 𝑀𝑀𝑘𝑘 (𝑥𝑥1 )𝑀𝑀𝑘𝑘 (𝑥𝑥2 ) ∑𝑇𝑇 2 𝑡𝑡=1 𝐴𝐴𝑘𝑘 (𝑡𝑡) совместимости, формат заголовка файла имеет 𝐶𝐶𝑆𝑆𝑆𝑆 (𝑥𝑥1 , 𝑥𝑥2 ) = + размер 348 байт. �∑𝑇𝑇 2 𝑇𝑇 2 𝑡𝑡=1 𝑆𝑆 (𝑥𝑥1 ,𝑡𝑡)�∑𝑡𝑡=1 𝑆𝑆 (𝑥𝑥2 ,𝑡𝑡) Поле dim_info хранит в одном байте направление ∑𝑘𝑘≠𝑙𝑙 ∑𝑙𝑙≠𝑘𝑘 𝑀𝑀𝑘𝑘 (𝑥𝑥1 )𝑀𝑀𝑘𝑘 (𝑥𝑥2 ) ∑𝑇𝑇 𝑡𝑡=1 𝐴𝐴𝑘𝑘 (𝑡𝑡)𝐴𝐴𝑙𝑙 (𝑡𝑡) кодирования частоты, направления кодирования , �∑𝑇𝑇 2 𝑇𝑇 2 фазы и направление разреза на слои. 𝑡𝑡=1 𝑆𝑆 (𝑥𝑥1 ,𝑡𝑡)�∑𝑡𝑡=1 𝑆𝑆 (𝑥𝑥2 ,𝑡𝑡) Поле dim содержит размер матрицы изображения. где первое слагаемое является суммой в сети в Первый элемент содержит количество измерений (1- пределах связности, а второе слагаемое является 7). Если его значение не лежит в этом диапазоне, суммой между связностями. предполагается, что данные имеют обратный 𝐶𝐶𝑆𝑆𝑆𝑆 (𝑥𝑥1 , 𝑥𝑥2 ) = 𝑇𝑇𝑇𝑇𝑡𝑡𝑡𝑡𝑡𝑡 𝑊𝑊𝑊𝑊𝐶𝐶 + 𝑇𝑇𝑇𝑇𝑡𝑡𝑡𝑡𝑙𝑙 𝐵𝐵𝐵𝐵𝐶𝐶 . порядок байт. Второй, третий и четвертый элемент Для решения задачи поиска связности между отвечают за обозначения пространства (x, y, z), а различными удаленными компонентами возможно пятый элемент отвечает за пространство времени t. не учитывать значение Total WNC, тем самым Остальные размерности могут использоваться как 268 угодно. Каждое i-ое поле (1-7) содержит 4.2 Метод 2 положительное целое число, обозначающие длину i- го измерения. Второй метод используется для указания координат сканера. Он также может быть использован для Поле intent_code является целым числом, которое выравнивания изображения на предыдущей сессии описывает данные. Некоторые требуют одного и того же субъекта. Для компактности и дополнительных параметров, которые содержатся в простоты информация хранится в виде кватернионов полях intent_p*, которые могут быть применены к (a, b, c, d), которые хранятся в полях quatern_b, изображению какое-то время или к 5-у измерению, quatern_c, quatern_d. Первый кватернион если там хранится значение вокселя. В этом поле могут быть как статистические, так и выражается через остальные по формуле: 𝑎𝑎 = нестатистические данные. √1 − 𝑏𝑏 2 − 𝑐𝑐 2 − 𝑑𝑑2 . С помощью них строится Поля полей slice_code, slice_start, slice_end и матрица поворота: 𝑎𝑎2 + 𝑏𝑏2 − 𝑐𝑐2 − 𝑑𝑑2 2(𝑏𝑏𝑏𝑏 − 𝑎𝑎𝑎𝑎) 2(𝑏𝑏𝑏𝑏 + 𝑎𝑎𝑎𝑎) slice_duration полезны для хранения информации о тайминге fMRI и должны использоваться с полем 𝑅𝑅 = � 2(𝑏𝑏𝑏𝑏 + 𝑎𝑎𝑎𝑎) 𝑎𝑎2 + 𝑐𝑐2 − 𝑏𝑏2 − 𝑑𝑑2 2(𝑐𝑐𝑐𝑐 − 𝑎𝑎𝑎𝑎) � . dim_info, который содержит поле slice_dim. Если, и 2(𝑏𝑏𝑏𝑏 − 𝑎𝑎𝑎𝑎) 2(𝑐𝑐𝑐𝑐 + 𝑎𝑎𝑎𝑎) 𝑎𝑎2 + 𝑑𝑑2 − 𝑏𝑏2 − 𝑐𝑐2 только если, поле slice_dim отлично от нуля, то Эта матрица поворота вместе с размерами вокселя и slice_code имеет несколько возможных положений сдвигом определяют мировые координаты: слоев. 𝑥𝑥 𝑖𝑖 𝑝𝑝𝑝𝑝𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥[1] 𝑞𝑞𝑞𝑞𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑡𝑡_𝑥𝑥 �𝑦𝑦� = 𝑹𝑹 � 𝑗𝑗 � ⨀ �𝑝𝑝𝑝𝑝𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥[2]� + �𝑞𝑞𝑞𝑞𝑓𝑓𝑓𝑓𝑓𝑓𝑒𝑒𝑡𝑡_𝑦𝑦�, Поле slice_start и slice_end сообщают, какой слой 𝑧𝑧 𝑞𝑞 ∗ 𝑘𝑘 𝑝𝑝𝑝𝑝𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥[3] 𝑞𝑞𝑞𝑞𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑡𝑡_𝑧𝑧 является первым, а какой последним, которые получаются после снимков МРТ. Все слои, где ⨀ – снова, произведение Адамара, а q = pixdim[0], присутствующие в изображении и не входящие в равный либо 1, либо -1. этот диапозон, рассматриваются как подбитые слои (обычно заполненные нулями). Slice_duration 6.3 Метод 3 указывает количество времени, необходимое для Использует аффиную матрицу, сохраненную в обработки одного слоя. srow_*[4], которая отображает воксельный Размер каждого вокселя хранится в pixdim[8] и координаты в мировые: каждый его элемент соответствует полю dim. Однако первый элемент имеет особое значение, которое 𝑥𝑥 𝑖𝑖 𝑠𝑠𝑠𝑠𝑜𝑜𝑜𝑜_𝑥𝑥[0] 𝑠𝑠𝑠𝑠𝑜𝑜𝑤𝑤_𝑥𝑥[1] 𝑠𝑠𝑠𝑠𝑜𝑜𝑜𝑜_𝑥𝑥[2] 𝑠𝑠𝑠𝑠𝑜𝑜𝑜𝑜_𝑥𝑥[3] равно либо 1 или -1. Информация про единицы 𝑦𝑦 𝑗𝑗 � 𝑧𝑧 � = �𝑠𝑠𝑠𝑠𝑜𝑜𝑜𝑜_𝑦𝑦[0] 𝑠𝑠𝑠𝑠𝑜𝑜𝑜𝑜_𝑦𝑦[1] 𝑠𝑠𝑠𝑠𝑜𝑜𝑜𝑜_𝑦𝑦[2] 𝑠𝑠𝑠𝑠𝑜𝑜𝑜𝑜_𝑦𝑦[3]� ∙ � � . измерения хранится в поле xyzt_units, который может 𝘎𝘎𝘎𝘎𝘎𝘎𝑤𝑤_𝑧𝑧[0] 𝑠𝑠𝑠𝑠𝑜𝑜𝑜𝑜_𝑧𝑧[1] 𝑠𝑠𝑠𝑠𝑜𝑜𝑜𝑜_𝑧𝑧[2] 𝑠𝑠𝑠𝑠𝑜𝑜𝑜𝑜_𝑧𝑧[3] 𝑘𝑘 1 1 быть закодирован для различных измерений. Основное преимущество формата Nifti состоит в Отличие от второго метода, который отображает том, что он может хранить информацию об воксельные координаты в мировые координаты ориентации пространства. В стандартном файле сканера или выравнивает изображения одного и того предполагается, что каждая воксельная координата же субъекта, 3 метод используется для соответствует центру каждого вокселя. Мировые преобразования в какое-то стандартное мировое координаты системы являются следующими: x – ось, пространство, например Talairach или MNI. В этом направленная поперек человеческой головы, y – ось, случае начало системы координат (0, 0, 0) находится вдоль головы и z – вверх головы. Создатели данного на передней спайки мозга. формата разработали три метода для трансформации из воксельных координат в мировые. Первый метод 5 Поток работ поддерживает совместимость формата с форматом Analyze. Другие два метода используются для разных Для решения задачи поиска функциональной систем координат. В полях qform_code и sform_code связности был специфицирован поток работ (см. Рис. задается нужный метод. 1). Далее описана каждая задача потока работ. Важным уточнением является, что данные 4.1 Метод 1 предзагружены в HDFS [7]. 1. loadData. Данные каждого субъекта загружаются Мировые координаты определяются путем в отдельный набор данных, где строки масштабирования по воксельной координате: представляют значение вокселей в конкретный момент времени, а столбец значения 𝑥𝑥 𝑖𝑖 𝑝𝑝𝑝𝑝𝑥𝑥𝑥𝑥𝑥𝑥𝑚𝑚[1] соотвествующих вокселей во временном ряде. �𝑦𝑦� = � 𝑗𝑗 � ⨀ �𝑝𝑝𝑝𝑝𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥[2]�, 2. splitGender. После загрузки данных, с помощью 𝑧𝑧 𝑘𝑘 𝑝𝑝𝑝𝑝𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥[3] csv файла, который отдельно доступен в HCP, можно получить дополнительные факторы про где ⨀ - произведение Адамара. каждого субъекта, такие как пол, возраст, доход, образование, IQ, вредные привычки и т.д. Для разделения объектов по половому признаку используется параметр возраст. 269 Рисунок 1 Описание потока работ 3. runMigp. Далее, отдельно для набора данных уменьшают размерность данных таким образом, мужчин и женщин запускается алгоритм MIGP чтобы было потеряно наименьшее количество [5]. Этот алгоритм основан на итерационном информации. Для проверки гипотез приводится применении PCA. Алгоритм выполняется обзор классических статистических подходов. В параллельно в разных потоках, что позволяет статье также описаны основные поля nifti-формата и эффективнее производить вычисления. работа с ними, составлен и представлен поток работ 4. concatenateData. После завершения алгоритма с кратким описанием каждого шага. MIGP, на выходе получается единственный набор В дальнейшем планируется разработать данных, состоящих из n собственных векторов, архитектуру программного обеспечения, провести имеющих наибольшие собственные значения. эксперименты на данных проекта HCP для проверки гипотезы, представленной в статье [15], и определить 5. runICA. Метод независимых компонент гендерные различия функциональной связности принимает набор собственных векторов, здоровых людей между разными регионами мозга. полученных на предыдущем этапе и возвращает вектора, которые максимально статистически независимы друг от друга. Благодарность 6. runSeedBasedCorrelation. ICA алгоритм Автор статьи выражает благодарность Н.В. апроксимирует BOLD-сигнал, в связи с этим его Пономаревой и Д.Ю. Ковалеву за предоставленную можно разложить на пространственные и идею. временную компоненты и рассматривать корреляцию только между внешними компонентами связей мозга. Литература 7. transformateFisher. Для применения [1] Christian F. Beckmann, Marilena DeLuca, Joseph T. статистического теста, к полученным значениям Devlin and Stephen M. Smith. Investigations into корреляции применяется преобразование Resting-state Connectivity using Independent Фишера, который отображает интервал в Component Analysis. Philosophical transactions of интервал . the Royal Society of London, 360(1457), May 2005, p. 1001-1013. 8. runtTest. Статистический тест Стъюдента принимает z-value, полученные после [2] B.B. Biswal, J. Van Kylen, J.S. Hyde. Simultaneous преобразования Фишера и возвращает значение assessment of flow and BOLD signals in resting- p-value. state functional connectivity maps. NMR in Biomedicine, 1997, 10, p.165-170. 9. selectComponent. После получения значения p- [3] Roland N. Boubela, Klaudius Kalcher, Wolfgang value, отбираются только те компоненты, для Huf, Christian Našel and Ewald Moser. Big Data которых p-value < 0.05, тем самым отвергая Approaches for the Analysis of Large-Scale fMRI нулевую гипотезу о том, что у данных областей Data Using Apache Spark and GPU Processing: A мозга нет функциональный связей. Demonstration on Resting-State fMRI Data from the Human Connectome Project. Frontiers in Заключение Neuroscience, 9, 2015. В данной работе описаны методы для построения http://journal.frontiersin.org/article/10.3389/fnins.2 гипотез гендерных различий функциональной 015.00492/full связности данных фМРТ состояния покоя проекта [4] Hester Breman. Diagrams of the NIfTI-1.1 file HCP. Для вычисления функциональной связности structure. http://nifti.nimh.nih.gov/nifti- вначале используется метод корреляции seed-based. 1/documentation/nifti1diagrams_v2.pdf. В силу большого количества данных проекта HCP [5] V. Calhoun, T. Adali, G. Pearlson and J. Pekar. A перед корреляцией необходимо уменьшить method for making group inferences from functional размерность пространства данных. В статье MRI data using independent component analysis. рассмотрены методы MIGP и SMIG, которые Hum. Brain Mapp,;14(3), 2001, p. 140–151. 270 [6] K. J. Friston. Functional and Effective connectivity: Proceedings of European Magnetic Resonance a review. Brain Connectivity, 1(1), June 2011.p. 13- Forum. November 2014. 36. [17] S.M. Smith, A. Hyvärinen, G. Varoquaux, K.L. [7] HDFS Architecture Guide. Miller,C.F. Beckmann. Group-PCA for very large https://hadoop.apache.org/docs/r1.2.1/hdfs_design. fMRI datasets. Neuroimage, November 2014, 101, html. p. 738-749. [8] M.P. van den Heuvel, H.E. Hulshoff Pol. Exploring [18] Liang Wang, Yufeng Zang, Yong He, Meng Liang, the brain network: A review on resting-state fMRI Xinqing Zhang, Lixia Tian, Tao Wu, Tianzi Jiang functional connectivity. European and Kuncheng Li. Changes in hippocampal Neuropsychopharmacology, August 2010, 20(8), p. connectivity in the early stages of Alzheimer's 519-534. disease: Evidence from resting state fMRI. [9] S. A. Huettel, A. W. Song, G. McCarthy. Functional Neuroimage,31(2), June 2006, p. 496-504. Magnetic Resonance Imaging . Sunderland, MA: [19] Large Synoptic Survey Telescope (LSST) project. Sinauer Associates, Inc, 2- edition, 2009. Opening a window of discovery of the dynamic [10] Alexander G. Huth, Wendy A. de Heer, Thomas L. universe. http://www.lsst.org. Griffiths, Frederic E. Theunissen and Jack L. [20] WU-Minn HCP 900 Subjects Data Release: Gallant. Natural speech reveals the semantic maps Reference Manual. December 2015. that tile human cerebral cortex. Nature International http://www.humanconnectome.org/documentation/ weekly journal of science, 532(7600), April 2016, p. S900/HCP_S900_Release_Reference_Manual.pdf. 453-458. [21] Ю.А. Селивеሷрстов, Е.В. Селивеሷрстова, Р.Н. [11] Hyvärinen A., Smith S. Computationally efficient Коновалов, М.В. Кротенкова, С.Н. group ICA for large groups. In Proceedings of Иллариошкин. Функциональная магнитно- Annual Meeting of the Organization for Human резонансная томография покоя: возможности и Brain Mapping. 2012. будущее метода. Анналы клинической и [12] Suresh E. Joel, Brian S. Caffo, Peter C.M. van Zijl экспериментальной неврологии, 7(4), 2013, стр. and James J. Pekar. On the relationship between 39-44, Москва. seed-based and ICA-based measures of functional connectivity. Magnetic Resonance in Medicine, Research methods to search for the gender 66(3), September 2011, p. 644–657. differences of functional connectivity of rest [13] A. Martin Lindquist. The Statistical Analysis of fMRI Data. Statistical Science, 23(4), May 2009, state fMRI in healthy middle-aged people 439-464. Sergey Priymenko http://projecteuclid.org/euclid.ss/1242049389 There are a lot of big data sets in neuroimaging that have [14] D. S. Marcus, J. Harwel, T. Olsen, M. Hodge, M. F. been collected by fMRI nowadays. Despite of that, Glasser, F. Prior and D. C. Van Essen. 2011. people barely use Large-Scale algorithms to analyze such Informatics and data mining tools and strategies for data. This article introduces the number of methods to the human connectome project. Front. investigate a difference among functional connectivity of Neuroinform.5. Available at: resting state fMRI by gender for healthy middle-aged http://www.ncbi.nlm.nih.gov/pmc/articles/PMC312 people. These methods differ from conventional methods 7103/ (accessed February 10, 2015). in that they use different approaches for reducing the [15] E. McGlade, J. Rogowska and D. Yurgelun-Todd D. dimensionality data space thus wasting the smallest Sex differences in orbitofrontal connectivity in male amount of information. The article also presents the and female veterans with TBI. Brain Imaging and Human Connectome Project Project (HCP) and the Behavior, 9(3), September 2015, p 535–549. format of the analysis nifti, which contains the data. It [16] A. Peter Rinck. Magnetic Resonance, a critical peer- describes a workflow term that describes all the steps to reviewed introduction; functional MRI. In find connectivity parts of the brain. 271