Авторизация
Авторизируйтесь
X
  • Логин*
  • Пароль *
или зарегистрируйтесь
Регистрация
X
  • Логин
    (3-15 символов)*
  • Пароль
    (6-15 символов)
    *
  • Подтвердите пароль *
Сообщение администратору
X
 
>>

Методы и программные средства для обработки данных электроэнцефалографии

Попова Елена Александровна

Методы и программные средства для обработки данных электроэнцефалографии

Диссертация на соискание ученой степени кандидата физико-математических наук. Москва - 2009

Диссертация | 2009 | Россия | docx/pdf | 5.35 Мб

Для доступа к источнику авторизируйтесь или зарегистрируйтесь.

Внимание! Все источники запакованы в zip архивы! Для распаковки на android-устройствах Вы можете воспользоваться одним из сторонних приложений, например Total Commander



Специальность 05.13.11 - математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
Исследованию проблем, связанных с функционированием человеческого мозга, всегда уделялось большое внимание со стороны специалистов из разных научных областей. Важная роль в решении возникающих задач отводится методам автоматизированной обработки сигналов, измеряемых при изучении человеческого мозга. Одно из важных направлений в изучении человеческого мозга связано с исследованиями его электрической активности, регистрируемой в виде сигнала электроэнцефалограммы (ЭЭГ). Ключевое место в этой проблеме занимает задача локализации источников. Определение зон активности открывает новые возможности для проведения диагностирования и лечения заболеваний, исследования реакций мозга на внешние воздействия, исследования проблем восприятия человеком внешнего мира.
Определение зон активности коры головного мозга при реакциях на различные внешние воздействия широко используется при создании интерфейса мозг-компьютер (Brain-Computer Interface). В нейрофизио-логических исследованиях на основе ЭЭГ проводятся важнейшие эксперименты по выявлению реакции мозга на поступающие образы. Получая оценку функционального состояния работы мозга, нейрофизиологи выявляют принципы и механизмы внутреннего взаимодействия компонент мозга. Практическое внедрение новых программных систем, на основе новых информационных технологий позволяет дать дополнительные новые инструменты для понимания нейрофизиологами проблем восприятия человеком внешнего мира.
Принципиальную роль в этих исследованиях играет автоматизированный анализ данных ЭЭГ.
Нейронная система мозга представляет собой очень сложный объект, содержащий приблизительно 1014 нейронов, которые в совокупности отражают функциональное состояние мозговой активности. Судить о реакции мозга мы можем по измерениям потенциала на поверхности головы, которые являются многомодовыми, т.е. отражают реакцию мозга на
разные сенсорные рецепторы - зрительные, слуховые, ментальные, дви-гательные и др. В полученном экспериментальном сигнале содержится несколько ритмов, которые отвечают за разный тип активности, и результат их взаимодействия. Главной особенностью экспериментальных данных, изучаемых в диссертации, является то, что они получены внешними по отношению к объекту диагностиками. Необходимо определить внутренние источники этих сигналов, чтобы понять модели, лежащие в основе этих данных.
Причиной развития параллельных алгоритмов в задачах локализации источников служат масштабы разрабатываемых моделей человеческого мозга. От общих многослойных моделей исследователи переходят к моделированию максимально приближенным к конкретному испытуемому анатомических структур мозга и описанию более сложных процессов электрической активности, происходящих на микро-уровне. В связи с этим число элементов в рассматриваемой структуре возрастает в несколько раз, что требует увеличения вычислительных ресурсов для микро-моделирования. Создание новых поколений многопроцессорных вычислительных систем, содержащих сотни тысяч процессорных элементов, позволяет ставить новые задачи по прямому моделированию работы мозга.
Все это приводит к необходимости разработки новых алгоритмов и программных комплексов для обработки данных измерений, связанных с активностью и строением мозга. Основное, что предлагается в диссертации - это метод, основанный на использовании ансамблей деревьев решений и программный комплекс, построенный на базе этого метода для поиска источников анализируемых сигналов электрической активности головного мозга.
Цель диссертации.
Разработка алгоритмов и программных средств, реализующих ав-томатизированное построение пространственно-временных карт активности мозга по данным ЭЭГ. Целями диссертации являются:,
1. Разработка алгоритмов и программных средств, реализующих автоматизированное построение пространственно-временных карт активности мозга на основе метода случайных деревьев решений. 
2. Разработка параллельных алгоритмов и программного комплекса ансамблей деревьев решений для автоматизированного анализа больших баз экспериментальных данных исследований мозга на параллельных высокопроизводительных вычислительных системах.
3. Применение разработанных программных средств для анализа оценки функционального состояния мозговой деятельности в нейрофизиологических экспериментах.
Диссертация состоит из введения, трех глав, заключения, списка литературы и приложения, содержащего рисунки.
Первая глава посвящена построению нового метода анализа сигналов ЭЭГ на основе ансамблей деревьев решений. Главной особенностью предложенного метода является сведение задачи локализации нейронных источников внутри мозга к задаче классификации признаков источников с использованием комитета голосующих классификаторов, обученных на входном сигнале ЭЭГ.
Судить об активности мозга можно с помощью нескольких диагностик: получение данных об электрической активности (ЭЭГ), о магнитной активности (МЭГ), измерение электромагнитного отклика атомов водорода на возбуждение их определенной комбинацией электромагнитных волн в постоянном магнитном поле высокой напряженности (МРТ), измерение резонансного поглощения электромагнитной энергии (ЯМР). В диссертации рассматривается метод обработки данных электрической активности мозга.
Электрическая активность регистрируется в виде электроэнцефалограммы (ЭЭГ). Электроэнцефалограммой [2] называется запись слабых (порядка 5-100 //V) электрических потенциалов, генерируемых мозгом. ЭЭГ-сигнал представляет собой разность потенциалов между электродами, размещенными на поверхности головы.
В основе обработки сигнала ЭЭГ лежат две методики. Первая состоит в анализе временных рядов, выделении амплитудно-частотных характеристик ритмов ЭЭГ сигнала, исследовании их корреляции и взаимодействия. Вторая - в нахождении (локализации) активных групп нейронов в мозговой структуре, которые формируют регистрируемый по- 
тенциал на поверхности. В диссертации рассматривается модель нейронной электрической активности, основанная на предположениях о нейронных клетках как источниках (генераторах) электрического тока. Мозг моделируется как некий объемный проводник с неоднородной электропроводностью с имплантированными в него диполями. Прямая задача состоит в вычислении трехмерного электрического поля, создаваемого источниками-диполями [6]-[8]. Полученное решение - потенциал электрического поля на поверхности головы - моделирует измеряемый в эксперименте с помощью электродов потенциал электрического поля. Делая различные предположения о распределении и числе диполей, можно добиваться совпадения экспериментального потенциала с модельным. Обратная задача ЭЭГ состоит в -определении положений источников по измеренным потенциалам на поверхности головы [9]-[11]. Для решения обратной задачи требуется решение большого числа прямых задач [12].
Так как задача является некорректно поставленной (для одного и того же распределения потенциала на поверхности головы существует бесконечно много комбинаций активных дипольных источников), то большинство методов вводят специальные функции и параметры для внесения ограничений па рассматриваемую модель с целью определения единственного решения.
Существует два подхода при решении задачи локализации источников. Первый подход ’’распределенных источников” основан на фиксированном расположении большого числа диполей (около 10000): обратная задача сводится к отысканию их силы тока [9],[13]-[16]. Несмотря на хорошую точность, которую можно достигнуть, рассматривая все возможные зоны внутренней поверхности головы, задача выявления единственной комбинации для большого числа диполей является весьма сложной, и эффективных методов определения единственного решения для такого числа источников не существует. Поэтому большинство подходов используют дополнительные априорные ограничения на рассматриваемую область возможных положений источников [103]. Среди известных подходов можно отметить регуляризационный параметр Тихонова[97], анатомические ограничения расположений диполей на поверхности коры головного мозга [98], исключение из рассмотрения глубинных источников и математические 
ограничения, такие как выбор минимального значения энергии на поверхности или максимума непрерывной производной решения[100]. Статистические подходы, основанные на Байесовском правиле [103] или энтропийном анализе [103], также используют априорную информацию о функциональной роли областей мозга и анатомических ограничениях путем введения вероятностных коэффициентов.
В другом случае, подходе ’’эквивалентного диполя”, задается небольшое число источников (обычно от 1-3) и неизвестными считаются как сила, так и расположения источников. Можно выделить несколько базовых алгоритмов параметрического подхода решения обратной задачи.
Методы, основанные на алгоритме Beamformer [95] выполняют про-странственную фильтрацию сигнала ЭЭГ от датчиков регистрации для классификации активных и неактивных источников. Алгоритм отслеживает сигнал от заданного положения дипольного источника, исключая из рассмотрения другие источники, также требует задания ограничения на значения вектора силы дипольного источника. Активность неусчтойчи- вой и взаимосвязанной нейронной структуры отражается в многомодовом сигнале, который невозможно описать набором независимых одинаковых источников, что является причиной ложных локализаций зависимых истчоников методом LCMV Beamformaer[95].
Известная модель многократной классификации сигнала MUSIC (Multiple Signal Classification) [12] определяет алгоритм поиска источников, являющихся независимыми друг от друга во времени. Алгоритм основан на ’’сканировании” проекции одного дипольного источника на подпространство сигнала. Итеративная процедура локализации заключается в нахождении корреляции между модельным подпространством и подпространсвом данных, которая с свою очередь задается метрикой проекций. Активность, которая не может быть приписана к источнику в фиксированном расположении рассматривается как шум.
Класс алгоритмов, рассматриваемых в диссертации, относится к методам Least-Squares Source Estimation (LSSE, метод наименьших квадратов поиска источника). В данном случае обратная задача сводится к минимизации функционала невязки между модельным и экспериментально измеренным потенциалом. Для минимизации 
функционала приближения используются методы вычислительной математики (адаптированные градиентные методы) [ЮЗ], математической статистики для оценки вероятностных интервалов параметров активных источников [112] , методы случайного поиска (Монте-Карло, генетический алгоритм) [11]. Неединственность решения в случае модели эквивалентных источников также присутствует, поэтому используются ограничения на рассматриваемую область расположения источников, на основе исходного распределения потенциала на поверхности головы и снимков МРТ конкретного человека. Используя LSSE подход, необходимо задавать число локализуемых дипольных источников априори - это является основным его недостатком. Также при рассмотрении многодипольных моделей число вариантов параметров диполей, соотвествующих входному сигналу возрастает экпонентациально, и число ложных обнаружений источников (локальных минимумов) увеличивается. Разработанный в диссертации метод относится к данному классу параметрических алгоритмов с минимальными априорными ограничениями на пространство решений. Недостатками существующих методов LSSE являются: зависимость решения от начального приближения, параметрическая зависимость при регуляризации, определение ложных траекторий движения диполей (искусственное ограничение на изменения положения источников), значительная вычислительная сложность при рассмотрении многодипольных моделей. Стохастические методы поиска минимальной невязки между модельным и экспериментальным сигналом (генетический алгоритм, Монте-Карло) позволяют решить проблемы локальных минимумов, однако при увеличении уровня шума начинают терять эффективность.'
В диссертации предлагается принципиально новый подход решения задачи о локализации нейронных источников. Суть подхода заключается в сведении задачи локализации к задаче классификации. Подход основан на выделении из пространства возможных положений дипольных источников тех диполей, которые дают основной вклад в регистрируемый потенциал. Классификация активных и неактивных источников проводится по задаваемой величине порога ошибки по потенциалу. В качестве модели классификации данных рассматривается комитет го- 
лосующих деревьев решений. Выделение зон активных источников при использовании деревьев решений соответствует построению некоторой кусочно-постоянной функции аппроксимации для приближения экспе-риментального потенциала модельным. Несколько деревьев решений в области мозга образуют пересекающееся зоны, которые ’’голосуют” в результативном выборе победителя-диполя. Построение такого ансамбля деревьев основано на формировании обучающего множества, составленного из вычисления модельного сигнала на поверхности в некоторых случайных позициях диполей. В отличие от ранее предложенных подходов решения обратной задачи ЭЭГ, разработанный подход позволяет за одну итерацию оценить вероятность появления источника в конкретной зоне, а точность локализации зависит от размерности построенного обучающего множества, которое формируется один раз (т.е. его не надо пересчитывать) .
Обучающее множество классификационной модели состоит из случайных возможных активных источников внутри мозга и ошибки приближения ими экспериментального сигнала. Каждый пример в обучающем множестве - это набор диполей, характеризуемый параметрами, включающими координаты и моменты источников. Полное анализируемое множество образов разбивается на независимые подмножества, соответствующие определенному моменту времени в ЭЭГ сигнале. Каждое такое подмножество состоящее из набора образов - диполей, расположенных некоторым способом внутри пространственной области, назовем обучающим множеством. В каждый момент времени имеется набор определенного числа диполей внутри области. Далее эти диполи делятся на два класса - С^С^. К классу С± относятся те диполи, которые дают ошибку в аппроксимации экспериментальных данных меньшую некоторого заданного порога eth по потенциалу £th [П]- К классу С2 относятся все остальные. По сформированному обучающему множеству строится ансамбль классификаторов, который основан на алгоритме Random Forest [21]. Random Forest один из наиболее многосторонних алгоритмов классификации данных известный в области Машинного Обучения.
В настоящее время можно выделить три основных метода построения ансамбля деревьев решений для задач классификации данных. Это Bagging [22], Random Forest [23] и Boosting [25]. Так же существует мно- 
жество их модификаций, каждая из которых в какой-то степени улучшает созданные методы построения. Алгоритм построения дерева решений можно найти в работе [26], некоторые детали построения дерева решений будут обсуждены в этой главе. Одно из основных достоинств деревьев решений это обработка данных разного типа, а также данных, имеющих нетривиальные связи. Например, алгоритм CART (classification and regression trees) [24] основан на вероятностном структурировании данных. Очередной признак для построения дерева выбирается, основываясь на критерии минимальной энтропии. Такой принцип моделирования оказывается широко распространенным при построении моделей предсказания. При этом дерево решений дает грубую кусочно-постоянную аппроксимацию данных, устойчивую к шуму. В последнее время деревья решений находят свое применение не только в задачах прогнозирования, но также при обработке сигналов, распознавании изображения и текста, разработке системы безопасности, моделировании лекарственных препаратов и т.д.
Обобщая все существующие алгоритмы формирования ансамбля деревьев решений, процесс построения классификатора такого типа можно разделить на два этапа: это обучения каждого дерева в ансамбле и объединение всех деревьев в единый ансамбль. Выделяют две концепции обучения ансамбля. Первая, когда все члены ансамбля строятся последовательно, вторая, когда они строятся параллельно. К первому классу относится алгоритм Adaboost [25], который строит последовательность ансамблей деревьев решений, где обучающее множество каждого из них формируется на основе примеров, которые были неверно классифицированы предыдущем ансамблем. К этому классу также можно отнести алгоритмы Агс-х4 [27], fBoost [28], MiniBoost [29], MultiBoost [30], и т.д. К классу параллельно обучающихся деревьев относится Bagging [22], который формирует множества обучающих векторов для каждого дерева ансамбля путем селекции с замещением. Другими алгоритмами, отно-сящимися к данному подходу, являются SEQUEL [31], Wagging [32], р- Bagging [33], GASEN [32], random subspaces [34], random forests [23], и randomized C4.5 [35] и т.д.
Основными параметрами при построении ансамбля деревьев решений являются: 
• исходная размерность задачи, которая диктует выбор соответствующего метода. В случае использования всего исходного множества примеров для построения каждого дерева решений ошибка клас- сифкации будет меньше, чем ошибка на подмножестве данных. С другой стороны, разбиение на подмножества исходного пространства, позволит четко разбить задачу на независимые подзадачи, минимизировать память для хранения обучающей выборки для построения каждого дерева [23,35-37].
I
• критерий выбора следующего признака для разбиения при построении дерева решения. Этой проблеме посвящено достаточно много работ, так как она является важным параметром, влияющим на скорость работы алгоритма и его обобщающую способность. Можно выделить три принципа выбора признака для разбиения: вероятностный, случайный и смешанный [39]. Наиболее распространенными вероятностными методами [40] являются критерий Gini, который используется в С4.5 и CART, towing splitting rule для бинарных задач, Boolean splitting, impurity function и др [42], [43].
• критерий остановки построения дерева решений. В качестве критерий обычно выбирается несколько вариантов: ограничить глубину дерева, оценить число возможных ответвлений на каждом этапе формирования узла дерева, алгоритмом “отсечения ветвей” сократить дерево после его полного построения, ограничить число признаков, участвующих в построении каждого узла дерева.
• функция голосования деревьев в ансамбле. Среди существующих подходов можно выделить несколько: использовать весовые коэффициенты для деревьев ансамбля [44], основываясь на априорных оценках общей ошибки классификации [45], эволюционные алгоритмы отбора деревьев в итоговый ансамбль [47], случайный выбор деревьев [46].
• число деревьев в ансамбле. Автоматическое определение оптимального числа деревьев в лесу проводится [48], путем введения двух обучающих множеств, что делает задачу непараметризованной. С помощью первого множества 
отсекается часть деревьев, с помощью второго оценивается обобщающая способность классификатора. Например, в работе [49] объединяются несколько ансамблей, построенных разными алгоритмами (Boosting, Bagging, Random Forest и т.д.) в один решающий ансамбль путем введения ортогональных деревьев решений.
Специфика решаемой прикладной задачи определяет эффективность выбранного алгоритма построения ансамбля деревьев решений и возможных параметров построения каждого дерева. Решение задачи классификации в рамках проблемы локализации источников позволяет выделить в пространстве признаков (параметров дипольных источников) те подпространства, которые отвечают активным зонам с некоторой вероятностью. Пресечение всех подпространств положений источников и выбор сочетания областей, минимизирующих функцию ошибки, дает итоговое решение задачи локализации.
В главе приводится решение модельной обратной задачи ЭЭГ по выше предложенным алгоритмам локализации нейронных источников. Постановка модельной задачи состоит в выборе некоторых параметров диполей, для которых можно найти аналитические, точные значения потенциала на поверхности сферы. Эти значения называются квазиреаль- ным экспериментом. Вычисленные значения потенциала зашумляются по параметру Vy Проводится анализ результатов работы алгоритма на входном сигнале квазиреального эксперимента. В результате определяются зависимости точности локализации от значения порога по потенциалу, шага сетки тренировочного множества ансамбля и числа признаков для построения каждого дерева. Показана сходимость метода - уменьшение ошибки локализации диполя при уменьшении порога по потенциалу. Определены основные параметрические зависимости предложенного алгоритма.
Во второй главе дана характеристика и определены требования к программному комплексу обработки сигнала ЭЭГ, представлена оценка вычислительной сложности алгоритма локализации источников электрической активности, описана разработка архитектуры и структуры программного комплекса, удовлетворяющего заявленным требованиям.
Программные системы локализации и визуализации источников 
нейронной активности как правило состоят из трех основных компонент: первичная обработка экспериментальных данных (анализ амплитудно-частотных характерист, корреляционный анализ, энтропийный анализ); обработка снимков МРТ и определение анатомических особенностей; локализация нейронных исчтоников; постобработка (построение динамических карт активности) и визуализация результатов. К настоящему моменту существует несколько широко распространенных программных систем и библиотек, позволяющих осуществлять поиск источников электрической активности внутри мозга на основе анализа сигнала ЭЭГ: BrainStrom [64], EEGlab [67], The Brain Imaging Software Toolbox [68], FieldTrip [69], Cartool [70], BrainVISA/Anatomist [101], BrainSuite [71], FreeSurfer [72], MNE [73], SPM5 [74]. Программные инструменты BrainStrom, EEGLAB являются библиотекой функций и интерфейсов для программного пакета MATLAB. В программах есть возможность моделирования трехмерной реальной геометрии головы и мозга человека с помощью реконструкции снимков MRI, или использования стандартных трехслойных моделей головы. Поддерживаются форматы входных данных ЭЭГ для известных систем регистрации сигнала (NeuroMag, NeuroScan, EEGAmplyphier) и форматы бинарного представления сигнала. В качестве алгоритмов локализации дипольных источников реализованы два метода: RAP-MUSIC и MinimumNormLocalization. Существует возможность моделирования сигнала на поверхности головы с помощью решения прямой задачи ЭЭГ.
В главе предлагается расширение функциональности существующей программных систем посредством разработки новых методов для статистического анализа результатов локализации, который имеет зна-чительную роль при обработки данных нейрофизиологических исследований: динамическая локализация источников электрической активности по времени, получение усредненных положений источников активности для нескольких записей сигнала ЭЭГ, сокращение временных затрат при обработки сигнала с большой размерности (частотой дискретизации 1000 Гц и более для реальных моделей головы), стастистический анализ локализованных областей для выделения положений диполей, вызванных отношений сигнал-шум в исходных данных. 
На основе обзора существующих программных систем локализации дипольных источников и учете специфики входных экспериментальных данных в главе формулируются требования к разрабатываемому программному комплексу. Первая группа требований включает в себя требования к производительности и масштабируемости разрабатываемого комплекса программ, учитывающие возможные размерности входных данных и их типы. Вторая группа требований определяет функциональные возможности комплекса, относящиеся к задаче локализации источников на основе анализа данных ЭЭГ. В нее входят требования: к формату входных данных; к протоколу эксперимента; к функциональным возможностям предварительной обработки сигнала, решения прямой задачи, задания и мониторинга параметров алгоритма обратной задачи; к статистическому анализу экспериментов, визуализации результатов; к созданию тестовых данных ЭЭГ. В главе обсуждаются существующие способы реализации программных систем для обработки данных ЭЭГ, и предлагаются новые решения в их разработке.
В главе описана структура разработанного программного комплекса для обработки данных ЭЭГ, удовлетворяющая сформулированным в работе требованиям.
Загрузка входных данных ЭЭГ, их предварительная обработка и представление во внутреннем формате осуществляется модулем Data Manager. Параметрами модуля является спецификация формата входных данных, согласно принятой системе регистрации сигнала ЭЭГ. В настоящее время разработанный комплекс поддерживает работу семи форматов входных данных. Основными модулями комплекса являются модули, реализующие решение прямой задачи (Forward Solver) и построение ансамбля деревьев решений с возможностью параллельного исполнения на многопроцессорных вычислительных (Inverse Solver). Для визуализации и интерпретации результатов работы алгоритмов реализован модуль мониторинга основных параметрических зависимостей и модуль визуализации активности на реальных структурах мозга (Graphics Library). Алгоритм построения усредненных карт активности на основе кластерного анализа реализован в модуле (Group Statistics).
Программная реализация предложенных алгоритмов выполнена на 
языке C++. Параллельная реализация модуля Inverse Solver выполнена с использованием технологий параллельного программирования MPI и ОрепМР. Реализация интерпретации результатов локализации использует библиотеку трехмерных моделей мозга BrainVisa, представленную в виде классов на языке C++.
Многие исследования, направленные на достижение общего понимания функций работы мозга, основываются на картировании активности мозга на его анатомию [104]. Это требует объединения гигабайт данных, полученных из различных методик регистрации данных о мозге, таких как: магнитно-резонансной томографии (МРТ), электроэнцефалография (ЭЭГ, МЭГ) и др [104]. Группы ученых и инженеров по всему миру сталкиваются с общей проблемой: объемы данных растут быстрее, чем компьютеры могут обрабатывать их [108-114].
С появлением многоядерных процессоров на персональных компьютерах все алгоритмы построения пространственных карт активности мозга на основе анализа ЭЭГ, решения прямых и обратных задач стали адаптироваться к параллельным вычислениям. Основная задача разработчиков состоит в создании параллельных программных инструментов по локализации источников, позволяющих осуществлять обработку данных в режиме ’’онлайн” в том смысле, что обработка информации не должна превышать по времени эксперимент по регистрации данных. Все современные алгоритмы локализации источников обрабатывают данные ЭЭГ в соответствии с анатомическими особенностями конкретных испытуемых (subject-oriented), поэтому учет реконструированных поверхностей мозга и визуализация результатов локализации также занимают значительные временные затраты. Существуют библиотеки по обработке данных мозга, позволяющие осуществлять локализацию активных нейронных структур на многоядерных архитектурах. Разработан интерактивный язык и кросс-платформенная инструментальная среда (IDL) [104], позволяющая исследователю проводить картирование актив-ности мозга на многоядерных архитектурах и вычислительных кластерах на основе технологий MPI. Исследователями данного проекта было достигнуто ускорение работы параллельной программы картирования в 3.8 раз на четырехпроцессорной Sun Ultra 80 с 450MHz процессорами UltraSPARC II и 4 Гб оперативной памяти, и в 2 раза сократить времен- 
ные затраты на двухъядерной Intel Core 2 Duo Т7400, 2.16gHZ архитектуре.
Причиной развития параллельных алгоритмов в задачах локализации источников служат масштабы разрабатываемых моделей человеческого мозга. От общих многослойных моделей ученые переходят к моделированию максимально приближенным к конкретному испытуемому анатомических структур мозга и описанию более сложных процессов электрической активности, происходящих на микро-уровне. В связи с этим число элементов в рассматриваемой структуре возрастает в несколько раз, и требуется увеличение вычислительных ресурсов для микро-моделирования. Для таких целей была создана библиотека ParExPDE для параллельного выполнения обратной задачи ЭЭГ, основанной на дипольной модели, содержащий 109 элементов и позволяет проводить вычисления в реальном времени на 220 процессорах [114].
Во многих программных системах последовательной обработки сигнала ЭЭГ существуют ограничения на объем обрабатываемых данных, число рассматриваемых в модели компонент, точность приближения и др. Например, обработка сигнала ЭЭГ длительностью 15 минут с частотой дискретизации 128 Гц для 128 датчиков (около 150 Мб) для большинства программных систем является недопустимой [105]. Хранение в памяти нескольких файлов не осуществляется, поэтому необходимо для каждого выбранного сигнала сохранять результаты и последовательно сравнить его с остальными. Для увеличения максимального объема обрабатываемых данных и следовательно времени на их обработку в настоящее время существует ряд библиотек, позволяющих осуществлять параллельные вычисления при анализе данных, не удовлетворяющих заданным ограничениям. Библиотека HiPerSAT (High Performance Signal Analysis Toolkit) функций на языке C++ является дополнительной компонентой известной системы EEGLab, предназначенной для анализа больших объемов данных [107]. С ее использованием объем обрабатываемых данных ЭЭГ можно увеличить в 1000 раз.
Целью разработки параллельных алгоритмов и программных средств для анализа сигналов мозга является возможность анализа
различных данных о его структуре, особенностях, электрических и магнитных характеристик, состояния кровеносной системы', ЭКГ и т.д. одновременно для понимания функционирования мозга как единого сложного механизма. Создание параллельных алгоритмов для обработки данных ЭЭГ является актуальной проблемой в существующей области биомедицины.
Во второй главе диссертации проводится анализ последовательного' алгоритма решения задачи локализации. Целью данного анализа является выявление наиболее ’’узких” мест алгоритма и их дальнейшая параллельная реализация. Под ’’узким” местом будем понимать наиболее вычислительноемкие части алгоритма.
Анализируется зависимость времени решения прямой задачи ЭЭГ от параметров задачи: размерности обучающего множества и способа задания геометрии поверхности головы человека. На основе полученных результатов предлагается алгоритм параллельного решения прямой задачи при вычислениях сложной поверхности головы и входных данных большой размерности. Показано, что вычислительные затраты, необходимые для построения ансамбля деревьев решений, занимают около 90% от общего времени решения задачи. Голосование деревьев и определение результирующей зоны требуют около 7% общего времени решения. Исходя из полученных результатов, для реализации параллельной обработки предлагается разделение исходной задачи построения множества классификаторов на независимые подзадачи, реализующие построение одного классификатора. Для определения наиболее эффективного способа построения дерева решений в главе анализируется последовательный алгоритм обучения. Можно определить основные вычислительные затраты построения дерева решений следующими шагами алгоритма:
1. Выборка подмножества данных для вычисления текущей точки разбиения (число переменных в выборе точки разбиения пропорционально квадратному корню общего числа переменных в базе данных).
2. Сортировка значений каждого атрибута для последующего вычисления энтропии. Сортировка может быть выполнена независимо для каждого атрибута. 
3. Итеративные вычисления .изменения энтропии для нахождения, лучшего признака для разбиения. Поиск признака осуществляется за один проход отсортированного массива значений.
4. Распределение обучающих примеров по потомкам исходного узла.
Экспериментально показано, что операции 1-4 занимают около 90% про-цессорного времени. На каждом их 4-х этапов осуществляется обработка исходного обучающего множества данных, и если его размер превышает доступный объем оперативной памяти вычислительной системы, то затраты на обмен информацией становятся очень значительными.
К настоящему моменту существует ряд работ [50-57], в которых предложено параллельное построение дерева решений для различных архитектур. В наиболее эффективных из существующих параллельных подходов построения дерева решений снижаются затраты на обмен информацией для вычисления точек разбиения в узлах дерева, оптимизируется работа с обучающим множеством (минимизировать число проходов по базе данных). Алгоритмы SLIQ [50] и SPRINT [51] представляют два основных алгоритма параллельного построения деревьев решений для данных большой размерности. SLIQ сортирует упорядоченные атрибуты только один раз и образует из входного обучающего множества списки атрибутов. Это влечет за собой значительные вычислительные затраты. Сортировка данных, находящихся на внешней памяти, представляет собой трудоемкую задачу, а составление дополнительных списков для атрибутов влечет за собой увеличение времени выполнения до 3-х раз. SPIRIT формирует хэш-таблицы, которые пропорциональны числу записей, ассоциированных с узлом дерева решений. Существуют другие методы, которые оптимизируют проходы по обучающему множеству, избегая полной сортировки и перезаписи данных. Например, RainForest [52] не требует сортировки значений атрибутов и формирования списков атрибутов. Объем основной памяти, требующийся для хранения структур данных алгоритма (так называемых AVC групп), пропорционален числу различных значений атрибутов. Но так как количество числовых атрибутов обычно очень велико, то в алгоритме RainForest предлагается подход, основанный на SPIES (Statistical Pruning of Intervals for Enhanced Scalability) [52] - разбиению на интервалы области значений каждого ат
рибута, нахождения наименее вероятных интервалов, которые могут содержать точку для разбиения и их отбрасывание. В данном подходе не нужна сортировка исходного обучающего множества, объем хранимых в основной памяти структур данных и поток обмена данными минимальны. В алгоритме BOAT [53] за счет итеративного построения дерева, полный проход по обучающему множеству совершается только два раза для построения нескольких уровней дерева решений, что сильно сокращает вычислительные затраты.
В отличие от существующих методов параллельного обучения деревьев классификации в работе предлагается использовать метод оптимального распределения процессоров для вычисления узлов деревьев. Данная идея базируется на критерии оптимального разбиения исходной задачи на подзадачи. Критерий основан на отношении времени вычисления узла дерева к временной стоимости обмена информации между процессорами. С увеличением глубины дерева, объем собираемой статистики на каждом уровне увеличивается. На каком-то уровне временная стоимость обмена информацией между процессорами становится чрезмерно большой. Тогда в этом случае, группа процессоров, работающих в блоке над каждым узлом, разбивается на две подгруппы, которые выполняют построение поддеревьев параллельно.
В главе представлена схема параллельного построения комитета классификаторов, описана реализация и тестирование алгоритма на супер-ЭВМ “IBM 690 p-series Regatta”. Экспериментально проведено сравнение ускорения времени работы алгоритма построения дерева при разбиении группы процессоров на подгруппы на каждом уровне дерева решений, при отсутствии разбиения на подгруппы, и с использованием предложенного оптимального критерия разбиения.
В конце главы проведен анализ соответствия предложенной структуры программного комплекса заявленным требованиям, представлены результаты сравнительного анализа функциональных возможностей с существующими программными средствами обработки сигнала ЭЭГ.
Третья глава посвящена описанию алгоритмов и программ для построения пространственно-усредненных карт активности нейронных дипольных источников, и анализу результатов применения разработан- 
ного комплекса программ для обработки экспериментальных данных при исследовании нейрофизиологических проблем визуального восприятия.
Целью проведения экспериментов регистрации сигнала ЭЭГ как правило является выявление электрических характеристик мозга, связанных с реакцией мозга на определенную группы внешних по отношению к испытуемому событий, или с внутренним состоянием испытуемого, соответствующим его нормальной активности. Например, внешняя зрительная стимуляция широко применима при исследовании общих характеристик функциональных состояний мозговой деятельности, связанных с распознаванием образов, общением человека, реакции мозга на неспецифические внешние стимулы (вспышка света, цветовые гаммы). Правильная постановка эксперимента играет очень важную роль в получении достоверных данных о реакциях мозга. Человеческий мозг представляет собой сложную структуру, состоящую из нейронов со множественными связями, судить о которых можно только на уровне регистрируемых следствий мозговой активности. Получаемые данные в виде сигнала ЭЭГ содержат в себе множество артефактов, связанных с мышечной ак-тивностью, и отражают любые смены внутреннего состояния человека. Следствием использования неинвазивного метода получения данных, являются многократные повторения одних и тех же стадий эксперимента. Для нахождение общих закономерностей электрических характеристик требуется использование статистических методов обработки данных. В диссертация предлагается метод построения усредненных карт активности нейронных источников, основанный на специфике задачи локализации.
Входными данными алгоритма является множество временных по-следовательностей найденных параметров дипольных источников. Так как локализация источников в каждый момент времени проводится независимо, то временной процесс изменения положения диполя можно представить как случайный процесс. Нахождение усредненной области положения диполя-источника для некоторого временного промежутка (временного окна) позволяет определить область стационарности процесса и определить изменения положения, вызванные некоторым событием.
В главе формулируется алгоритм формирования пространственных карт активности для группы сигналов ЭЭГ в фиксированном вре-
менном окне. Алгоритм основан на предложенном методе кластерного анализа временных последовательностей параметров положений источников. В разработанном подходе кластеризации использована специфика задачи локализации источников:
1. Положения центроидов и порядок их рассмотрения заданы априори множеством с весовыми коэффициентами.
2. Центроид кластера не может менять свое положение, а только исключаться из рассматриваемого множества.
3. Число кластеров неизвестно и итеративно определяется минимизацией критерия функционала качества.
4. Все точки, имеющие степени принадлежности двум и более кластерам, которые отличаются на заданную пороговую величину, исключаются из рассмотрения.
Разработанные алгоритмы построения усредненных карт активности ре-ализованы в компоненте Group Statistics.
На основе разработанного комплекса программ были обработаны данные нейрофизиологического эксперимента, проводимого в лаборатории нейрофизиологии когнитивных процессов Института Нейрофизиологии и Высшей Нервной Деятельности РАН. Эксперименты направлены на изучение неосознаваемых установок.
В результате влияния внешних стимулов, действующих на человека в конкретной ситуации, в мозге человека формируется внутренне состояние, которое в последующем влияет на восприятие других стимулов. Это состояние называется установкой. Формирования этой установки соответствует процессу обработки внешнего стимула мозгом. Механизмы выработки установок у человека основываются на переходе мозговой деятельности из одного состояния (до предъявления стимула, предстимуль- ное состояние) в другое состояние, являющееся последствием влияния стимула (постстимульное).
Обработка экспериментальных данных ЭЭГ позволяет изучать влияние фиксированной установки на последующую мозговую деятельности человека, выявлять параметры отдельных зон коры или 
показателей их совместного взаимодействия при восприятии мозгом стимулов. Данный класс исследований очень важен для определения механизмов формирования зрительных реакций, и последующем влиянии обрабатываемых визуальных стимулов на поведение человека.
Целью обработки описанных экспериментальных данных было исследование предложенного метода локализации источников и построения усредненных карт активности для его применения в качестве способа оценки функционального состояния мозговой активности. Данная апробация разработанных алгоритмов и программ может служить подтверждением применимости метода оценки для различных нейрофизиологических экспериментов, связанных с исследованием реакций человека на внешние стимулы. Полученные результаты локализации являются дополнительной информации об активности мозговых структур во время обработки внешних стимулов.
В главе описаны результаты сравнения областей возникновения источников активности и их смещения для четырех стадий эксперимента по визуальному восприятию. Показано, что с помощью построения пространственно-временных карт активности дипольных источников, можно различить стадии эксперимента. Это свидетельствует о том, что данный алгоритм может быть использован для оценки функционального состояния мозговой деятельности.
Показано, что созданные программные средства анализа полученных результатов обработки экспериментальных данных на реальной геометрии мозга позволяют интерпретировать положения найденных источников на мозговых структурах.
Вычислительные эксперименты показывают, что разработанные пространственно-временные алгоритмы анализа экспериментальных данных ЭЭГ позволяют решить проблему соотношения сигнал - шум и отфильтровать случайные скачки дипольных источников, вызванные артефактными событиями.
В главе описано сравнение результатов обработки экспериментальных данных предложенным программным комплексом с существующими алгоритмами решения обратных задач ЭЭГ, такими как aRAP-MUSIC[94], ВК Beamformer[95], LORETA[97], МЕМ2 [100], Minimum Norm Localizaiton [98].

Содержание

Введение 4
Глава 1. Метод ансамблей деревьев решений для анализа электрической активности мозга человека 24
§ 1.1. Постановка задачи локализации нейронных источников 24
§ 1.2. Сведение задачи локализации к задаче классификации. 29
§ 1.3. Алгоритм построения классификатора для определения
зон электрической активности 31
1.3.1. Алгоритм построения дерева решений 32
1.3.2. Алгоритм голосования классификаторов 34
§ 1.4. Сходимость и определение основных параметрических
зависимостей предложенного метода 36
Глава 2. Параллельные алгоритмы и программный комплекс обработки данных ЭЭГ. 42
§ 2.1. Определение требований к программному комплексу об
работки сигналов ЭЭГ 42
§ 2.2. Структура программного комплекса локализации ней
ронных источников электрической активности 44
2.2.1. Базовые классы основных модулей программного
комплекса 46
§ 2.3. Анализ производительности последовательного алгоритма решения обратной задачи ЭЭГ 52
§ 2.4. Параллельный алгоритм построения ансамблей деревьев
решений 55
2.4.1. Анализ эффективности МИ-реализации
параллельного алгоритма локализации источников. 61
2.4.2. Многонитевая реализация параллельного алгоритма локализации нейронных источников 65 
Глава 3. Использование комплекса программ по обработке сигнала ЭЭГ при исследовании нейрофизиологических проблем восприятия. 69
§ 3.1. Алгоритм построения пространственно-усредненных
карт активности нейронных дипольных источников 69
§ 3.2. Задача определения пространственных нейронных структур мозга, участвующих в обработке зрительной информации 74
§ 3.3. Протокол нейрофизиологического эксперимента, цели
математической обработки экспериментальных данных. . . 76
§ 3.4. Построение временных карт активности нейронных источников и их сравнение для различных стадий эксперимента 79
3.4.1. Выбор масштаба временного окна для построения
пространственно-временных карт 79
3.4.2. Построение пространственно-временных карт ак
тивности для фоновой ЭЭГ и при возникновении у испытуемого зрительно-иллюзорного образа 81
3.4.3. Сравнение областей возникновения вероятных ис
точников активности для всех фрагментов сигнала ЭЭГ 84
3.4.4. Определение проекции усредненных зон активно
сти дипольного источника на реальную геометрию мозга 85
§ 3.5. Сравнение разработанных алгоритмов локализации источников с существующими методами 86
Заключение 95
Приложение 96
Список литературы 101

Диссертация | 2009 | Россия | docx/pdf | 5.35 Мб

Для доступа к источнику авторизируйтесь или зарегистрируйтесь.

Внимание! Все источники запакованы в zip архивы! Для распаковки на android-устройствах Вы можете воспользоваться одним из сторонних приложений, например Total Commander



Методы и программные средства для обработки данных электроэнцефалографии

релевантные научные источники:

Другие источники по дисциплине Математическое и программное обеспечение вычислительных машин:

  1. Параллельно-рекурсивные методы выполнения вейвлет-преобразования в задачах обработки дискретных сигналов
    Нго Кыу Фук | Диссертация на соискание ученой степени кандидата физико-математических наук. Москва - 2005 | Диссертация | 2005 | Россия | docx/pdf | 6.81 Мб
  2. Методы и средства построения представлений унаследованной информационной системы в процессе реинжиниринга
    Романенко Сергей Александрович | Диссертация на соискание ученой степени кандидата технических наук. Санкт-Петербург - 2004 | Диссертация | 2004 | Россия | docx/pdf | 6.98 Мб
  3. Разработка и исследование моделей, методов и средств редактирования информационного наполнения компьютерных банков знаний
    Орлов Василий Александрович | Диссертация на соискание ученой степени кандидата технических наук. Владивосток - 2004 | Диссертация | 2004 | Россия | docx/pdf | 12.95 Мб
- Авиационная и ракетно-космическая техника - Автоматизация и управление - Безопасность деятельности человека - Библиотековедение, библиографоведение и книговедение - Биотехнология пищевых продуктов - Гидравлика и инженерная гидрология - Документалистика, документоведение, архивоведение - Инженерная геометрия и компьютерная графика - Информатика, вычислительная техника и управление - Математическое и программное обеспечение вычислительных машин - Математическое моделирование, численные методы и комплексы программ - Материаловедение - Машиностроение и машиноведение - Методы и системы защиты информации, информационная безопасность - Метрология, информационно-измерительные приборы - Оптические и оптико-электронные приборы и комплексы - Приборы и методы контроля природной среды - Проектная деятельность - Процессы и аппараты пищевых производств - Процессы и машины агроинженерных систем - Процессы и машины обработки материалов резанием - Радиотехника и связь - Системный анализ, управление и обработка информации - Системы, сети и устройства телекоммуникаций - Стандартизация и управление качеством продукции - Тепловые двигатели - Технологии и машины обработки давлением - Технологии и оборудование механической и физико-технической обработки - Технология мясных, молочных, рыбных продуктов и холодильных производств - Технология неорганических веществ - Технология продовольственных продуктов - Технология силикатных и тугоплавких неметаллических материалов - Транспортное, горное и строительное машиностроение - Управление в социальных и экономических системах (технические науки) - Электротехника -