Воскресенье, 2024-05-12
Файлы для студентов
Меню сайта
Главная » 2014 » Август » 20 » Скачать Метод главного эксперта в задачах диагностики и прогнозирования. Демьянова, Вероника Владимировна бесплатно
3:26 AM
Скачать Метод главного эксперта в задачах диагностики и прогнозирования. Демьянова, Вероника Владимировна бесплатно

Метод главного эксперта в задачах диагностики и прогнозирования

Диссертация

Автор: Демьянова, Вероника Владимировна

Название: Метод главного эксперта в задачах диагностики и прогнозирования

Справка: Демьянова, Вероника Владимировна. Метод главного эксперта в задачах диагностики и прогнозирования : диссертация кандидата физико-математических наук : 01.01.09 / Демьянова Вероника Владимировна; [Место защиты: С.-Петерб. гос. ун-т] Санкт-Петербург, 2008 156 c. : 61 09-1/34

Объем: 156 стр.

Информация: Санкт-Петербург, 2008


Содержание:

Список обозначений
ВВЕДЕНИЕ
§01 Общая характеристика работы
§02 Содержание работы
Глава 1 ОДНОМЕРНАЯ ИДЕНТИФИКАЦИЯ И РАНЖИРОВАНИЕ
§11 Постановка задачи идентификации
§12 Задача одномерной идентификации Идентификация методом разделения
121 Постановка задачи
122 Необходимые и достаточные условия оптимальности
123 Численный метод для минимизации т(х)
124 Квазивыпуклые функции
§13 Одномерная идентификация методом изоляции
131 Идентификация методом изоляции
132 Метод покоординатного спуска для минимизации m{z)
133 Метод сопряженных направлений для минимизации m{z)
§14 Ранжирование параметров
141 Ранжирование с помощью одномерной идентификации
Глава 2 МЕТОД ГЛАВНОГО ЭКСПЕРТА
В ЗАДАЧАХ ИДЕНТИФИКАЦИИ
§21 Постановка задачи идентификации
§22 Метод главного эксперта
§23 "Выборочные" вероятности правильной и неверной идентификации методом главного эксперта
§24 Параметрическая оптимизация
§25 Примеры
Глава 3 ЗАДАЧА ПРОГНОЗИРОВАНИЯ И МЕТОД ГЛАВНОГО ЭКСПЕРТА
§31 Введение
§32 Задача прогнозирования
§33 Исследование множеств fii и 0,2 методом главного эксперта
Глава 4 ПРОГНОЗИРОВАНИЕ ЭФФЕКТИВНОСТИ ХИМИОТЕРАПИИ ПРИ ЛЕЧЕНИИ ОНКОЛОГИЧЕСКИХ ЗАБОЛЕВАНИЙ
§41 Введение и постановка задачи
§42 Разделение баз СТ-140 и WCT
421 Разделяющие гиперплоскости
422 Разделение базы СТ
423 Разделение базы WCT-113
§43 Перекрестное исследование баз WCT-113 и СТ
431 Исследование базы WCT-113 с помощью плоскости Ь\
432 Исследование базы СТ-140 с помощью плоскости L

Введение:

§ 0.1. Общая характеристика работы.
Актуальность темы. "Homo sapiens" , как "человек разумный" , наблюдая явления внешнего мира, старается выявить его закономерности ("законы природы") и действует, учитывая эти законы. Другими словами, человек строит модель внешнего мира (или какого-то процесса). Все современные науки (исключая гуманитарные) представляют собой набор моделей, описывающих те или иные стороны внешнего мира. Математика, как "царица" наук, призвана обслуживать эти модели. Иногда эти модели достаточно адекватно описывают изучаемые объекты или процессы (так называемые "точные" науки), другие процессы пока не поддаются точному описанию (медицина, биология), но и там прогресс стремительно развивается (см., например, [3, 4]). Толчком к этому послужило развитие вычислительной техники и основанных на ней информационных технологий. Многие выдающиеся достижения биологии последних десятилетий были бы невозможны без использования математических методов. Биоматематика стала существенной частью биологии. Необходимость решения задач диагностики в медицине и технике привели к появлению "математической диагностики" , которая включает в себя математический аппарат, используемый для изучения моделей для решения задач идентификации, распознавания образов, обработки экспериментальных данных, технической и медицинской диагностики, прогнозирования. Такие задачи возникают в различных областях пауки. Для их решения строятся различные модели и применяются различные подходы. К сожалению, одного универсального подхода не существует, что приводит к необходимости строить модели, учитывающие специфику конкретного класса задач, и разрабатывать (или использовать существующие) методы их исследования.
Конечной целью изучения баз данных является выявление закономерностей, которым подчиняется изучаемый процесс или явление. Часто эта цель недостижима, поскольку имеющиеся данные могут быть недостаточно достоверными или не отражающими существенные свойства процесса и потому не позволяющими выявить искомые закономерности. Это зависит и от качества имеющейся модели. В данном исследовании эти вопросы не затрагиваются. Нашей целью является оптимальная (в том или ином смысле) обработка уже имеющейся информации (баз данных).
Практические задачи идентификации, диагностики, обработки баз экспериментальных данных, планирования эксперимента привели к развитию теории распознавания образов (см., например, работы В.Н.Вапника, Ю.И.Журавлева и др. [9, 27, 29, 41, 88], а также обзор [82]). Вначале в основном применялись статистические методы обработки баз данных, начало которым положили работы Р.А.Фишера [68] (см. также [2, 4, 5, 42]). Р.Фишер создал лииейный дискриминантный анализ [51]. Появилась математическая теория обучения (см. работы В.Н.Вапника, Ф.Розенблата, В.Н.Фомина, Я.З.Цыпкина, В.А.Якубовича [9, 46, 52, 53, 79, 85, 88]) и соответствующие алгоритмы [17, 32, 40, 46, 87]. В середине прошлого столетия наряду со статистическим подходом стал широко применяться оптимизационный подход. Это связано как с развитием численных методов оптимизации и вычислительной техники, так и с тем, что зачастую статистические характеристики баз данных либо неизвестны, либо их трудно получить. В развитие теории и методов оптимизации внесли существенный вклад как отечественные (советские и российские) ученые, так и зарубежные исследователи (Л.В.Канторович, Ю.И.Журавлев, И.И.Еремин, Б.Н.Пшеничный, В.Н.Тихомиров, Дж.Данциг, Р.Рокафеллар и др.). Методы оптимизации применяются к решению широкого круга вопросов идентификации и обработки данных (см., например, работы А.А.Первозванского, Я.З.Цыпкина, Б.Т.Поляка [11, 13, 44, 46, 63, 70, 75, 76, 78, 89]).
Одним из эффективных методов решения задач обработки данных является кластерный анализ (см. [26, 27, 55, 58, 61, 69, 71, 80, 86]).
В настоящее время существует два подхода к решению задач математической диагностики: статистический и оптимизационный. Первый подход использует вероятностные и статистические методы (это требует изучения статистических характеристик изучаемого процесса, что иногда затруднительно вследствие отсутствия достаточного количества наблюдений), второй - оптимизационный - использует методы математического программирования. Эти подходы взаимно дополняют друг друга и позволяют проводить диагностику и прогнозирование, например, эффективности применения той или иной методики лечения или обучения, с большей надежностью.
Хотя, как отмечено выше, статистический подход к решению задач диагностики начал развиваться еще с начала прошлого века, а оптимизационный - с середины XX столетия, остается немало нерешенных вопросов, актуальность которых не уменьшается. Возникают новые задачи, требующие соответствующего математического и программного обеспечения.
Предлагаемая работа относится ко второму (оптимизационному) направлению.
Одна из задач, которая изучается в данной работе, ставится следующим образом. Имеется две (в действительности может быть и больше) базы экспериментальных данных: А и В. Каждая из них представляет собой набор точек в многомерном пространстве. Предполагается, что каждая из этих баз является генеральной выборкой из некоторого (каждая из своего) случайного процесса. Требуется пайти правило, по которому любую точку из множества С = A U В можно идентифицировать как точку того или иного множества. Математически задача сводится к разделению двух множеств точек. Если выпуклые оболочки множеств А и В не пересекаются, то задача решается с помощью теоремы отделимости: проводится разделяющая гиперплоскость, и точки, находящиеся по одну сторону гиперплоскости, принадлежат одному множеству, а точки, находящиеся по другую ее сторону, принадлежат второму множеству. К сожалению, в реальных задачах указанное условие не выполняется, поэтому приходится проводить разделение неточно. И здесь возникает задача найти такую гиперплоскость (если разделение проводится с помощью гиперплоскости, хотя можно разделять и другими поверхностями и способами), которая обеспечивает наилучшее (в том или ином смысле) разделение. И вот на этом этапе и возникают задачи выбора функционала, способа идентификации (построение идентификатора), построение численного метода.
Вначале для разделения множеств применялись, в основном, методы линейного программирования, которые исторически были разработаны раньше (см. [13, 44]). Наиболее популярным в настоящее время является метод опорных плоскостей (SVM - support vector machines), основанный на линейном программировании или сводящиеся к нему с помощью так называемых методов ядра (kernel methods) (В.Н.Вапник, О.Мапгасарян) ([9, 54, 60, 65, 75, 66, 76, 77, 88]). Использование методов нелинейного и негладкого программирования позволяет значительно улучшить качество идентификации (см. [14, 15, 33, 37, 47, 56, 59, 73]).
Одной из важных проблем при обработке баз данных является ранжирования параметров. Выбор наиболее значимых параметров позволяет ускорить обработку результатов экспериментов и удешевить их проведение (поскольку получение данных является часто дорогостоящей или - в случае медицинских баз данных - болезненной или даже опасной процедурой).
Существуют различные способы ранжирования [26, 34, 35, 57, 62, 72, 83].
Задачи диагностики в медицине являются одновременно и весьма важными, и сложными. Им посвящены многие исследования (см., например, работы [1, 12, 16, 24, 25, 36, 43, 48]).
Актуальность тематики определяется и необходимостью разработки эффективных методов диагностики и прогнозирования, в том числе "экспресс-диагностики" для принятия оперативных решений (первая помощь в медицине, при технологических авариях), когда полная информация недоступна или еще не готова.
Цели и задачи исследования
Целями диссертационной работы являются:
1) исследование задач обработки баз экспериментальных данных и разработка оптимизационных методов идентификации, распознавания, классификации, диагностики и прогнозирования эффективности различных способов обучения и лечения,
2) на основе полученных результатов выявление закономерностей изучаемого процесса.
Указанные цели достигаются: а) решением задач одномерной и "малоразмерной" идентификации; б) решением задачи ранжирования параметров на основе одномерной идентификации; в) разработкой нового метода (метод главного эксперта) для построения правила идентификации (идентификатора, решающего правила или классификатора) при наличии нескольких идентификаторов; г) разработкой методики прогнозирования эффективности различных способов обучения и лечения на основе метода главного эксперта.
Основными методами исследования являются методы математической диагностики, математического программирования, теории вероятностей и математической статистики, математического моделирования. Предлагаемые методы идентификации и прогнозирования построены на основе оптимизационного подхода и не используют статистические характеристики изучаемого процесса или явления (которые обычно заранее не известны).
Эти методы апробированы на конкретных базах данных (в частности, на базе данных больных раком молочной железы СНЕМО-253 Висконсинского университета для прогнозирования эффективности различных схем послеоперационного лечения).
Научная новизна диссертационной работы состоит в разработке оптимизационных методов решения задач одномерной идентификации баз данных, метода главного эксперта (позволяющего построить более эффективный метод идентификации, используя имеющиеся идентификаторы, полученные, например, с помощью одномерных или двумерных идентификаторов), метода прогнозирования эффективности разных способов обучения, лечения и т.п.
Основные положения, выносимые на защиту:
1) новые оптимизационные методы решения задач одномерной идентификации точек двух множеств (метод разделения и метод изоляции);
2) метод ранжирования на основе одномерной идентификации; с его помощью строятся простые идентификаторы (одномерные, двумерные или трехмерные) для наиболее существенных параметров. Эти простые идентификаторы могут использоваться для экспресс-идентификации и распознавания.
3) метод главного эксперта (МГЭ) для построения правила идентификации (идентификатора, решающего правила или классификатора) при наличии нескольких идентификаторов. Каждый из указанных идентификаторов может оказаться не очень точным, но с помощью МГЭ качество идентификации может быть существенно улучшено.
4) методика прогнозирования эффективности различных способов обучения и лечения, разработанная на основе метода главного эксперта.
Практическая ценность. С помощью разработанной методики проведено исследование базы данных СНЕМО-253 больных раком молочной железы и предложена методика прогнозирования эффективности применения или неприменения различных видов терапии для лечения конкретного пациента. База содержит данные о 253 пациентах, которым была сделана хирургическая операция. Будем считать, что комплексное лечение было успешным, если срок жизни пациента после операции составил 5 и более лет. В результате математической обработки были составлены 16 подгрупп - от неблагоприятного до благоприятного прогноза по каждой из четырех схем лечения со своей вероятностью.
Для каждого пациента определено место в одной из подгрупп и рекомендовано именно то лечение, при котором прогноз для него наиболее благоприятен. В действительности более 5 лет прожило 115 человек. При использовании двух параметров удалось прогнозировать благоприятный исход у 141, а при использовании трех параметров - у 155 пациентов. Метод главного эксперта позволяет существенно повысить качество прогнозирования эффективности лечения.
Указанный метод может оказать существенную помощь не только в процессе сопровождения лечебно-диагностического процесса, но и при обработке результатов массовых обследований, проводимых в целях профессионального психофизиологического отбора и психофизиологического сопровождения профессиональной деятельности.
Результаты научных исследований прошли апробацию на Международной конференции "Longevity, Aging and Degradation Models in Reliability, Public Health, Medicine and Biology (LAD'2004)"(Санкт-Петербург, СП6ПТУ, 2004); на 35-й межвузовской научной конференции аспирантов и студентов СПбГУ "Процессы управления и устойчивость"(С.Петербург, 2004г.); на 37-й межвузовской научной конференции аспирантов и студентов СПбГУ "Процессы управления и устойчивость"(С.-Петербург, 2006г.); на Международной конференции "Устойчивость и процессы управления" (С.-Петербург, 29.06.2005-01.07.2005); на Всероссийской конференции "Психофизиология профессионального здоровья человека"(С.Петербург, Военно-медицинская Академия, 16 ноября 2007г.); на научной конференции Военного Института физической культуры (СПб, 1995г.), на Международном семинаре по математической диагностике в Эриче (Сицилия, Италия, 10-20 июля 2006г., Workshop MATHEMATICS AND MEDICAL DIAGNOSIS).
Связь с научными программами. Частично исследования по теме диссертации выполнялись в рамках проекта "Инновационная образовательная среда в классическом университете" Национального проекта "Образование" в 2006 и 2007 годах по темам "Методика составления прогноза эффективности применения различных способов лечения" (2006 г., СПбГУ) и "Разделение баз данных результатов медицинских исследований" (2007 г., СПбГУ).
Публикации. По материалам диссертации опубликованы 12 работ, четыре из которых в изданиях, входящих в перечень ВАК рецензируемых научных журналов. Список работ приведен в конце диссертации.
Структура и объем диссертации. Диссертация изложена на 156 страницах и состоит из Введения, пяти глав, заключения, шести Приложений, списка обозначений и списка литературы, включающего 91 наименование. Работа содержит 10 рисунков и 30 таблиц в основном тексте и 6 рисунков и 36 страниц таблиц в Приложениях.

Скачивание файла!Для скачивания файла вам нужно ввести
E-Mail: 4142
Пароль: 4142
Скачать файл.
Просмотров: 137 | Добавил: Анна44 | Рейтинг: 0.0/0
Форма входа
Поиск
Календарь
«  Август 2014  »
ПнВтСрЧтПтСбВс
    123
45678910
11121314151617
18192021222324
25262728293031
Архив записей
Друзья сайта
  • Официальный блог
  • Сообщество uCoz
  • FAQ по системе
  • Инструкции для uCoz
  • Copyright MyCorp © 2024
    Конструктор сайтов - uCoz