Features of implementation of simulation processes based on DATA FARMING methodologies

The basic concepts and features of application of methodology Data Farming in simulation practice of complex stochastic systems are considered. There is proposed based on specified concepts the approach to increase efficiency of distributed simulation system NEDISOPT_D developed in V. M. Glushkov In...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2015
Автори: Krikovlyuk, E.A., Pepelyaev, V.A., Sahnyuk, M.A.
Формат: Стаття
Мова:Ukrainian
Опубліковано: Інститут програмних систем НАН України 2015
Теми:
Онлайн доступ:https://pp.isofts.kiev.ua/index.php/ojs1/article/view/97
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Problems in programming

Репозитарії

Problems in programming
id pp_isofts_kiev_ua-article-97
record_format ojs
resource_txt_mv ppisoftskievua/4f/38850fc796326918752ac71811573a4f.pdf
spelling pp_isofts_kiev_ua-article-972018-09-26T11:02:58Z Features of implementation of simulation processes based on DATA FARMING methodologies Особенности реализации процессов имитационного моделирования на основе методологи DATA FARMING Krikovlyuk, E.A. Pepelyaev, V.A. Sahnyuk, M.A. simulation modeling UDC 519.711; 002.53: 004.89 имитационное моделирование УДК 519.711; 002.53: 004.89 імітаційне моелювання УДК 519.711; 002.53: 004.89 The basic concepts and features of application of methodology Data Farming in simulation practice of complex stochastic systems are considered. There is proposed based on specified concepts the approach to increase efficiency of distributed simulation system NEDISOPT_D developed in V. M. Glushkov Institute of cybernetics. Рассмотрены основные концепции и особенности применения методологии Data Farming в практике имитационного моделирования сложных стохастических систем. Предложен базирующийся на указанных концепциях подход к повышению эффективности системы распределенного моделирования NEDISOPT_D, разработанной в Институте кибернетики им. В.М. Глушкова. Інститут програмних систем НАН України 2015-09-10 Article Article application/pdf https://pp.isofts.kiev.ua/index.php/ojs1/article/view/97 PROBLEMS IN PROGRAMMING; No 2-3 (2012) ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ; No 2-3 (2012) ПРОБЛЕМИ ПРОГРАМУВАННЯ; No 2-3 (2012) 1727-4907 uk https://pp.isofts.kiev.ua/index.php/ojs1/article/view/97/96 Copyright (c) 2015 ПРОБЛЕМИ ПРОГРАМУВАННЯ
institution Problems in programming
baseUrl_str https://pp.isofts.kiev.ua/index.php/ojs1/oai
datestamp_date 2018-09-26T11:02:58Z
collection OJS
language Ukrainian
topic simulation modeling
UDC 519.711
002.53: 004.89
spellingShingle simulation modeling
UDC 519.711
002.53: 004.89
Krikovlyuk, E.A.
Pepelyaev, V.A.
Sahnyuk, M.A.
Features of implementation of simulation processes based on DATA FARMING methodologies
topic_facet simulation modeling
UDC 519.711
002.53: 004.89
имитационное моделирование
УДК 519.711
002.53: 004.89
імітаційне моелювання
УДК 519.711
002.53: 004.89
format Article
author Krikovlyuk, E.A.
Pepelyaev, V.A.
Sahnyuk, M.A.
author_facet Krikovlyuk, E.A.
Pepelyaev, V.A.
Sahnyuk, M.A.
author_sort Krikovlyuk, E.A.
title Features of implementation of simulation processes based on DATA FARMING methodologies
title_short Features of implementation of simulation processes based on DATA FARMING methodologies
title_full Features of implementation of simulation processes based on DATA FARMING methodologies
title_fullStr Features of implementation of simulation processes based on DATA FARMING methodologies
title_full_unstemmed Features of implementation of simulation processes based on DATA FARMING methodologies
title_sort features of implementation of simulation processes based on data farming methodologies
title_alt Особенности реализации процессов имитационного моделирования на основе методологи DATA FARMING
description The basic concepts and features of application of methodology Data Farming in simulation practice of complex stochastic systems are considered. There is proposed based on specified concepts the approach to increase efficiency of distributed simulation system NEDISOPT_D developed in V. M. Glushkov Institute of cybernetics.
publisher Інститут програмних систем НАН України
publishDate 2015
url https://pp.isofts.kiev.ua/index.php/ojs1/article/view/97
work_keys_str_mv AT krikovlyukea featuresofimplementationofsimulationprocessesbasedondatafarmingmethodologies
AT pepelyaevva featuresofimplementationofsimulationprocessesbasedondatafarmingmethodologies
AT sahnyukma featuresofimplementationofsimulationprocessesbasedondatafarmingmethodologies
AT krikovlyukea osobennostirealizaciiprocessovimitacionnogomodelirovaniânaosnovemetodologidatafarming
AT pepelyaevva osobennostirealizaciiprocessovimitacionnogomodelirovaniânaosnovemetodologidatafarming
AT sahnyukma osobennostirealizaciiprocessovimitacionnogomodelirovaniânaosnovemetodologidatafarming
first_indexed 2025-07-17T09:54:00Z
last_indexed 2025-07-17T09:54:00Z
_version_ 1838410138240679936
fulltext Прикладне програмне забезпечення УДК 519.711; 002.53: 004.89 ОСОБЕННОСТИ РЕАЛИЗАЦИИ ПРОЦЕССОВ ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ НА ОСНОВЕ МЕТОДОЛОГИИ DATA FARMING Е.А. Криковлюк, В.А. Пепеляев, М.А. Сахнюк Институт кибернетики им. В.М. Глушкова НАН Украины, 03680, ГСП, Киев-187, проспект Академика Глушкова,40, тел.: (380-44)526 4107, (380-44)526 3308, e-mail: emk160ik@gmail.com Рассмотрены основные концепции и особенности применения методологии Data Farming в практике имитационного моделирования сложных стохастических систем. Предложен базирующийся на указанных концепциях подход к повышению эффективности системы распределенного моделирования NEDISOPT_D, разработанной в Институте кибернетики им. В.М. Глушкова. The basic concepts and features of application of methodology Data Farming in simulation practice of complex stochastic systems are considered. There is proposed based on specified concepts the approach to increase efficiency of distributed simulation system NEDISOPT_D developed in V. M. Glushkov Institute of cybernetics. Введение В связи с широким использованием методов и средств имитационного моделирования в практике исследования и проектирования сложных систем актуальными остаются вопросы повышения эффективности указанных методов и разработки новых подходов на их основе. Проблемы создания систем управления в области космических исследований, транспорта, финансов, маркетинга, логистики, медицины, для различных областей экономики, особенно в условиях глобализации, выдвинули новые требования к расширению функциональных возможностей существующих методов и средств имитационного моделирования. На формирование такого рода требований также существенным образом повлияли задачи принятия, как правило, в критические сроки, соответствующих проектных или управленческих решений при ликвидации различного рода чрезвычайных ситуаций, разработки современных военных стратегий, планов боевых действий, тактик обучения личного состава групп быстрого реагирования в условиях урбанизированных территорий. В последние годы в мировой практике имитационного моделирования наряду с такими подходами к повышению эффективности, как оптимизационно-имитационная интеграция и использование технологий распределенных вычислений [1, 2], получила развитие методология Data Farming [3]. В основе этой методологии лежит интеграция возможностей методов имитационного моделирования, оптимизации, интеллектуального анализа данных и технологий распределенных вычислений, которые реализуются на высокопродуктивных платформах вычислительной техники (кластерных или сетевых архитектурах). Использование методологии Data Farming обеспечивает высокопродуктивную генерацию и обработку больших пространств параметров решений, что делает возможным оценивание непредвиденных ситуаций (как позитивных, так и негативных) и, как следствие, принятие наиболее правильных решений. Концепция Data Farming впервые была предложена в 1998 году Гари Хорном (Gary E.Horne) при разработке проекта "Альберт" по заказу военно-морского флота США. Вокруг идеи Data Farming сформировано международное сообщество, которое регулярно проводит конференции International Data Farming Workshop. Основные результаты, полученные в области применения Data Farming, публикуются в работах ежегодной конференции Winter Simulation Conference. В настоящее время сформировано свыше десяти интернациональных групп, которые занимаются вопросами практического применения методологии Data Farming в разных прикладных областях. Наиболее активными участниками являются специалисты из США, Германии, Канады, Сингапура, Швеции, Голландии и Австралии. Кроме практического применения усилия специалистов направлены на разработку методологических и технологических стандартов для Data Farming. Зарубежными специалистами по Data Farming создан центр SEED (Simulation Experiment and Efficient Design), одним из основных назначений которого является проведение исследований по разработке современных средств планирования и реализации оптимальных экспериментов для повышения эффективности процессов принятия решений [4]. В настоящее время в Институте кибернетики имени В.М. Глушкова НАН Украины выполняется работа по созданию системы распределенного оптимизационно-имитационного моделирования на основе методов и подходов, принятых в методологии Data Farming. При этом в качестве базовой составляющей будет использоваться ранее разработанная в Институте система NEDISOPT_D [5]. ©Е.А. Криковлюк, В.А. Пепеляев, М.А. Сахнюк, 2012 ISSN 1727-4907. Проблеми програмування. 2012. № 2-3. Спеціальний випуск 414 Прикладне програмне забезпечення Основные концепции методологии Data Farming Методология Data Farming базируется на следующих двух идеях: • разработка дистилляционных моделей (distillation), направленных на решение конкретных, поставленных лицом, принимающим решения (ЛПР) задач. Поскольку методология Data Farming используется при исследовании сложных стохастических систем, для которых, как правило, отсутствуют (или еще не получены) соответствующие формальные описания, возникает необходимость в разработке имитационных моделей. При этом, такие модели не должны усложняться детализацией процессов функционирования исследуемых систем. Процедура “дистилляции” обеспечивает выбор такого уровня детализации, который, в первую очередь, учитывает специфику поставленных ЛПР вопросов и позволяет получить на них корректный ответ. Окончательная версия модели “distillation” погружается в среду Data Farming и многократно прогоняется на огромном пространстве параметров решений с целью выбора оптимального варианта. Эффективный и направленный поиск оптимальной комбинации параметров решений, выступающий в качестве факторов прогоняемой distillation модели, требует планирования экспериментов на основании соответствующих оптимизационных стратегий; • использование высокопродуктивных платформ вычислительной техники для многоразовых прогонов дистилляционных моделей на варьируемых начальных условиях для получения возможных распределений результатов, трендов или выбросов. Реализация любого приложения в среде Data Farming рассматривается как итеративно- командный процесс, в котором должны принимать участие эксперты проблемной области (subject matter experts), разработчики модели (modelers), аналитики (analysts) и ЛПР (decision makers). На рис. 1. показана схема взаимодействия основных процессов в среде Data Farming [3]. Define, Edit or Prepare Data Space Gridded Volumes Generative Analysis Multi-Scenario Execution High Performance Computing Environ Data Mining Data Visualization Data Analysis Execute and Examine Individual Scenarios Create, Edit, Expand, Distill Scenarios Scenario Building Loop Scenario Run Space Execution Loop Information Store Data Farming Loop Рис. 1. Взаимодействие процессов в системе Data Farming Процессы “Scenario Building Loop ” предназначены для поддержки традиционных процедур имитационного моделирования, связанных с вопросами оценки адекватности построенной дистилляционной модели (верификация, валидация, оценка чувствительности). Это итеративный процесс, который достаточно часто требует коррекции. Представленный справа на рис. 1 процесс “Scenario Run Space Execution Loop” используется командой для разработки сценария исследования, определяющего структуру входных данных для имитационных экспериментов и необходимые для их вариации подходы (методы планирования оптимальных экспериментов). К наиболее известным оптимизационным стратегиям, используемым в Data Farming, относятся метод полнофакторного эксперимента, Near-Orthogonal Latin HyperCube, а также на основании алгоритмов эволюционных вычислений, базирующихся на определенных пользователем fitness-функциях. 415 Прикладне програмне забезпечення На рис. 2 показаны основные компоненты системы Data Farming и курсирующие между ними потоки данных. Generative Analysis System Analysis (Viz, Stats, Data Mining) 7 6 5 3 Distillation Scenario Builder Study Builder HPC System 1 2 4 Рис. 2. Основные компоненты и схема потоков данных в системе Data Farming Разработчики системы Data Farming особое внимание уделили вопросам структурной организации входных и выходных данных для всех компонент системы. Каждая представленная на рис. 2. компонента завершается формированием в специально отведенных файлах выходной информации в заданных форматах, которая будет использоваться компонентой-наследником. Так в результате выполнения модулей Distillation Scenario Builder формируются три выходных файла: файл, содержащий описанную на соответствующем алгоритмическом языке моделирования дистилляционную модель (distillation model); файл, содержащий описание всех используемых при прогоне модели данных (roadmap); пакет данных, используемых при реализации соответствующей модели на HPC (scenario package). Компонента Study Builder на основании анализа информации, подготовленной компонентой Distillation Scenario Builder, формирует собственный выходной пакет (study package), содержащий данные для управления многократными прогонами моделей на HPC. Компонента HPC System посредством соответствующей оптимизационной стратегии поддерживает многократные прогоны дистилляционной модели с последующим накоплением выходных результатов в принятых для Data Farming форматах. Компонента Analysis обеспечивает визуализацию и статистический анализ результатов экспериментов с оценкой возможности их завершения. Еще одна составляющая системы Generative Analysis (порождающий анализ) в соответствии с заданными критериями оценивает условия останова процесса моделирования или необходимость дополнительных прогонов имитационной модели. В настоящее время международное сообщество пользователей Data Farming проводит исследования, связанные со стандартизацией форматов данных, используемых основными компонентами системы, с возможностью их автоматической подготовки. Многие пользователи Data Farming разрабатывают проблемно-ориентированные версии указанной системы и базированные на них приложения [6, 7]. Заслуживает особого внимания разработанная специалистами из Сингапура версия системы Data Farming – Automated Red Teaming (ART), которая на основании концепции "ко-эволюции" (co-evolution) позволяет оценивать качество тактических и оперативных решений, принимаемых командами оппонентами: Red Team та Blue Team. Процессы принятия и оценки соответствующих решений реализуются параллельно по схеме co-evolution [8]. Структурная организация системы NEDISOPT_DF Выполняемая в Институте кибернетики разработка системы NEDISOPT_DF базируется на концепциях Data Farming и особенностях структурной организации программной среды системы NEDISOPT_D [9]. Общая схема взаимодействия основных компонент системы NEDISOPT_D показана на рис. 3. Основные модули компоненты ОПТИМИЗАТОР определяют соответствующие оптимизационные стратегии (на основе генетического алгоритма и методов последовательного перебора вариантов) и управляют распределенным поиском оптимальных решений на сетевой архитектуре. На каждом из сетевых компьютеров (i = P0 ,…, PNA) размещается компонента ИМИТАТОР, включающая систему распределенного моделирования NEDIS_D, которая обеспечивает прогон соответствующих версий имитационных приложений. В свою очередь каждое такое приложение содержит сценарий (SCNA_i) управляющий прогоном имитационной модели приложения (SMA_i) на множестве факторов, определенных в компоненте ОПТИМИЗАТОР. 416 Прикладне програмне забезпечення В системе NEDISOPT_D процесс моделирования рассматривается как процесс поиска оптимальной альтернативы, основные характеристики которой представляются набором соответствующих факторов. При этом, каждый такой набор факторов задает структуру соответствующей хромосомы-рещения. Множество таких хромосом определяет пространство поиска оптимальных решений. Модуль INTERFACE обеспечивает взаимодействие между ОПТИМИЗАТОРОМ и ИМИТАТОРОМ на уровне потоков управления и потоков данных. IN TE R FA C E SCNA_NA Потоки управления Информационные потоки SCNA_0 P0 PNA ИМИТАТОР СИСТЕМНАЯ СОСТАВЛЯЮЩАЯ NEDIS_D PNA NEDIS_D P0 SMA-0 P0 SMA_NA PNA SCNA_NA PNA IN TE R FA CE ПРОБЛЕМНО-ОРИЕНТИРОВАННАЯ СОСТАВЛЯЮЩАЯ ОПТИМИЗАТОР СИСТЕМНАЯ СОСТАВЛЯЮЩАЯ ПРОБЛЕМНО- ОРИЕНТИРОВАННАЯ СОСТАВЛЯЮЩАЯ P0 SCNA-0 P0 Рис. 3. Виртуальная среда поддержки системы NEDISOPT_D Система NEDISOPT_D поддерживает различные режимы моделирования: последовательный (на одном процессоре); распределенный с реализацией на сетевой архитектуре. В первом случае система NEDIS_D размещается на одном процессоре с ОПТИМИЗАТОРОМ, а прогон имитационных моделей осуществляются циклически. Схема проекта разрабатываемой системы NEDISOPT_DF показана на рис. 4. В общем случае каждый узел сети характеризуется своим номером (L0…LN). При этом один из компьютеров каждого узла выбирается в качестве главного и содержит полную систему NEDISOPT_D, а на периферийных компьютерах (по аналогии с системой NEDISOPT_D) размещается компонента ИМИТАТОР. Такой подход позволяет распределить пространство параметров решений между компьютерами сети и осуществлять направленный поиск оптимальных решений на каждом узле с возможностью миграции хромосом-решений между узлами сети. При этом главный сценарий системы NEDISOPT_DF обеспечивает управление процессом распределенного моделирования, контролирует шаг тактировки процессов миграции. По завершению каждого шага осуществляется обмен хромосомами-решениями согласно принятому алгоритму миграции. В процессе реализации экспериментов на каждом из главных компьютеров, принадлежащих узлам сети, осуществляется накопление статистических данных, представленных откликами имитационных моделей и соответствующими fitness-значениями. 417 Прикладне програмне забезпечення По завершению процессов моделирования каждый из узлов сети осуществляет экспорт полученных результатов в общее хранилище данных. Анализ множества таких данных позволяет выбрать оптимальное решение. Главный сценарий системы NEDISOPT_DF NEDISOPT_D NEDISOPT_D L0 L1 NEDISOPT_D LN Анализ результатов моделирования Выдача результатов Потоки управления Информационные потоки Рис. 4. Структурная схема системы NEDISOPT_DF Специально разработанные информационные модели-шаблоны задают управляющую информацию для экспериментов, реализуемых в формате сессий моделирования. Выводы Поскольку процессы исследования и проектирования сложных систем на базе методологии Data Farming сопровождаются генерированием и накоплением больших объёмов разнородной информации, возникает необходимость в использовании методов и средств интеллектуального анализа данных (в частности Data Mining). Одно из перспективных направлений модификации системы NEDISOPT_DF связано с внедрением и использованием именно таких средств. 1. Fu M. Optimization for Simulation: Theory and Practice // INFORMS J. on Computing. – 2002. – № 14(3). – P. 192 – 215. 2. April J., Glover F., Kelly J.P., Laguna M. Practical introduction to simulation optimization // Proc. of the 2003 Winter Simul. Conf. – 2003. – P. 71 – 78. 3. Horne G. E., Meyer T. E. Data Farming: Discovering Surprise // Proc. of the Winter Simulation Conf., 2005. – P. 1082 – 1087. 4. SEED Center for Data Farming // http://harvest.nps.edu/ 5. Галаган Т.Н., Пепеляев В.А., Сахнюк М.А. Особенности реализации многослойного сценария распределенного поиска оптимальных решений // Проблеми програмування. – 2008. – № 2 - 3. – С. 636 – 640. 6. Barry Ph, Koehler M. Simulation in context: using Data Farming for decision Support // Proc. of the Winter Simulation Conf., 2004. – P. 814 – 819. 7. Horne G.E., Schwierz K.-P. Data Farming around the world overview // Proc. of the Winter Simulation Conf., 2008. – P. 1442 – 1447. 8. Choo C.S., Ng E.C., Ang D., Chua C.L. Data Farming: a brief history // Proc. of the Winter Simulation Conf., 2008. – P. 1448 – 1455. 9. Пепеляев В.А., Сахнюк М.А., Чёрный Ю.М. Параллельная реализация процессов направленного поиска оптимальных решений // Проблеми програмування. – 2010. – № 2 – 3. – С. 572 – 576. 418 http://harvest.nps.edu/ ОСОБЕННОСТИ РЕАЛИЗАЦИИ ПРОЦЕССОВ ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ НА ОСНОВЕ МЕТОДОЛОГИИ DATA FARMING Введение Основные концепции методологии Data Farming Структурная организация системы NEDISOPT_DF Выводы