О применении реконфигурируемых вычислителей для ускорения обработки xml-запросов в современных информационных системах
The application of RUCs (FPGA-based Reconfigurable Unificated Coprocessors) to accelerate XML-document processing is investigated.
Gespeichert in:
Datum: | 2009 |
---|---|
1. Verfasser: | |
Format: | Artikel |
Sprache: | Russian |
Veröffentlicht: |
Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України
2009
|
Schriftenreihe: | Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України |
Online Zugang: | http://dspace.nbuv.gov.ua/handle/123456789/26531 |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Zitieren: | О применении реконфигурируемых вычислителей для ускорения обработки xml-запросов в современных информационных системах / С.Я. Гильгурт, Г.Е. Пухова // Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України. — К.: ІПМЕ ім. Г.Є.Пухова НАН України, 2009. — Вип. 52. — Бібліогр.: 7 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-26531 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-265312011-12-17T00:25:05Z О применении реконфигурируемых вычислителей для ускорения обработки xml-запросов в современных информационных системах Гильгурт, С.Я. The application of RUCs (FPGA-based Reconfigurable Unificated Coprocessors) to accelerate XML-document processing is investigated. 2009 Article О применении реконфигурируемых вычислителей для ускорения обработки xml-запросов в современных информационных системах / С.Я. Гильгурт, Г.Е. Пухова // Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України. — К.: ІПМЕ ім. Г.Є.Пухова НАН України, 2009. — Вип. 52. — Бібліогр.: 7 назв. — рос. XXXX-0067 http://dspace.nbuv.gov.ua/handle/123456789/26531 004.75:004.272.23 ru Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
description |
The application of RUCs (FPGA-based Reconfigurable Unificated Coprocessors) to accelerate XML-document processing is investigated. |
format |
Article |
author |
Гильгурт, С.Я. |
spellingShingle |
Гильгурт, С.Я. О применении реконфигурируемых вычислителей для ускорения обработки xml-запросов в современных информационных системах Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України |
author_facet |
Гильгурт, С.Я. |
author_sort |
Гильгурт, С.Я. |
title |
О применении реконфигурируемых вычислителей для ускорения обработки xml-запросов в современных информационных системах |
title_short |
О применении реконфигурируемых вычислителей для ускорения обработки xml-запросов в современных информационных системах |
title_full |
О применении реконфигурируемых вычислителей для ускорения обработки xml-запросов в современных информационных системах |
title_fullStr |
О применении реконфигурируемых вычислителей для ускорения обработки xml-запросов в современных информационных системах |
title_full_unstemmed |
О применении реконфигурируемых вычислителей для ускорения обработки xml-запросов в современных информационных системах |
title_sort |
о применении реконфигурируемых вычислителей для ускорения обработки xml-запросов в современных информационных системах |
publisher |
Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України |
publishDate |
2009 |
url |
http://dspace.nbuv.gov.ua/handle/123456789/26531 |
citation_txt |
О применении реконфигурируемых вычислителей для ускорения обработки xml-запросов в современных информационных системах / С.Я. Гильгурт, Г.Е. Пухова // Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України. — К.: ІПМЕ ім. Г.Є.Пухова НАН України, 2009. — Вип. 52. — Бібліогр.: 7 назв. — рос. |
series |
Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України |
work_keys_str_mv |
AT gilʹgurtsâ oprimeneniirekonfiguriruemyhvyčislitelejdlâuskoreniâobrabotkixmlzaprosovvsovremennyhinformacionnyhsistemah |
first_indexed |
2025-07-02T22:18:09Z |
last_indexed |
2025-07-02T22:18:09Z |
_version_ |
1836575295595872256 |
fulltext |
УДК 004.75:004.272.23
С.Я. Гильгурт, канд.техн.наук, ИПМЭ им. Г.Е. Пухова НАНУ, г. Киев
О ПРИМЕНЕНИИ РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЕЙ ДЛЯ
УСКОРЕНИЯ ОБРАБОТКИ XML-ЗАПРОСОВ В СОВРЕМЕННЫХ
ИНФОРМАЦИОННЫХ СИСТЕМАХ
The application of RUCs (FPGA-based Reconfigurable Unificated
Coprocessors) to accelerate XML-document processing is investigated.
В настоящее время такие информационные технологии, как GRID и
SOA, находят широкое применение при построении распределенных систем
сбора, хранения, анализа и визуализации больших объемов данных. На их
основе разрабатываются виртуальные ресурсно-операционные центры в
различных отраслях, в том числе и в энергетике. Целью создания таких
систем является консолидация имеющейся информации, представление ее в
удобном для использования виде, обеспечение информационной и методо-
логической поддержки научных исследований [1].
В качестве аппаратной базы для подобных систем чаще всего выступают
кластерные решения, что обусловлено их доступностью, масштабируемостью
и относительно высоким уровнем стандартизации. Однако реализация
некоторых современных протоколов и служб на компьютерах с массовым
параллелизмом приводит, при определенных условиях, к недопустимо
высокой загрузке серверов, что негативно сказывается на функционировании
виртуального центра в целом.
С другой стороны, в компьютерных технологиях в настоящее время
интенсивно развивается альтернативное направление, способное дополнить и
расширить возможности кластеров – использование унифицированных
вычислителей (УВ), которыми оснащаются узлы высокопроизводительных
ЭВМ, либо отдельные системные блоки компьютеров [2].
В настоящей работе анализируются возможности решения проблемы
разгрузки серверов информационных систем путем применения унифици-
рованных вычислителей.
Анализ последних достижений и публикаций по информационным
технологиям обработки распределенных данных свидетельствует, что данная
область находится в стадии интенсивного развития. По этой причине многие
проблемы выявлены недавно и публикации по их решению либо
отсутствуют, либо ограничиваются формой кратких сообщений и тезисов
докладов. Информации по использованию унифицированных вычислителей
также недостаточно, поскольку эта область в настоящее время развивается
еще стремительнее.
Целью настоящей статьи является исследование принципов ускорения
реализации некоторых процессов обработки данных, в частности, обработки
XML-запросов в распределенных информационных системах посредством
реконфигурируемых унифицированных вычислителей [3].
1. XML – стандартный формат данных
К наиболее распространенным стандартам реализации веб-сервисов в
информационно-аналитических системах на сегодняшний день можно
отнести:
SOAP (Simple Object Access Protocol) – протокол для посылки
сообщений по протоколу HTTP и другим интернет-протоколам;
WSDL (Web Services Description Language) – язык для описания
программных интерфейсов веб-сервисов;
UDDI (Universal Description, Discovery and Integration) – стандарт для
индексации веб-сервисов.
В качестве единого формата представления данных чаще всего
применяется язык XML (Extensible Markup Language) [4]. К его
преимуществам можно отнести простоту использования, удобство передачи
по стандартным сетевым протоколам интернет, таким как HTTP и FTP,
возможность быстрого кодирования структурированных и неструктуриро-
ванных данных, независимость от используемой платформы и др.
Вместе с тем, использование языка XML при построении современных
информационных систем сопровождается некоторыми сложностями, которые
необходимо учитывать. В частности, при оперировании документами в
данном формате из-за увеличения размеров файлов существенно повышается
сетевой трафик. Кроме того, проблемы безопасности, неизбежно
возникающие в информационно-аналитических системах, приводят к
необходимости реализации в обязательном порядке таких функций, как
аутентификация, подтверждение подлинности, обеспечение целостности
информации, а также закрытие передаваемых данных криптографическими
методами электронной защиты.
2. Применение РУВ – перспективное направление
Разгрузить серверы кластеров от рутинных операций, существенно
повысив тем самым производительность информационных систем, позволя-
ют унифицированные вычислители, рассмотренные, например, в работе [2].
Применительно к вышеупомянутым проблемам наиболее перспективным
оказывается один из подклассов УВ, а именно, реконфигурируемые
унифицированные вычислители (РУВ), исследованные в работе [3]. Эти
устройства (на базе программируемой логики типа FPGA) благодаря
простоте обслуживания, низкому энергопотреблению, высокой гибкости и
универсальности находят в последнее время все более широкое применение
при решении ресурсоемких задач различного класса. Показательным фактом,
подтверждающим перспективность данного направления, представляется
появление типовых реконфигурируемых решений у таких известных
производителей суперкомпьютерной техники, как CRAY и SGI.
В настоящем исследовании, в отличие от предыдущих публикаций
автора, речь идет о применении реконфигурируемых вычислителей в составе
не универсальных ПЭВМ общего назначения, а узлов вычислительных
кластеров. Одной из особенностей такого применения является
необходимость разделения ресурсов РУВ между несколькими процессами.
Как указывалось в работе [5], обязательным условием эффективного
использования РУВ является их интеграция в системную среду. Иными
словами, для операционной системы устройство должно выглядеть как
стандартный аппаратный компонент. Применение в распределенных
вычислительных комплексах приводит к тому, что в составе внутренних
регистров РУВ должны быть предусмотрены специальные поля для хранения
системных сведений. В качестве таких сведений может выступать
информация о занятости/доступности устройства, о том, какой процесс
использует его в текущий момент времени, и т.п.
Еще один важный вопрос, на который необходимо обратить внимание в
данной связи, это проблема частичной реконфигурации программируемых
СБИС – partial reconfiguration. При "традиционном" использовании
программируемой логики для макетирования и отработки новых проектов,
частичная реконфигурация позволяет сократить время разработки. Однако,
при использовании РУВ в составе высокопроизводительного сервера,
обрабатывающего миллионы транзакций в секунду, преимущества частич-
ного синтеза (incremental synthesis), позволяющего существенно ускорить
выполнение интеллектуальных операций, возрастают многократно.
Следует также заметить, что способность быстрой реконфигурации, то
есть мгновенной смены вычислительной структуры, загруженной в ПЛИС
унифицированного вычислителя, позволяет в случае необходимости опера-
тивно переключиться на решение более актуальной в текущий момент задачи
и использовать то же самое оборудование для выполнения, например,
функций защиты информации [6].
3. Обработка потока XML-документов на РУВ
В общем случае процесс прохождения электронного документа через
сервер включает такие этапы, как прием, расшифрование, разборка, проверка,
обработка по нужному алгоритму, формирование нового документа (при
необходимости), добавление цифровой подписи, зашифрование, передача
выходного XML-документа.
Высокие технические характеристики современных ПЛИС, используе-
мых в составе РУВ, позволяют аппаратно реализовать как низкоуровневые
функции, так и более интеллектуальные, вплоть до прикладного уровня.
Более того, именно при высокоуровневой обработке в значительной степени
реализуется мощный потенциал реконфигурируемых вычислений в части
гибкости и адаптивности [7].
Для навигации по дереву XML-документа и обращения к его к
элементам разработан специальный язык – XPath (XML Path Language).
Рассмотрим, как производится обработка XPath-запроса на микросхеме
программируемой логики (ПЛИС), которая является обязательным
компонентом РУВ.
Для нахождения элементов в дереве XML-документа используются пути
адресации, которые делятся на шаги адресации, с последующей фильтрацией
отобранного набора. Возможность реализации синтаксического анализатора
(parser) и операции фильтрации в конвейерном режиме на одном и том же
кристалле ПЛИС позволяет существенно сократить коммуникационные
задержки, неизбежные при реализации на традиционных многоядерных
системах. В практических разработках удается достичь ускорения более чем
на порядок [7].
Плотный поток запросов, поступающих в информационную систему,
приводит к повышенным требованиям, предъявляемым к реализации
процедуры обработки XML-запросов. Широко распространенное решение
данной проблемы основано на кластеризации запросов, то есть на их
группировке по сходным признакам с целью сузить область поиска в
пространстве элементов. Для реализации данного подхода используется
цифровой автомат (ЦА), на состояния которого отображаются элементы
пользовательских запросов. Собственно кластеризация осуществляется
накапливанием многих запросов в одном ЦА путем анализа элементов XPath-
сообщений и обнаружения схожих путей адресации. За счет однообразия, а
также использования априорно известной информации о запросах анализ и
кластеризацию удается выполнить до начала процесса фильтрации.
Реализация описанного выше механизма на традиционной фон-
неймановской архитектуре приводит к существенным задержкам, являясь,
фактически, "узким местом" обработки электронных документов. Обработка
одного тега (элемента XML-документа) в такой системе требует нескольких
сотен машинных тактов, затрачиваемых на выполнение соответствующих
низкоуровневых операций. Единственный путь устранить данное
затруднение – распараллелить вычисления и распределить их на несколько
процессоров. Однако такое решение не позволяет принципиально решить
проблему из-за появляющихся в этом случае дополнительных
коммуникационных задержек на межпроцессорный обмен.
С другой стороны, использование программируемой логики
предоставляет гораздо более широкие возможности для распараллеливания
процессов обработки, позволяя в то же время избежать подобных негативных
последствий. Задача обработки множества запросов, поступающих,
практически, одновременно, по своей природе является хорошо
распараллеливаемой. Для каждого запроса может быть выделена конкретная
часть аппаратных ресурсов ПЛИС. При определенной оптимизации на одной
микросхеме могут обрабатываться одновременно тысячи запросов. При этом
отпадает необходимость обмена данными с другими компонентами
вычислительной системы. Данная особенность аппаратной реализации XML-
документа позволяет реализовать конвейеризацию процессов синтакси-
ческого анализа и фильтрации, в результате чего каждое событие,
инициируемое парсером, непосредственно передается в модуль фильтрации.
Гибкость программируемой логики позволяет также реализовать
комбинационные схемы высокой сложности для быстрого выполнения
фильтрации запросов после синтаксического разбора. Для синтеза такой
схемы подлежащий обработке XML-документ предварительно анализируется
специальными программными средствами, в результате чего в микросхеме
программируемой логики синтезируется структура, оптимизированная под
этот конкретный электронный документ. Адаптивность такого уровня
недостижима при реализации обработки на традиционных последовательных
вычислителях.
Выводы
Необходимость обработки больших объемов данных в информационно-
аналитических системах приводит к повышенным нагрузкам на вычис-
лительные узлы кластеров. Применение программируемой логики в виде
РУВ, используемых в качестве сопроцессоров, позволяет существенно
ускорить обработку плотного потока пользовательских запросов и разгрузить
процессорные ядра для выполнения управляющих функций.
1. Воропай Н.И., Массель Л.В. ИТ-инфраструктура системных исследований в
энергетике и предоставление ИТ-услуг // Изв. РАН. Энергетика. 2006. №3. С.86-93.
2. Гильгурт С.Я. Анализ существующих унифицированных вычислителей для
выполнения ресурсоемких расчетов // Моделювання та інформаційні технології. Зб.
наук. пр. ІПМЕ НАН України. – Вип. 48. – Київ: 2008. – С. 115–120.
3. Гильгурт С.Я. Обзор современных реконфигурируемых унифицированных
вычислителей // Моделювання та інформаційні технології. Зб. наук. пр. ІПМЕ НАН
України. – Вип. 49. – Київ: 2008. – С. 17–24.
4. Самсонов В.Е., Солодкин Г.И., Точицкий Л.И. Проблемы создания
автоматизированных информационных систем для органов территориального
управления // Информатика. – 2005. – №1. – С. 103–111.
5. Гильгурт С.Я., Гиранова А.К. Программное обеспечение для тестирования
аппаратных средств реконфигурируемых вычислителей // Моделювання та
інформаційні технології. Зб. наук. пр. ІПМЕ НАН України. – Вип. 38. – Київ: 2006. –
С. 8–14.
6. Гильгурт С.Я., Гиранова А.К. О применении реконфигурируемых вычислителей
для решения задач защиты информации // Зб. наук. праць ІПМЕ НАН України. – Київ,
2008. – Вип. 46. – С.93-99.
7. Abhishek Mitra, Marcos R. Vieira, Petko Bakalov, Walid Najjar, Vassilis J. Tsotras
Boosting XML Filtering with a Scalable FPGA-based Architecture // 4th Biennial
Conference on Innovative Data Systems Research (CIDR) January 4-7, 2009, Asilomar,
USA.
|