60 Years of Databases (part three)

The article provides an overview of research and development of databases since their appearance in the 60s of the last century to the present time. The following stages are distinguished: the emergence formation and rapid development, the era of relational databases, extended relational databases,...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2022
Автор: Reznichenko, V.A.
Формат: Стаття
Мова:Ukrainian
Опубліковано: Інститут програмних систем НАН України 2022
Теми:
Онлайн доступ:https://pp.isofts.kiev.ua/index.php/ojs1/article/view/488
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Problems in programming

Репозитарії

Problems in programming
id pp_isofts_kiev_ua-article-488
record_format ojs
resource_txt_mv ppisoftskievua/eb/f62e9327443691028557540f745f9ceb.pdf
spelling pp_isofts_kiev_ua-article-4882022-07-12T19:31:08Z 60 Years of Databases (part three) 60 років базам даних (частина третя) Reznichenko, V.A. hierarchical; network; relational; navigational; temporal; spatial; spatio-temporal; spatio-network; moving objects; deductive; active; object-oriented; object-relational; distributed; parallel; arrays; statistical; multidimensional; database machines; da UDC 004.94 ієрархічна; мережева; реляційна; навігаційна; темпоральна; просторова; просторово-темпоральна; просторово-мережева; об’єктів, що переміщуються; дедуктивна; активна; об’єктно-орієнтована; об’єктно-реляційна; розподілена; паралельна; масивів; статистична УДК 004.94 The article provides an overview of research and development of databases since their appearance in the 60s of the last century to the present time. The following stages are distinguished: the emergence formation and rapid development, the era of relational databases, extended relational databases, post-relational databases and big data. At the stage of formation, the systems IDS, IMS, Total and Adabas are described. At the stage of rapid development, issues of ANSI/X3/SPARC databasearchitecture, CODASYL proposals, concepts and languages of conceptual modeling are highlighted. At the stage of the era of relational databases, the results of E. Codd’s scientific activities, the theory of dependencies and normal forms, query languages, experimental research and development, optimization and standardization, and transaction management are revealed. The extended relational databases phase is devoted to describing temporal, spatial, deductive, active, object, distributed and statistical databases, array databases, and database machines and data warehouses. At the next stage, the problems of post-relational databases are disclosed, namely, NOSQL-, NewSQL- and ontological databases. The sixth stage is devoted to the disclosure of the causes of occurrence, characteristic properties, classification, principles of work, methods and technologies of big data. Finally, the last section provides a brief overview of database research and development in the Soviet Union.Prombles in programming 2022; 1: 34-66 Наводиться огляд досліджень і розробок баз даних з моменту їх виникнення в 60-х роках минулого століття і по теперішній час. Виділяються наступні етапи: виникнення і становлення, бурхливий розвиток, епоха реляційних баз даних, розширені реляційні бази даних, постреляційні бази даних і великі дані. На етапі становлення описуються системи IDS, IMS, Total і Adabas. На етапі бурхливого розвитку висвітлені питання архітектури баз даних ANSI/X3/SPARC, пропозицій КОДАСИЛ, концепції і мов концептуального моделювання. На етапі епохи реляційних баз даних розкриваються результати наукової діяльності Е. Кодда, теорія залежностей і нормальних форм, мови запитів, експериментальні дослідження і розробки, оптимізація та стандартизація, управління транзакціями. Етап розширених реляційних баз даних присвячений опису темпоральних, просторових, дедуктивних, активних, об’єктних, розподілених та статистичних баз даних, баз даних масивів, машин баз даних і сховищ даних. На наступному етапі розкрита проблематика постреляційних баз даних, а саме, NOSQL-, NewSQL- і онтологічних баз даних. Шостий етап присвячений розкриттю причин виникнення, характерних властивостей, класифікації, принципів роботи, методів і технологій великих даних. Нарешті, в останньому розділі дається короткий огляд досліджень і розробок по базах даних в Радянському Союзі.Prombles in programming 2022; 1: 34-66 Інститут програмних систем НАН України 2022-05-30 Article Article application/pdf https://pp.isofts.kiev.ua/index.php/ojs1/article/view/488 10.15407/pp2022.01.034 PROBLEMS IN PROGRAMMING; No 1 (2022); 034-066 ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ; No 1 (2022); 034-066 ПРОБЛЕМИ ПРОГРАМУВАННЯ; No 1 (2022); 034-066 1727-4907 10.15407/pp2022.01 uk https://pp.isofts.kiev.ua/index.php/ojs1/article/view/488/487 Copyright (c) 2022 PROBLEMS IN PROGRAMMING
institution Problems in programming
baseUrl_str https://pp.isofts.kiev.ua/index.php/ojs1/oai
datestamp_date 2022-07-12T19:31:08Z
collection OJS
language Ukrainian
topic hierarchical
network
relational
navigational
temporal
spatial
spatio-temporal
spatio-network
moving objects
deductive
active
object-oriented
object-relational
distributed
parallel
arrays
statistical
multidimensional
database machines
da
UDC 004.94
spellingShingle hierarchical
network
relational
navigational
temporal
spatial
spatio-temporal
spatio-network
moving objects
deductive
active
object-oriented
object-relational
distributed
parallel
arrays
statistical
multidimensional
database machines
da
UDC 004.94
Reznichenko, V.A.
60 Years of Databases (part three)
topic_facet hierarchical
network
relational
navigational
temporal
spatial
spatio-temporal
spatio-network
moving objects
deductive
active
object-oriented
object-relational
distributed
parallel
arrays
statistical
multidimensional
database machines
da
UDC 004.94
ієрархічна; мережева; реляційна; навігаційна; темпоральна; просторова; просторово-темпоральна; просторово-мережева; об’єктів
що переміщуються; дедуктивна; активна; об’єктно-орієнтована; об’єктно-реляційна; розподілена; паралельна; масивів; статистична
УДК 004.94
format Article
author Reznichenko, V.A.
author_facet Reznichenko, V.A.
author_sort Reznichenko, V.A.
title 60 Years of Databases (part three)
title_short 60 Years of Databases (part three)
title_full 60 Years of Databases (part three)
title_fullStr 60 Years of Databases (part three)
title_full_unstemmed 60 Years of Databases (part three)
title_sort 60 years of databases (part three)
title_alt 60 років базам даних (частина третя)
description The article provides an overview of research and development of databases since their appearance in the 60s of the last century to the present time. The following stages are distinguished: the emergence formation and rapid development, the era of relational databases, extended relational databases, post-relational databases and big data. At the stage of formation, the systems IDS, IMS, Total and Adabas are described. At the stage of rapid development, issues of ANSI/X3/SPARC databasearchitecture, CODASYL proposals, concepts and languages of conceptual modeling are highlighted. At the stage of the era of relational databases, the results of E. Codd’s scientific activities, the theory of dependencies and normal forms, query languages, experimental research and development, optimization and standardization, and transaction management are revealed. The extended relational databases phase is devoted to describing temporal, spatial, deductive, active, object, distributed and statistical databases, array databases, and database machines and data warehouses. At the next stage, the problems of post-relational databases are disclosed, namely, NOSQL-, NewSQL- and ontological databases. The sixth stage is devoted to the disclosure of the causes of occurrence, characteristic properties, classification, principles of work, methods and technologies of big data. Finally, the last section provides a brief overview of database research and development in the Soviet Union.Prombles in programming 2022; 1: 34-66
publisher Інститут програмних систем НАН України
publishDate 2022
url https://pp.isofts.kiev.ua/index.php/ojs1/article/view/488
work_keys_str_mv AT reznichenkova 60yearsofdatabasespartthree
AT reznichenkova 60rokívbazamdanihčastinatretâ
first_indexed 2025-07-17T09:51:29Z
last_indexed 2025-07-17T09:51:29Z
_version_ 1838410011132297216
fulltext 34 Моделі та засоби систем баз даних і знань Розподілені бази даних. Розподілена база даних (РоБД) – це інтегрована сукупність баз даних, які фізично розподілені комп′ютерною мере- жею. А розподілена система управління базами даних (РоСУБД) – це програмна система, яка управляє розподіленою ба- зою даних таким чином, що аспекти роз- поділення стають прозорими (невидими- ми) для користувачів. РоСУБД може мати спільний інтерфейс для доступу до розпо- ділених даних [10]. Виникненння РоБД обумовлене тим, що тут природно представляються організаційна структура даних підпри- ємства, підвищується надійність, до- ступність і локальний контроль, зростає продуктивність, полегшується процедура розширення системи. Розробка концепції і досліджен- ня РаБД почалися в другій половині 70-х років. Серед численних дослідницьких систем найбільш відомими є три: систе- ма SDD-1 [439 - 442], створена в науко- во-дослідницькому відділенні корпорації Computer Corporation of America наприкін- ці 1970-х і початку 1980-х років, система System R * [443 - 446], розподілена вер- сія системи -протоколу System R, створе- на в дослідницькому відділенні компанії IBM на початку 1980-х років, і система Distributed Ingres [447 - 449], розподілена версія прототипу системи Ingres, створена також на початку 1980-х років у Каліфор- нійському університеті в Берклі. Варто зга- дати також проєкт POLIPHEME у Франції [450]. У проєктах 70-х років було виявле- но низку ключових проблем, пов′язаних із розробкою систем розподілених баз даних, подані підходи до їх вирішення. Той факт, що всього лише за кілька років у цій царині були отримані значні результати, підтвер- джується появою наприкінці 70-х оглядів на цю тему [451 - 453]. До кінця 80-х років були здійснені численні дослідження, експериментальні розробки, почали з′являтися перші про- мислові РоБД. Було звернуто увагу на створення мультибаз даних і на надання більшої автономності індивідуальним сис- темам [454 - 455]. У 1986 – 87 роках були представле- ні перші промислові РоСУБД Ingres/STAR, УДК 004.94 http://doi.org/10.15407/pp2022.01.34 В.А. Резніченко 60 РОКІВ БАЗАМ ДАНИХ (частина третя) Наводиться огляд досліджень і розробок баз даних з моменту їх виникнення в 60-х роках минулого століття і по теперішній час. Виділяються наступні етапи: виникнення і становлення, бурхливий роз- виток, епоха реляційних баз даних, розширені реляційні бази даних, постреляційні бази даних і великі дані. На етапі становлення описуються системи IDS, IMS, Total і Adabas. На етапі бурхливого розвитку висвітлені питання архітектури баз даних ANSI/X3/SPARC, пропозицій КОДАСИЛ, концепції і мов концептуального моделювання. На етапі епохи реляційних баз даних розкриваються результати науко- вої діяльності Е. Кодда, теорія залежностей і нормальних форм, мови запитів, експериментальні дослі- дження і розробки, оптимізація та стандартизація, управління транзакціями. Етап розширених реля- ційних баз даних присвячений опису темпоральних, просторових, дедуктивних, активних, об’єктних, розподілених та статистичних баз даних, баз даних масивів, машин баз даних і сховищ даних. На наступному етапі розкрита проблематика постреляційних баз даних, а саме, NOSQL-, NewSQL- і он- тологічних баз даних. Шостий етап присвячений розкриттю причин виникнення, характерних власти- востей, класифікації, принципів роботи, методів і технологій великих даних. Нарешті, в останньому розділі дається короткий огляд досліджень і розробок по базах даних в Радянському Союзі. Ключові слова. Типи баз даних: ієрархічна, мережева, реляційна, навігаційна, темпоральна, просторо- ва, просторово-темпоральна, просторово-мережева, об’єктів, що переміщуються, дедуктивна, активна, об’єктно-орієнтована, об’єктно-реляційна, розподілена, паралельна, масивів, статистична, багатовимір- на, машина баз даних, сховища даних, NoSQL, ключ-значення, стовпчикова, документно-орієнтована, графова, мультимодельна, хмарна, наукова, багатозначна, XML, NewSQL, онтологічна, великі дані. © В.А. Резніченко, 2022 ISSN 1727-4907. Проблеми програмування. 2022. № 1 35 Моделі та засоби систем баз даних і знань Oracle 7 s DB2. Тож постала необхідність формування основних принципів, вимог і функціональних можливостей РоБД. Від- повіддю на ці вимоги в 90-му році стала стаття Дейта [456], де були сформульовані 12 правил РоБД, головне з них – прозорість для користувачів розподіленої структури баз даних.Ці правила були прийняті науко- вим товариством і ними досі користуються у розробці РоСУБД. Типи РоБД. Існують два основні типи РоБД: однорідні (homogeneous) і нео- днорідні (heterogeneous). Однорідні РоБД. У них усі вузли пе- ребувають під управлінням РоСУБД одно- го типу (і, можливо, під управлінням одні- єї операційної системи). Існують два типи однорідних РоБД: автономні і неавтоном- ні. Автономні працюють незалежно, пе- редаючи і приймаючи повідомлення одне одному для спільного оновлення даних. Неавтономні РоБД передбачають існуван- ня центральної (головної) РоСУБД, котра координує доступ до даних і їх оновлен- ня в мережі. Звичайні розподілені (regular distributed) й паралельні бази даних нале- жать до однорідних РоБД. Неоднорідні РоБД. Вони працю- ють під управлінням різних операційних систем і типів РоСУБД. Існує чотири типи неоднорідних РоБД: - федеративні (federated); - із посередниками (mediators); - мультибази даних (multidatabases); - однорангові бази даних. Федеративні РоБД. Являють со- бою об′єднання БД різних типів, яки- ми володіють різні користувачі і які об′єднуються для спрощення спільного використання даних. Федеративна БД пе- редбачає визначення глобальної інтегра- ційної схеми, що містить відображення в схеми баз даних учасників. Уперше феде- ративну БД визначили Маклеод і Хайм- бігнер (McLeod, Heimbigner) 1985 року [457], вона досліджувалася у багатьох працях [458, 459]. У [460] наводиться огляд федеративних БД. У разі суттєвого збільшення баз да- них, що інтегруються, буває важко, а ін- коли і неможливо визначити глобальну інтеграційну схему. Мультибази даних не передбачають існування глобальної схе- ми. Натомість мова запитів дає можливість специфікувати вирази, які дозволяють здійснювати пошук за об′єднувальними базами даних. Посередники (mediators) [462, 463]. Вони розміщені між системами з однією глобальною схемою і взагалі без схем. Натомість користувачі визначають погляди – посередники, які об′єднують і узгоджують дані з різних джерел. Для та- ких поглядів необхідна мова запитів, яка здатна формулювати запити за багатьма базами даних, подібно до мови запитів мультибаз даних. Однорангові БД (peer – to – peer databases – P2PDB) [464 - 466]. Вони являють собою сукупність автономних локальних репозиторіїв/баз даних, які взаємодіють між собою на рівноправній основі. Основне завдання P2PDB – роз- повсюджувати запити між гетерогенними вузлами у великій розподіленій мережі. Таке розповсюдження може зупинитися за кілька кроків. Це допустимо для деяких сучасних систем, які не потребують висо- кої точності результатів. Як – от у пошу- кових машинах Інтернету. Розподіл даних. Фрагментація. В РоБД існує задача розподілу логічно ціліс- ної БД по вузлах розподіленої структури таким чином, щоб оптимізувати цільову функцію. Є два фундаментальні методи вирішення цієї задачі: фрагментація і ре- плікація. Фрагментація (сегментація, деком- позиція) передбачає розподіл даних на сег- менти (фрагменти) даних, що не перетина- ються, для їх прив′язування до вузлів мере- жі. Реплікація передбачає запам′ятовування на різних вузлах ідентичних копій всієї або ж частини логічної бази даних. РоСУБД гарантує користувачам прозорість такого розподілу. Крім цього, існує задача розмі- щення фрагментованих/реплікованих да- них у вузлах мережі. Є два види фрагментації: горизон- тальна і вертикальна. Під час горизонталь- ної фрагментації відношення розбивається на групи рядків, які розподіляються по вуз- лах. За вертикальної фрагментації відно- 36 Моделі та засоби систем баз даних і знань шення розбиваються на групи стовпчиків. Допускається також гібридна фрагмента- ція, яка передбачає одночасне використан- ня двох попередніх фрагментацій. Основні дослідження з фрагмента- ції були здійснені на початку 80-х років [467, 469, 470, 10]. Одна з основних за- дач вертикальної фрагментації – визна- чення наборів атрибутів, що мають бути об′єднані в одну групу. В працях [471, 472] було запропоновано алгоритм енергетич- ного зв′язування (bond energy algorithm) для групування атрибутів. На його основі здійснюється вертикальна фрагментація. У праці [473] висунуто модифікований ва- ріант цього алгоритму. Що ж до задачі розміщення даних, то роботи в цьому напрямку почалися ще наприкінці 60-х років, коли досліджува- лась проблема розміщення файлів [474]. У працях [475 - 477] була досліджена про- блема складності задач розміщення. В [478, 479] досліджені динамічні алгоритми розміщення даних, які передбачають мож- ливість зміни початкового розміщення для обліку змін у методах доступу й робочих навантаженнях. Пропонувались також ме- тоди інтеграції фрагментації та розміщен- ня [467, 468]. Розподіл даних. Реплікація. Роботи із реплікації БД датуються початком 80-х років, коли були здійснені дослідження щодо доступності даних, а більшість про- понованих рішень забезпечувала узгодже- ність даних. Цікавим оглядом досліджень того часу є стаття [480]. Основна проблема реплікації даних полягає в тому, що оновлення будь – якого заданого логічного об′єкту має розповсю- джуватися по всіх збережених копіях цього об′єкту. 1996 року Грей продовжив дослі- дження в цій царині [481] й запропонував варіанти негайного (eager) і відтерміно- ваного (lazy) оновлень. Один із варіантів відтермінованого оновлення – викорис- тання первинної копії (master copy), коли основна копія оновлюється оперативно, а оновлення вторинних копій відкладається до зручного часу. Причому синхронна ре- плікація передбачає завершення розповсю- дження змін до завершення транзакції, а синхронна реплікація допускає розповсю- дження змін після завершення транзакції. Зрештою Грей запропонував дворівневе оновлення транзакцій. Остання стаття активізувала по- дальші дослідження з реплікації. Серед на- прямків досліджень – зменшення наклад- них витрат на комунікацію і координацію за рахунок затримки оновлень видалених копій. Однак у цьому випадку копії мо- жуть містити застарілі або навіть неузго- джені дані. Через це з′явилися пропозиції щодо неузгодженості [482], встановлення обмежень на «застарілі» дані та виявлення й усунення неузгодженості [483]. Інший напрямок досліджень, які здійснювалися в контексті масштабова- ної кластерної реплікації, пов’язаний із розробкою методів забезпечення надій- ної узгодженості за прийнятних витрат [484, 485]. Із появою хмарних систем зберігання в дослідження були залучені внутрішньохмарні реплікації, концеп- туально схожі на кластерну реплікацію, а також міжхмарні й геореплікації [486, 487]. Що ж до розподілених систем, то спочатку дослідження концентрували- ся на реплікаційних файлових системах [488, 489], згодом на веб-серверних ре- плікаціях [490] і файлових реплікаціях однорангових систем [491]. Також були отримані результати із відмовостійких реплікацій об′єктів [492, 493]. Як і в сфе- рі баз даних, найостанніші результати щодо реплікації розподілених систем, належать до хмарної інфраструктури, а саме – реплікації в системах зберігання [494], таких, як HDFS і Cassandra, а та- кож глобальна (wide – area) реплікація [484, 495]. Тупики в РоБД. У БД, що послу- говуються протоколом блокувань для до- ступу до спільно використовуваних даних, можливі тупикові ситуації (deadlock), коли транзакція очікує події, яка може статися через наступні дії самої транзакції. Як–от, коли дві транзакції чекають одна на одну. Існують такі категорії алгоритмів виявлення тупиків у РоБД [10]: центра- лізовані, ієрархічні, розподілені. Центра- лізовані алгоритми [496, 497] використо- вують центральний вузол для виявлення тупиків. Як зазначається в [439], цен- 37 Моделі та засоби систем баз даних і знань тралізоване двофазне блокування (two – phase locking – 2PL) і виявлення тупиків стало позитивною природною комбіна- цією. Централізоване виявлення тупиків уперше було реалізовано в Distributed INGRES [498]. Ієрархічні алгоритми [497, 499] для виявлення тупиків покла- даються на ієрархічну структуру вузлів РоБД. Розподілені алгоритми [499, 500] покладаються на кооперацію всіх вузлів РоБД для виявлення тупиків. Розподілене виявлення тупиків уперше було реалізо- вано в System R* [500]. У [10] представлено огляд методів управління розподіленими тупиками. В оглядах [501 - 504] обговорюються різні розподілені алгоритми виявлення тупиків. У праці [505] наводиться порівняльний аналіз додаткових алгоритмів виявлення тупиків : просування шляху (path – pushing) [499], зондовий (probe – based) [506], гло- бального стану (global state) [507, 508]. Розподілена обробка запитів. Це процедура виконання запиту в розподіле- ному середовищі, де дані розміщені в різ- них вузлах комп′ютерної мережі. Вона пе- редбачає перетворення запиту, сформульо- ваного високорівневою мовою (наприклад, SQL), у вираз процедурної мови низького рівня (приміром, реляційна алгебра), який названо «план виконання запиту». Далі цей план оптимізується з урахуванням роз- поділеності даних і, зрештою, відбувається послідовне виконання операторами отри- маного оптимального плану. Дослідження із розподіленої оброб- ки запитів почалися наприкінці 70-х ро- ків. Тоді було розроблено три експеримен- тальні системи, де були закладені фунда- ментальні методи розподіленої оптиміза- ції і обробки запитів: SDD-1 [509] (1976), Distributed INGRES [510, 511] (1977) і Sysnem R* [512, 513] (1981). Вважається, що першим дистрибутивним алгоритмом оптимізації запитів є «скелелазіння» (hill climbing) Вонга [514], який згодом було поліпшено в SDD-1 через включення опе- рації напівз′єднання. Оптимізаційний ал- горитм SDD-1 є статичним, він спрямова- ний на зменшення сумарних комунікацій- них витрат і не підтримує фрагментацію і реплікацію. Дистрибутивний алгоритм оптимізації запитів Distributed Ingres [510] у кожному наступному кроці детерміно- вано аналізує простір імовірних планів і робить висновок щодо локальної оптимі- зації. Він також підтримує горизонтальну фрагментацію. Цільова функція оптимі- зації є виваженою комбінацією вартості сумарного часу і часу реакції. Алгоритм є динамічним. Дистрибутивний алгоритм оптимі- зації запитів System R* [513] всебічно ана- лізує межі пошуку всіх можливих планів виконання запитів. Алгоритм не підтримує фрагментацію і реплікацію. Цільова функ- ція оптимізації враховує локальну обробку й комунікаційні витрати. Алгоритм є ста- тичним. Було здійснено дослідження з оптимізації виконання виражень реля- ційної алгебри із розподіленим серед- овищем включно. В статті [515] наведе- но огляд цих результатів. Запропоновано кілька підходів щодо динамічної оптимі- зації запитів для паралельних і розподі- лених баз даних [516]. Алгоритм у [517] передбачає зміну плану відпрацювання запиту в процесі його виконання, аби врахувати непередбачувані обставини. В системі Mariposa [518] вперше була ви- сунута модель оптимізації розподіленого запиту. В монографіях [519, 10] детально висвітлюються результати в галузі техно- логій розподілених баз даних і оптиміза- ції розподілених запитів, отримані у 80 – 90-х роках. Стаття [516] є найновішим оглядом у цій сфері. Управління паралелізмом (Concurrency Control). Це процедура та- кого управління одночасною безконфлік- тною роботою багатьох транзакцій, за якої транзакції коректно виконують свою роботу без порушення обмежень ціліс- ності БД (принципа ACID). Дослідження з управління парале- лізмом у розподілених системах зароди- лися на початку 80-х років. Вони спира- лися на широко відому на той час статтю [520] із управління паралелізмом у цен- тралізованих БД. Грей розвинув ці ідеї для транзакцій [521], а Спектор і Шварц [522] дослідили транзакції у розподілено- му середовищі. 38 Моделі та засоби систем баз даних і знань Було запропоновано три механіз- ми управління паралелізмом: блокуван- ня, оптимістичний протокол і впорядку- вання за часовими позначками (timestamp odering). Блокування. Це обмеження досту- пу до спільно використовуваних ресурсів (даних) із одночасним виконанням бага- тьох транзакцій. Першим широко відомим механіз- мом блокувань було двофазне блокування (Two – Phase Locking – 2PL), яке вперше описане в [520]. Згодом була визначена велика кількість його різновидів: строга (strict), консервативна (conservative), пер- винної копії (primary copy), розподілена (distributed), точна (rigorous). У [523] опи- сано варіант 2PL з урахуванням викорис- тання старих значень. Також були запропо- новані гібридні блокування, що передбача- ють використання методів, відмінних від 2PL [524 - 526]. Наступний тип управління пара- лелізмом дістав назву «оптимістичний» у тому сенсі, що створюються локальні копії даних транзакції й оновлюються саме вони, а не власне дані. Вперше цей метод був ви- сунутий у праці [527], і відтоді досліджено чимало його різновидів [528, 529]. Зрештою впорядкування за часови- ми позначками використовує Системний Час або ж певний логічний лічильник в ролі часових позначок для впорядкування вико- нання паралельних транзакцій. Транзакції присвоюється часова позначка здебільшо- го із урахуванням часу запуску транзакції. Старіша транзакція є пріоритетнішою. У разі конфлікту перевага надається пріори- тетній транзакції. Цей протокол описано в [530 - 532]. У [532, 533] також описані багатоверсійні часові позначки. Цікавий огляд методів управління паралелізмом знаходимо в статті [534]. Машини баз даних. Загалом машиною бази даних (МБД) прийнято називати апаратно-програмний мультимікропроцесорний комплекс, при- значений для всіх або деяких функцій СУБД. Цей напрямок баз даних з′явився на початку 70-х років. На першому етапі протягом 10 – 12 років основна ідея дослі- джень і розробок МБД була спрямована на створення спеціальних обчислювальних обладнань і розробку архітектур, де про- цес обчислення бази даних розміщувався ближче до дисків з метою значного збіль- шення продуктивності. На той час було реалізовано понад 50 проєктів. Основними критеріями оцінки того чи іншого проєкту були повнота виконуваних функцій СУБД і очікуване підвищення продуктивності. На основі експериментальних прототипів у багатьох країнах світу згодом сформувало- ся виробництво різних зразків машин баз даних [535]. У цей період були запропоновані рі- шення, які дістали назву процесорів філь- трів. Їхньою задачею була перевірка пере- даваних даних із дисків на зовнішній сер- вер. У працях [536, 537] процесори філь- трів були розділені на такі групи: процесор на доріжку (Processor-per- Track - PPT), процесор на голівку (Processor-per- Head - PPH), процесор на диск (Processor-per- Disk – PPD), мультипроцесорний кеш (Multi- Processor Cashe – MPC), процесор на комірку бульбашкової пам′яті (Processor-per-Bubble-cell – PPB). Процесор на доріжку – PPT. Згідно із [538] першим дослідни- ком в галузі МБД був Даніель Слотник (Daniel L. Slotnick), який 1970 року опу- блікував статтю [539], де висунув пропо- зицію архітектури з процесором на кожну доріжку. В цій архітектурі запам′ятовувач складається з великої кількості комірок, кожна з яких має доріжку даних, зв′язану з процесором, котрий блискавично ви- конує функцію пошуку потрібних да- них. Координацію роботи з комірками здійснює управляючий процесор. Осно- вна ідея Слотника полягала в тому, щоби здійснювати пошук у базі даних безпосе- редньо на запам′ятовувачі. Тим самим об- межити обсяг даних, які передаються на основний процесор. У подальшому під- хід Слотника розвинули Паркер (Parker) [540], Мінскі (Minsky) [541] і Пархамі (Parhami) [542]. На основі цієї архітекту- ри реалізовані МБД RAP [543], CASSM [544], RARES [545]. 39 Моделі та засоби систем баз даних і знань Даніель Слотник Процесор на голівку – PPH. До цьо- го класу належать МБД, в яких логіка об- робки даних прив′язується до кожної голів- ки в диску з рухомими голівками. В PPH дані паралельно передаються від головок до багатьох процесорів. Кожен процесор застосовує функцію відбору до вихідного потоку даних і розміщує вибрані дані у ви- хідному буфері. За такої організації кожен циліндр диску з рухомою голівкою аналі- зується щокожен оберт. До цього класу на- лежать МБД DBC [546], SURE [547]. Процесор на диск – PPD. На відмі- ну від PPT і PPH дана архітектура перед- бачає використання стандартних дисково- дів. Процесор (або багато процесорів) роз- міщується між диском і запам′ятовувачем, куди передаються відібрані дані. Цей про- цесор діє як фільтр, передаючи до осно- вного процесора лише ті дані, які відпові- дають критерію відбору. Мультипроцесорний кеш – МРС. До цього класу належать МБД, в яких спеці- алізовані процесори відділяються від при- строїв зберігання великим дисковим ке- шем. Мета цього архітектурного вирішен- ня – підтримувати паралелізм обробки під час використання традиційних пристроїв зберігання. Перед обробкою дані мають бути переміщені з диска в кеш, після чого вони стають доступними процесорам у па- ралельному режимі. Більше того, проміжні результати виконання запиту поміщають- ся процесорами в кеш і до них надається швидкий доступ для виконання наступних операцій запиту. Реалізовано багато МБД цього класу, як от RAP2 [548], DIRECT [549], INFOPLEX [550], RDBM [551], DBMAC [552]. Процесор на комірку бульбашкової пам′яті – РРВ. З кожною коміркою зовніш- ньої пам′яті асоціюється процесор. Варто зауважити, що в цей період більшість проєктів розробки МБД кон- центрувалася навколо спеціалізованого апаратного забезпечення, яке перебувало ще в стадії розробки. Зокрема, такого, як CCD-пам′ять (charge-coupled device, при- стрій із зарядовим зв′язком), бульбашкова пам′ять (bubble memory), диски з фіксова- ними голівками на кожну доріжку (hesd- per-track disks), оптичні диски (optical disks). Жодна з цих технологій уповні не виправдала себе. Тож після дванадцяти років активності в цьому напрямку май- бутнє МБД виглядало непевно навіть для найбільших її прихильників. Так, напри- клад, 1983 року стаття [538] передрікала стрімке зникнення МБД. Найвідомішими монографіями на тему машин баз даних першого етапу були праці Есена Озкара- хана (1986р.), а також Калиниченка Л.А. і Ривкіна В.М. (1990р.) [9]. Есен Озкарахан Попри песимістичні настрої, напря- мок МБД вижив і успішно розвивається за- вдяки паралельним системам баз даних. Як зазначається в [553], успіх пара- лельних баз даних пояснюється широким розповсюдженням реляційних баз даних. 1983 року вони лише почали з′являтися на ринку, сьогодні ж – домінують. Реляцій- ні запити щонайкраще підходять для па- ралельного виконання; вони складаються 40 Моделі та засоби систем баз даних і знань з однорідних операцій над однорідним потоком даних. Кожна операція утворює нове відношення, тож із операцій можуть складатися високо паралельні графи пото- ків даних. Дві операції можуть працювати послідовно, якщо направити вивід однієї операції на вхід іншої. Це так званий кон- веєрний паралелізм (pipelined parallelism). Якщо розділяти введені дані між кілько- ма процесорами і пам′яттю, часто-густо з′являється можливість розбити опера- цію на кілька незалежних операцій, кож- на з яких працює з частиною даних. Та- кий розподіл даних і обробка мають на- зву «роздільний паралелізм» (partitioned parallelism). Таким чином, історія демонструє, що вузькоспеціалізовані машини баз даних виявилися неспроможними, тоді як пара- лельні системи баз даних досягли величез- них успіхів. Успішні паралельні системи баз даних базуються на звичайних проце- сорах, пам′яті і дисках. Саме в цих систе- мах здебільшого відобразилися ідеї високо паралельних архітектур. У 1980-х роках дослідження щодо машин баз даних були зосередже- ні на масивних паралельних обчисленнях (massive parallel computing). Процесори були з′єднані у вузли, і такі вузли потім об′єднувалися у високошвидкісні міжбло- кові зв′язки [553, 554]. Деякі з цих типів машин баз даних досягли значного успіху в промисловості. У середині 80-х років Стоунбрейкер висунув наступну просту класифікацію паралельних мультипроцесорних систем [555]. Спільно використовувані пам′ять і диски (shared-everything – SE). Всі про- цесори мають прямий доступ до загальної глобальної пам′яті і до всіх дисків. Взаємо- дія між процесорами відбувається з вико- ристанням загальної пам′яті. Прикладами таких систем можуть бути XPRS [556], DBS3 [557]? Volcano [558]. Спільно використовувані диски (shared disks – SD). Кожен процесор має власну пам′ять і прямий доступ до всіх дис- ків. Усі процесори пов′язані один з одним через високошвидкісну мережу для переда- чі даних. Прикладами паралельних систем баз даних SD-архітектури є IBM IMS [559], Oracle Parallel Server [560], nCUBE [561], VAXclusters [562], IBM Parallel Sysplex [563]. Відсутність спільного викорис- тання ресурсів (shared-nothing – SN). Кожна пам′ять і диск є у розпорядженні одного процесора, який працює як сер- вер збережених в них даних. Масовий запам′ятовуючий пристрій у таких архі- тектурах розподілений між процесорами через з′єднання одного чи більше дисків. Так само, як і в SD-архітектурі, всі проце- сори зв′язані один з одним через високош- видкісну мережу. Відсутність спільного використання ресурсів характерна для сис- тем баз даних, які використані в проєктах Teradata[564], Gamma [565], Tandem [566], Bubba [567], Arbre [568], і nCUBE [569]. Прикладами комерційних систем SD- архітектури є NonStop SQL [570], Informix PDQ [571], NCR/Teradata DBC [572], IBM DB2 PE [573]. Аналізу архітектур паралельних систем баз даних присвячена також стаття Соколинського Л.Б. [574]. Згодом з′явилися мультипроцесорні системи, які поєднували характеристики SE- і SN-архітектур, тому Коупленд і Кел- лер [575] запропонували розширити класи- фікацію Стоунбрейкера наступним чином: - кластеризовано все (clustered everything – CE) – кластери з SE- архітектурою об′єднуються за принципом SN-архітектури; - кластеризовані диски (clustered- disk – CD) – кластери з CD-архітектурою об′єднуються за принципом CN- архітектури. Такі архітектури дістали назву ієрар- хічних [576]. Пропозиції Коупленда дозво- ляють створювати дворівневі ієрархії (ISE/ SD-кластери першого рівня з′єднуються в SN-кластери другого рівня). Дворівне- ва архітектура Коупленда може бути лег- ко розширена до архітектур із трьома чи більше ієрархічними рівнями. Дворівнева ієрархічна архітектура була досліджена в працях [575, 577 - 580]. Зазначимо, що в другій половині 90-х років з′явилися багатопроцесорні сис- теми із компонентами складної конструк- ції. Вони увібрали в себе різні архітектурні 41 Моделі та засоби систем баз даних і знань рішення, що не підпадають під класифіка- цію Стоунбрейкера і Коупленда. До них можна віднести мультипроцесорну систе- му серії МВС-100/1000 [581], мультипро- цесорну систему SP-2 [582] компанії IBM, комп′ютери на основі технології Server Net компанії Tandem [583], гібридну архітекту- ру CDN [584]. За [585] першим кроком на шляху створення сучасних МБД була презента- ція 2000 року технології Infi niBand – висо- кошвидкісної комутованої комп′ютерної мережі компанії Voltaire (партнер Oracle, починаючи з 2001 року), яка була вико- ристана в Oracle RAC (Real Application Cluster), починаючи з версії Oracle Database 9i. 2009 року серед Тор 500 суперкомп′ютерів світу 29% викорис- товували Infi niBand. Oracle Exadata VI була першою сучасною MBD, створеною Oracle HP (Hewlett-Packard) 2008 року. Тестування цієї MBD у CERN [586] по- казало високу ефективність за часом і пам’яттю в процесі розвантаження даних великого обсягу. Sun і Oracle створили MBD Exadata Database Mashine Version 2. Завдяки застосуванню сучасних техноло- гій цих двох компаній MBD працює вдвічі ефективніше за Oracle Exadata VI. Teradata Database – це система ма- сової паралельної обробки (MPP) із ко- лективною розподіленою архітектурою. Задача рівномірно розподіляється по всіх процесах і паралельно обробляється. Під- тримує архітектуру без спільного викорис- тання ресурсів. Має високу горизонтальну масштабованість, а також один із найроз- винутіших оптимізаторів на ринку. Авто- матично рівномірно розподіляє дані по дисках. Підтримує стандарт SQL. Бази даних, що підтримують робо- ту з масивами. БД масивів дає змогу пред- ставляти і маніпулювати багатомірними масивами однорідних даних. Вважається, що попередником БД масивів була ство- рена 1982 року PICDMS [587] – СУБД для роботи з рисунками. Вона уможливлює оперування двомірними масивами з допо- могою процедурної мови. 1993 року Майєр і Венс [588] кон- статували, що технологія баз даних вкрай рідко використовується в наукових додат- ках тому, що СУБД не підтримують струк- тури з упорядкованими даними, зокрема, такими, як масиви. Ця заява співпала з по- чатком активного розвитку досліджень і розробок із БД масивів. Значний внесок у розвиток теорії і практики СУБД масивів зробив німецький учений Пітер Бауманн (Peter Baumann). Він перший 1994 року запропонував деклара- тивну мову запитів для роботи з багатомір- ними масивами, які базуються на пропоно- ваній ним же алгебрі багатомірних масивів [589, 590]. Розроблені алгебра і мова запи- тів стали основою створення 1996 року під його керівництвом першої СУБД масивів RasDaMan [591], яка підтримувала реля- ційну модель даних із додатковим типом даних «багатомірний масив» і спеціаль- ною мовою запитів RASQL, що базується на SQL. Згідно з даними [592] обсяг даних на всіх пристроях RasDaMan наближається до петабайту. Пітер Бауманн Моделі і мови. Було запропонова- но численні формальні моделі й мови баз даних масивів, аналіз яких можна знайти в [593, 594]. Наведемо деякі. Алгебра карт (Map algebra) [595, 596] – алгебра, що базується на множинах, розроблена на початку 80-х років Даною Томлін (Dana Tomlin) для маніпулювання географічними даними. Представляє дво- мірні і тримірні растрові дані. В ній від- бувається категоризація операцій над ма- сивами залежно від кількості комірок вхід- ного масиву, які беруть участь у створенні комірки вихідного масиву. 42 Моделі та засоби систем баз даних і знань AFATL Image Algebra [597] – це ал- гебра, розроблена для обробки зображень і отримання статистичної інформації. AML (Array Manipulation Lanquage) [598] – універсальна мова маніпулювання масивами, що базується на пропонованій авторами алгебрі багатовимірних масивів. Характерною рисою AML є поняття біто- вих шаблонів і шаблонно-орієнтованих функцій. AQL (Array Query Language) [599, 600] – ця мова вмонтовує підтримку бага- товимірних масивів у мову NCRA, яка є розширенням мови вкладеного реляційно- го обчислення NRC. Array Algebra [589, 590] – пропо- нується алгебраїчна модель масиву, яка базується на трьох ортогональних при- мітивах, щодо яких надається набір до- поміжних функцій. Цей набір обумовлю- ється використовуваною моделлю даних (об′єктивною або реляційною). RAM [601, 602] – модель розроблена як розширення реляційної СУБД MonetDB [603]. Зберігання масивів. Зазвичай ве- ликі багатомірні масиви розбиваються на підмасиви, що утворюють одиниці досту- пу до них. Таке розбиття дістало назву мо- заїки (tiling), а елементи мозаїки – плитки (tile) [618]. Мозаїка складається з пли- ток, що не перетинаються, кожна плит- ка – багатомірний підмасив висхідного масиву. Виділяють два основні види мо- заїки – рівномірна (aligned) і нерівномір- на (nonaligned). Рівномірна мозаїка для n-мірного масиву означає, що вона фор- мується гіперплощинами, які є ортого- нальні вісям n-мірного простору і розби- вають весь масив на «плитки». Якщо всі площини знаходяться на одній відстані, то така мозаїка називається регулярною рів- номірною, в іншому випадку – нерегуляр- ною. В нерівномірній мозаїці (nonaligned tiling) деякі плитки мають сторони, які не є продовженням сторін сусідніх плиток. У частково рівномірній (partially aligned) мозаїці плитки вирівняні принаймні по одному з вимірів, а в повністю нерівно- мірній (totally nonaligned) таких вимірів немає. На рисунку, взятому з [618], наво- диться приклад графічної інтерпретації цих чотирьох категорій мозаїки для дво- мірного простору. Архітектура реалізації. Виділя- ються наступні варіанти архітектури реа- лізації систем БД масивів: - повнофункціональні системи БД масивів, реалізовані з нуля (RasDaMan [591], SciDB [604], MonetDB/SciQL [605]; - реалізовані у вигляді додаткових рівнів у існуючих СУБД (EXTASICID [606, 607]; - реалізовані у вигляді об′єктно- реляційних розширень (PostGIS Raster [608], Teradata Arrays [609], Oracle GeoRaster [610]. Пропонувалося два способи «впро- вадження» масивів у реляційні БД: - додавання масивів у вигляді ново- го типу стовпчика (Ras DaMan, Teradata, Oracle, PostGIS, Roster, ISOSQL); - подання масивів у вигляді таблиці (SciQL і SciDB). 2007 року на симпозіумі з екстре- мально великих баз даних (XLDB) пред- ставники науки і промисловості дійшли висновку, що існуючі СУБД не спромож- ні маніпулювати обсягами даних, які з′являться в найближчому майбутньому. Була також підкреслена необхідність роз- робки СУБД нового покоління, що мають відповідати таким вимогам [611]: 43 Моделі та засоби систем баз даних і знань - модель даних базується на багато- вимірних масивах, а не на кортежах; - модель зберігання базується на версійності, а не на оновленні значень; - масштабованість до сотень пета- байт і висока відмовостійкість; - СУБД є вільно розповсюджува- ним програмним забезпеченням. Відповіддю на це звернення став за- пуск 2008 року міжнародного проєкту під ке- рівництвом Майкла Стоунбрейкера із ство- рення нової СУБД під назвою SciDB. 2010 року було випущено першу публічну версію SciDB [612]. Її архітектура заснована на мо- дифікованому ядрі Postgress. SciDB призна- чена для зберігання, обробки й аналізу над- великих обсягів багатовимірних розподіле- них масивів наукових даних, масштабованих на тисячі серверів [613]. Зберігання даних організовано у вигляді багатовимірних вкла- дених масивів, для обробки яких розробле- ні мови AQL (Array Query Language) і AFL (Array Functional Language). Інші системи БД масивів. SciQL [605]. Мова запитів, що за- снована на SQL і використовує масиви для наукових застосувань. Розширює ко- лончату СУБД MonetDB операторами над масивами [614, 615], тим самим дозволяю- чи MonetDB ефективно функціонувати як база даних масивів. EXTASCID [606, 607]. Це повна і розширювана система для обробки на- укових даних. Підтримує як масиви, так і реляційні дані. Створена на основі масив- но-паралельної архітектури GLADE для агрегування даних. PostGIS Raster [608] (раніше відо- ма як WKT Raster) дає змогу підтриму- вати растрові дані в системі PostGIS. Це забезпечується визначенням нового типу даних RASTER і додаткового набору SQL- функцій, котрі працюють із векторними і растровими даними. Oracle GeoRaster [610] – це вбудо- вана в Oracle Spatial можливість збере- ження, індексування, аналізу й доставки растрових зображень (як-от супутникових знімків), даних типу grid-даних, а також зв’язаних з ними метаданих. Ці типи даних можна використовувати для зберігання ба- гатовимірних grid-шарів і електронних зо- бражень, які можуть бути прив′язані для позиціювання на поверхні Землі або в ло- кальній системі координат. Teradata Arrays [609]. Нещодавно Teradata ввела в свою СУБД масиви у ви- гляді самостійного типу даних. Для ілюстрації історії розвитку сис- тем БД масивів наведемо рисунок із [616]. У 2018 році до ISO SQL було вклю- чено підтримку багатовимірних масивів даних [617] у вигляді спеціального типу даних. На завершення зазначимо, що Альянс із Дослідницькими Даними (RDA – Research Data Alliance) надав 2021 року вичерпний огляд баз даних масивів і пов′язаних з ними Технологій [594]. Статистичні бази даних. Під статистичними базами даних (СБД) маються на увазі такі БД, які дають можливість отримувати, зберігати і обро- бляти агреговані дані, тобто дані, отримані з допомогою різних способів узагальнен- ня, групування, класифікації. Дослідження статистичних баз да- них почалися у 1970-х роках, а найбільшо- го розвитку набули в 1980-х роках ще до появи OLAP і їхній розвиток триває й до- тепер. Статистичні моделі даних. Статистичні дані абстрактніші за звичайні, а операції мають іншу семанти- 44 Моделі та засоби систем баз даних і знань ку. В СБД аналіз здійснюється з викорис- танням агрегованих даних, отриманих із необроблених. Зведені дані мають бути різних форм, які не підтримуються тра- диційними СУБД. Більше того, реляційна модель у чистому вигляді теж не підходить для обробки таких даних. Основна причи- на – багатовимірність статистичних даних. Тож для СУБД потрібні або нові структури даних і операції над ними, або ж необхідно розширювати реляційну модель даних, аби мати можливість представляти відношен- ня над множинами й нові оператори до них [630]. У СБД визначено три типии моделей даних: графічні, табличні й багатовимірні. Подамо короткий опис статистичних моде- лей даних, про які докладну інформацію знаходимо в працях [619, 620]: SUBJECT [621] – подана графічна модель системи SUBJECT; SAM (Semantic Association Model) [622] – модель було розроблено для моде- лювання як наукових статистичних даних, так і бізнесорієнтованих даних; GRASS (Graphical Approach for Statistical Summaries) [623] – є розширен- ням SUBJECT. Для представлення моделі використовується орієнтований, направле- ний, ациклічний граф; CSM (Conceptual Statistical Model) [624] – використовуються дві різні, однак доповнюючи одна одну моделі даних для опису елементарних і зведених даних, а саме ER-модель Чена і перевизначену мо- дель GRASS; STORM (Statistical Object Representation Model) [625] – графічна модель, в якій логічне представлення від- окремлене від фізичної структури статис- тичних таблиць; MEFISTO [626] – функціональна модель даних, що базується на структурі з назвою «статистична сутність», а також на численних операціях, які складають алге- бру маніпулювання даними цієї структури; Розширена реляційна модель даних із включенням у реляційну алгебру додат- кових статистичних операторів [627]; Темпоральна статистична модель даних [628]. Статистичні оператори (алге- бри). У статтях про СБД пропонується чимало підходів щодо визначення опера- торів, які б відповідали обраній структурі моделі. В праці [629] вводяться статис- тичні оператори, аналогічні реляційній алгебрі, але із семантикою, характерною для багатовимірних об′єктів. У подальшо- му вводиться поняття повноти за аналогі- єю з реляційною повнотою і показується повнота запропонованої алгебри. В праці [630] пропонується також розширення ре- ляційної моделі даних шляхом введення відношень над множинами й оператори до них. Ще одним прикладом алгебри, за- лежної від обраної статистичної моделі, є праця [631], де задіяна двомірна модель презентації статистичних даних. 1997 року в [632] було висунуто варіант розши- рення SQL функціональними можливос- тями OLAP для отримання підсумкових значень у багатовимірному просторі. У працях [633, 634] пропонуються багато- вимірні моделі даних і оператори. Статті [626, 635] також присвячені операторам у СБД. У [636] представлена алгебра ста- тистичних даних. Метадані. Вважається, що статис- тичні дані мають два типи атрибутів [637]: вільні атрибути, що являють собою ре- зультати застосування до висхідних даних агрегуючих функцій, і дескриптивні атри- бути, які ці вільні дані описують, що також називаються метаданими. Правильно орга- нізовані, класифіковані й описані метадані дуже корисні для розуміння суті зведених даних. У зв′язку з цим ефективне викорис- тання метаданих є вкрай важливим у СБД. Додаткову інформацію про це можна отри- мати в працях [638 - 642]. Системи й мови запитів статис- тичних баз даних. В огляді [643] дано всебічний аналіз систем і мов запитів ста- тистичних баз даних на основі таксономії, запропонованій в [644]. Перерахуємо їх, посилаючи зацікавлених читачів до вказа- них статей для детального ознайомлення. 1)Статистичні системи управ- ління базами даних (ССУБД), створені на основі традиційних СУБД. Більшість ССУБД даної категорії створені на основі реляційних СУБД. До них належать: STRAND [645] базується на ER- моделі Чена, є похідним від CABLE [646] 45 Моделі та засоби систем баз даних і знань і має за основу реляційну СУБД INGRES. Запити STRAND транслюються в мову QUEL і виконуються в INGRES. HSDB [647] являє собою ССУБД, створену на основі реляційної системи Model 204 [648]. HSDB підтримує зведені таблиці й надає обмежений набір операцій над ними. Здатна виконувати процедури статистичного аналізу над реляційними і зведеними таблицями. Розширена РМД [649]. Розширю- ється модель Кодда з метою представ- лення статистичних даних через запро- вадження «статистичної реляційної та- блиці». Для неї розширюються реляційні операції і вводяться нові статистичні опе- ратори. Пропонується мова запитів, що має подібні риси з QBE. SYSTEM/K [650]. Об′єкт но- орієнтована система управління базами знань створена на основі системи SQL/DS. Має широкі можливості з управління мета- даними й обмежений перелік статистичних функцій. GRAFSTAT [651]. Прикладна сис- тема призначена для аналізу даних із до- помогою функцій прикладної статистики й графічного представлення результатів. Має інтерфейс із DB2 і SQL/DS через SQL. SUBYL [652], PASTE [653], GPI [654], PEPIN-SICLA [655] є прикладами систем, що використовують традиційну СУБД, статистичний пакет і графічний па- кет для створення системи управління ста- тистичними даними. 2)Самостійно розроблені ССУБД. Вони мають шість підкатегорій відповід- но до використовуваної моделі й мови за- питів: - Системи на базі реляційної моде- лі й реляційних мов запитів. Вони пропо- нують власні методи фізичної організації даних, засоби концептуального моделю- вання, придатні для ССУБД, а також мож- ливості використання агрегуючих функцій у мовах запитів. До них належать: RAPID [656] і CAS SBD [657] – ви- користовують реляційну алгебру; ABE [658] – використовує реляційне обчислення; SIR/SQL [659], GENISYS [660], CANTOR [661] - використовують SQL. У [662] представлено мову запитів статистичної обробки неповної інформації. У системі July [663] використову- ється універсальний реляційний інтерфейс для інтерпретації статистичних запитів. У статті [664] описана статистична модель даних та її застосування в СБД. - Системи на базі ієрархічної і мере- жевої моделей. Прикладами є: SIR/DBMS [665], TPL і TPLDCS [666], BROWSE [667]. - Формальні розширення реляцій- ної моделі: ABE [658], SSDL [668], SSDB [669]. - ССУБД і мови з графічним зо- внішнім інтерфейсом. Системи даної кате- горії мають графічні двомірні або таблич- ні мови запитів. Прикладами є: SUBJECT [621], GRASS [623], ABE [658], GUIDE [670], STBE [671], ALDS [672], GRASP [673]. - Природномовний інтерфейс ко- ристувача: LIDS 86 [674]. - Мови запитів, що обчислюють агреговану інформацію з темпоральних даних. Приклади: TQUEL [675], HQUEL [676], TBE [677], TEER [678], розширена реляційна алгебра Тансела [679]. Підсумовуючи, відзначимо, що на підставі аналізу літератури можна стверджувати, що в розвиток дисци- пліни «статистичні бази даних» (при- наймні на початковому етапі) значний внесок зробили турецько-американські вчені Зехра Мерал Озсойоглу (Zehra Meral Ozsoyoglu) і Гюльтекін Озсойоглу (Gultekin Ozsoyoglu). Мерал Озсойоглу 46 Моделі та засоби систем баз даних і знань Мерал Озсойоглу спеціалізується на базах даних. 2011 року вона отрима- ла звання «Дійсний член АСМ» (ACM Fellow) за «великий внесок у систе- ми управління базами даних». А 2018 року отримала премію АСМ SIGMOD Contributions Award за «віддане служін- ня співтовариству баз даних». У нагоро- ді згадується її діяльність як головного редактора ACM Transactions on Database Systems і Proceedings of the VLDB Endowment, а також як голови програм- ного комітету конференції VLDB та Сим- позіуму з принципів систем баз даних. Сховища даних. Завдання збору ін- формації з різних джерел не є новим. На- прикінці минулого сторіччя поширилася концепція створення сховищ даних (Data Warehouse). Термін «сховище даних» (DWH – Data Warehouse) уперше з′явився на по- чатку 1980-х років, коли дослідники IBM Пол Мерфі (Paul Murphy) й Баррі Дев- лін (Barry Devlin) розробили сховище бізнес-даних. Проте основоположником сховищ даних вважається Вільям Х. Ін- мон (William H. Inmon), який почав до- слідження в цій царині 1983 року, а влас- не концепція сховищ даних була викла- дена ним 1990 року в монографії [682]. Ця монографія стала своєрідною біблією сховищ даних і започаткувала розвиток їх індустрії. Інмон організував першу конференцію, вперше створив тематич- ний розділ у журналі. Вільям Інмон Ще одним фундатором справедливо вважається Ральф Кімбелл (Ralph Kimball). Він є одним із перших архітекторів сховищ даних, і його методологія (відома також як просторове моделювання або методологія Кімбелла) стала фактичним стандартом у системі підтримки прийняття рішень. 1990 року компанія Red Brick System, заснована Кімбеллом, розробила Red Brick Warehouse – компактну стандартну реляційну базу даних на основі SQL для додатків DWH і бізнес-аналітики. Його монографія [683] є бестселером і нині. Ральф Кімбелл Попри те, що ці вчені часом притри- мувалися протилежних поглядів на DWH, вони заснували і суттєво збагатили науку DWH. Порівняння поглядів на DWH цих двох учених наведено в [684] й багатьох інших працях дослідників їхнього творчо- го доробку. Дослідниками – новаторами у DWH, які опублікували свої монографії в серед- ині 90-х років, є також Брекетт [685], Гілл і Рао [686], По [687]. За Інмоном сховище даних – це предметно орієнтована, інтегрована, хро- нологічно послідовна і незмінна (постійна) колекція даних, створена для підтримки процесу прийняття рішень керівництвом [682]. Також вважається, що в широкому сенсі сховище даних – це сукупність тех- нологій, котрі дозволяють керівництву приймати рішення швидше і якісніше, а тому вони є складовими автоматизованих систем підтримки прийняття рішень. 47 Моделі та засоби систем баз даних і знань DWH передбачають інтеграцію гетерогенних (неоднорідних) БД. Од- нак тут є відмінність від традиційного підходу. Останній передбачає створення оболонок та посередників, що приво- дять стандартні запити до вигляду, який сприймається кожною з інтегрованих БД. Натомість у DWH інформація з числен- них гетерогенних джерел попередньо пе- ретворюється, інтегрується і зберігається в єдиному сховищі даних. Основним завданням традицій- них БД, що отримали назву операцій- них, є ефективне виконання транзак- цій із урахуванням активного оновлен- ня БД, аби підтримувати її цілісність. Ці БД належать до класу систем опе- ративної обробки транзакцій (online transaction processing OLTP). З іншого боку, системи DWH не передбачають динамічного оновлення. Для них не- має проблеми підтримання цілісності й призначені вони для користувачів, які здійснюють аналіз даних для прийняття рішень. Системи такого класу отримали назву систем оперативної аналітичної обробки (online analytical processing – OLAP). Термін OLAP було введено Едга- ром Коддом у його публікації в журна- лі Computerworld 1993 року [688]. В цій статті він визначив OLAP як засіб дина- мічного аналізу, синтезу й консолідації великих обсягів багатовимірних даних, сформулював концептуальні положення OLAP, описав архітектуру, виділив фун- даментальні компоненти й за аналогією до 12 правил для реляційних баз даних запропонував 12 принципів аналітичної обробки. На початку 1995 року Найджел Пендс (Nigel Pendse), не згідний із кри- теріями Кодда, запропонував альтерна- тивні 5 правил приналежності систем до категорії OLAP [689]. Вони дістали назву «тести FASMI» - абревіатура від перших букв слів фрази “Fast Analysis of Shared Multidimensional Information” (швидкий аналіз спільно використовуваної багато- вимірної інформації). Це визначення є також доволі популярним серед спеціа- лістів OLAP. Найджел Пендс Зрештою, рада OLAP (OLAP Council), створена 1995 року, дала таке розгорнуте визначення OLAP: «Оперативна аналітична обробка (OLAP) – це категорія програмних техноло- гій, які дозволяють аналітикам, менеджерам і керівникам мати уявлення про дані за раху- нок швидкого, погодженого, інтерактивного доступу до представленої в різному вигляді інформації, перетвореної з вихідних даних, щоб вони таким чином усвідомлювали ре- альний стан речей на підприємстві» [690]. Архітектура DWH. Пропонувалося чимало різних архітектурних рішень DWH [691-702], кожне з яких має свої специфіч- ні особливості. В праці [703] здійснено аналіз 73 архітектур DWH. На базі про- позицій, висловлених у [691, 692] подано узагальнену архітектуру DWH. DWH має трирівневу архітектуру. Нижчий рівень являє собою БД DWH. Вона підтримує обрану модель да- них DWH і надає засоби ведення цієї БД. Середній рівень виконує функції OLAP. Зазвичай він представлений наступ- ними чотирма типами [693, 694]: Реляційний OLAP (ROLAP) – роз- ширена реляційна СУБД, яка відображає операції багатовимірної моделі даних у стандартні операції реляційної алгебри. Багатовимірний OLAP (MOLAP) – СУБД, яка безпосередньо підтримує бага- товимірну модель даних та її операції. Гибрідний OLAP (HOLAP) поєднує в собі якості попередніх двох видів. Спеціалізований SQL – сервер має розвинуті можливості мови запитів SQL 48 Моделі та засоби систем баз даних і знань для роботи з DWH-схемами (зірка, сніжин- ка, сузір′я фактів) у режимі лише читання. Зовнішній рівень містить інстру- ментальні засоби підтримки прикладних завдань DWH, включно з: - бізнес аналітикою (business intelligence), - оперативною аналітичною оброб- кою (OLAP), - інтелектуальним аналізом даних (data mining), - системами підтримки прийняття рішень (dicision support systems), - мовами запитів і створення звітів. Окрім цих трьох рівнів архітектури DWH включає: • Репозиторій метаданих, який міс- тить інформацію про дані DWH; • Вітрини даних (data marts), що містять підмножину корпоративних даних, цікавих для певної групи користувачів. • Засоби управління і контролю. • Інструментальні засоби заван- таження даних із зовнішніх джерел (бази даних, файли, електронні таблиці тощо) у БД DWH. Ця компонента дістала назву ETL (Extract, Transform, Load). Вона виконує функції одержання даних із джерел, їх пе- ревірки і очистки, перетворення до належ- ного вигляду, інтеграції й завантаження або оновлення БД DWH [704]. Концепція ETL виникла в 1970-х роках у зв′язку з ви- користанням централізованих репозиторі- їв даних. Але лише в кінці 1980-х і початку 1990-х років вона набула великої популяр- ності в зв′язку з появою DWH. Моделі DWH. Із архітектурної точ- ки зору виділяють наступні три типи моде- лей DWH [705]: -корпоративне сховище із консолі- дованими даними, взятими з кількох опе- раційних джерел – це DWH усієї корпора- ції [706]; -вітрина даних – містить підмножи- ни корпоративних даних; -віртуальне сховище – це множин- ність поглядів (views) операційних БД [707, 708]. Також існує точка зору [709], що архітектура DWH включає: архітектуру моделі даних, процесну архітектуру, ін- формаційну архітектуру, технологічну та ресурсну архітектури. Вітрина даних (data mart). Кон- цепція вітрин даних була запропонована Forrester Research ще 1991 року. Це пред- метно спрямована база даних, яка зазвичай містить дані одного з напрямків діяльності компанії. Вона орієнтована на користувачів однієї робочої групи або департаменту. У ві- трині інформація зберігається оптимізовано з точки зору вирішення конкретних задач. Існує три типи вітрин даних, які від- різняються залежно від їх відношення до сховища даних. Залежні вітрини даних – це сегмен- ти в корпоративному сховищі даних. Цей низхідний підхід починається зі збережен- ня всіх бізнес даних в одному централь- ному місці. Новостворені вітрини даних отримують певну підмножину первинних даних щоразу за потреби аналізу. Незалежні вітрини даних діють як автономна система, яка не покладається на сховище даних. Аналітики можуть діс- тавати дані щодо конкретного предмету або бізнес-процесу із внутрішніх або зо- внішніх джерел даних, обробляти їх, а від- так зберігати в репозиторії вітрини даних доти, доки вони знадобляться групі. Гібридні вітрини даних об′єднують дані з існуючих сховищ та з інших операцій- них джерел. Цей уніфікований підхід вико- ристовує швидкість і зручний інтерфейс низ- хідного підходу, а також пропонує інтеграцію незалежного методу на рівні підприємства. Ідея об′єднати дві концепції – сховищ даних і вітрин даних, очевидно, належить Марку Демаресту (Marc Demarest) [710], який 1994 року запропонував об′єднати дві концепції та використати сховище даних як єдине інтегроване джерело даних для вітрин даних. Для взаємодії між собою вітрини да- них можуть об′єднуватися в мережу, тим са- мим створюючи віртуальне сховище даних. Багатовимірна модель даних DWH. Куб даних. Було запропоновано безліч багатовимірних моделей даних. Їх класифікація, аналіз і порівняння наведені в праці [711]. Коротко опишемо одну з них, яка використовується найбільше, а саме, куб даних [712]. 49 Моделі та засоби систем баз даних і знань Куб даних передбачає моделювання і подання даних, використовуючи поняття багатовимірного простору. Куб даних ви- значається через поняття «факт» і «вимір». Згідно [713] терміни «факт» і «ви- мір» виникли в кінці 1960-х років у резуль- таті виконання спільного дослідницького проєкту корпорації General Mills і Дарт- мутського університету. В 1970-х роках маркетингові компанії AC Nielsen і IRI по- стійно вживали ці терміни для опису своїх агрегованих даних і прагнули використати просторові моделі для презентації аналі- тичної інформації. Вимір (dimension) – це характерис- тика, відносно якої представлено дані, що агрегуються. Використовуючи n ви- мірів, отримуємо n – мірний куб. Вимір – це вісь куба. Вимір може ділитися на підвиміри. Приміром, вимір «країна» - на під виміри «області», а області – на «міста» тощо, та- ким чином утворюючи ієрархічну структу- ру виміру. Факт – це характеристика, віднос- но якої представлені агреговані дані. Факт може мати властивості (атрибути). Міра (measures) – це власне агрего- вані значення. Міри знаходяться в комір- ках кубу. Багатовимірна модель має графічне зображення, що отримало назву кубоїда (cuboid) [714]. Кубоїд із найнижчим рів- нем агрегованих даних (по всіх вимірах), називається базовим кубоїдом. На рисунку нижче подано трирівневий базовий кубоїд. Із цього трирівневого кубоїда мож- на отримати три двомірні кубоїди шля- хом агрегування даних по кожному з трьох вимірів. Із них – три одномірних і, зрештою, один нуль мірний кубоїд (ку- боїд – вершина). Тобто одне агреговане значення всіх мір вихідного кубоїда. Така структура є решіткою кубоїдів (cuboids lattice) [715] і називається кубом. На ри- сунку нижче наводиться куб (решітка кубоїдів) для чотиривимірного базового кубоїда з вимірами: товар, час, місто, по- стачальник. Іноді кубоїди називають та- кож кубами чи підкубами. Операції над OLAP – кубами. Іс- нує п′ять основних операцій над кубами OLAP: Згортання (roll-up), що також на- зивається узагальненням (drill-up). При- водить до агрегування куба даних чи- то переміщенням вгору по ієрархічній структурі виміру (перехід від окремого поняття до загальнішого), чи-то видален- ням виміру шляхом агрегування всіх мір цього виміру. Розгортання (roll-down), що також має назву деталізація (drill-down). Опе- рація протилежна згортанню/узагальнен- ню – перехід від узагальнених даних до детальніших через переміщення вниз по ієрархічній структурі виміру чи введення нових вимірів. Зріз (slice) – добування з куба під- множини комірок, пов′язаних із якимось певним значенням одного з його вимірів. Тобто отримуємо куб, де один з вимірів містить одне значення. Жодна агрегація мір не відбувається. 50 Моделі та засоби систем баз даних і знань Фрагментація (dice) – є узагальнен- ням зрізу. Із куба добувається підкуб, що має лише ті значення кожного з вимірів, які вказані в операції. Жодна агрегація мір не відбувається. Обертання (pivot) – дозволяє зміню- вати просторову орієнтацію осей вимірів куба, обираючи найзручніше для аналітика представлення. В OLAP-технологіях куб – це передусім засіб візуалізації багатови- мірних даних. Тому, використовуючи його, необхідно вирішувати задачу відображен- ня інформації у зручному й інтерпретова- ному для людини вигляді. Крім того, були запропоновані на- ступні додаткові операції. Об′єднання (drill across) – дозволяє об′єднувати багато кубів, які мають один або більше спільних вимірів. Проникнення (drill through) – дозво- ляє переходити від даних на нижньому рів- ні куба (базовий куб) до вихідних даних, звідки куб було добуто. Операція зазвичай використовується для визначення причини «викидів» у кубі даних. Агрегуючі функції. Невід′ємна частина OLAP-моделі – завдання функцій агрегування. Оскільки мета OLAP – ство- рення багаторівневої моделі аналізу, дані на всіх рівнях включно з базовим мають бути відповідно агреговані. По кожно- му виміру можливо задавати власну (і не одну) функцію агрегації. Такі функції включають: функції агрегування, статистичні функції, функції ранжування Top N, Bottom N тощо. В [716] наведено класифікацію агрегуючих функцій з точки зору складності розпаралелювання. У зв′язку із складністю структури куба опубліковано багато статей щодо його ефективної реалізації. Огляд досліджень у цій царині наведено в працях [715, 717]. Крім того, вичерпний огляд із реалізації ROLAP-кубів наведено в [718]. На закінчення відзначимо, що куб даних використовується не лише для пред- ставлення багатовимірних даних, а й ін- ших складних типів даних. Серед них про- сторові, темпоральні, текстові, мультиме- дійні, мережеві і графічні [719, 720]. Багатовимірні бази даних (ББД) – це різновид БД, що створюється для схо- вищ даних і оперативної аналітичної об- робки даних (OLAP). OLAP, що працюють з ББД, називаються багатомірними OLAP (MOLAP). Як правило, ББД використо- вують модель багатовимірних кубів для представлення висхідних даних. У [721] стверджується, що математичний апарат багатовимірних БД було розроблено видат- ним американським математиком Доном Нельсоном (Don Nelson) у 60-х роках на замовлення міністерства оборони США. Концептуальні схеми DWH. За ана- логією із ER-схемою концептуальної моде- лі ПЗ, прийнятою в традиційній технології проєктування реляційних OLTP-баз даних, у технології проєктування DWH було за- пропоновано наступні OLAP-схеми: зірка, сніжинка й сузір′я фактів [714]. Схема зірки. Найпопулярніша схе- ма, яка містить: -одну велику центральну таблицю фактів із даними по всіх мірах; -безліч невеликих за розміром та- блиць вимірів, по одній на кожен вимір. Ця таблиця містить відомості (атрибути) ви- міру. Графічне зображення цієї схеми на- гадує зірку, де таблиці вимірів знаходяться радіально навколо таблиці фактів. Схема сніжинки. Є узагальненням схеми зірки. В даному випадку, якщо та- блиця вимірів містить багато «різнопла- нових» атрибутів (приміром, вона містить атрибути не лише країни, а й міст), така та- блиця нормалізується, тобто розбивається на кілька «додаткових» таблиць (таблиць підвимірів). Граф результуючої схеми на- гадує сніжинку. Сузір′я фактів. Припускає існування багатьох таблиць фактів, що мають спільні таблиці вимірів. Графічно ця схема пред- ставлена безліччю зв′язаних схем зірок. Враховуючи складність процесу концептуального моделювання DWH, було здійснено чимало досліджень із питання оцінки якості цього процесу, огляд яких подається в [42]. Методології проектування. Пропо- нуються такі три методології проєктування. Проєктування знизу – вгору. Ця ме- тодологія висунута Кімбеллом і передбачає попереднє проєктування вітрин даних із конкретним тематичним напрямком. Остан- 51 Моделі та засоби систем баз даних і знань ні представлені самостійними продуктами із наступним їх обслуговуванням в DWH. Проєктування зверху – вниз. За- пропонована Інмоном методологія перед- бачає спершу створення централізовано- го репозиторію DWH із використанням «нормалізованої» моделі даних ПЗ. Далі на основі DWH створюються вітрини да- них для конкретних додатків або підрозді- лів підприємства. Гібридне проєктування. Передба- чає поєднання попередніх підходів і забез- печує всебічне й надійне проєктування. Інструментальні засоби. Було зро- блено багато інструментальних засобів DWH. За адресою https://www.guru99.com/ top-20-etl-database-warehousing-tools.html наводиться стислий опис 26 найпопулярні- ших інструментальних систем класу DWH. Активні DWH. На початку цього століття була висунута концепція актив- них DWH [723, 724] для того, щоб DWH підтримували автоматичнее прийняття рішень. В активних DWH розширюється технологія, яка є основою активних БД. А саме, вводяться «правила аналізу», що імі- тують роботу аналітика під час прийняття рішення. Водночас з′явилися перші комер- ційні продукти DWH із обмеженими мож- ливостями активних правил [725, 726]. DWH реального часу [727]. Ця кон- цепція розрахована на те, що вихідні дані надходять до DWH одразу, як тільки вони були породжені їхнім джерелом і стають доступними для аналізу. Про такі систе- ми говорять, що вони є DWH «з нульовою затримкою». Популярність даної концеп- ції сприяла тому, що багато виробників, включно з IBM [728] та Oracle [729], по- чали виробництво DWH цього класу. Стис- лий аналіз досліджень із цього напрямку наведено в [730]. Еволюція DWH. DWH уможливлю- ють збереження й аналіз даних за значний проміжок часу. Через те, що реальний світ, відображений у DWH, змінюється, те саме має відбуватися в DWH. Кімбалл, ймовір- но, був першим, хто звернув на це увагу 1996 року й запропонував низку рішень [731]. З легкої руки Кімбалла ця проблема дістала назви «виміри, що повільно змі- нюються» (Slowly Changing Dimentions – SCD). Відтоді в цьому напрямку було здій- снено чимало досліджень, стислий огляд деяких з них наведено в [732]. Темпоральні DWH. Темпоральні DWH містять такі ж структурні компонен- ти, що й традиційні DWH. А саме, вимі- ри, ієрархії змін, факти й міри. Основною ж відмінністю є те, що в нетемпоральних DWH час може асоціюватися лише з факта- ми, які зазвичай представляють теперішній час (в термінах темпоральних БД). А в тем- поральних DWH є можливість відслідкову- вати еволюцію вимірів, фактів і мір. Окрім того, темпоральні DWH, як і темпоральні БД, можуть бути бітемпоральними. До- слідження з темпоральних DWH охоплю- ють різні аспекти. Зокрема, темпоральні типи [733], концептуальне моделювання й проєктування [734], логічне моделювання й запити [735, 736], затримка в отриман- ні вимірів [737], багатовимірна агрегація [738], коректна агрегація за наявності змін у даних і структурі [739], еволюція багато- вимірних схем [740]. У праці [741] пода- ється огляд темпоральних DWH. Просторові DWH. Просторові DWH (Spatial DWH – SDWH) виникли в зв′язку з бурхливим розвитком додатків, що мають відношення до оперування про- сторовими даними і передовсім геогра- фічних інформаційних систем (geographic information system – GIS). SDWH – це такі DWH, які уможливлюють оперування про- сторовими об′єктами задля підтримки про- сторово-орієнтованої ділової активності й прийняття рішень. У праці [742] вперше було введе- но поняття просторового OLAP (SOLAP), яке відображає застосування методів інте- лектуального аналізу щодо обробки про- сторових даних. У працях [743, 744] було введено поняття просторових вимірів і запропоновано їх класифікацію. В статті [745] пропонується розширення концеп- туальної багатовимірної моделі просто- ровими вимірами, ієрархіями і мірами, а також введенням у модель топологічних зв′язків і операторів. Були досліджені спо- соби представлення просторових мір для геометричних об′єктів із використанням системи координат [742, 743, 745, 746] і сукупності точок [744]. 52 Моделі та засоби систем баз даних і знань SOLAP застосовують переважно до дискретних просторових даних, однак чи- мало складних задач GID-аналізу перед- бачають використання безперервних про- сторових даних, що зазвичай називаються просторовими полями. Просторові поля, або просто поля, описують фізичні явища, які безперервно змінюються в просторі або в часі. Як-от температура і тиск повітря, узвишшя землі, поширення буревію. Поля зазвичай представляються у вигляді функ- цій, які надають певні значення кожній точці простору.В зв′язку з цим здійсню- ються дослідження і розробки із створення польових DWH. Серед перших у цій цари- ні праць була стаття [747], де пропонуєть- ся куб даних із безперервними вимірами. В статті [748] також пропонується багатови- мірна модель даних із безперервними вимі- рами і з набором операцій, котра може за- стосовуватися для OLAP-аналізу польових даних. У працях [749-751] подана модель і алгебра для роботи з просторово-часовими безперервними полями та їх використання для OLAP-аналізу просторових даних. Було здійснено чимало інших до- сліджень із SDWH. Добрим вступом до просторових DWH є стаття [752]. У статті [753] подано аналітичний огляд фундамен- тальних методів і концепцій, що станов- лять основу просторових DWH. SQL і OLAP. 1995 року група до- слідників на чолі з Джеймсом Греєм за- пропонувала розширення мови SQL – фра- зу CUBE BY, завдання якої - створення OLAP-кубів [754]. CUBE BY створює гру- пування за всіма можливими комбінаціями вказаних у ньому вимірів, із різними рівня- ми агрегації даних. Ця ідея була сприйнята в SQL:1999. В SQL:1999 з′явилися можливості роботи з OLAP-кубами. Для цього фра- за GROUP BY була розширена фразами ROLLUP, CUBE і GROUPING SETS, а та- кож додана функція GROUPING. Фраза ROLLUP створює умови для багаторівневого ієрархічного групування за вказаними в ній стовпчиками й створює проміжні суми (subtotals) у відповідності зі збільшуваним рівнем агрегації. Від найде- талізованіших рівнів представлення даних до більш узагальнених сум. Фраза CUBE дозволяє в одній ко- манді вирахувати всі можливі комбінації проміжних сум. Висловлюючись терміна- ми решітки кубів, вказані в цій фразі стовп- чики формують базову таблицю, й для неї створюється решітка. Фраза CUBE здатна генерувати інформацію, необхідну для пе- рехресних звітів (cross – tabulation reports), в одному запиті. Фраза GROUPING SETS формує результати угрупувань за вказаними в ній стовпчиками й об′єднує їх в одну табли- цю. Інакше кажучи, вона еквівалентна кон- струкції UNION ALL до вказаних груп. Функція GROUPING повертає істи- ну в разі, якщо вказаний вислів є статис- тичним (тобто має підсумкове значення), і – неправду, якщо вислів нестатистичний. References 439. Rothnie J.B. Jr, Bernstein P.A., Fox S., Goodman N., Hammer M., Landers T.A., Reeve C.L., Shipman D.W., Wong E. Intro- duction to a system for distributed databases (SDD-1). ACM Trans. on Database Syst. 1980;5(1):1–17. 440. Bernstein P.A., Shipman D.W., Rothnie J.B. Concurrency Control in a System for Distrib- uted Databases (SDD-1) ACM Transactions on Database Systems, Vol. 5, No. 1, March 1980, Pages 19-51. 441. Hammar M., Shipman D. Reliability mecha- nism for SDD-1: a system for distributed database. ACM Trans. Database Syst., 5 (4) (Dec. 1980), pp. 431-466 442. Bernstein P.A., Goodman N., Wong E., Reeve C.L., Rothnie J.B. Query Processing in a System for Distributed Databases (SDD- 1). ACM Transactions on Database Systems, Vol. 6, No. 4, December 1961, Pages 602- 625 443. Selinger P.G. An architectural overview of R*: a distributed database management sys- tem. In: Proceedings of the 5th Berkeley Workshop on Distributed Data Management and Computer Networks; 1981, p. 187. 444. Williams R., Daniels D., Haas L., Lapis G., Lindsay B., Ng P. Obermarck R., Selinger P., Walker A., Wilms P., Yost R. R*: An Over- view of the Architecture.IBM Research Re- port RJ3325, IBM Research Laboratory, San Jose, CA, Dec. 1981. 53 Моделі та засоби систем баз даних і знань 445. Lohman G.M., Mohan C., Haas L.M., Dan- iels D., Lindsay B.G., Selinger P.G., Wilms P.F. Query Processing in R*. Lohman G.M. et al. (1985) Query Processing in R*. In: Kim W., Reiner D.S., Batory D.S. (eds) Que- ry Processing in Database Systems. Topics in Information Systems. Springer, Berlin, Hei- delberg, pp. 31-47 446. Daniels D. et al. An Introduction to Distrib- uted Query Compilation in R*. Distributed Data Bases (ed. H.-J. Schneider): Proc. 2nd Int. Symposium on Distributed Data Bases. - New York, N.Y.: North-Holland, 1982. 447. Stonebraker M.R., Neuhold E.J. A Distrib- uted Data Base Version of INGRES // Proc. 2nd Berkley Conf. On Distributed Data Man- agement and Computer Networks. — Low- rence Berkley Laboratory, May 1977. 448. Epstein R., Stonebraker M., Wong E. Dis- tributed Query Processing in a Relational Database System // Proc. 1978 ACM SIG- MOD Int. Conf. on Management of Data. — Austin, Tex. — May-June 1978. 449. Stonebraker M. The design and implementa- tion of distributed INGRES. The INGRES Papers, Reading; 1986, p. 187–196. 450. Adiba M.E., Andrade J.M., Fernandez F., Gia Toan Nguyen. POLIPHEME: An experience in distributed database system design and implementation. Proc. of Int. Simposium on Distributed Data Bases. Paris, France, 1980, pp. 475-479 451. Epstein R., Stonebraker M., Wong E. Dis- tributed Query Processing in a Relation Data Base System. SIGMOD ‘78: Proceedings of the 1978 ACM SIGMOD international con- ference on management of dataMay 1978 Pages 169–180. 452. Davenport R.A. Distributed database tech- nology — a survey. Computer Networks (1976), Volume 2, Issue 3, 1978, Pages 155- 167, 453. Rothnie J.В., Goodman N. A Survey of Re- search and Development in Distributed Data- base Management. VLDB ‘77: Proceedings of the third international conference on Very large data bases - Volume 3October 1977 Pages 48–62 454. Sheth A.P., Larson J.A. Federated database systems for managing distributed, hetero- geneous, and autonomous databases. ACM Comput Surv. 1990;22(3):183–236. 455. Stonebraker M., Aoki P.M., Pfeff er A, Sah A, Sidell J, Staelin C, Yu A. Mariposa: a wide- area distributed database system. VLDB J. 1996;5(1):48–63. 456. Date С.J. What is a Distributed Database System? In: Date C. J. Relational Database Writings 1985-1989. — Reading, Mass.: Ad- dison-Wesley, 1990. 457. Heimbigner D., McLeod D. “A Federated Architecture for information management”. ACM Transactions on Information Systems, 1985,.Volume 3, Issue 3. pp. 253–278. 458. Sheth A.P., Larson J.A. “Federated Database Systems for Managing Distributed, Hetero- geneous, and Autonomous Databases”. ACM Computing Surveys, 1990, Vol. 22, No.3. pp. 183–236. 459. Masood N., Eaglestone B. “Component and Federation Concept Models in a Federated Database System”. Malaysian Journal of Computer Science, 2003, 16 (2): 47–57. 460. Sheth A., Larson J.A. Federated Database Systems for Managing Distributed, Hetero- geneous, and Autonomous Databases. ACM Computing Surveys 1990, 22(3):183--236 461. Litwin W., Mark L., Roussopoulos N. In- teroperability of multiple autonomous data- bases. ACM Comput. Surv. 1990; 22(3):267– 293. 462. Wiederhold G. Mediators in the architecture of future information systems. IEEE Com- put. 1992;25(3): 38–49. 463. Risch T., Josifovski V., Katchaounov T. (2004) Functional Data Integration in a Dis- tributed Mediator System. In: Gray P.M.D., Kerschberg L., King P.J.H., Poulovassilis A. (eds) The Functional Approach to Data Man- agement. Springer, Berlin, Heidelberg. pp. 211-238 464. Gribble S.D., Halevy A.Y., Ives Z.G., Ro- drig M., Suciu D. What Can Database Do for Peer-to-Peer? In Processing of Int’l Work- shop on the WEB and Databases (WebDB), 2001, pp. 31-36 465. Bonifati A., Chrysanthis P.K., Ouksel A.M., Sattler K.-U. Distributed databases and peer- to-peer databases: Past and present, ACM SIGMOD Record, 2008, 37(1): 5-11 466. Beng Chin Ooi, Kian-Lee Tan, guest editors. Introduction: special section on peer-to-peer- based data management. IEEE Trans Knowl Data Eng. 2004;16(7):785–786. 54 Моделі та засоби систем баз даних і знань 467. Sacca D., Wiederhold G. Database partition- ing in a cluster of processors. ACM Trans Database Syst. 1985;10(1):29–56. 468. Yoshida M., Mizumachi K., Wakino A., Oyake I., Matsushita Y. Time and cost evalu- ation schemes of multiple copies of data in distributed database systems. IEEE Trans. Softw. Eng. 1985; 11(9) :954–958. 469. Ceri S., Negri M., Pelagatti G. Horizontal data partitioning in database design. In: Pro- ceedings of the ACM SIGMOD International Conference on Management of Data; 1982. p. 128–136. 470. Ceri S., Pelagatti G. Distributed databases: principles and systems. New York: McGraw- Hill; 1984. 471. Navathe S., Ceri S., Wiederhold G., Dou J. Vertical partitioning of algorithms for da- tabase design. ACM Trans Database Syst. 1984;9(4):680–710. 472. McCormick W.T., Schweitzer P.J., White T.W. Problem decomposition and data reor- ganization by a clustering techniqiue. Oper Res. 1972;20(5): 993–1009 473. Shikha Mehta, Parul Agarwal, Prakhar Shrivastava, Jharna Barlawala, Diff erential bond energy algorithm for optimal vertical fragmentation of distributed databases, Jour- nal of King Saud University - Computer and Information Sciences, 2018, 474. Chu W.W. Optimal fi le allocation in a multi- ple computer network. IEEE Trans Comput. 1969;- 18(10):885–889. 475. Apers P.M. Data allocation in distributed da- tabase systems. ACM Trans Database Syst. 1988;13(2): 263–304. 476. Bell D.A. Diffi cult data placement problems. Comput J. 1984;27(4):315–320. 477. Chang C.C, Shieh J.C. On the complexity of fi le allocation.problem. In: Proceedings of the International.Conference on the Foun- dations of Data Organization; 1985. p. 177– 181. 478. Brunstrom A., Leutenegger S.T, Simha R. Experimental evaluation of dynamic data al- location strategies in a distributed database with changing workloads. In: Proceedings of the 40) 4th International Conference on Information and Knowledge Management; 1995. p.395–402. 479. Karlapalem K., Ng M.P. Query-driven data allocation algorithms for distributed data- base systems. In: Proceedings of the 8th In- ternational Conference Database and Expert Systems Applications; 1997. p. 347–356. 480. Bernstein P.A., Hadzilacos V., Goodman N. Concurrency control and recovery in data- base systems. Reading: Addison Wesley; 1987. 481. Gray J., Helland P., O’Neil P., Shasha D. The dangers of replication and a solution. In: Pro- ceedings of the ACM SIGMOD International Conference on Management of Data; 1996. p. 173–182. 482. Breitbart Y., Komondoor R., Rastogi R., Ses- hadri S., Silberschatz A. Update propagation protocols for replicated databases. In: Pro- ceedings of the ACM SIGMOD International Conference on Management of Data; 1999. p. 97–108. 483. Saito Y., Shapiro M. Optimistic replication. ACM Comput Surv. 2005;37(1):42–81. 484. Lin Y., Kemme B., Patiño-Martínez M., Ji- ménez-Peris R. Middleware based data repli- cation providing snapshot isolation. In: Pro- ceedings of the ACM SIGMOD International Conference on Management of Data; 2005. p. 419–430. 485. Wiesmann M., Schiper A. Comparison of database replication techniques based on to- tal order broadcast. IEEE Trans Knowl Data Eng. 2005;17(4):551–566 486. Corbett J.C., Dean J., Epstein M., Fikes A., Frost C., Furman J.J., Ghemawat S., Gubarev A., Heiser C., Hochschild P., Hsieh W.C., Kanthak S., Kogan E., Li H., Lloyd A., Melnik S., Mwaura D., Nagle D., Quinlan S., Rao R., Rolig L., Saito Y., Szymaniak M., Taylor C., Wang R., Woodford D. Spanner: Google’s globally distributed database. ACM Trans Comput Syst. 2013;31(3):8:1-8:22. 487. Mahmoud H.A., Nawab F., Pucher A., Agrawal D., El Abbadi A. Low-latency multi-datacenter databases using replicated commit. Proc VLDB Endow. 2013;6(9):661– 672. 488. Satyanarayanan M., Kistler J.J., Kumar P., Okasaki M.E., Siegel E.H., Steere D.C. Coda: a highly available fi le system for a distributed workstation environment. IEEE Trans Comput. 1990;39(4):447–459. 489. Terry D.B., Theimer M., Petersen K., De- mers A.J., Spreitzer M., Hauser C. Managing update confl icts in Bayou, a weakly connect- 55 Моделі та засоби систем баз даних і знань ed replicated storage system. In: Proceedings of the 15th ACM Symposium on Operating System Principles; 1995. p. 172–183. 490. Sivasubramanian S., Szymaniak M., Pierre G., van Steen M. Replication for web hosting systems. ACM Comput Surv. 2004;36(3):291–334. 491. Lv Q., Cao P., Cohen E., Li K., Shenker S. Search and replication in unstructured peer- to-peer networks. In: Proceedings of the 16th Annual International Conference on Super- computing; 2002. p. 84–95. 492. Budhiraja N, Marzullo K, Schneider FB, Toueg S. The primary-backup approach. In: Mullender S, editor. Distributed systems. 2nd ed. Reading: Addison Wesley; 1993. p. 199–216. 493. Schneider F.B. Replication management us- ing the state-machine approach. In: Mullen- der S, editor. Distributed systems. 2nd ed. Reading: Addison Wesley; 1993. p. 169–198. 494. Almeida S., Leitão J., Rodrigues L.E.T. Chainreaction: a causal+ consistent datastore based on chain replication. In: Proceedings of the 8th ACM SIGOPS/EuroSys European Conference on Computer Systems; 2013. p. 85–98. 495. Sovran Y., Power R., Aguilera M.K., Li J. Transactional storage for geo-replicated systems. In: Proceedings of the 23rd ACM Symposium on Operating System Principles; 2011. p. 385–400. 496. Gray J. Notes on data base operating sys- tems. In: Advanced Course: Operating Sys- tems; 1978. p. 393–481. 497. Ho G.S, Ramamoorthy C.V. Protocols for deadlock detection in distributed da- tabase systems. IEEE Trans Softw Eng. 1982;8(6):554–557. 498. Stonebraker M. The design and implementa- tion of distributed ingres. In: The INGRES papers: anatomy of a relational database sys- tem; 1986. p. 187–96. 499. Menascé D.A., Muntz R. Locking and dead- lock detection in distributed data bases. IEEE Trans Softw Eng. 1997;5(3):195–202. 500. Mohan C., Lindsay., Bruce G., Obermarck R. Transaction management in the R* dis- tributed database management system. ACM Trans Database Syst. 1986;11(4):378–396. 501. Abonamah A.A,. Elmagarmid A. A survey of deadlock detection algorithms in distributed database systems. In: Advances in distributed and parallel processing. System paradigms and methods, vol. 1; 1994. p. 310–341. 502. Elmagarmid A.K. A survery of distributed deadlock algorithms. ACM SIGMOD Rec. 1986;15(3):37–45. 503. Knapp E. Deadlock detection in distributed databases. ACM Comput Surv. 1987;19(4): 303–328. 504. Singhal M. Deadlock detection in distributed systems. Computer. 1989;22(11):37–48. 505. Krivokapic N, Kemper A, Gudes E. Deadlock detection in distributed database systems: a new algorithm and a comparative perfor- mance analysis. VLDB J. 1999;8(2):79–100. 506. Roesler M., Burkhard W.A., Cooper K.B. Effi cient deadlock resolution for lock-based concurrency control schemes. In: Proceed- ings of the 18th International Conference on Distributed Computing Systems; 1998. p. 224–233. 507. Bracha G., Sam T. Distributed deadlock de- tection. Distrib Comput. 1985;2(3):127–138. 508. Chandy K.M., Lamport L. Distributed snap- shots: determining global states of distrib- uted systems. ACM Trans Comput Syst. 1986;3(1):63–75. 509. Bernstein P.A., Goodman N., Wong E., Reeve C.L., Rothnie Jr.J.B. Query processing in a sys- tem for distributed databases (SDD-1). ACM Trans Database Syst. 1981;6(4):602–625. 510. Epstein RS, Stonebraker M, Wong E. Dis- tributed query processing in a relational data base system. In: Proceedings of the ACM SIGMOD International Conference on Man- agement of Data; 1978. p. 169–180. 511. Stonebraker M. The design and implementa- tion of distributed INGRES. In: Stonebraker M, editor. The INGRES papers. Reading: Addison-Wesley; 1986. 4) Williams R., Dan- iels D., Hass L., Lapis G., Lindsay B., Ng P., Obermarck R., Selinger P., Walker A., Wilms P., Yost R. R*: an overview of the architec- ture. IBM Research Lab, San Jose, Technical Report RJ3325; 1981. 512. Williams R., Daniels D., Hass L., Lapis G., Lindsay B., Ng P., Obermarck R., Selinger P., Walker A., Wilms P., Yost R. R*: an over- view of the architecture. IBM Research Lab, San Jose, Technical Report RJ3325; 1981. 513. Haas L.M., Selinger P.G., Bertino E., Dan- iels D., Lindsay B.G., Lohman G.M., Masu- 56 Моделі та засоби систем баз даних і знань naga Y., Mohan C., Ng P., Wilms P.F., Yost R.A. R*: a research project on distributed relational DBMS. IEEE Database Eng Bull. 1982;5(4):28–32. 514. Wong E. Retrieving dispersed data from SDD-1: a system for distributed databases. In: Proceedings of the 2nd Berkeley Work- shop on Distributed Data Management and Computer Networks; 1977. p. 217–235. 515. Yu C.T. and Chang C.C. Distributed query processing. ACM Comput. Surv., 16(4):399– 433, 1984. 516. Kossmann D. The state of the art in distrib- uted query processing. ACM Comput Surv. 2000;32(4):422–469. 517. Urhan T., Franklin M.J., Amsaleg L. Cost based query scrambling for initial delays. In: Proceedings of the ACM SIGMOD Interna- tional Conference on Management of Data; 1998. p. 130–141. 518. Stonebraker M., Devine R., Kornacker M., Litwin W., Pfeff er A., Sah A., Staelin C. An economic paradigm for query processing and data migration in Mariposa. In: Proceedings of the 3rd International Conference Parallel and Distributed Information Systems; 1994. p. 58–67. 519. Ceri S., Pelagatti G. Distributed databases principles and systems. New York: McGraw- Hill; 1984. 520. Eswaran K.P., Gray J.N., Lorie R.A., Traiger I.L. The notion of consistency and predicate locks in a database system. Commun ACM. 1976;19(11):624–633. 521. Gray J.N. The transaction concept: virtues and limitations. In: Proceedings of the 7th International Conference on Very Data Bas- es; 1981. p 144–154. 522. Spector A.Z., Schwarz P.M. Transactions: a construct for reliable distributed computing. ACM Operat Syst Rev. 1983;17(2):18–35 523. Stearns R.E., Rosenkrantz D.J. Distributed database concurrency controls using before- values. SIGMOD ‘81: Proceedings of the 1981 ACM SIGMOD international confer- ence on Management of data, 1981, pp 74– 83 524. Boral H., Gold I. Towards a self-adapting centralized concurrency control algorithm. In: Proceedings of the ACM SIGMOD In- ternational Conference on Management of Data; 1984. p. 18–32. 525. Lausen G. Concurrency control in database systems: a step towards the integration of optimistic methods and locking. In: Proceed- ings of the ACM Annual Conference; 1982. p. 64–68. 526. Salem K., Garcia-Molina H., Shands J. Al- truistic locking. ACM Trans Database Syst. 1994;19(1):17–165. 527. Kung H.T. Robinson J.T. “On Optimistic Methods for Concurrency Control”. ACM Transactions on Database Systems, Vol. 6, No. 2, 1981, pp. 213-226. 528. Rahm E. Concepts for Optimistic Concur- rency Control in Centralized and Distributed Database Systems. IT Informationstechnik, (in German), 1988, vol. 30, no. 1, pp. 28-47. 529. Thomasian A. Distributed optimistic concur- rency control methods for high-performance transaction processing IEEE Transactions on Knowledge and Data Engineering, 1998, 10(1):173 - 189 530. Bernstein P., Goodman N. [1980] “Time- stamp-Based Algorithms for Concurrency Control in Distributed Database Systems,” in VLDB ‘80: Proceedings of the sixth interna- tional conference on Very Large Data Bases - Volume 6October, 1980, pp. 285–300 531. Bernstein PA., Goodman N., RothnieJ.B.Jr., Papadimitriou C.H. Analysis of serializabil- ity of SDD1: a system of distributed data- bases (the fully redundant case). IEEE Trans. On Software Engineering, SE-4: 3 (1978), pp. 154-168. 532. Reed D.P. “Implementing Atomic Actions on Decentralized Data,” TOCS, 1:1, February 1983, pp. 3–23. 533. Reed D.P. Naming and synchronization in a decentralized computer system. Ph. D. The- sis, MIT, Cambridge, Mass., 1977 534. Thomasian A. Concurrency Control: Meth- ods, Performance, and Analysis, ACM Com- puting Surveys, 1998, 30(1):70-119 535. Ozkarahan E. Database Machines and Data- base Management. Englewood Cliff s, N.J.; Prentice-Hall, 1986 - 636 p. 536. DeWitt D.J., Hawthorn P.B. A performance evaluation of data base machine architec- tures. In: Proceedings of the 7th Internation- al Conference on Very Data Bases; 1981. p. 199–214. 537. Boral H., DeWitt D.J., Wilkinson W.K. Per- formance evaluation of four associative disk 57 Моделі та засоби систем баз даних і знань designs Information Systems, Volume 7, Is- sue 1, 1982, Pages 53-64 538. Boral H., DeWitt D. Database machines: An idea whose time has passed? A critique of the future of database machines. In Proceed- ings of the 1983 Workshop on Database Ma- chines. H.-O. Leilich and M. Missikoff , Eds., Springer-Verlag, 1983, pp. 16--187 539. Slotnik D.L. “Logic per Track Devices” in Advances in Computers, Vol. 10., Frantz Alt, Ed., Academic Press, New York, 1970, pp. 291 - 296. TODS, Vol 1, No. 3. September 1976. 540. Parker J.L. “A Logic per Track Retrieval System,” IFIP Congress, 1971. J.L. Parker, “A Logic per Track Retrieval System”, Proc. IFIP Congress 1971, pp. TA-4-146 to TA-4- 150 541. Minsky N., “Rotating Storage Devices as Partially Associative Memories” Proc. 1972 FJCC. N. Minsky: Rotating Storage Devices as Partially Associative Memories, FJCC 1972, AFIPS Conf. Proc., pp. 587–595 542. Parhami B. “A Highly Parallel Computing System for Information Retrieval” Proceed- ings of the Fall Joint Computer Conference, 1972. pp. 681-690 543. Ozkarahan E.A., Schuster S.A., Smith K.S. RAP: An Associative Processor for Data Base Management. Proc. AFIPS 44, NCC, 1975, pp. 379-387. 544. Su S.Y.W., Lipovski G.J.”CASSM: A Cel- lular System for Very Large Data Bases”, VLDB ‘75: Proceedings of the 1st Interna- tional Conference on Very Large Data Bas- esSeptember 1975 Pages 456–472 545. Lin S.C., Smith D.C.P., Smith J.M. “The De- sign of a Rotating Associative Memory for Relational Database Applications,” TODS Vol. 1, No. 1, pages 53 - 75, Mar. 1976. 546. Kannan K. “The Design of a Mass Memory for a Database Computer,” Proc. Fifth An- nual Symposium on Computer Arcliecture. Palo Alto, CA. April 1978, pp. 44-51 547. Leilich H.-O., Stiege G., Zeidler H.Ch. “A Search Processor for Data Base Manage- ment Systems” VLDB ‘78: Proceedings of the fourth international conference on Very Large Data Bases - Volume 4, September 1978, Pages 280–287 548. Schuster S.A., Nguyen, H.B., Ozkarahan, E.A. K.C. Smith, “RAP.2 - An Associative Processor for Databases and its Applica- tions,” IEEE Transactions on Computers, C-28, No. 6, June 1979. pp. 446-458 549. DeWitt D.J., “DIRECT - A Multiprocessor Organization for Supporting Relational Data- base Management Systems,” IEEE Transac- tions on Coiputers. June 1979, pp. 395-406. 550. Madnick S.E. “The Infoplex Database Com- puter: Concepts and Directions,” Proceed- ings of the IEEE Computer Conference, Feb. 1979l, pp. 168-176 551. Hell W. “RDBM - A Relational Database Machine: Archtecture and Hardware De- sign,” Proceedings of the 6th Workshop on Computer Architecture for Non-Numeric Processing, June 1981, 552. Missikoff M. “An Overview of the project DBMAC for a relational machine,” Proceed- ings of the 6th Workshop on Computer Ar- chitecture for Non-Numeric Processing, Hy- eres, France, June 1981. 553. DeWitt D.J., Gray J. Parallel database sys- tems: the future of high performance database systems. Commun ACM. 1992;36(6):85–98. 554. Hurson A.R., Miller L.L., Pakzad S.H., Eich M.H., Shirazi B. Parallel architectures for database systems. Advances in Computers, Vol. 28, 1989, pp. 107-151. 555. Stonebraker M. “The Case for Shared Noth- ing,” Database Engineering, Vol. 9, No. 1, 1986. pp. 4-9 556. Stonebraker M., Katz, R.H., Patterson, D.A., Ousterhout, J.K., The Design of XPRS, Four- teenth Int. Conf. on Very Large Data Bases, (Los Angeles, 1988), Morgan Kaufmann, 1988, pp. 318–330. 557. Bergsten B., Couprie, M., Lopez, M., DBS3: A Parallel Data Base System for Shared Store (Synopsis), in Issues, Architectures, and Algorithms (Proc. of the 2nd Int. Conf. on Parallel and Distributed Information Sys- tems (PDIS 1993), San Diego, 1993), IEEE Comput. Soc., 1993, pp. 260–262. 558. Graefe G., Volcano—An Extensible and Par- allel Query Evaluation System, IEEE Trans. Knowledge Data Engineering, 1994, vol. 6, no. 1, pp. 120–135. 559. Strickland J.P., Uhrowczik, P.P., Watts, V.L., IMS/VS: An Evolving System, IBM Systems J., 1982, vol. 21, no. 3, pp. 490–510. 560. Linder B., Oracle Parallel RDBMS on Mas- sively Parallel Systems, in Issues, Architec- 58 Моделі та засоби систем баз даних і знань tures, and Algorithms (Proc. of the 2nd Int. Conf. on Parallel and Distributed Informa- tion Systems (PDIS 1993), San Diego, 1993), IEEE Comput. Soc., 1993, pp. 67–68. 561. Dubova N., Supercomputers nCube, Otkry- tye sistemy, 1995, no. 2, pp. 42–47. 562. Kronenberg N.P., Levy, H.M., Strecker, W.D., VAXclusters: A Closely-Coupled Dis- tributed System, ACM Trans. Comput. Sys- tems, 1986, vol. 4, no. 2, pp. 130–146. 563. Nick J.M., Moore B.B., Chung J.-Y., Bow- en N.S., S/390 Cluster Technology: Parallel Sysplex, IBM Systems J., 1997, vol. 36, no. 2, pp. 172–201. 564. Teradata: DBC/1012 Data Base Computer Concepts & Facilities, Teradata Corp. Docu- ment No. C02-0001-00, 1983. 565. Dewitt D.J., Ghandeharizadeh S., Schneider D.A., Bricker A. Hsiao H.-I., Rasmussen R. “The Gamma Database Machine Project,” IEEE Knowledge and Data Engineering, Vol. 2, No. 1, March, 1990, pp. 44-62 566. Tandem Performance Group, “A Benchmark of Non-Stop SQL on the Debit Credit Trans- action,” Proceedings of the 1988 SIGMOD Conference, Chicago, IL, June 1988. 567. Alexander W., Copeland G.P. Process And Datafl ow Control In Distributed Data-Inten- sive Systems. Proceedings of the 1988 ACM SIGMOD International Conference on Man- agement of Data, Chicago, Illinois, June 1-3, 1988. ACM Press, 1988. P. 90-98 568. Lorie R., Daudenarde J., Hallmark G., Sta- mos J., Young H., “Adding Intra-Transaction Parallelism to an Existing DBMS: Early Ex- perience”, IEEE Data Engineering Newslet- ter, Vol. 12, No. 1, March 1989., pp. 2–8. 569. Gibbs J, “ Massively Parallel Systems, Re- thinking Computing for Business and Sci- ence,” Oracle, 1991, Vol. 6, No.1 570. Engler, S., Glasstone R., Hasan W., Parallel- ism and Its Price: A Case Study of NonStop SQL/MP, ACM SIGMOD Record, 1995, vol. 24, no. 4, pp. 61–71. 571. Clay D. Informix Parallel Data Query (PDQ), in Issues, Architectures, and Algo- rithms (Proc. of the 2nd Int. Conf. on Parallel and Distributed Information Systems (PDIS 1993), San Diego, 1993), IEEE Comput. Soc., 1993, pp. 71–72. 572. Page J., A Study of a Parallel Database Ma- chine and Its Performance: The NCR/Terada- ta DBC/1012. Advanced Database Systems, Lecture Notes in Computer Science (Proc. of the 10th British Natl. Conf. on Databas- es. BNCOD 10, Aberdeen, 1992), Springer, 1992, vol. 618, pp. 115–137. 573. Baru C.K. et al. DB2 Parallel Edition, IBM System J., 1995, vol. 34, no. 2, pp. 292–322. 574. Sokolinsky L.B. Survey of Architectures of Parallel Database Systems (Rus). Program- ming and Computer Software volume 30, No 6, pages 337–346 (2004) 575. Copeland G.P., Keller T., A Comparison of High-Availability Media Recovery Tech- niques, Proc. of the 1989 ACM SIGMOD Int. Conf. on Management of Data (Portland, 1989), ACM, 1989, pp. 98–109. 576. Graefe G., Query Evaluation Techniques for Large Databases, ACM Computing Surv., 1993, vol. 25, no. 2, pp. 73–169. 577. Hua K.A., Lee C., Peir J.-K., Interconnect- ing Shared-Everything Systems for Effi cient Parallel Query Processing, Proc. First Int. Conf. on Parallel and Distributed Informa- tion Systems (PDIS 1991) (Miami Beach, 1991), IEEE-CS, 1991, pp. 262–270. 578. Pramanik S., Tout W.R. The NUMA with Clusters of Processors for Parallel Join, IEEE Trans. Knowledge Data Eng., 1997, vol. 9, no. 4, pp. 653–666. 579. Bouganim L., Florescu D., Valduriez P. Dynamic Load Balancing in Hierarchical Parallel Database Systems, Proc. 22th Int. Conf. on Very Large Data Bases (VLDB’96) (Mumbai, India, 1996), Morgan Kaufmann, 1996, pp. 436–447. 580. Xu Y., Dandamudi S.P. Performance Evalu- ation of a Two-Level Hierarchical Parallel Database System, Proc. Int. Conf. Comput- ers and Their Applications, Tempe, Arizona, 1997, pp. 242–247. 581. Korneev V.V. Parallel’nye vychislitel’nye sistemy (Parallel Computing Systems), Mos- cow: Nolidzh, 1999. 582. Shmidt V. IBM SP2 Systems (Rus), Otkrytye Sistemy, 1995, no. 6, pp. 53–60. 583. Shnitman V. Fault-Tolerant Servers ServerNet (Rus), Otkrytye Sistemy, 1996, no. 3, pp. 5–11. 584. Sokolinsky L.B. Organization of Parallel Query Processing in Multiprocessor Database Machines with Hierarchical Architecture, Programmirovanie, 2001, no. 6, pp. 13–29. 59 Моделі та засоби систем баз даних і знань 585. Velicanu M., Litan D., Mocanu (Virgolici) A.-M., 2010. “Some Considerations about Modern Database Machines,” Informatica Economica, Academy of Economic Studies - Bucharest, Romania, vol. 14(2), pages 37-44. 586. Eric G. Oracle and storage IOs, explanations and experience at CERN,” 17th International Conference on Computing in High Energy and Nuclear Physics, Prague, Czech Repub- lic, March 2009, pp. 21 – 27. 587. Chock M., Cardenas A., Klinger A. Database structure and manipulation capabilities of a picture database management system (PICD- MS). IEEE ToPAMI, 6(4):484–492, 1984 588. Maier D., Vance B. A call to order. In PODS ’93: Proceedings of the twelfth ACM SIGACT- SIGMOD-SIGART symposium on Principles of database systems, 1993, pp. 1–16 589. Baumann P. Management of Multidimen- sional Discrete Data. VLDB Journal, Special Issue on Spatial Database Systems, 1994, Vol 4, No. 3, pp. 401–444 590. Baumann P. A Database Array Algebra for Spatio-Temporal Data and Beyond, 4th International Workshop on Next Genera- tion Information Technologies and Systems (NGITS ‘99), July 5–7, 1999, Zikhron Yaa- kov, Israel, Lecture Notes on Computer Sci- ence 1649, Springer Verlag, pp. 76 – 93. 591. Baumann P., Dehme A., Furtado P., Ritsch R., Widmann N. The Multidimensional Da- tabase System RasDaMan. Conference: SIG- MOD 1998, Proceedings ACM SIGMOD International Conference on Management of Data, June 2-4, 1998, Seattle, Washington, USA. ACM SIGMOD Record, 1998, Vol. 27, No. 2, pp 575–577 592. EarthServer: The EarthServer Initiative. www.earthserver.eu 593. Baumann P., Holsten S. (2011) A Compara- tive Analysis of Array Models for Databases. In: Kim T. et al. (eds) Database Theory and Application, Bio-Science and Bio-Technolo- gy. BSBT 2011, DTA 2011. Communications in Computer and Information Science, vol 258. pp 80-89 Springer, Berlin, Heidelberg. 594. Baumann, P., Misev, D., Merticariu, V., Bang Pham Huu. Array databases: concepts, stan- dards, implementations. Journal of Big Data, vol 8, No. 1 (2021). 595. Tomlin D. A Map Algebra. Harvard Graduate School of Design, 1990. 596. Mennis, J., Viger, R., Tomlin, C.D.: Cubic Map Algebra Functions for Spatio-Temporal Analysis. Cartography and Geographic In- formation Science, Vol. 32, No. 1, 2005, pp. 17-32. 597. Ritter G, Wilson J, Davidson J. Image Alge- bra: An Overview. Computer Vision, Graph- ics, and Image Processing. Vol. 49, No. 3, 1990, pp. 297-331. 598. Marathe A, Salem K. A language for manipu- lating arrays. In: Proceedings of the 23th In- ternational Conference on Very Large Data Bases; 1997. p. 46–55. 599. Libkin, L., Machlin, R., Wong, L.: A query language for multidimensional arrays: de- sign, implementation and optimization tech- niques. Proc. ACM SIGMOD’96, Montreal, Canada/ ACM SIGMOD Record, 1996, vol. 25, No. 2, pp. 228–239 600. Machlin R. Index-based multidimensional array queries: safety and equivalence. In L. Libkin, editor, PODS, pp. 175–184. ACM, 2007. 601. van Ballegooij A.R., de Vries A.P., Kersten M. RAM: Array processing over a relational DBMS. Technical Report INS-R0301, CWI (March 2003) 602. van Ballegooij A.R. RAM: A multidimen- sional array DBMS. In W. Lindner, M. Mes- iti, C. Turker, Y. Tzitzikas, and A. Vakali, editors, EDBT Workshops, volume 3268 of Lecture Notes in Computer Science, pp. 154–165. Springer, 2004. 603. Cornacchia R., Heman S., Zukowski M., de Vries A., Boncz P. Flexible and effi cient IR using array databases, VLDB Journal. 7(1): 151–168. 604. Stonebraker M., Brown P., Poliakov A., Ra- man S. (2011) The Architecture of SciDB. In: Bayard Cushing J., French J., Bowers S. (eds). Proceedings of the 23rd International Conference on Scientifi c and Statistical Da- tabase Management; 2011 pp 1-16 605. Kersten M.L, Zhang Y., Ivanova M., Nes N. SciQL, a query language for science applica- tions. Proceedings, EDBT/ICDT 2011 Work- shop on Array Databases: Uppsala, Sweden, March 25, 2011, рр 606. Cheng, Y., Rusu, F. Formal representation of the SS-DB benchmark and experimental evaluation in EXTASCID. Distrib Parallel Databases, 2015, vol. 33, No. 3, pp. 277–317 60 Моделі та засоби систем баз даних і знань 607. Cheng Y., Rusu, F. Astronomical data pro- cessing in EXTASCID. SSDBM: Proceed- ings of the 25th International Conference on Scientifi c and Statistical Database Manage- ment, 2013 Article No.: 47, pp. 1–4 608. Tollefsen, Andreas Forø (2013) PostGIS 2.0 og Raster, Kart og Plan 73(3), pp. 159–164. 609. Teradata. Multidimensional array options. - https://docs.teradata.com/r/VrFCOAaniAIfr- JsA51oQJA/ZMY8sE8cSytuSPtp8QnuFA 610. Oracle: GeoRaster. - http://docs.oracle.com/ cd/B19306_01/appdev.102/b14254/geor_in- tro.htm. 611. Becla J., Lim K.T. Report from the fi rst Workshop on Extremely Large Databases, Data Science Journal, 2008, Vol. 7, pp. 1-13 612. Stonebraker M., Brown P., Poliakov A., Ra- man S. (2011) The Architecture of SciDB. In: Bayard Cushing J., French J., Bowers S. (eds). Proceedings of the 23rd International Conference on Scientifi c and Statistical Da- tabase Management; 2011 pp. 1-16 613. Bauman National Library. SciDB. - https:// ru.bmstu.wiki/SciDB 614. Ivanova M, Kersten M.L, Manegold S. Data vaults: a symbiosis between Database tech- nology and scientifi c fi le repositories. Proc. Intl. Conference on Scientifi c and Statistical Database Management (SSDBM). Athens. 2012, pp. 485-:494. 615. Zhang Y, Kersten M.L, Ivanova M, Nes N. SciQL, bridging the gap between science and relational DBMS. In: Desai B.C, Cruz I.F, Bernardino J, editors. Proceedings of the 15th Symposium on International Database Engi- neering and Applications; 2011. pp. 124–133. 616. Baumann P., Stamerjohanns H. (2014) To- wards a Systematic Benchmark for Array Database Systems. In: Rabl T., Poess M., Baru C., Jacobsen H.A. (eds) Specifying Big Data Benchmarks. pp 94-102. 617. “ISO/IEC DIS 9075-15 Information technol- ogy -- Database languages -- SQL -- Part 15: Multi-dimensional arrays (SQL/MDA)” 618. Furtado P., Baumann P. Storage of multidi- mensional arrays based on arbitrary tiling. In Proceedings of the 15th International Con- ference on Data Engineering, pp. 328–336. IEEE Computer Society, 23-26 March 1999 619. Srivastava J., Ngo H.Q. Statistical Da- tabases. Technical Report TR 99-009, 1999, Department of Computer Science and Engineering, University of Minne- sota. - https://conservancy.umn.edu/bit- s t ream/handle/11299/215365/99-009. pdf?sequence=1&isAllowed=y 620. Michalewicz Z. (ed.) Statisticai and Scien- tifi c Databases. Market Cross House, Cooper Street, Chichester, West Sussex, PO19 1EB, 11991, 544 p. 621. Chan P., Shoshani A. SUBJECT: A directory driven system for large statistical databases. In VLDB ‘81: Proceedings of the seventh international conference on Very Large Data Bases - Volume 7, 1981, pp. 553–563 622. Su S. SAM: A semantic association model for corporate and scientifi c-statistical data- bases. Journal of Information Science, pp. 151–199, 1983. 623. Rafanelli M., Ricci F.L. A visual interface for browsing and manipulating statistical enti- ties. In Proceedings of the Fifth International Conference on Scientifi c and Statistical Da- tabase Management, pp. 1990, 163–182, 624. Battista G.D., Batini C. Design of statistical databases: a methodology for the conceptual step. The Journal of Information Systems, vol. 13, no. 4, pp. 407–422, 1988 625. Rafanelli M., Shoshani A. STORM: A sta- tistical object representation model. In Pro- ceedings of the Fifth International Confer- ence on Scientifi c and Statistical Database Management, pp. 14–29, 1990. 626. Rafanelli M., F.L. Ricci, “Mefi sto: A func- tional model for statistical entities,” IEEE Transactions on Knowledge and Data En- gineering, vol. 5, No. 4, pp. 670–681, Aug. 1993. 627. Ghosh S.P. (1989) Statistical relational mod- el. In: Rafanelli M., Klensin J.C., Svensson P. (eds) Statistical and Scientifi c Database Management. SSDBM 1988. Lecture Notes in Computer Science, vol 339. Springer, Ber- lin, Heidelberg. pp. 338-355 628. Shoshani A., Kawagoe K. Temporal data management. In Proceedings of the Twenty- Second International Conference on Very Large Data Bases (VLDB), 1986 pp. 79–90. 629. Meo-Evoli L., Ricci F.L., Shoshani A., On the Semantic Completeness of Macro-Data Operators for Statistical Aggregation, SS- DBM 1992, pp. 239-258. 630. Ozsoyoglu G., Ozsoyoglu Z.M., Matos V., Extending relational algebra and relational 61 Моделі та засоби систем баз даних і знань calculus with set-valued attributes and aggre- gate functions,” ACM Transactions on Data- base Systems, 1987, vol. 12, pp. 566–592. 631. Ozsoyoglu G., Ozsoyoglu Z.M., Malta F. A Language and a Physical Organization Tech- nique for Summary Tables. SIGMOD, 1985: pp. 3-16. 632. Gray J., Bosworth A., Layman A., Pirahesh H. Data Cube: A Relational Aggregation Op- erator Generalizing Group-By, Cross-Tab, and Sub-Total. Data Mining and Knowledge Discovery, 1997, Vol. 1, No. 1, pp. 29–53 633. Agrawal R., Gupta A., Sarawagi S. Model- ing Multidimensional Databases. ICDE ‘97: Proceedings of the Thirteenth International Conference on Data EngineeringApril, 1997, pp. 232–243. 634. Vassiliadis P. “Modeling multidimensional da- tabases, cubes and cube operations,” Proceed- ings. Tenth International Conference on Sci- entifi c and Statistical Database Management (Cat. No.98TB100243), 1998, pp. 53-62, 635. Gentle J.E., Bell J. Special Data Types and Operators for Statistical Data. IEEE Database Eng. Bull., 1984, Vol. 7, No. 1, pp. 34-37 636. Fortunato E., Rafanelli M., Ricci F., Sebastio A.,An algebra for statistical data. In SSD- BM’86: Proceedings of the 3rd international workshop on Statistical and scientifi c data- base management, 1986, pp. 122–134 637. Bezenchek A., Rafanelli M., Tininini L. A data structure for representing aggregate data. In Proceedings: Eighth International Conference on Scientifi c and Statistical Da- tabase Systems, Stockholm, Sweden (P. P. Svensson and J. C. J. C. French, eds.),, IEEE Computer Society Press, 1996, pp. 22–31 638. van den Berg G.M., E. de Feber. Defi nition and use of meta-data in statistical data pro- cessing. In Proceedings of the 6th Interna- tional Conference on Statistical and Scien- tifi c Management, (Ascona, Switzerland), 1992, pp. 290–306 639. Kent J.P., Schuerhoff M. Some thoughts about a metadata management system, in Proceedings of the 9th International Confer- ence on scientifi c and Statistical Databases, (Olympia, WA), pp. 155–164, IEEE Press, Aug. 1997. 640. Westlake A. “A simple structure for statis- tical meta-data,” in Proceedings of the 9th International Conference on scientifi c and Statistical Databases, (Olympia, WA), pp. 186–195, IEEE Press, Aug. 1997. 641. Ghosh S. P. Statistical Metadata. In Kotz- Johnson Encyclopedia of Statistical Science, Vol.8, John Wiley & Sons Inc. Publ., 1988 642. Signore M., Scanu M., Brancato G. Statisti- cal metadata: a unifi ed approach to manage- ment and dissemination. Journal of Offi cial Statistics, 2015, Vol. 31, No 2, pp. 325-347 643. Tansel A. Query languages for statistical da- tabases. Statistics and Compuing. 1995. Vol. 5, No. 1, pp. 59-72 644. Ozsoyoglu G., Ozsoyoglu, Z. M. Statistical database query languages. IEEE Transac- tions on Software Engineering. 1985, vol 11, No. 10, pp. 1071-1080. 645. Johnson R. Modeling summary data. In Pro- ceedings of the ACM SIGMOD Conference, (Ann Arbor, Michigan), pp. 93–97, 1981. 646. Shoshani A. CABLE: A Chain-Based Lan- guage for the Entity-Relationship Model. Proceedings of the 1st International Confer- ence on the Entity-Relationship Approach to Systems Analysis and Design, 1980, pp. 465–466 647. Ikeda H., Kobayashi Y. Additional facilities of a conventional DBMS to support interac- tive statistical analysis. In Proceedings of the 1st LBL Workshop on Statistical Data- base Management, Lawrence Berkeley Lab, Berkeley, CA, Dec. 1981, pp. 25–36 648. Computer Corporation of America. File Manager’s Technical Reference Manual, Model 204 Database Management System. Computer Corporation of America, Cam- bridge, MA, 1979 649. Ghosh S.P. Statistical relational tables for statistical database management, IEEE Transactions of Software Engineering, 1986, vol. SE-12, No. 12, pp. 1106–1116. 650. Maier D., Cirilli C. SYSTEM/K: A knowl- edge based management system. In Proceed- ings of the Second Int. Workshop on Statis- tical Database Management, Los Altos, CA, Sept. 1983, pp. 287–294 651. Stein D.M. A database interface to an inte- grated dataanalysis and plotting tool. In Pro- ceedings of the 3rd Inter-national Workshop on Statistical and Scientifi c Database Man- agement, Luxemburg, 1986, pp. 98–106 652. Heiler S., Bergman R.F. SIBYL: An economist’sworkbench. In SSDBM’83: Pro- 62 Моделі та засоби систем баз даних і знань ceedings of the 2nd International Workshop on Statistical Database Management, Los Al- tos, CA., 1983, pp. 73–79 653. Weiss S.E., Weeks P.L. PASTE-a tool to put application systems together easily. In SSD- BM’83: Proceedings of the 2nd International Workshop on Statistical Database Manage- ment LosAltos CA, 1983, pp. 119–123 654. Hollabaugh L.A., Reinwald L.T. GPI: a statistical package/database interface. SS- DBM’81: In Proceedings of the 1st Inter- national Workshop on Statistical Database Management MenloPark CA, 1981, pp. 78–87 655. Boufares P., Elkabbaj Y., Joiner G., Ounally H. Laversion SM90 du SGBD relationnel PEPIN. Journes SM90, Versailles, France, 1985 656. Turner M. T., Hammond R. Cotton P. A DBMS for large statistical databases. In VLDB ‘79: Proceedings of the fi fth interna- tional conference on Very Large Data Bases - Volume 5, 1979, pp. 319–327 657. Johji S., Sato H. Statistical database research project in Japan and the CAS SDB project. In SSDBM’83: Proceedings of the 2nd in- ternational workshop on Statistical Database Management, 1983 pp. 325–330. 658. Klug A. ABE – a query language for con- structing aggregates-by-example. In SSD- BM’81: Proceedings of the 1st LBL Work- shop on Statistical Database Management, 1981, pp. 190–205 659. Anderson G., Snider T., Robinson B., Toporek J. An integrated research support system for inter-package communication and handling large volumne output from statistical data- base analysis operation. In SSDBM’83: Pro- ceedings of the 2nd international workshop on Statistical Database Management, 1983, pp. 104–110 660. Dintelman S.M., Maness A.T. An imple- mentation of a query language supporting path expressions. In Proceedings of the 1982 ACM SIGMOD International Conference on Management of Data, (Orlando, Florida), 1982., pp. 87–93 661. Karasolo I., Sevenson P. An overview of CANTOR – a new system for data analysis. In SSDBM’83: Proceedings of the 2nd in- ternational workshop on Proceedings of the Second International Workshop on Statistical Database ManagementSeptember 1983 pp. 315–324 662. Chan C., Michalewicz Z. A query language capable of handling incomplete information and statistics. In SSDBM’86: Proceedings of the 3rd international workshop on Statistical and scientifi c database management, 1986, pp. 107–115 663. D’attri A., Ricci F.L. Interpretation of statsit- ical queries to relational databases. In SS- DBM’1988: Proceedings of the 4th interna- tional conference on Statistical and Scientifi c Database Management, 1988, pp. 246–258 664. Chen M., McNamee L., Melkanoff M. A model of summary data and its applications in statistical databases. In SSDBM’1988: Proceedings of the 4th international confer- ence on Statistical and Scientifi c Database Management, 1988, pp 356-387 665. Anderson G., Snider T., Robinson B., Toporek J. An integrated research support system for inter-package communication and handling large volumne output from statistical database analysis operation. In SSDBM’83: Proceedings of the Second In- ternational Workshop on Statistical Database Management, 1983, pp. 104–110. 666. Weiss W., Weeks P., Byrd P. Must we navi- gate through databases. In SSDBM’81: Pro- ceedings of the 1st LBL Workshop on Sta- tistical Database Management, Lawrence Berkeley Lab, Berkeley, CA, Dec. 1981, pp. 111–122 667. Hendrix G.G., Sacerdoti E.D., Sagalowicz D., Slocum J. Developing a natural language interface to a complex system. ACM Trans- actions on Database Systems, 1978, Vol. 3, No. 2,, pp. 105–147 668. Brown W., Navathe S., Su S. Complex data types and a data manipulation language for scientifi c and statistical databases. In SSD- BM’83: Proceedings of the 2nd international workshop on Statistical Database Manage- men, 1983, pp.188–195 669. Ozsoyoglu G., Ozsoyoglu Z.M. Features of a system for statistical databases. In SSD- BM’83: Proceedings of the 2nd international workshop on Statistical Database Manage- ment, 1983, pp. 9–18. 670. Wong H.K.T., Kuo I. GUIDE: Graphical user interface for database exploration. Iin Proceedings of the 8th Conference on Very 63 Моделі та засоби систем баз даних і знань Large Databases, Morgan Kaufman pubs. (Los Altos CA), McLeod and Villasenor, Mexico City, 1982, pp. 22-32 671. Ozsoyoglu Z. M., Ozsoyoglu G. Summary- table-by-example: A database query lan- guage for manipulating summary data. In Proceedings of the International Conference on Data Engineering, (Los Angeles, CA), 1984, pp. 193–202. 672. Thomas J., Hall D. ALDS project: Motiva- tion, statistical database management issues, perspectives, and directions, In SSDBM’83: Proceedings of the 2nd international work- shop on Statistical Database Management- September, 1983, pp.82–88 673. Catarci T., Santucci G. GRASP: A graphical system for statistical databases. In Proceed- ings of the Fifth International Conference on Scientifi c and Statistical Database Manage- ment, (Charlotte, NC), 1990, pp. 148–162 674. Sato H. A data model, knowledge base and natural language processing for sharing a large statistical database. Iin Proceedings of the 4th International Working Conference SSDBM on Statistical and Scientifi c Data- base Management, 1988, pp. 207–225 675. Snodgrass R. T., The temporal query lan- guage TQuel. In Symposium on Principles of Database Systems, 1984, pp. 204–213. 676. Tansel A.U., Arkun M.E. HQUEL, A query language for historical relational databases. In SSDBM’86: Proceedings of the 3rd inter- national workshop on Statistical and scientif- ic database management, 1986, pp. 135–142 677. Tansel A., Arkun M.E., Ozsoyoglu G. Time- by-example query language for historical databases. IEEE Transactions on Software Engineering (SE), 1989, vol. 15, No. 4, pp.464-478 678. Elmasri R., Kouramajian V. A temporal query language based on conceptual entities and roles. ER ‘92: Proceedings of the 11th International Conference on the Entity-Rela- tionship Approach: Entity-Relationship Ap- proach, 1992, pp. 375–388 679. Tansel A.U. A statistical interface for histori- cal relational databases. In Proceedings of the Third International Conference on Data EngineeringFebruary, 1987, pp 538–546 680. Reznichenko V.A. Workig with windows in SQL (Rus). Software Engineering, 2011, vol. 7, No 3, pp. 35-48 681. Chandra P., Gupta M.K. Comprehensive sur- vey on data warehousing research. Interna- tional Journal of Information Technology. 10, pp. 217–224 (2018). https://doi.org/10.1007/ s41870-017-0067-y 682. Inmon, W.H.‘Building the data warehouse’, 5th Edition, John Wiley & Son. 2005 683. Kimball R., Ross M. The Data Warehouse Toolkit: The Defi nitive Guide to Dimension- al Modeling, Third Edition. John Wiley & Sons, Inc. 2013. 600 p. 684. Breslin M. Data Warehousing Battle of the Giants: Comparing the Basics of the Kimball and Inmon Models. In Business Intelligence Journal. 2004. pp. 6-20 685. Brackett M.H.The Data Warehouse Chal- lenge: Taming Data Chaos. John Wiley & Sons, 1996, 579 pages. 686. Gill S.H., Rao P.C. The Offi cial Client/Server Computing Guide to Data Warehouse. QUE Corporation, 1996, 382 pages. 687. Poe V. Building a Data Warehouse for Deci- sion Support. Prentice Hall. 1995 688. Codd E.F. Providing OLAP to User-Ana- lysts: An IT Mandate // Computerworld. — Т. 27, № 30 689. Pendse N. What is OLAP? - http://dssresourc- es.com/papers/features/pendse04072002. htm 690. Ponniah P. ‘Data warehousing fundamen- tals’, John Wiley & Sons, 2001, 516 p. 691. Han J., Kamber M.,Pei J. Data Mining: Concepts and Techniques, 3rd ed.The Morgan Kaufmann Series in Data Management Systems. Morgan Kaufmann Publishers, 2011, 703 p. 692. Chaudhuri S., Dayal U. An Overview of Data Warehousing and OLAP Technology. ACM SIGMOD Record, Volume 26, Is- sue 1, March 1997 pp 65–74. - https://doi. org/10.1145/248603.248616 693. Jensen C.S, Pedersen T.B, Thomsen C. Mul- tidimensional databases and data warehous- ing. Synthesis lectures on data management. San Rafael: Morgan Claypool; 2010. 111 р. 694. Vaisman A, Zimányi E. Data Warehouse Systems: Design and Implementation (Data- Centric Systems and Applications) 2014th Edition. Springer; 2014. 695. Muhammad Arif, Ghulam Mujtaba. A Sur- vey: Data Warehouse Architecture. Interna- tional Journal of Hybrid Information Tech- nology Vol.8, No. 5 (2015), pp. 349-356. 64 Моделі та засоби систем баз даних і знань 696. Astriani W.,Trisminingsih R. Extraction, Transformation, and Loading (ETL) mod- ule for hotspot spatial data warehouse using Geokettle. Procedia, Environmental Science, Elsevier, The 2nd International Symposium on LAPAN-IPB Satellite for Food Security and Environmental Monitoring 2015, pp 626-634 697. Chaudhary S., Murala D.P., Srivastav V.K. (2011) ‘A critical review of data warehouse’, Global Journal of Business Management and Information Technology, Volume(1):No.(2), pp. 95-103. 698. Oliveira B., Belo O. (2015) A Domain-Spe- cifi c Language for ETL Patterns Specifi cation in Data Warehousing Systems. In: Pereira F., Machado P., Costa E., Cardoso A. (eds) Prog- ress in Artifi cial Intelligence. EPIA 2015. Lecture Notes in Computer Science, vol 9273. Springer, Cham. pp 597-602 https://doi. org/10.1007/978-3-319-23485-4_60 699. Data Warehouse Architecture, Concepts and Components. - https://www.guru99.com/da- ta-warehouse-architecture.html 700. Data Warehouse Architecture: Types, Com- ponents, & Concepts. - https://www.astera. com/type/blog/data-warehouse-architecture/ 701. Enterprise Data Warehouse: Concepts and Architecture. - https://www.altexsoft.com/ blog/enterprise-data-warehouse-concepts/ 702. Bhadresh Pandya, Dr. Sanjay Shah. Proposed Local Data Mart Approach for Data Ware- house Architecture. International Journal of Emerging Technology and Advanced Engi- neering. 2014. Vol. 4, No. 2. pp. 101-104 703. Yang Q., Ge M. Helfert M. Analysis of Data Warehouse Architectures: Modeling and Classifi cation. In Proceedings of the 21st International Conference on Enterprise In- formation Systems (ICEIS 2019), pages 604-611. 704. Kimball R., Caserta J. The Data Warehouse ETL Toolkit. Wiley Publ., 2004, 526 p. 705. Chandra P., Gupta M.K. Comprehensive sur- vey on data warehousing research. Interna- tional Journal of Information Technology. 706. Scabora L.C., Brito J.J., Ciferri R.R., Ciferri C.D.D.A. Physical data warehouse design on NoSQL databases – OLAP Query Pro- cessing over HBase. Proc. 18th Intern. Conf. SCITEPRESS. 2016, pp. 111–118. DOI: 10.5220/0005815901110118.10, pp. 217–224 707. Khan F.A., Ahmad A., Imran M., Alharbi M., Jan B. Effi cient data access and perfor- mance improvement model for virtual data warehouse. Sustainable cities and society. 2017, vol. 35, pp. 232–240. DOI: 10.1016/j. scs.2017.08.003. 708. Gupta A., Mumick I.S. ‘Maintenance of ma- terialized views: problems, techniques, and applications’, IEEE Data Engineering Bulle- tin, Special Issue on Materialized Views and Data Warehousing, 1995, Vol.18, No. 2, pp. 3-18 709. Sachin Chaudhary, Devendra Prasad Murala, V.K. Srivastav. A Critical Review of Data Warehouse. Global Journal of Business Man- agement and Information Technology. 2011, Vol. 1, No.2, pp. 95-103 710. Demarest, “Building The Data Mart”, DBMS Magazine, 1994. — Vol 7, No.8. — p. 44— 50. 711. Pedersen T.B, Jensen C.S. Multidimensional data modeling for complex data. In: Proceed- ings of the 15th International Conference on Data Engineering; 1999. p. 336–345. 712. Vassiliadis P. Modeling multidimensional databases, cubes and cube operations. In: Proceedings of the 10th International Con- ference on Scientifi c and Statistical Database Management; 1998. p. 53–62. 713. Kimball R., Ross M. The Data Warehouse Toolkit: The Defi nitive Guide to Dimension- al Modeling, Third Edition. John Wiley & Sons, Inc. 2013, 600 p. 714. Han J., Kamber M.,Pei J. Data Mining: Con- cepts and Techniques, 3rd ed.The Morgan Kaufmann Series in Data Management Sys- tems. Morgan Kaufmann Publishers, 2011, 703 p. - УЖЕ ЕСТЬ ВЫШЕ 715. Harinarayan V, Rajaraman A, Ullman J.D. Implementing data cubes effi ciently. In: Pro- ceedings of the ACM SIGMOD International Conference on Management of Data; 1996. p. 205–216. 716. Sanjay Goil and Alok Choudhary. High per- formance OLAP and data mining on parallel computers. Center of Parallel and Distrib- uted Computing Technical Report TR9705, 1997 717. Morfonios K., Ioannidis Y. Cube Implemen- tations. In Encyclopedia of Database Sys- tems, Ling Liu, M. Tamer Özsu Editors. pp. 710-716. 65 Моделі та засоби систем баз даних і знань 718. Morfonios K, Konakas S, Ioannidis Y, Kot- sis N. ROLAP implementations of the data cube. ACM Computing Surveys, 2007. vol. 39, No. 4, Article 12, 53 pages/ 719. Pedersen TB. Managing complex multidi- mensional data. In: Aufaure M-A, Zimányi E, editors. Business intelligence – second European summer school, eBISS 2012. Brussels: Springer LNBIB; 2013, 15–21 July 2012, Tutorial Lectures. 720. Vaisman A, Zimányi E. Data warehouse sys- tems – design and smplementation. Springer; 2014. 721. Multidimensional DBMS. - https://tadviser. com/index.php/Article:Multidimensional_ DBMS 722. Gosain A., Heena. Literature Review of Data model Quality metrics of Data Warehouse. International Conference on Intelligent Computing, Communication & Convergence (ICCC-2015). Procedia Computer Science 48 (2015) 236 – 243 723. Schrefl M, Thalhammer T. On Making Data Warehouses Active. In M. Mohania and A. Min Tjoa, editors, DaWaK 2000: Proceed- ings of the Second International Conference on Data Warehousing and Knowledge Dis- cover, Greenwhich, London (UK), Septem- ber 4-6, 2000. Springer LNCS, pp. 34–46 724. Thalhammer T, Schrefl M, Mohania M. Ac- tive data warehouses: complementing OLAP with analysis rules. Data & Knowledge En- gineering, 2001, Vol. 39, No. 3, pp. 241–269. 725. Brobst S. Active data warehousing: a new breed of decision support. In: Proceedings of the 13th International Workshop on Data and Expert System Applications; 2002. p. 769–772. 726. Borbst S, Rarey J. The fi ve stages of an ac- tive data warehouse evolution. Teradata Mag. 2001;3(1):38– 44. 727. Syed Ijaz Ahmad Bukhari: Real Time Data Warehouse. CoRR abs/1310.5254 (2013) 728. IBM Data Warehousing. -https://www.ibm. com/analytics/us/en/data-management/data- warehouse. 729. Best practices for Real-time Data Warehous- ing. An oracle white paper. 2014. http:// www.oracle.com/us/products/middleware/ data-integration/realtime-datawarehousing- bp-2167237.pdf 730. Mohania M., Nambiar U., Tam H., Schrefl M., Vincent M. Active, Real-Time, and Intel- lective Data Warehousing. In Encyclopedia of Database Systems, Ling Liu, M. Tamer Özsu Editors. pp 41-49 731. Kimball R. Slowly changing dimensions. DBMS Mag. 1996;9(4):14. 732. Eder J., Koncilia C., Wiggisser K. Data Warehouse Maintenance, Evolution, and Versioning. In In Encyclopedia of Database Systems, Ling Liu, M. Tamer Özsu Editors. pp. 884-890 733. Bruckner R, Min Tjoa A. Capturing delays and valid times in data warehouses: towards timely consistent analyses. J. Intell. Inf. Syst. 2002;19(2):169–190. 734. Malinowski E, Zimányi E. Advanced data warehouse design: from conventional to spa- tial and temporal applications. Berlin/Hei- delberg: Springer; 2008. 735. Ahmed W, Zimányi E, Wrembel R. Temporal data warehouses: logical models and query- ing. In: Proceedings of the Journées fran- cophones sur les Entrepôts de Données et l’Analyse en ligne, EDA. Editions Hermann; 2015. p. 33–48. 736. Mendelzon A, Vaisman A. Time in multidi- mensional databases. In: Rafanelli M, edi- tor. Multidimensional databases: problems and solutions. Hershey: Idea Group; 2003. p. 166–199. 737. Golfarelli M, Rizzi S. Managing late mea- surements in data warehouses. Int J Data Wareh Min. 2007;3(4):51–67. 738. Böhlen M, Gamper J, Jensen C. Towards general temporal aggregation. In: Proceed- ings of the 25th British National Conference on Databases; 2008. p. 257–169. 739. Golfarelli M, Lechtenbörger J, Rizzi S, Vos- sen G. Schema versioning in data ware- houses: enabling cross-version querying via schema augmentation. Data Knowl Eng. 2006;59(2):435–459. 740. Ahmed W, Zimányi E, Wrembel R. A logical model for multiversion data warehouses. In: Proceedings of the 16th International Con- ference on Data Warehousing and Knowl- edge Discovery; 2014. p. 23–34. 741. Golfarelli M, Rizzi S. A survey on tempo- ral data warehousing. Int J Data Wareh Min. 2009;5(1):1–17. 742. Rivest S, Bédard Y, Marchand P. Toward bet- ter support for spatial decision making: de- fi ning the characteristics of spatial on-line 66 Моделі та засоби систем баз даних і знань analytical processing (SOLAP). Geomatica 2001;55(4):539–555. 743. Bédard Y, Merrett T, Han J. Fundaments of spatial data warehousing for geographic knowledge discovery. In: Miller H, Han J, editors, Geographic data mining and knowl- edge discovery. London: Taylor & Francis; 2001. p. 53–73. 744. Stefanovic N, Han J, Koperski K. Object- based selective materialization for effi cient implementation of spatial data cubes. IEEE Trans Knowl Data Eng. 2000;12(6):938–958. 745. Malinowski E, Zimányi E. Representing spatiality in a conceptual multidimensional model. In: Proceedings of the 12th ACM Symposium on Advances in Geographic In- formation Systems; 2004. p. 12–22. 746. Bimonte S, Tchounikine A, Miquel M. To- wards a spatial multidimensional model. In: Proceedings of the 8th ACM International Workshop on Data Warehousing and OLAP; 2005. p. 39–46. 747. Shanmugasundaram J, Fayyad U, Bradley P. Compressed data cubes for OLAP ag- gregate query approximation on continu- ous dimensions. In: Proceedings of the 5th ACM SIGKDD International Conference on Knowledge Discovery and Data Min- ing; 1999. p. 223–232. 748. Ahmed TO, Miquel M. Multidimensional structures dedicated to continuous spatio- temporal phenomena. In: Proceedings of the 22nd British National Conference on Data- bases; 2005. p. 29–40. 749. Gómez L, Gómez S, Vaisman A. Analyz- ing continuous fi elds with OLAP cubes. In: Proceedings of the 14th ACM International Workshop on Data Warehousing and OLAP; 2011. p. 89–94. 750. Gómez L, Gómez S, Vaisman A. A generic data model and query language for spatio- temporal OLAP cube analysis. In: Proceed- ings of the 15th Interna tional Conference on Extending Database Technology; 2012. p. 300–11. 751. Gómez L, Gómez S, Vaisman A. Model- ing and querying continuous fields with OLAP cubes. Int J Data Wareh Min. 2013;9(3):22–45. 752. A.A. Vaisman, Zimányi E. Spatial Data- warehousing. Encyclopedia of Database Systems, Ling Liu, M. Tamer Özsu Editors, Second Edition, 2018, pp. 3587-3592 753. Bédard, Y., T. Merrett & J. Han, 2001, Fundamentals of Spatial Data Warehous- ing for Geographic Knowledge Discov- ery, Geographic Data Mining and Knowl- edge Discovery, Taylor & Francis, Vol. Research Monographs in GIS, No. Chap. 3, p. 53-73 754. Gray J, Chaudhuri S, Bosworth A, Lay- man A, Venkatrao, M, Reichart D, Pellow F, Pirahesh H. Data Cube: A Relational Ag- gregation Operator Generalizing Group-By, Cross-Tab and Sub-Totals. Data Mining and Knowledge Discovery, 1997, 1(1):29–54. Отримано: 27.07.2021 Про автора: Резніченко Валерий Анатолієвич, кандидат фізико-математичних наук, заступник завідувача відділом. Кількість публікацій в українських виданнях– 61. Кількість зарубіжнихих публікацій – 4. Індекс Хірша – 12. http://orcid.org/0000-0002 4451-8931. Місце роботи автора: Інститут програмних систем НАН України, 03187, м. Київ-187, проспект Академіка Глушкова, 40. Тел.: (044) 526 3559. E-mail: reznich@isofts.kiev.ua