Досвід застосування електронних баз данних в історичних дослідженнях

У статті розглядаються інформаційні бази даних, історія виникнення, класифікація та їх застосування в процесі історичного дослідження в рамках проектів Інституту історії України НАН України....

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2009
Автор: Жданович, О.
Формат: Стаття
Мова:Ukrainian
Опубліковано: Інститут історії України НАН України 2009
Онлайн доступ:http://dspace.nbuv.gov.ua/handle/123456789/13208
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Досвід застосування електронних баз данних в історичних дослідженнях / О. Жданович // Історико-географічні дослідження в Україні : Зб. наук. пр. — 2009. — Вип. 11. — С. 256-275. — Бібліогр.: 30 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-13208
record_format dspace
spelling irk-123456789-132082010-11-02T12:04:10Z Досвід застосування електронних баз данних в історичних дослідженнях Жданович, О. У статті розглядаються інформаційні бази даних, історія виникнення, класифікація та їх застосування в процесі історичного дослідження в рамках проектів Інституту історії України НАН України. The article covers information databases, their origins, classification and implementation in historical research within the framework of the projects initiated by NASU Institute of History of Ukraine. 2009 Article Досвід застосування електронних баз данних в історичних дослідженнях / О. Жданович // Історико-географічні дослідження в Україні : Зб. наук. пр. — 2009. — Вип. 11. — С. 256-275. — Бібліогр.: 30 назв. — укр. XXXX-0022 http://dspace.nbuv.gov.ua/handle/123456789/13208 uk Інститут історії України НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Ukrainian
description У статті розглядаються інформаційні бази даних, історія виникнення, класифікація та їх застосування в процесі історичного дослідження в рамках проектів Інституту історії України НАН України.
format Article
author Жданович, О.
spellingShingle Жданович, О.
Досвід застосування електронних баз данних в історичних дослідженнях
author_facet Жданович, О.
author_sort Жданович, О.
title Досвід застосування електронних баз данних в історичних дослідженнях
title_short Досвід застосування електронних баз данних в історичних дослідженнях
title_full Досвід застосування електронних баз данних в історичних дослідженнях
title_fullStr Досвід застосування електронних баз данних в історичних дослідженнях
title_full_unstemmed Досвід застосування електронних баз данних в історичних дослідженнях
title_sort досвід застосування електронних баз данних в історичних дослідженнях
publisher Інститут історії України НАН України
publishDate 2009
url http://dspace.nbuv.gov.ua/handle/123456789/13208
citation_txt Досвід застосування електронних баз данних в історичних дослідженнях / О. Жданович // Історико-географічні дослідження в Україні : Зб. наук. пр. — 2009. — Вип. 11. — С. 256-275. — Бібліогр.: 30 назв. — укр.
work_keys_str_mv AT ždanovičo dosvídzastosuvannâelektronnihbazdannihvístoričnihdoslídžennâh
first_indexed 2025-07-02T15:10:36Z
last_indexed 2025-07-02T15:10:36Z
_version_ 1836548396277563392
fulltext 256 Олексій Жданович ДОСВІД ЗАСТОСУВАННЯ ЕЛЕКТРОННИх БАЗ ДАНИх В ІСТОРИЧНИх ДОСЛІДЖЕННЯх У статті розглядаються інформаційні бази даних, історія виник- нення, класифікація та їх застосування в процесі історичного дослі- дження в рамках проектів Інституту історії України НАН України. Доступ великої кількості людей до електронних інформаційних масивів прискорив процеси структуризації суспільства, фор- мування нових товариств, учасники яких об’єднуються на базі окремих інтересів. Реалізація цих інтересів пов’язана з використан- ням певних інформаційних баз даних – організованих масивів тема- тичної інформації, представлених в електронному виді. Таким чином, бази даних – це певним чином відібрані, організовані й упорядковані масиви інформації. При цьому мова йде про свідомо підготовлену і організовану інформацію1. Ще академік В. І. Вернадський зазначав, що інформація в ноосфе- рі виробляється, зберігається, кодується, декодується, розмножується, відтворюється, втілюється в матеріальні цінності і предмети культу- ри2. Дане уявлення було першим чітким визначенням інформаційного ресурсу з інформаційною базою загальноцивілізаційного масштабу та з механізмами створення і управління інформацією. Серед основних процесів, необхідних для підтримки і розвитку інформаційних баз дослідник М. Баград виділяє наступні: нагрома- дження і збереження інформації, створеної попередніми поколіннями; збір і оцінка інформації; аналітична обробка інформації й т. ін.3. Відповідно до розподілу впровадження нових інформаційних тех- нологій на три основні етапи, а саме, створення бібліографічних баз даних, запровадження процедур для їхньої автоматичної класифікації та розробка програм для кількісного аналізу є змістом першої стадії4. Глибока й усебічна переробка старих сутностей за допомогою нових технологій відкриває можливості переходу від управління документа- ми до управління інформацією і знаннями. Використання систем баз даних значно прискорює створення бі- бліографічної бази історичного дослідження, а комплексні системи, створені на їх основі, у кілька разів підвищують ефективність пошуку 257 тематичної інформації. Однак інтеграція знань неможлива без попе- реднього аналізу, що передбачає глибокий аналіз предметної галузі, її структуризацію і врахування інформаційних потреб дослідників. Най- важливішим питанням, на наш погляд, є правильний вибір основних критеріїв структуризації інформації і шляхів її здійснення, для макси- мального задоволення вимог дослідників історичної науки. Перші перспективи у використанні структурованої інформації в історичній науці намітилися вже у 60-і рр. ХХ ст. Хоча поняття бази даних тоді ще не ввійшло до наукового обігу історика, доцільність і важливість їх застосування дослідники розуміли повною мірою. Слід зазначити, що вже на ті часи використання баз даних в історичній на- уці цілком пов’язували з комп’ютерною технікою. Одним з перших науковців, хто своєчасно усвідомив важливість розробки даної про- блематики і розпочав займатися цими питаннями був І. Д. Ковальчен- ко. Він всіляко намагався привернути увагу істориків до того факту, що групування даних за певними критеріями, розташування матері- алу в будь-якій потрібній послідовності, усілякого роду вибірки, зі- ставлення і пошук даних з подальшим підбиттям підсумків, тобто всі так звані комбінаторні завдання, можуть успішно вирішуватись на об- числювальних машинах5. Перевага використання електронних машин полягала ще й у тому, що відкривалися можливості для випробування різних принципів об- робки даних і на основі зіставлення підсумків відбувався вибір найдо- цільніших з них (звичайними методами це зробити практично немож- ливо). З таких структурованих форм зберігання інформації найбіль- шого поширення набули табличні форми, а своє завершене концепту- альне вирішення вони знайшли в реляційній моделі даних, запропо- нованій наприкінці 60-х рр. ХХ ст. науковим співробітником компанії IBM І. Ф. Коддом. Реляційна модель відіграла свого часу значну роль в упорядкуванні організації інформації в базах даних і доступу до них. Вона була покладена в основу концепції доступу до інформаційних ресурсів низкою великих компаній. В результаті, на сьогодні, за оцін- ками експертів, сховища даних, які створені по реляційній моделі, охоплюють до 99% баз даних у світі. Протягом декількох десятиліть сектор використання баз даних в іс- торичній науці розвивався уповільненими темпами. Це відбувалося че- рез низку причин, одна з яких полягала у відсутності широкого доступу до ЕОМ, інша – у недостатньому інформуванням істориків про широкі можливості і перспективи роботи з інформаційними системами. 258 Тільки у 80-і рр. ХХ ст., разом з появою досить великих масивів структурованої інформації, стало можливим створювати бази даних зі складною структурою та ефективно використовувати їх у роботі на- уковців різних галузей, зокрема, істориків.. Відкрилися можливості об’єднання декількох програм для відпрацьовування даних із ними самими, а також викликати програми, вже виходячи з даних, а не на- впаки, як це було раніше6. Зазначені процеси стали поштовхом до широкого впровадження в історичну науку систем управління базами даних (СУБД). Наприкінці 1980-х рр. істориками були розроблені бази даних, що включали біографічні відомості про сотні тисяч персоналій. Ство- рення численних баз даних потребувало їх стандартизації та концен- трації7. До середини 1990-х рр. створення баз даних стало одним із пріоритетних напрямків розвитку історичної інформатики в СНД. Останнє привело до того, що значну частину наукової продукції чле- нів кліометричного товариства почали становити сюжети, пов’язані саме із цим напрямком. А на наукових конференціях представлялися доповіді, теми яких П. Доорн визначив як «Я і моя база даних» або «Як я перетворив моє джерело на базу даних8. Ще наприкінці 1980-х рр. головну увагу історики приділяли струк- туруванню первинних даних суто кількісного характеру, що не ви- кликало проблем з переведенням інформації в електронний вигляд. Це найчастіше перекладалось у просту однотабличну базу даних, або електронну таблицю. На початку 90-х рр. ХХ ст. ситуація змінилась, адже найбільшої популярності досягли технології створення баз да- них, які використовувались для обробки і аналізу структурованих джерел9. До середині 1990-х рр. головною сферою роботи з базами даних стала розробка спеціалізованого програмного забезпечення, що вра- ховує особливості історичних джерел насамперед систему KLEIO, розроблену М. Талером. Особливо активно велися дослідження, пов’язані з розбудовою та аналізом колективних біографій спеціалі- зованих груп людей. На той час у різних країнах функціонувало біль- ше 20 великих банків даних або архівів електронних даних в галузі історико-соціальних досліджень. Вони мають певний проблемний профіль, організаційну структуру і займаються розширенням колек- цій баз даних, їх розподілом і публікацією каталогів. З удосконалюванням програмного забезпечення «стандартних» систем керування базами даних, типу dBASE та інших, і розробкою 259 спеціалізованого програмного забезпечення, що враховує особливості історичних джерел, розпочалася активізація діяльності цілої низки на- укових центрів по створенню великих баз даних, що містять відомості з популярних історичних джерел10. Багато дослідників можливостей ЕОМ стверджували, що саме бази даних виступають найважливішим проявом використання комп’ютера для управління інформацією, особливо коли вони пов’язані один з од- ним за допомогою передачі даних і доступні віддаленим користува- чам11. Саме в цей період історики, що працювали в галузі розробки і створення баз даних, почали розділяти інформацію у формі, близькій до оригіналу, а також у формі, пристосованій до потреб наступної об- робки. З того часу питання підтримки перетворення даних розгляда- ється як окремий напрямок, що заслуговує на спеціальну увагу. Особливо варто звернутися до використання мережі Інтернет, як до основного фактору реалізації всіх можливостей описаної техноло- гії. З розвитком мережних технологій користувач одержав можливість працювати з базою даних у діалоговому режимі і з віддаленого термі- нала формувати на екрані свій запит, переглядати результати пошуку (реферати, тексти документів) і вибирати необхідні, змінювати запити в процесі пошуку, одержувати статистичні й фактографічні дані, ви- водити на локальні принтери всі або вибіркові результати пошуку. Та- кий процес істотно скорочує час, необхідний для пошуку інформації, а також підвищує його ефективність. Саме мережну версію бази даних можна назвати сучасною і найбільш перспективною формою її існу- вання, що може стати основою для розробки складніших аналітичних систем. Першими мережними базами даних, з якими ознайомились істо- рики, стали ресурси бібліотек. Якщо ще десять років тому електронні каталоги, що підключають до мережі Інтернет, розробляли лише деякі найбільші бібліотеки, то в наш час технологія створення онлайнових бібліографічних банків даних зробила великий крок уперед. Кількість комп’ютеризованих бібліотек, підключених до мережі Інтернет, про- довжує зростати зі значною швидкістю. Певний інтерес представляють бібліографічні системи. Деякі під- ходи до структурування інформації в цій галузі стали основою для розробки баз даних, що використовуються на українському історично- му порталі. Особливої уваги заслуговує Інтернет-портал Національ- ної бібліотеки України ім. В. І. Вернадського (www.nbuv.gov.ua), роз- виток якого здійснюється на глибокому науковому підґрунті, а Центр 260 комп’ютерних технологій, створений у 1992 р. на базі відділу автома- тизації бібліотечно-інформаційних процесів є флагманом створення інформаційних ресурсів і підготовки методичних матеріалів з питань інформатизації12. З 1998 р. здійснюється створення Національної електронної біблі- отеки, що містить значний обсяг наукових праць, нормативних актів, творів класичної літератури, періодичних видань. Проводиться комп- лекс заходів, спрямованих на розвиток онлайнових ресурсів як повно- цінного наукового Іnternet-портала13. Слід зазначити, саме структура сайту Національної бібліотеки України ім. В.І. Вернадського стала основою розробленої в 2003 р. концепції створення Інтернет-бібліотеки Інституту історії України НАН України. Так, була запозичена, перероблена і адаптована до за- питів істориків база посилань на ресурси українських і світових бі- бліотек і архівів. За аналогією з порталом був організований сектор тематичних семінарів і конференцій. Подальший розвиток Інтернет- ресурсу в домені www.history.org.ua, відбувався відповідно до вдоско- налювання технічної та програмної бази Інституту історії і ключових напрямків його досліджень Оскільки електронні бібліотеки, представлені винятково в мережі Інтернет, досі не мають значних обсягів спеціалізованої історичної лі- тератури, вони орієнтовані, головним чином, на популярні видання і не ставлять високих вимог до якості тексту і бібліографічних даних, основну увагу варто звернути на сервери традиційних бібліотек. Такі ресурси надають відомості про книги, журнали, дисертації та інші матеріали, що зберігаються в бібліотеці, інформацію про наявність документу у книгосховищі, а в окремих випадках дозволяють безпо- середньо через мережу здійснити замовлення книги на абонементі. Практичний досвід розробки баз даних можна простежити на при- кладі порталу Інституту історії України НАН України, на якому розмі- щені чотири бази даних: три тематичних і одна інтеграційна. В огляді тематичних баз даних представлені Інтернет-бібліотека Інституту іс- торії України НАН України, «Електронна енциклопедія історії Украї- ни», «Історики України: онлайновий довідник». Найбільшу увагу при- ділено етапу проектування і можливостям роботи з інформацією на рівні користувача. Технічна складова, пов’язана з реалізацією розроблених схем в Microsoft Access, конвертуванням баз даних, передачею запитів за до- помогою sql у СУБД MySQL, формуванням і виведенням інформації 261 в браузер за допомогою мов html і php значною мірою пов’язана із програмуванням. Оскільки її програмну реалізацію можна здійснити на різних мовах програмування і за допомогою різних СУБД, безпо- середньо в тексті статті ці питання розглядатися не будуть. Першою найбільшою базою стала «Онлайнова бібліотека видань інституту історії України НАН України». Нагромадження великої кількості pdf-документів, які були структуровані винятково відповід- но до номерів журналів і збірників, призвело до проблем, пов’язаних з пошуком необхідних матеріалів, що й стало основною причиною ор- ганізації бібліографічної бази даних. Найголовнішими критеріями відбору матеріалів мали стати макси- мальна точність збігу копії з оригіналом документу, що повною мірою забезпечується за рахунок використання формату pdf, а також якомога глибше розкриття інформаційного потенціалу збереженого матеріа- лу, доступне вже на етапі пошуку. Для цього необхідно було всебічно розглянути питання тематичного поділу статей і організації складного пошуку по базі даних, що зробило класифікацію і систематизацію ста- тей першочерговим завданням. Було доопрацьовано і перероблено досвід різних підходів до кла- сифікації, заснованого не на простому розподілі на групи, а шляхом розкриття тематичних зв’язків та запровадженням додаткових типів, родів, видів і категорій14. На розробку структури інформації істотно вплинув аналіз балок (зовнішніх підключень). За його результатами було визначене ядро користувальницьких інтересів, відповідно до якого відбувалося подальше структурування бази даних. Можливість роботи з базою даних одночасно може бути доступ- на значній кількості користувачів. З огляду на структурування інфор- мації, головна цінність бази даних полягає в тому, що за допомогою комп’ютерних систем вона надає неоціненну допомогу користувачеві в пошуку необхідної і всебічної інформації в галузі його інтересів, оскільки головні складнощі виникають не стільки із замовленням по- трібних книг, журналів, статей, скільки з їхнім наступним переглядом, випискою необхідних фактів і відомостей. При організації баз даних виникає проблема відбору інформації для зберігання. Якщо для документальних систем, у принципі зро- зуміло, які об’єкти підлягають зберіганню, то для фактографічної та енциклопедичної інформації питання надмірності стоїть надзвичайно гостро. Широко розповсюджений у точних науках так званий метод «завдань»15, що полягає у відборі і зберіганні тільки тих параметрів, 262 які використовуються в завданнях, можна реалізувати при створенні бібліографічної бази, в якій кожен з запис містить основні вихідні дані (автор, назва, видавництво, рік випуску, випуск або том, кількість сто- рінок, адреса електронної копії). Вся додаткова інформація може бути отримана безпосередньо з електронної версії, що істотно заощаджує ресурси сервера. Інформаційний метод полягає в розробці інформа- ційної моделі досліджуваного об’єкта і виділенні збережених пара- метрів на основі цієї інформаційної моделі. Тут виникають проблеми оцінки цінності інформації, старіння інформації. Найбільш успішна стратегія використання двох методів: методу «завдань» – при базово- му пошуку, і інформаційного – при розширеному. На рівні базового пошуку до системи може бути сформований за- пит, в якому зазначене ім’я автора і назва статті. В результаті користу- вач довідається про кількість матеріалів у базі, пов’язаних із запитом, одержує список статей по темі, або усі роботи даного автора. Також можливий і реферативний опис окремих праць. Рівень розширеного пошуку шляхом залучення додаткової інформації про видавництво, рік випуску і, що особливо важливо підключенні додаткової інтегрую- чої бази даних, дозволяє більш глибоко зробити вибірку та одержати матеріали, найбільш близькі за змістом до теми пошуку. Від січня 2002 р. в Інституті історії України НАН України діє робо- ча група з наукової інформації суспільних наук. Перше завдання, яке було покладено на цю групу – створення електронної версії «Україн- ського історичного журналу», що здійснювалося за фінансової підт- римки Міжнародного фонду «Відродження». Завдяки сучасним елек- тронним технологіям журнал став доступним для користувачів Інтер- нет в усьому світі. Протягом першого року існування електронного ресурсу з ним ознайомилися більше 9 тис. читачів із 64 країн світу. У вільному доступі тут розташований архів журналів починаючи з 1998 р. Формат pdf дозволяє зберегти всі особливості друкованого видання при використанні програми AcrobatReader; до того ж ця програма є вільно поширюваним програмним забезпеченням16. На початковому етапі створення електронної версії «Українського історичного журналу» весь матеріал був елементарно структурований за часом виходу номерів. Для більш глибокої орієнтації пропонувало- ся звертатися до бібліографічних списків статей, які розміщалися в останньому номері за рік. Такі списки являли собою pdf-документ, що передбачало витратити додатковий час на його завантаження і запуск, а також необхідною умовою була обов’язкова наявність Adobe Reader 263 для його відтворення. Будь-які можливості пошуку були відсутні ще й у тому випадку, якщо останнього номеру не було, тому для отримання результату потрібно було послідовно переглядати всі статті, що ви- йшли в журналі того року. Зі збільшенням кількості номерів, доступних в електронному ви- гляді і включенням у портал ще декількох періодичних видань («Со- ціум», «Рутеніка», «Україна в Центрально-східній Європі») успішний тематичний пошук став ще складнішим. Про підключення можливос- тей пошуку свідчили і спеціальні журнали (балки), в яких висвітлю- валася історія підключень користувачів. Більшість користувачів послі- довно переходили від одного номера до іншого, переглядаючи списки статей у пошуках необхідного матеріалу, не маючи чіткого уявлення про те, де він може знаходитись. Пошук матеріалів журналу по його електронних версіях став на- гальною потребою. Ще одним фактором, що істотно вплинув на струк- туру розроблювальної бази даних, став початок створення електро- нного каталогу бібліотеки Інституту історії України НАН України. Основна таблиця бази даних містила наступні пункти: порядковий номер – унікальне ключове поле, автор, назва статті, назва журналу або іншого видання, номер або том, рік видання, видавництво, html- адреса на порталі, тематичний індекс, сторінки розміщення статті, ко- ментарі. Така структура основної таблиці дозволила сформувати php- запит до SQL, що виводить всю необхідну інформацію для складання посилання на тверду копію. З цією таблицею за принципом рівноправ- ності пов’язані дві додаткових таблиці: одна містить розгорнуту ін- формацію про тематичні індекси17, інша – загальну кількість сторінок у виданні. Ще одна таблиця в SQL-базі являє собою згруповані дані і є залежною: у ній зберігається інформація про загальну кількість но- мерів і статей видання, отримана на основі підрахунку значень деяких полів з основної таблиці. Запровадження двох додаткових логічних полів «наявність/відсут- ність електронної версії» і «наявність/відсутність у бібліотеці Інституту історії НАН України» дозволило підключити до порталу бібліографічну базу книг бібліотеки, створену в Інформаційному центрі в системі «Ір- біс», що дозволило співробітникам Інституту одержати повний список всіх видань, що надходили до бібліотеки, починаючи з 2003 р. На основі електронної версії «Довідника УІЖу» і переробки до- відника 1995 р., бібліографічна база журналу була істотно розширена і вміщувала інформацію про всі статті, що вийшли з 1985 р. 264 Наукова праця неможлива без довідкових і енциклопедичних ви- дань. З розвитком комп’ютерних технологій енциклопедії стали до- ступні також і в електронному вигляді. Такі електронні енциклопе- дії від аналогічних книжкових версій відрізняються багаторівневим механізмом пошуку, широкою системою перехресних гіпертекстових посилань, і мультимедійними функціями (можливістю сполучення тексту із графікою, звуком і відео). Основною метою таких ресурсів є подання користувачеві великої кількості матеріалу, підготовленого фахівцями. Це дозволяє всебічно вивчати культурну спадщину і ви- конувати на досить високому науковому рівні загальноосвітню, пізна- вальну і популяризаторську функції. Інтернет-енциклопедія – це результат спільної праці фахівців з двох напрямків: предметної галузі, якій присвячене видання, і власне комп’ютерних технологій. Унікальність електронних енциклопедій і перспективність їхнього розвитку, у порівнянні з аналогічними па- перовими виданнями, полягає в тому, що вони можуть забезпечити комплексний доступ не тільки до тексту і зображення, але й до відео- матеріалів, тривимірних зображень моделей. Саме завдяки функціям мультимедіа більшість сучасних електронних довідників, що не ма- ють книжкових аналогів, дозволяють користувачам отримати більш предметні уявлення про музику, кіно, мистецтво. Однією з їх унікаль- них властивостей, як вже зазначалося, є підтримка тривимірних зо- бражень. Багато електронних енциклопедій, присвячених історії та мистецтву, дозволяють одержувати доступ до віртуальних панорам іс- торичних пам’ятників і залів найбільших музеїв світу. Дослідник має можливість розглянути окремі частини експозиції, детально вивчити тривимірне зображення предметів. Електронні енциклопедії в наш час доступні або на відповідних ре- сурсах мережі Інтернет, або на компакт-дисках. Здавалися б, ці чисто технічні характеристики стають факторами визначальної методики ро- боти з електронним виданням. На наш погляд, Інтернет-енциклопедії більш динамічно реагують на запити користувачів, забезпечують по- стійне поповнення матеріалами. За необхідності адміністратор може допомогти вирішити технічні проблеми, а можливість залишати ко- ментарі, або навіть розміщувати тексти статей, істотно розширює спроможності динамічного розвитку таких проектів. Робота з Інтернет-версіями залежить від технічних характеристик мережі й найчастіше не може забезпечити нормальну швидкість за- вантаження інформації. Якщо ресурс платний, то така робота поєд- 265 нана зі складним механізмом оплати, особливо для більшості вітчиз- няних користувачів. Ще одним недоліком є непостійна адреса того чи іншого ресурсу. Однією з головних переваг Інтернет-версій енциклопедій є можли- вість їх постійного поновлення відповідно до побажань користувачів. Іншою перевагою таких енциклопедій стала відсутність фактичних обмежень за кількістю наданої інформації, тоді як програми, розміще- ні на дисках, мають обмежений обсяг. Швидкість роботи з енциклопе- діями на дисках значно вища, тому що не має потреби в підключенні до мережі. Однак виправлення неточностей, зміна і доповнення таких робіт призводить до появи нових версій, зміна яких призводить до до- даткових витрат. Різні браузери (програми перегляду ресурсів мережі Інтернет) відображають інформацію по-різному, що часом стає при- чиною зміни або втрати частини тексту, або некоректного відображен- ня графічних файлів. Нерідко виникають складнощі у зв’язку з відсутністю необхідних шрифтів для прочитання польської, грецької, німецької та будь-якої іншої мови, що містить унікальні символи. При інсталяції програми з компакт-диску всі необхідні шрифти автоматично встановлюються в систему. Таким чином, на даний момент не можна віддати перевагу жодному способу. Самі творці енциклопедій намагаються розвивати обидва напрями, і більшість вдалих проектів, випущених на дисках, ма- ють посилання на сайт, що містить коротку Інтернет-версію продукту. Не можна не відзначити й успішний проект створення «Історії Ки- єва» на двох дисках, у розробці якого брали участь і співробітників Інституту історії України НАН України. Цікаво, що в Інтернеті абсо- лютно незалежно був створений і продовжує розвиватися сайт «Енци- клопедія Києва» (http://wek.kiev.ua). Приблизно повний обсяг «Енциклопедії історії України» складе більше 13 тис. статей. В Інституті історії України НАН України статті зберігаються у форматі doc, а після передачі у видавництво перетво- ряться у формат програм верстки. Статті з версток не використову- ються як звичайні тексти, оскільки не можуть бути відкриті за допо- могою стандартних текстових процесорів, а деякі потребують ще й обов’язкового підключення додаткових шрифтів. Розробка і створення електронної версії «Енциклопедії історії України» передбачає переклад статей з формату верстки у формат текстового документа. Але пряме перетворення текстів верстки у зви- чайний текстовий формат є неможливим, оскільки відбувається втрата 266 цілого ряду нестандартних символів, що не входять до англійського і російського алфавітів. Такі шрифти, як грецький, німецький, поль- ський і т.п. відображаються не правильно. Щоб уникнути залежності від використовуваних шрифтів, тексти переводяться в кодування Юнікод. UNICODE (UTF-8), що дозволяє підтримувати багато мов і не вимагає установки в системі додаткових шрифтів. Особлива перевага полягає в тому, що такі тексти можуть бути використані при розробці продуктів на більшості мов програ- мування. Кодування Юнікод підтримується як Інтернет-броузерами (починаючи з 4-ої версії Explorer), так і практично всіма сучасними операційними системами. Зміна кодування для більшості статей (близько 90 %) не представ- ляє складності. Достатньо лише файли з верстки експортувати в тек- стовий формат. Складнощі виникають при використанні в тексті мов з унікальними символами (грецька, німецька, польська та ін.). У цьому випадку такі частини тексту можна перетворити такими способами: а) скопіювати через буфер обміну; б) скористатися спеціальними конвер- торами; в) набрати текст заново. Електронна версія «Енциклопедії історії України» наповнюється як матеріалами вже опублікованих томів, так і текстами повного циклу редагування. При розміщенні матеріалів у мережі Інтернет до будь-якої статті можна зробити коментар, який автоматично вводиться в базу даних та індексується за обсягом і часу внесення. Окрім універсальної бази, яка містить всі статті, організовані за алфавітним принципом, можуть бути запроваджені й інші класифікації, такі як біографічний і термінологічний словники (як додатковий варіант хронологічний і (або) архітектурний розділи). Якщо енциклопедія буде розміщена в мережі Інтернет, пошук за ключовими словами бажано здійснювати переважно в назвах статей, тому що робота із власне самими текстами істотно збільшить час виконання запиту і кількість знайдених матері- алів може вираховуватися десятками або навіть сотнями. Розроблено і введено в дію сайт, на якому розміщується інформація про вихід нових томів енциклопедії із прес-релізами, дані про роботу з електронним проектом, поновлення для придбаних компакт-дисків з «ЕІУ». Для забезпечення достатнього рівня захисту, кожний користу- вач має одержати унікальний код, що забезпечує доступ до поновлень для сайту даного проекту. Карти, включені до енциклопедії, можуть бути перетворені на гео- інформаційні системи (системи керування базами даних, призначені 267 для роботи з територіально-орієнтованою інформацією – далі ГІС), що дозволить пов’язувати картографічні об’єкти (тобто, об’єкти, що ма- ють форму й місце розташування) з описовою, атрибутивною інфор- мацією (текстами і зображеннями), що відноситься до цих об’єктів і описує їхньої властивості. За допомогою ГІС, самі карти можуть бути доповнені звітними документами, тривимірними зображеннями, гра- фіками, таблицями, діаграмами, фотографіями та іншими мультиме- дійними засобами. При розробці даної бази, вперше була випробувана технологія об’єктно-орієнтованих банків даних, що забезпечує використання пря- мих адресних посилань та відкриває широкі можливостях багаторазо- вого перевизначення структурних відносин між об’єктами, і забезпе- чення підтримки взаємозв’язків на кшталт «значні-до-значних»18. На наш погляд, саме такий підхід є оптимальним для енциклопедичного формату. Онлайнова версія «Енциклопедії історії України» розроблялася на основі Accesses-бази. Для організації Інтернет-версії, текстові матері- али переводилися в html-формат, здійснювалася вставка перехресних посилань, підключення унікальних стилів для кожного з підрозділів (назва, основний текст, бібліографія, автор) енциклопедичної статті, системна реорганізація назв і форматів ілюстрацій. Особливістю бази є її інтерактивність: будь-який користувач, може доповнити існуючі матеріали, розширити бібліографію, вказати на ресурси пов’язані з даною тематикою. Одним з фундаментальних стало питання про можливість одно- часної модифікації даних і знань у випадку їхнього взаємного перет- инання. Знання, застосовані до даних, постійно змінюються, а отже, зв’язок між ними в історичних інформаційних базах є динамічним19. Саме енциклопедична база даних забезпечує гнучкість, адже у випад- ку значних перетворень її статті, шляхом динамічного створення ін- теграційною базою відповідних гіперпосилань, пов’язуються з будь- якою інформацією, що дозволяє одержати найбільш повне уявлення про ту чи іншу тему. На окрему увагу заслуговує база зображень (близько 5 тис. оди- ниць), яка в перспективі може бути розширена і виділена в самостійну базу. В 90-і роки ХХ ст. творці колекцій зображень були вимушені ро- бити вибір між якісними і кількісними характеристиками матеріалів20. Тоді в більшості випадків при створенні баз дані, які нараховували десятки, або й сотні тисяч одиниць, використовувалася відносно низь- 268 ка розв’язна здатність. Це стало причиною повернення до повторного процесу оцифровки, але вже на підставі інших вимог до якості зобра- жень. Однак уже в той час професійні історики вказували на те, що якщо матеріали відносно низької якості ще можуть використовуватися при організації презентацій, або для освітніх функцій у музеях та на- вчальних закладах, то для систематичних досліджень, переставлення зображення з більш низькою якістю, ніж на фотографіях, є недопус- тимим21 . Третя база даних розробляється у співробітництві із проектом «Українські історики», а її теперішня структура визначена з опорою на видання «Інститут історії України». Вона містить інформацію біо- графічного характеру про українських дослідників історії, а також бі- бліографічні дані про найбільш визначні роботи. В історичній науці розвиток баз даних, пов’язаних із просопогра- фічними дослідженнями, метою яких є створення і аналіз колективних біографій специфічних груп людей, відбувався особливо інтенсивно. Наприкінці 80-х рр. ХХ ст. істориками були розроблені бази даних, до яких входили біографічні відомості про сотні тисяч персоналій. Ство- рення численних інформаційних баз потребувало їх стандартизації і концентрації. До середини 90-х рр. минулого століття у різних краї- нах функціонувало більше 20 великих банків даних або архівів елек- тронних даних в галузі історико-соціальних досліджень, що мають певний проблемний профіль, організаційну структуру і займаються розширенням колекцій баз даних, їхнім розподілом, та публікацією каталогів22. Таким чином, методологія проектування баз даних колективних біографій досить глибоко розроблена, основні вимоги до таких баз сформовані. Завданням проекту «Історики України: онлайновий довід- ник» було створення довідкового ресурсу, присвяченого українським історикам, що містить інформацію про біографії дослідника, його на- укові інтереси і основні роботи. Був розроблений модуль що дозво- ляє додавати нові записи в базу через мережу Інтернет, а спеціальна розмітка тексту біографії дозволяє проводити вибірки за додатковими ознаками (місце навчання, наукова школа, колеги й співавтори). При роботі над базою «українські історики» іноді досить складно визначити, які джерела вказувати, оскільки найчастіше дані, що за- носять у запис бази, інтегровані з фрагментів різних джерел. Обсяг створюваних у ході написання біографії «запитально-перехресних» таблиць може перевищувати обсяг кінцевого продукту в десятки, а 269 іноді й у сотні разів. У такому випадку необхідна одночасна публікація остаточної, фактологічної бази даних і допоміжної, взаємопов’язаної з першою, бази даних, створеної на основі всієї залученої до дослі- дження літератури і джерел із посиланням на їх вихідні дані, або дані архівного зберігання. Неабиякий інтерес для дослідників представляють енциклопедії із графічною складовою, як джерела портретів, карт, різноманітних фото- і відео- матеріалів. Що ж стосується текстів, т тут, виходячи з власного досвіду, перевагу варто віддавати сайтам бібліотек і періо- дичних видань. Взагалі, саме текстові матеріали є найпопулярнішими Інтернет-ресурсами. Враховуючи той факт, що кількість інформації в Мережі подвоюєть- ся кожні 9 місяців, досить важливим фактором є формування загальних принципів організації у розміщеній інформації. Тексти можуть бути представлені як у формі, що читається машиною (HTML, текстовий формат), так і у формі малюнків (у першу чергу мова йде про рукопис- ні документи). Поряд з вищевказаними формами стрімко збільшується кількість документів у спеціальних форматах (одним з найбільш відо- мих і розповсюджених форматів на сьогоднішній день є PDF). Процеси інтеграції й синтезу, є однією з визначальних характерис- тик сучасного етапу розвитку науки. Успішно вирішувати завдання інтеграції можливо лише при чіткому виявленні узагальнюючих за- кономірностей і використанні єдиного методологічного підходу до об’єктів дослідження23. Експериментальною перевіркою ефективності використання інте- граційних рішень, стало створення бази даних «Наукові напрямки». Наукова тема завжди є набагато ширшою за її представлення в біблі- ографічному каталозі. Головна проблема полягає в тому, що форму- вання ключових слів та інших змістовних критеріїв, за якими буде можливий пошук у базі даних, розглядається як проста формально- технічна процедура, що не вимагає високої кваліфікації. Такий підхід призводить до втрати «прикордонних» тем для одного або декількох напрямків. У результаті, навіть наявність у базі даних великого обсягу інформації не гарантує можливість її одержання. При такому підході може відбуватися повторне «відкриття» тем, що може стати особливо актуальним на рубежах кількох галузей знань24. Навіть використання всіляких класифікацій, і створення на їхній основі систематичних (тематичних) каталогів, не виключають втрати матеріалу для багатьох зацікавлених у його одержанні дослідників. 270 Для більш глибокої структурної розбудови необхідна участь на ета- пі класифікації вузькопрофільних фахівців, що чітко представляють увесь спектр тем, пов’язаних з певною проблематикою. Так, визна- чення тематичної області матеріалів повинно належати безпосеред- ньо авторові. Крім того, текст має пройти рад етапів автоматизованого аналізу з використанням спеціальних алгоритмів. Об’єднання трьох існуючих баз даних потребувало спеціального дослідження теоретичних питань, пов’язаних з логікою та методо- логією створення інтегрованих баз даних. Прийнято виділяти п’ять основних напрямів інтеграції знань у системах баз даних: здійснення теоретичного синтезу знань на методологічному рівні, розробка мате- матичної теорії СБД, створення програмного забезпечення СБД, інте- грація знань за формами подання інформації та через техніку (інтегра- ція локальних баз даних в інформаційно-обчислювальних мережах)25. Оскільки експериментальні бази являють собою, головним чином, масиви текстової інформації, головна увага приділяється питанням методології, формам подання матеріалів і механізмам реалізації спе- цифічних вимог історичної науки. Інтеграційна база даних «Наукові напрямки» є центром забезпе- чення комплексного пошуку, а її основними елементами є системати- заційні й класифікаційні матриці, які забезпечують складний пошук відповідно до запитів, генерованих на основі даних користувача. До систематизаційних матриць відносяться «Хронологія», «Персоналії», «Події», «Географія», «Спеціальні історичні дисципліни». Класифіка- ційними матрицями є «Періодизація», «Проблеми», «Міжнародні від- носини». Основною цінністю даної бази є можливість її модифікації корис- тувачами, що забезпечує більш гнучку реакцію при підборі матеріалів відповідно до вузькоспеціалізованих запитів. При її розробці особли- ва увага приділялася фіксації основних результатів розвитку кожно- го конкретного наукового напряму в інституті історії України НАН України і чітке визначення областей перетинання різних класифіка- цій відповідно до обраної тематики. На даний час розроблена тільки базова модель, оскільки комплексна її реалізація можлива тільки при залученні вузькопрофільних фахівців, тому доступна на порталі база не має прикладного значення. Однією з невирішених проблем стала цілісність бази даних – відсутність суперечливих даних і відносин: в інтеграційній базі наукових напрямків, наявність суперечливих даних і відносин мало передбачатися. 271 За своєю суттю база даних «Наукові напрямки» є семантичною оболонкою, що забезпечує успішний пошук при вирішенні конкрет- них завдань. Під семантичною оболонкою ми розуміємо передачу знань у вигляді набору категорій, об’єднаних в ієрархічні структури, пов’язані з текстами за рахунок організації спеціального форматуван- ня. Деякі елементи тексту (слова, словосполучення, імена і прізвища, дати, географічні назви) набувають статусу визначальної значимості для теми запиту. При цьому кожна категорія може мати більше однієї «батьківської», тобто ті самі матеріали можуть бути подані при фор- муванні різних запитів. Використання такого підходу забезпечує «доступ до атомарної ін- формації», дозволяючи тим самим здійснювати пошук як по вертика- лі – шляхом переміщення від більше загальних категорій до більше часток, так і по горизонталі – від однієї родинної категорії до іншої26. У випадку запиту до одного з базових напрямів, система трансфор- мує його в набір текстових шаблонів, що входять у визначення даного напрямку, для організації подальшого пошуку. Семантичні системи, побудовані на основі таких принципів, представляють цінність ще й за рахунок того, що можуть бути використанні з іншими текстами і базами даних без суттєвої модифікації27 . Таким чином, можна зробити висновки, що, хоча сховища даних, засновані на реляційній моделі є загальноприйнятим стандартом, іс- нує низка принципових недоліків, властивих табличній формі збері- гання даних. Серед цих недоліків відокремлюємо наступні: - неможливість забезпечення повної підтримки об’єктів; - недостатня гнучкість і продуктивність роботи; - низький відсоток аналітичного потенціалуреляційної моделі да- них28. Останній пункт пов’язаний з тим, що таблична форма призначена для реєстрації інформації, тож існує як реєстраційна форма подання даних. Вона не пристосована до того, щоб враховувати складні струк- тури об’єктів і численні, динамічно мінливі зв’язки між ними. Окрім того, вона не дозволяє реалізувати складні механізми інформаційно- логічної обробки даних на принципах структурної ієрархії, власти- вій високоорганізованим інтелектуальним системам. Ці обставини ускладнюють можливості створення системи збору, обробки й аналізу неструктурованої вербалізованої інформації. Поряд із названими недоліками технічного плану, в середині 90-х рр. ХХ ст. у середовищі істориків звернули увагу на ще одну про- 272 блему: загальну захопленість створенням банків даних. Ряд дослід- ників указували на переключення інтелектуальних сил на досягнення суто прагматичних цілей. Це, у свою чергу, призвело до обмеження дослідницького арсеналу стандартними пакетами програм29. У резуль- таті такого процесу значна кількість членів комп’ютерного співтовари- ства істориків (у тому числі й через об’єктивні причини) була задіяна у створенні баз і банків даних, удосконалюванням СУБД і програмно- го забезпечення, і відійшла від завдань вивчення історії30. Не історики, що підключилися до вищевказаного процесу, не безпідставно почали сприймати комп’ютеризацію як спробу перетворення історії з гумані- тарної науки на якийсь математично-комп’ютерний додаток. Ще один недолік баз даних, що обмежує їхнє широке використан- ня, полягає в тому, що по-справжньому оцінити можливості баз да- них можна лише в тому випадку, якщо кількість записів у них досягає декількох тисяч, а їх структура досить глибока й широко продумана. Відзначимо також і той факт, що поза комп’ютерною технікою бази даних існувати не можуть, а комп’ютери й мережі без баз даних втра- чають свою наукову значимість, залишаючись лише інструментом об- числення і засобом зберіганні інформації. Бази даних є невід’ємним елементом функціонування комп’ютерної системи, але при вибірці вони формують результати, глибоко заховані в масивах інформації і ті, які іноді неможливо отримати шляхом прямого перебору. Певним чином закладене в базу даних знання є частиною всього об’єктивно існуючого масиву знань і безпосередньо з нею зв’язане. Базам даних властиві, в першу чергу, наступні риси: - швидкість пошуку й одержання інформації; - економія часу користувачів; - збільшення кількості інформації з досліджуваної проблеми; - зростання кількості користувачів через підвищення зручності одержання і обробки інформації; - робота з інформацією на відстані; - можливість працювати з однією й тією ж інформацією одночасно великій кількості користувачів. Використання баз даних в Інтернеті не тільки істотно розширю- ють пошукові можливості для користувачів мережі, але й забезпечу- ють інтерактивність: можна одержати дані про найбільш популярні теми, організувати коментарі, розширити їхнє інформаційне наповне- ння. У випадку пошуку літератури, робота у такому режимі дозволяє організувати поряд із алфавітним, тематичний, хронологічний та інші 273 принци пошуку матеріалів. Технології баз даних покладені в основу пошукових систем, довідкових ресурсів, а на деяких Інтернет ресур- сах, вони лежать в основі всієї структури сайту. У такий спосіб бази даних, безумовно, істотно розширюють мож- ливості дослідників, але вирішення складних завдань можуть забезпе- чити тільки у випадку обширної інтерактивної взаємодії користувача з сервером, шляхом організації додаткових інтеграційних сервісів. Од- нак головна цінність баз даних полягає у тому, що саме вони є осно- вною складовою онлайнових аналітичних комплексів, геоінформацій- них і експертних систем. Труднощі, що виникають при розробці і створенні баз даних, не можуть бути успішно вирішені в рамках однієї наукової спеціальнос- ті й навіть у рамках всього спектру класичних наук. Необхідна коо- перація між фахівцями з інформатики, історії, соціології, географії. Широкий діапазон типів джерел (тексти, малюнки, карти) даних, що входять у бази, вимагає залучення експертів з кожної дисципліни, що передбачає різноманітні підходи до обробки даної інформації, дозво- ляючи знаходити оптимальні шляхи інтеграції та аналізу візуальних, текстових і картографічних матеріалів. 1 Горовий В.М. Особливості розвитку інформаційних баз сучасного укра- їнського суспільства. – К., 2005. – С. 18-19. 2 Вернадский В. И. Биосфера. – М.: Мысль, 1967. – С. 356. 3 Баград М. Научное управление обществом в аспекте классификации его структурных элементов. – Рига, 1973. – С. 11-12. 4 Livari J. Hierarchical spiral model for information system and softwart development. Part 1: Theoretical background. // Information and Software technology. – 1990, Vol. 3, No. 6. – PP. 386-399. 5 Ковальченко И.Д., Устинов В.А. Применение электронных вычис лительных машин в исторической науке // Вопросы истории. – 1964. – № 5. – С. 67. 6 Поспелов Г.С. Искусственный интеллект – основа новой информацион- ной технологии. – М., 1988. – С. 30. 7 Бородкин Л.И. Историческая информатика: этапы развития // Новая и новейшая история. – 1997. – № 1. – С. 4. 8 Доорн П. Европейские традиции в истории и компьютеризации // Источ- никоведческие и историографические проблемы истории Украины. – Вып.20. Теория и методы. – Днепропетровск, 1993. 9 Липницкая О.Л., Попова Е.Э. Учебно-методический комплекс по исто- рической информатике. Базовый курс: Обработка и анализ статистических и 274 структурированных исторических источников средстваими электронных та- блиц и систем управления базами данных. – Мн.: БГУ, 2002. – С. 13. 10 Бородкин Л.И. Историческая информатика: этапы развития // Новая и новейшая история. – 1997. – № 1. – С. 4. 11 Героименко В.А., Лазаревич А.А., Титаренко Л Г. Знание. Компьютер. Общество / Под ред. М.А. Слемнева. – Мн.: Навука i тэхніка, 1992. – С. 51. 12 Соловяненко Д.В. Проблеми впровадження та розвитку інтернет- проектів у бібліотеках України // Наук. праці Національної бібліотеки України імені В. І. Вернадського. Вип. 14. – К.: НБУВ, 2005. 13 Баркова О.В. Перспективи створення національного наукового порталу в мережі Internet на базі Web-сайта НБУВ // Нові обличчя бібліотек та органі- зацій: від надій до партнерства і профусіоналізму: Фокусний семінар. – Б.м. – 2001. – С. 24-28. 14 Липницкая О.Л., Попова Е.Э. Учебно-методический комплекс по исто- рической информатике. Базовый курс: Обработка и анализ статистических и структурированных исторических источников средствами электронных та- блиц и систем управления базами данных. – Мн.: БГУ, 2002. – С. 11. 15 Стогний А.А., Глазунов Н.М. Современные проблемы создания интегрированных баз данных / Кибернетика. Становление информатики. – М.: Наука, 1986. – С. 136. 16 Плахонін А.Г. Електронні проекти Інституту історії України НАН Украї- ни. // Хроніка та інформація. – № 1. – К., 2005. 17 За основу було взято тематичний розподіл статей «УІЖ» в бібліографі- ченому довіднику. 18 Сменцарев Г.В. О представлении и использовании гуманитарных знаний в сети Интернет // Круг идей: Историческая информатика в информационном обществе. Труды VII конференции Ассоциации «История и компьютер». – М.: Мосгорархив, 2001, – С. 328. 19 Леверман В. Данные и знания в исторических базах данных. История и компьютер: новые информационные технологии в исторических исследова- ниях и образовании. – М.: МГУ, 1993. – С. 26 20 Greenhalgh M. An interactive text-and-image database for the general public implemented on a low-cost micro computer for the Australian National Gallery. // Computer and the History of Art. – 1991, Vol. 1. – No. 2. – Pp. 26-29. 21 Яриц Герхард. К новому образу образов. // Круг идей: Историческая ин- форматика в информационном обществе. Труды VII конференции Ассоциа- ции «История и компьютер». – М.: Мосгорархив, 2001, – С. 212. 22 Бородкин Л.И. Историческая информатика: этапы развития. // Новая и новейшая история. – 1997. – №1. – С. 4. 275 23 Стогний А.А., Глазунов Н.М. Назв. праця. – С. 131. 24 Гутнов Д.А. Опасности глобальной информатизации гуманитарной на- уки. // Историк, источник и Интернет. – Новая и новейшая история. – 2001. – № 2. – С. 68. 25 Стогний А.А., Глазунов Н.М. Назв. праця. – С. 132. 26 Белова Е., Лазарев В. Система управления историческими текстами. // Круг идей: Историческая информатика в информационном обществе. Труды VII конференции Ассоциации «История и компьютер». – М.: Мосгорархив, 2001, – С. 194. 27 Белова Е., Лазарев В. Назв. праця. – С. 194. 28 Сменцарев Г.В. О представлении и использовании гуманитарных знаний в сети Интернет. // Круг идей: Историческая информатика в информационном обществе. Труды VII конференции Ассоциации «История и компьютер». – М.: Мосгорархив, 2001, – С. 327. 29 Интервью с профессором Л.А.Миловым // Информационный бюлле- тень. - 1992. – № 6. – С. 91-92. 30 Підгаєцький В.В. Основи теорії та методології джерелознавства з істо- рії України XX століття. Навч. посіб. – Д.: Вид-во Дніпропетр. ун-ту, 2000. – C. 171.