Архивы социальных данных: цели существования, формы работы, проблемы создания
The author discusses the problems of forming social data archives and the questions connected with the necessity of researchers’ special attention to the process of the empirical data documentation. The necessity of developing an integrated software which could support all the stages of empirical...
Збережено в:
Дата: | 2000 |
---|---|
Автор: | |
Формат: | Стаття |
Мова: | Russian |
Опубліковано: |
Iнститут соціології НАН України
2000
|
Назва видання: | Социология: теория, методы, маркетинг |
Теми: | |
Онлайн доступ: | http://dspace.nbuv.gov.ua/handle/123456789/89750 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Цитувати: | Архивы социальных данных: цели существования, формы работы, проблемы создания / А. Горбачик // Социология: теория, методы, маркетинг. — 2000. — № 3. — С. 130–144. — Бібліогр.: 3 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-89750 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-897502015-12-20T03:02:53Z Архивы социальных данных: цели существования, формы работы, проблемы создания Горбачик, А. Социологический архив The author discusses the problems of forming social data archives and the questions connected with the necessity of researchers’ special attention to the process of the empirical data documentation. The necessity of developing an integrated software which could support all the stages of empirical social research is emphasized. The experience of social data archive formation and functioning amassed throughout the world is analyzed. The author also discusses the work done at the Institute of Sociology, National Academy of Sciences of Ukraine, in forming a sociological archive and data bank for social studies. 2000 Article Архивы социальных данных: цели существования, формы работы, проблемы создания / А. Горбачик // Социология: теория, методы, маркетинг. — 2000. — № 3. — С. 130–144. — Бібліогр.: 3 назв. — рос. 1563-4426 http://dspace.nbuv.gov.ua/handle/123456789/89750 ru Социология: теория, методы, маркетинг Iнститут соціології НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
topic |
Социологический архив Социологический архив |
spellingShingle |
Социологический архив Социологический архив Горбачик, А. Архивы социальных данных: цели существования, формы работы, проблемы создания Социология: теория, методы, маркетинг |
description |
The author discusses the problems of forming social data archives and the questions
connected with the necessity of researchers’ special attention to the process of the
empirical data documentation. The necessity of developing an integrated software
which could support all the stages of empirical social research is emphasized. The
experience of social data archive formation and functioning amassed throughout the
world is analyzed. The author also discusses the work done at the Institute of Sociology,
National Academy of Sciences of Ukraine, in forming a sociological archive and data
bank for social studies. |
format |
Article |
author |
Горбачик, А. |
author_facet |
Горбачик, А. |
author_sort |
Горбачик, А. |
title |
Архивы социальных данных: цели существования, формы работы, проблемы создания |
title_short |
Архивы социальных данных: цели существования, формы работы, проблемы создания |
title_full |
Архивы социальных данных: цели существования, формы работы, проблемы создания |
title_fullStr |
Архивы социальных данных: цели существования, формы работы, проблемы создания |
title_full_unstemmed |
Архивы социальных данных: цели существования, формы работы, проблемы создания |
title_sort |
архивы социальных данных: цели существования, формы работы, проблемы создания |
publisher |
Iнститут соціології НАН України |
publishDate |
2000 |
topic_facet |
Социологический архив |
url |
http://dspace.nbuv.gov.ua/handle/123456789/89750 |
citation_txt |
Архивы социальных данных: цели существования, формы работы, проблемы создания / А. Горбачик // Социология: теория, методы, маркетинг. — 2000. — № 3. — С. 130–144. — Бібліогр.: 3 назв. — рос. |
series |
Социология: теория, методы, маркетинг |
work_keys_str_mv |
AT gorbačika arhivysocialʹnyhdannyhcelisuŝestvovaniâformyrabotyproblemysozdaniâ |
first_indexed |
2025-07-06T17:44:08Z |
last_indexed |
2025-07-06T17:44:08Z |
_version_ |
1836920444560605184 |
fulltext |
Андрей Горбачик
Архивы социальных данных: цели существо вания, формы работы, проблемы создания
ÑÎÖÈÎËÎÃÈ×ÅÑÊÈÉ ÀÐÕÈÂ
АНДРЕЙ ГОРБАЧИК,
êàíäèäàò ôèçèêî-ìàòåìàòè÷åñêèõ íàóê, äî -
öåíò ôàêóëüòåòà ñîöèîëîãèè è ïñèõîëîãèè
Êèåâñêîãî íàöèîíàëüíîãî óíèâåðñèòåòà
èìå íè Òàðàñà Øåâ÷åíêî
Архивы социальных данных: цели существо-
вания, формы работы, проблемы создания
Abstract
The author discusses the problems of forming social data archives and the questions
connected with the necessity of researchers’ special attention to the process of the
empirical data documentation. The necessity of developing an integrated software
which could support all the stages of empirical social research is emphasized. The
experience of social data archive formation and functioning amassed throughout the
world is analyzed. The author also discusses the work done at the Institute of Sociology,
National Academy of Sciences of Ukraine, in forming a sociological archive and data
bank for social studies.
Закончено эмпирическое исследование, в подготовку и проведение ко -
то рого вложено много сил и времени. Длительные дискуссии при со став -
лении опросника, тщательная проработка выборки, обучение интер вьюе -
ров, контроль и ввод информации. Наконец все данные в компьютере.
Можно приступать к самому интересному — анализу собранных данных.
Ответы на сформулированные перед началом исследования вопросы, но -
вые вопросы, о которых до начала исследования даже не задумывался, идеи
новых исследований... И вот результаты (по крайней мере, первые) опуб -
ликованы. Не покидает ощущение, что можно было бы проверить еще пару
небольших гипотез, обозначившихся в ходе анализа. Неплохо также
сделать сравнение с данными коллег из другого города, об исследовании
которых прочел в журнале. Однако нужно начинать новое исследование, и
130 Социология: теория, методы, маркетинг, 2000, 3
откла дываешь эти вопросы “на потом”, для аспирантов или для дипломной
сту денческой работы (а вдруг, в следующем году попадется хороший
диплом ник). А что делать с собранными данными? Данными, в которых, по
сути, сконцентрировалась значительная часть труда большого коллектива
лю дей, труда интеллектуального и даже физического.
В Англии, например, после написания отчета по проекту прибли зи -
тельно две трети исследователей хранят собранные в ходе выполнения
проекта данные дома или на работе (при этом риск быть разрушенными или
утерянными для этих данных очень велик, а нестандартная форма хранения
затрудняет доступ к ним для других исследователей), одна пятая ис сле -
дователей попросту уничтожают эти данные и лишь немногие архивируют
их (то есть сдают в какой-либо публично доступный архив). Ситуация в
Украине вряд ли чем-то отличается в лучшую сторону.
Подготовка и передача данных эмпирических исследований в архив
требуют от исследователя времени и дополнительных усилий. Эти затраты
должны быть оправданы. Зачем исследователю передавать собранные и уже
проанализированные данные в публично доступный архив? Основываясь
на собственном и чужом опыте, можно сформулировать такие основные
мотивы:
— публикация данных способствует более широкому обсуждению ис -
следования и, таким образом, увеличивает количество ссылок на
исследование;
— вторичный анализ опубликованных данных, произведенный другим
исследователем, иным методом, исходящий из отличных теоре ти -
ческих предпосылок, способствует открытой дискуссии по теме ис -
следования, является средством дополнительной проверки выводов
и результатов исследования;
— публикация данных способствует тому, что подходы к измерению и
методы сбора информации становятся более согласованными (может
быть даже, в определенной мере, стандартизированными) в про фес -
сиональном сообществе;
— публикация уменьшает дублирование усилий исследователей по сбо -
ру одних и тех же данных. Публикация данных крупных обще нацио -
нальных проектов позволяет вовлекать в анализ этой информации
десятки авторов, которые по различным причинам (организа цион -
ным, финансовым, временным и др.) сами не могут провести по доб -
ное масштабное исследование;
— опубликованные данные методически грамотных, профессионально
проведенных исследований — важнейший источник информации для
студентов и аспирантов.
Однако существует и “обратная сторона медали”. Передавая данные в
публичный архив, исследователь должен быть готов:
— к тому, что в его данных и выводах будут искать ошибки. При этом
чем интереснее и актуальнее исследование, тем выше вероятность
таких поисков;
— к критике со стороны коллег, анализирующих его данные другим
методом или с иных позиций;
— к возможному нарушению конфиденциальности собранной инфор -
мации. Как правило, исследователь обещает респондентам, экспе -
ртам и другим “источникам информации” сохранять конфиден ци -
Социология: теория, методы, маркетинг, 2000, 3 131
Архивы социальных данных: цели существо вания, формы работы, проблемы создания
аль ность и использовать полученные данные только в обобщенном
“анонимном” виде. А вот человек, подвергающий данные вторичному
анализу, таким обещанием непосредственно не связан (хотя, разу -
меется, существуют общепринятые в профессиональном сообществе
этические нормы);
— к возможному нарушению права интеллектуальной собственности на
собранные данные.
Тем не менее практика передачи собранных данных в публично доступ -
ные архивы в последние годы становится все более распространенной. Мно -
гие фонды, выделяя гранты на проведение эмпирических иссле дований,
требуют включать в контракт пункт, в соответствии с которым через опре -
деленное время после окончания проекта собранные данные обязательно
следует поместить в публично доступный архив. Затраты на подготовку и
передачу данных в архив вносятся непосредственно в смету исследования.
Зачастую исследователи не имеют содержательных возражений против
помещения данных своих исследований в архив, однако их останавливают
трудности подготовки данных к такого рода публикации, особенно необ хо -
димость составления подробной сопроводительной документации. Тре бо -
вания, выдвигаемые архивами к такой документации, достаточно высоки,
поскольку при отсутствии необходимых описаний данные не могут быть кор -
ректно использованы для вторичного анализа. Опыт показывает, что о со про -
водительной документации нужно заботиться заранее. Начинать со здавать
качественную документацию в ходе исследования (а тем более спус тя дли -
тельное время по его окончании), весьма трудно, а то и просто невоз можно.
Чтобы упростить процесс помещения результатов количественных ис -
следований в архив (личный, архив организации, публично доступный ар -
хив), уже на самых ранних этапах планирования исследования необходимо
сделать следующее:
— составить полный перечень документов, которые будут создаваться
во время исследования. Он, как правило, включает опросник, описа -
ние вы борки, инструкции интервьюерам, инструкции коди ров щи -
кам, описание файлов данных и другие документы;
— определить структуру файла данных исследования (или файлов
данных). Необходимо зафиксировать объект (или объекты) анализа.
Объектами анализа могут быть “ответы респондента”, “информация о
домашнем хозяйстве” и т.п. Отдельные части исследования могут
фокусироваться на разных объектах анализа. Следует решить, все ли
данные будут представлены в виде одного файла (что можно сделать
всегда) или нескольких файлов. Оформление результатов в виде
нескольких файлов нередко оказывается более экономным, удобным
и логически понятным. Скажем, один файл может содержать резуль -
таты интервью всех членов домохозяйств, а другой — информацию о
домохозяйствах в целом (жилая площадь дома или квартиры, нали -
чие в домохозяйстве иждивенцев, наличие и размер участка земли и
т.п.). Подавая материал из нескольких файлов, необходимо четко
определить, каким образом они будут связаны между собой, как най -
ти информацию о каждой конкретной единице анализа. Можно, на -
при мер, присвоить каждому домохозяйству уникальный номер, ко то -
рый позволит “соединять” результаты интервью отдельных ре спон -
дентов с информацией об их домохозяйстве;
132 Социология: теория, методы, маркетинг, 2000, 3
Андрей Горбачик
— установить общие соглашения о кодировании данных. Прежде всего
речь идет о кодировании отсутствующих значений (“Отказ от от ве -
та”, “Респондент не понимает вопроса”, “Вопрос не задавался” и т.п.) и
ошибок (“Ошибка интервьюера”, “Ошибка кодировщика”, “Ошиб ка
респондента” при самостоятельном заполнении анкеты почтового
опроса). Необходимо четко определить все возможные такого рода
значения для каждой из переменных. Выбор одинаковых (в пределах
файлов дан ных одного исследования) кодов отсутствующих зна че -
ний и ошибок для всех переменных может пред ставлять трудность
вследствие разнородности собираемых данных и специфики ис поль -
зуе мых шкал измерения;
— установить соглашения о правилах построения имен — имен файлов,
имен переменных (признаков), имен отдельных объектов. В качестве
последних часто выступают уникальные номера. При этом исполь зу ют
как “простую” сплошную нумерацию (вида 1,2,3,...), так и более слож -
ные “структурные” варианты. Примером может послужить сле дую -
щий способ построения уникальных номеров для домохозяйств: номер
домохозяйства всегда записывается в виде семизначного чис ла, в кото -
ром две первые цифры означают номер области, две вто рые — номер
района в области, три последние — номер домохозяйства в районе. При
этом обязательно должен быть определен способ коди рования об -
ластей и способ кодирования районов для каждой из об ластей;
— определить процедуру проверки данных во время ввода и инте граль -
ной проверки данных после ввода. Спектр проверок может быть до ста -
точно широким: начиная от контроля механических опечаток опе ра -
торов ввода (например, если переменная принимает только зна че ния 1
или 2, то значение 5 является недопустимым) и заканчивая конт ролем
довольно сложных логических условий “правдо подоб нос ти” дан ных
(неправдоподобным, к примеру, выглядит наличие в вы борке 17-лет -
него респондента, имеющего троих детей, старшему из которых 5 лет);
— определить процесс создания новых переменных (признаков) и, что
очень важно, структуру описания этих новых (вычисленных) пере -
менных. Минимальное описание должно включать формулы вычис -
ления или ссылку на метод и компьютерную программу, с помощью
которой производились вычисления. Однако такое минимальное опи -
са ние не всегда является достаточным;
— определить структуру полного описания всех переменных (при зна -
ков) файла (или файлов) данных. Описание переменных (“коди -
ровочная книга”, codebook) — один из важнейших, с точки зрения
обеспечения возможности вторичного анализа, документов. Опрос -
ник никогда не заменит этот документ, поскольку не включает мно -
гих кодов значений, возникающих на разных этапах работы с дан ны -
ми, а также кодов открытых и полуоткрытых вопросов. Опросник —
это инструмент интервьюера, адресованный респонденту. Описание
переменных — это документ, адресованный аналитику, который бу -
дет работать с данными.
Для качественных исследований многие задачи выглядят аналогично,
хотя, конечно, есть и своя специфика.
Разумеется, перечисленные выше мероприятия не исчерпывают всей
подготовительной работы к исследованию. В основном они направлены на
Социология: теория, методы, маркетинг, 2000, 3 133
Архивы социальных данных: цели существо вания, формы работы, проблемы создания
получение логически непротиворечивого (в первую очередь, с точки зрения
здравого смысла), целостного и, что очень важно, в достаточной степени
документированного набора данных. Именно качественная документация в
значительной мере определяет возможность использования данных за пре -
делами коллектива, проводившего исследование (хотя опыт показывает,
что качественная документация очень важна и для исследователей, соби -
равших данные).
Документированность данных существенно зависит от того, какое ком -
пьютерное программное обеспечение используется при организации и про -
ведении исследования. Интегрированных программных комплексов, кото -
рые бы позволяли согласованно решать типичные задачи эмпирических
социальных исследований (как, например, известный комплекс Microsoft
Office автоматизирует документооборот и коммуникации в небольшом
офи се), пока, к сожалению, нет. Заслуживает внимания набор программных
средств Methodologist’s Toolchest фирмы Idea Works Inc., представляющий
собой девятимодульную экспертную систему, которая помогает составить
план исследования и заявку на получение финансирования (включая гра -
фик работ и бюджет), позволяет определить необходимый объем выборки и
метод статистического анализа, дает рекомендации по составлению опрос -
ника, методам сбора информации, выбору компьютерного пакета статис -
тического анализа и формы графического представления данных в публи -
кациях и выступлениях. Есть и другие подходы к комплексному охвату
процесса эмпирического социологического исследования. Однако эти про -
граммные средства пока, к сожалению, не интегрированы. Более того, дале -
ко не все этапы работы исследователя поддержаны в них должным образом.
В своей работе исследователи используют текстовые редакторы, про -
граммы для работы с базами данных, пакеты статистического анализа и дру -
гие программные средства. В количественных исследованиях цент раль ное
место обычно занимает пакет статистического анализа, поскольку воз мож -
ности именно этой программной системы определяют количества и струк -
туры файлов данных, выбор кодировки признаков, способ контроля вводи -
мой информации, выбор структуры имен и т.п. Новые версии ста тисти чес -
ких пакетов позволяют интегрировать все больше информации, объединять
собственно данные и их описание (документацию), чтобы сде лать файл
данных действительно самодокументированным. Единого стан дарта само -
документированного файла данных в мире пока нет, хотя по пытки его
создания предпринимаются. Де-факто стандартами (по крайней мере, тех -
ническими) в области эмпирических социальных исследований стали
обыч ные текстовые файлы (“обычный текст” или так называемый “формат
ASCII/ANSI”), а также файлы известных пакетов статистического анализа
данных SPSS и SAS. Именно в этих форматах предпочитают депо нировать,
хранить и выдавать файлы большинство архивов социальных данных.
В Украине многие социологи, занимающиеся эмпирическими иссле -
дованиями, используют в своей работе пакеты статистического анализа
данных SPSS (разработка американской фирмы SPSS Inc.) и ОСА (раз -
работка автора этой статьи). Файл данных пакета SPSS позволяет хранить
достаточно длинные метки переменных (куда можно записать полные фор -
му лировки вопросов опросника) и метки значений (куда могут быть запи -
саны предлагаемые респонденту варианты ответов). Весьма гибкой в SPSS
является система кодирования и использования отсутствующих значений.
134 Социология: теория, методы, маркетинг, 2000, 3
Андрей Горбачик
Кроме того, модуль ввода пакета SPSS позволяет контролировать данные во
время ввода, облегчает и делает более надежным ввод данных путем про -
граммирования переходов и автоматического заполнения значений пере -
менных. В свою очередь, паспорт массива данных в пакете ОСА позволяет
хранить длинные названия признаков (переменных), полные формули -
ровки вопросов и предлагаемых альтернатив ответов, текстовые коммен -
тарии к массиву в целом (автор исследования, время проведения иссле -
дования, описание выборки и т.п.) и к каждому признаку в отдельности. При
вычислении нового признака пакет ОСА автоматически документирует
процесс вычисления в паспорте. Специальная технология ввода и полу -
автоматического кодирования открытых и полуоткрытых вопросов также
способствует автоматизации документирования данных. Строгая типи за -
ция измерительных шкал для признаков в сочетании с возможностью про -
граммирования переходов с автоматическим заполнением значений повы -
шают надежность ввода данных. К тому же, есть возможность организации
комплексной интегральной проверки качества введенных данных и орга -
низации повторного ввода данных.
Отметим, однако, что, с одной стороны, многие из перечисленных выше
возможностей документирования работы с данными во время работы ис -
сле дователями просто игнорируются, а имеющиеся возможности не ис -
пользуются. Ссылки на отсутствие времени не выдерживают критики и
свидетельствуют только о существенных пробелах в профессиональной
культуре исследователя. С другой стороны, пока нельзя назвать такую ком -
пьютерную программную систему, которая бы решала вопросы сопро вож -
дения данных комплексно и согласованно, делая процесс докумен тиро -
вания и контроля данных естественным, ненавязчивым, не очень обре -
менительным и в то же время обязательным.
Из-за отсутствия общепризнанных стандартов каждый архив вы дви -
гает свои требования к данным, принимаемым для депонирования. Часто
эти требования обусловлены характером деятельности (научной, обра зо -
вательной) самого архива. Ниже мы сделаем обзор некоторых наиболее
известных в мире архивов с точки зрения их деятельности и организации,
опираясь в основном на информацию, полученную из сети Интернет. Ори -
ен тация на информацию из Интернета определяется не только ее доступ -
ностью и оперативностью, но и тем, что “присутствие в Интернете” является
самостоятельным косвенным и одновременно очень важным и харак тер -
ным показателем функционирования архива. Как мы увидим, далеко не все
архивы распространяют свои данные, используя сеть Интернет. В боль -
шинстве случаев мотивы отказа от такой простой и дешевой формы рас про -
странения информации не только и не столько финансовые или связанные с
охраной прав на интеллектуальную собственность, сколько “методо логи -
ческие”, продиктованные опасением методологически некорректного ис -
пользования данных. Присутствие и активность в Интернете прежде всего
служит индикатором определенной завершенности формирования архива,
подлинной его “публичности”, понимаемой на современном уровне раз -
вития технических средств хранения, обработки и передачи данных.
Центр Роупера (The Roper Center for Public Opinion Research) — один
из известнейших и самых старых архивов в мире. Центр был создан Э.Роу -
пером в 1947 году и находится в университете штата Коннектикут, США.
Ныне Центр занимается созданием и сопровождением компьютерного бан -
Социология: теория, методы, маркетинг, 2000, 3 135
Архивы социальных данных: цели существо вания, формы работы, проблемы создания
ка данных исследований общественного мнения, обучением студентов, раз -
витием международных связей в области межнациональных политических
и социальных исследований. Здесь хранятся около 13 тысяч наборов дан -
ных об исследованиях общественного мнения со всего мира, включая не -
сколько уникальных коллекций (например, все опросы Геллапа, начиная с
1930 года). Большинство данных относятся к США, но есть и чисто “за -
рубежные” коллекции: данные исследований, проведенных в Японии, в
странах Латинской Америки. Центр издает журнал “Public Perspectives”,
серию монографий. Существенную помощь в работе Центра оказывают
студенты, в большинстве своем работающие как добровольцы.
Списки новых поступлений в архив Центра регулярно публикуются в
Интернете. В Интернете свободно (без регистрации и без оплаты) доступен
поиск файлов данных исследований в базе данных Центра. Поиск можно
производить:
— по фразе на английском языке (поиск вхождения этой фразы в на -
звание исследования или в описание исследования);
— по дате исследования (как правило, задается интервал дат);
— по названию организаций, проводивших и финансировавших иссле -
дование;
— по характеристике выборки (например, “избиратели”, “молодежь”,
“женщины”).
Результатом поиска является уникальный номер файла данных иссле -
дования в архиве Центра и общая информация об исследовании. Чтобы
получить данные для вторичного анализа, необходимо по телефону или по
электронной почте обратиться к сотрудникам Центра.
Центр Роупера имеет архив вопросов, работа с которым осуществляется
через систему POLL (Public Opinion Location Library) [1]. В этом архиве
единицей хранения является уже не файл исследования, а информация об
одном вопросе. Архив хранит более 275 тысяч единиц. Каждая единица
хранения включает в себя:
— полную формулировку вопроса и вариантов ответа;
— информацию об исследовании, в котором этот вопрос использовался:
дату проведения исследования, кто проводил и кто финансировал
исследование, использованный метод сбора информации, описание
генеральной совокупности, характеристики и объем выборки и т.п.;
— название тематической рубрики в классификаторе Центра, к которой
отнесен вопрос;
— возможно, некоторую дополнительную информацию о вопросе или
об исследовании. Это может быть указание на то, что вопрос зада -
вался не всем респондентам, или что таблица отображает объеди -
ненные данные нескольких исследований;
— одномерное распределение ответов респондентов на вопрос: либо
округленные до целых значений проценты, либо меры центральной
тенденции и вариации (среднее, медиана, среднеквадратическое от -
клонение). Если в исследовании применялось взвешивание выборки,
то распределения учитывают вес. Приблизительно для 50 тысяч во -
просов из исследований, проведенных после 1990 года, есть двух мер -
ные таблицы, где второй переменной является пол, возраст, образо -
вание, доход, регион проживания или раса респондента.
136 Социология: теория, методы, маркетинг, 2000, 3
Андрей Горбачик
Одноуровневый классификатор POLL включает около 100 тема ти чес -
ких рубрик. Отнесение вопроса к определенной рубрике осуществляют
сотрудники Центра.
Система POLL позволяет осуществлять поиск единиц хранения:
— по тематической рубрике;
— по дате исследования;
— по названию организации, проводившей исследование;
— по вхождению слова или фразы в текст единицы хранения (так назы -
ваемый “поиск в тексте по образцу “; есть возможность строить до -
вольно сложные текстовые образцы поиска).
Результатом поиска в POLL является набор одномерных и, возможно,
двухмерных таблиц распределений. В ряде случаев этой информации до -
статочно для работы. Таблицы содержат всю информацию, необходимую для
корректной ссылки на исследование. Если нужна более детальная ин фор -
мация или углубленный анализ, то, используя уникальный номер фай ла
данных исследования, который всегда присутствует в таблице, по теле фону
или по электронной почте можно обратиться к сотрудникам Центра и зака -
зать данные для углубленного вторичного анализа. Можно также за казать
проведение анализа сотрудниками Центра. Заметим, однако, что не для всех
единиц хранения в POLL имеются исходные данные. В архивах POLL содер -
жится довольно много таблиц, взятых из отчетов и пресс- ре ли зов фирм, про -
водивших исследование. В таких случаях исходную инфор мацию для вто -
ричного анализа в Центре получить нельзя. Доступ к системе POLL осу -
ществляется только по предварительной подписке через компью терные сети.
Основанное в 1962 году Межуниверситетское объединение поли ти -
ческих и социальных исследований (Inter-University Consortium for Po -
litical and Social Research, ICPSR) содержит и развивает один из круп -
нейших мировых архивов исследовательских и учебных данных в области
социальных наук. Архив содержит данные исследований из разных об лас -
тей, включая политические науки, социологию, демографию, экономику,
историю, образование, геронтологию, криминальное право, здравоохра не -
ние, международную политику и международное право. Так, например,
архив хранит данные переписи населения в США, начиная с 1790 года.
Помимо организации введения, хранения, доступа к компьютерным архи -
вам данных, ICPSR занимается распространением методических мате риа -
лов, издательской деятельностью, обучением методам количественного
ана лиза данных, оказывает методическую помощь в проведении анализа
данных. Членами ICPSR являются более 300 университетов и колледжей
Северной Америки, а также сотни образовательных и исследовательских
организаций Европы, Австралии, Новой Зеландии, Азии и Латинской Аме -
рики. Некоторые тематические коллекции архива ICPSR специально фи -
нансируются отдельными фондами. Центр ICPSR находится в Институте
социальных исследований университета штата Мичиган, США.
Депонировать свои данные в архивах Объединения могут все желаю -
щие, для этого не нужно быть членом ICPSR. Доступ к данным могут
получать не только члены Объединения. Общий объем распространенной в
1999 году информации составил более 250 тысяч файлов [2]. Архив ICPSR
использует различные способы распространения информации:
— передача файлов данных по сети Интернет. В 1999 году таким обра -
зом было разослано около 98% общего объема распространяемой
Социология: теория, методы, маркетинг, 2000, 3 137
Архивы социальных данных: цели существо вания, формы работы, проблемы создания
информации. При этом почти 40% информации востребовано через
свободный доступ (бесплатно, получатели, как правило, не являются
членами ICPSR). Остальной объем данных получили члены Объеди -
нения и те, кто оформил платную подписку;
— рассылка файлов по предварительно оплаченным заказам. Формат
данных и носитель информации (дискеты, магнитные ленты, лазер -
ные компакт-диски и т.п.) оговариваются в заказе;
— выпуск и распространение тематических лазерных компакт-дисков и
коллекций дискет.
На странице ICPSR в Интернете организован свободный (без ре гист -
рации и оплаты) поиск файлов в каталогах архива. Возможен поиск по
тексту (вхождению слова или фразы в название исследования или краткое
описание исследования), по названию организации, проводившей ис сле -
дование, по дате исследования. Возможен также поиск по двухуровневому
тематическому классификатору. На первом уровне классификатор со дер -
жит 18 тематических категорий, на втором уровне — 2–3 категории (обычно
это уточнения типа “В США”, “За пределами США”). Описания найденного
исследования и его инструмент (как правило, текст опросника) можно сво -
бодно получить через Интернет. На странице ICPSR размещены электрон -
ные публикации архива и Объединения.
Ежегодно ICPSR проводит в университете штата Мичиган известные во
всем мире летние школы по обучению статистике и применению ко ли -
чественных методов анализа данных в социальных науках. Фонды архива
часто используются как база эмпирических данных в работе различных
курсов этих летних школ.
Совет европейских архивов социальных данных (Council of European
Social Science Data Archives, CESSDA) был создан в 1976 году для распро -
стра нения данных эмпирических социальных исследований среди европей -
ских исследователей и для образовательных целей. Членами Совета в на -
стоя щее время являются архивы из 16 стран Европы. Совет CESSDA активно
зани мается развитием интеграции европейских архивов данных. На стра ни -
це CESSDA в Интернете размещается поисковый механизм, позволяющий
про из водить свободный (без регистрации и оплаты) поиск файлов данных в
ряде архивов, которые входят в сеть Совета. Поиск можно вести по назва нию
исследования, по названию исследовательской организации, по клю чевым
словам из реферата исследования, по датам начала и окончания исследо -
вания, по названию страны, в которой исследование проводилось. В резуль -
тате такого поиска выдается информация о том, в каком архиве со держатся
данные найденного исследования и общая информация об иссле довании.
Одним из крупнейших архивов, входящих в сеть Совета европейских
архивов, является Архив университета в Эссексе, Великобритания. Архив
был создан в 1967 году с целью организации хранения и распространения в
электронном виде для вторичного анализа данных в области социальных
наук и экономики, полученных из академических, коммерческих и прави -
тельственных источников. Архив является крупнейшим в Великобритании
хранилищем исследовательских данных в области социальных и гума ни -
тарных наук. В настоящее время он содержит данные более чем 7000 иссле -
дований. Для поиска в каталогах архива разработана специальная компью -
терная система BIRON. Система BIRON работает в Интернете (поиск не
требует регистрации и оплаты) и активно взаимодействует с электронным
138 Социология: теория, методы, маркетинг, 2000, 3
Андрей Горбачик
тезаурусом терминов в социальных науках HASSET, который, в свою оче -
редь, является средством терминологического контроля при индекси рова -
нии исследований, хранящихся в архиве. Архивные данные распростра -
няются на различных носителях (включая лазерные компакт-диски, маг -
нитные ленты и дискеты) или через компьютерную сеть. Получение данных
из архива возможно только на основе предварительно оплаченного заказа
и соглашения. Как правило, цена зависит не от того, какие данные запроше -
ны, а от категории заказчика (отдельный исследователь, образовательное
учреж дение, государственное учреждение, коммерческая организация и т.д.)
и может существенно меняться.
Архив регулярно проводит научные конференции, учебные семинары
для пользователей, принимает активное участие в работе летних школ по
количественному анализу социальных данных, издает собственный Бюл -
летень (The Data Archive Bulletin. — Alphaprint (Colchester) Ltd.). Архив в
Эссексе тесно сотрудничает с архивом ICPSR.
Одним из крупнейших в Европе считается созданный в 1960 году Цент -
ральный архив в Кельне, Германия. Этот архив является членом Совета
европейских архивов. Центральный архив в Кельне хранит и распростра ня -
ет для вторичного анализа материалы и результаты эмпирических со циаль -
ных исследований проведенных в Германии и в Европе. В настоящее время
в нем содержатся данные более 8000 исследований. В Интернете органи зо -
ван свободный (не требующий регистрации и оплаты) поиск в каталоге
архива. Параметрами для поиска являются название исследования, на зва -
ние организации, проводившей исследование, краткое описание иссле дова -
ния (можно указать слово или фразу), дата исследования, страна, темати -
ческая категория. В соответствии с одноуровневым классификатором выде -
ляется 31 тематическая категория. Сотрудники архива индексируют иссле -
дование по одной или нескольким тематическим категориям. В Интернете
можно получить полный список исследований, хранящихся в архиве. Для
получения хранящихся в архиве данных для вторичного анализа необ -
ходимо обращаться к сотрудникам архива.
Из стран, образовавшихся после распада СССР, только Эстония пред -
ставлена в Совете европейских архивов. Эстонский архив социальных
данных был создан при факультете социальных наук университета Тарту в
марте 1996 года. Архив содержит результаты более 200 исследований, про -
ве денных в Эстонии, начиная с 1975 года. В сети Интернет представлен
список этих исследований (в алфавитном порядке и сгруппированный по
ключевым словам). Файл данных для вторичного анализа и сопро вож даю -
щие его документы можно заказать, обратившись к сотрудникам архива.
Исследовательский Центр информатики социальных исследований
TARKI (Будапешт, Венгрия) был создан в 1985 году при содействии 11 вен -
герских исследовательских организаций. Центр TARKI является членом
Совета европейских архивов. В Центре размещается архив, содержащий
данные более 300 исследований, проведенных за последние 15 лет, а также
агрегированные данные статистики Венгрии и некоторых стран Европы.
Поиск файлов в каталоге архива возможен свободно через Интернет. Для
получения файлов данных для вторичного анализа необходимо обращаться
к сотрудникам центра.
В Совет европейских архивов также входит Архив факультета со -
циальных наук Люблянского университета, Словения.
Социология: теория, методы, маркетинг, 2000, 3 139
Архивы социальных данных: цели существо вания, формы работы, проблемы создания
В 1985 году был организован Банк социологических данных Ин сти ту -
та социологии РАН, Москва. В настоящее время он содержит данные более
500 исследований, проведенных за последние 25 лет в России и в Со вет ском
Союзе. В Интернете краткая информация о Банке представлена на странице
Института социологии РАН и на сервере немецкой ассоциации GESIS.
В 1998 году фонд “Демократические инициативы” (Киев, Украина) и
Центр изучения демократии университета Queen’s (Кингстон, Канада) со -
зда ли в сети Интернет двуязычный (украинско-английский) Архив опро -
сов общественного мнения в Украине. Автор статьи осуществлял техни -
ческое руководство украинской частью этого проекта. Архив содержит таб -
ли цы одномерных распределений для тринадцати опросов, проведенных
Институтом социологии НАН Украины и фондом “Демократические ини -
циативы” в 1993–1997 годах. Все таблицы в архиве проиндексированы с
помощью тематического классификатора [3]. Доступ к архиву свободен и
осуществляется благодаря стандартным средствам работы в Интернете.
Представленный список архивов ни в коей мере не претендует на пол -
ноту. Количество архивов социальных данных различного масштаба исчис -
ляется в мире, без преувеличения, сотнями. Но даже анализ и обобщение
изложенной выше информации позволяет сформулировать основные тре -
бования к организации и формам деятельности архива социальных данных.
Архив призван объединять усилия многих организаций. Для того, чтобы
архив функционировал эффективно, его должны поддерживать основные
научные и образовательные организации страны, основные производители и
потребители социальной информации, информации о результатах эмпи ри -
ческих социальных исследований. Архив должен быть престижным мес том
депонирования данных. Основная задача его — сохранять, делать до ступ -
ными для вторичного анализа и распространять данные. Как не может быть
полноценной библиотеки без талантливых писателей и без активных чита -
телей, так не может быть архива без тех, кто не жалеет усилий для его
пополнения, и тех, кто активно использует материалы архива в своей работе.
Архив должен иметь стабильные источники финансирования. Архив не
является собственником данных, это всего лишь депозитарий. Архив может
взимать плату за предоставление данных, но, как правило, эта плата незна -
чительна и не покрывает текущих расходов. Чаще всего архивы создаются
при университетах или крупных исследовательских институтах, оказы ваю -
щих им финансовую поддержку. Сотрудничество с университетами по -
лезно еще и тем, что позволяет привлекать к технической работе студентов,
которые выполняют эту работу в рамках практики или как волонтеры.
Финансовыми источниками существования архива могут быть специаль -
ные отчисления от бюджетов научно-исследовательских тем (как, напри -
мер, в Центре Роупера), стабильные финансовые поддержки определенных
фондов (фонды могут поддерживать как архив в целом, так и отдельные его
тематические коллекции, как в случае с рядом коллекций архива в Эс сексе),
членские взносы и средства, получаемые за подписку (подобное прак ти -
куется в архиве ICSPR), значительная плата за данные, взимаемая с от -
дельных категорий пользователей (до 1000 фунтов административных рас -
ходов с коммерческих организаций в архиве Эссекского университета).
Архив должен постоянно искать новые источники пополнения своих
фондов, пропагандируя с этой целью свою деятельность и одновременно
повышая свой престиж. Источниками данных в основном являются госу -
140 Социология: теория, методы, маркетинг, 2000, 3
Андрей Горбачик
дарственные и частные исследовательские центры, высшие учебные заве -
дения, органы государственной статистики. Политика пополнения инфор -
мационных фондов должна быть достаточно гибкой. Архиву следует стре -
миться принимать разнообразные данные и на различных условиях (от
открытого свободного использования и до ограниченного использования
исключительно на основе письменного согласия собственников данных).
Более того, большинство архивов хранят не только непосредственно пер -
вичные данные эмпирических исследований и документацию к ним, но и
другую нужную в работе исследователей информацию: данные госу дарст -
венной статистики (данные переписи, агрегированную информацию, необ -
хо димую для организации и анализа выборочных исследований), научные
публикации, компьютерные программы и документацию к ним, мето ди -
ческие материалы.
В дополнение к основной задаче хранения и распространения, для
вторичного анализа эмпирических данных архив, как правило, оказывается
вовлечен в:
— издательскую деятельность — выпуск собственного периодического
информационного издания (например, бюллетеня), серий моногра -
фий и методических пособий. При этом речь идет как о традицион -
ных изданиях (на бумаге), так и об электронных версиях (в Интер -
нете, на компакт-дисках);
— научно-образовательную деятельность — организация курсов и лет -
них школ для молодых ученых, обучение методике работы с архивом,
методам количественного и качественного анализа данных, про ве -
дение конференций и семинаров;
— научное обслуживание — тематический подбор данных, консульти -
рование исследовательских коллективов, помощь в анализе данных.
Такая работа обычно выполняется на договорной основе.
Архив должен быть исключительно надежным местом хранения дан -
ных. Начав работать, он должен постоянно развиваться, модифицироваться
и ни при каких обстоятельствах не закрываться. Именно поэтому для ар -
хива важен стабильный, пусть даже минимальный, источник финан сиро -
вания. Кроме того, надежность хранения должна обеспечиваться техни -
чески (необходимы надежные современные технические средства, ре зерв -
ное копирование и другие организационные и технические мероприятия).
Архив обязан заботиться об охране прав на интеллектуальную собст -
венность авторов исследования, гарантировать конфиденциальность ин -
фор мации (прежде всего препятствовать извлечению из массива данных
сугубо личной информации о респондентах, за исключением отдельных
биографических исследований).
Архив должен заботиться о качестве хранимых данных. Требования к
принимаемым данным должны быть достаточно высокими. В первую оче -
редь это касается сопроводительной документации, достаточной для про -
ведения вторичного анализа данных заинтересованным специалистом, не
являющимся автором исследования. Архив обязан разрабатывать, предъяв -
лять и контролировать требования, и в то же время оказывать всяческое
содействие (методическое и техническое) желающим депонировать данные.
Архив должен обеспечивать гибкий и удобный поиск (по различным
критериям), а также максимально простой и быстрый доступ к сберегаемой
информации. И поиск, и доступ следует постоянно совершенствовать, учи -
Социология: теория, методы, маркетинг, 2000, 3 141
Архивы социальных данных: цели существо вания, формы работы, проблемы создания
тывая развитие современных технологий хранения и обработки данных и
средств связи. Удобство и легкость доступа не должны противоречить охра -
не авторских прав, обеспечению конфиденциальности информации и на -
дежности ее хранения.
Архив должен поддерживать активные международные связи, предпо -
лагающие обмен опытом работы и данными с архивами других стран. Имен -
но архив должен концентрировать основные ресурсы (ресурсы данных,
методические ресурсы) сравнительных эмпирических исследований. И, на -
конец, эффективная работа архива в современных условиях невозможна без
присутствия в сети Интернет.
Е.Головаха [3] кратко изложил концепцию и историю создания в Ук -
раи не социологического архива и банка данных социальных исследований.
В настоящее время в Институте социологии НАН Украины ведется отра -
ботка концепции организации архива, логической структуры хранения и
алгоритмов поиска информации, технических аспектов организации банка
данных, разработка методических документов. Создание архива — не “одно -
моментный” акт. Это достаточно длинный (порой до нескольких лет) про -
цесс становления, а затем — постоянная поддержка и развитие, учитываю -
щие изменение тематики исследований, усовершенствование технических
средств сбора, методик измерения, накопления, хранения, поиска и пере -
дачи информации и т.п. Поэтому изначальная концепция и соответствую -
щие технические решения должны быть достаточно гибкими и открытыми.
Здесь важны мнения различных специалистов, включая тех, для кого со -
здание архива представляет самостоятельную научную и методическую
задачу (к ним принадлежит автор этой статьи), и потенциальных пользо -
вателей архива, для которых архив должен стать привычным инструментом
в повседневной работе.
Предполагается, что архив в первую очередь будет ориентироваться на
электронные формы хранения информации, что позволит упростить про -
цесс хранения, сопровождения и распространения данных. К тому же,
электрон ное хранение информации в сочетании с современными компью -
терными сетями практически снимает вопрос территориального распо ло -
жения архива. Предполагается, что архив будет максимально открыт для
приема данных. Все методические материалы по подготовке данных к хра -
нению в архиве, необходимые инструментальные (программные) средства
будут свободно предоставляться всем желающим депонировать данные.
В архиве будут храниться хорошо задокументированные первичные
эмпирические данные, результаты эмпирических исследований, мето ди -
ческие материалы. Уже сейчас можно выделить такие составляющие:
— Банк данных эмпирических исследований. Единицей хранения в
этой части архива будет полностью документированный файл дан -
ных с результатами эмпирического исследования, индексированный
по тематике исследований. Мониторинговые исследования в банке
будут представлены связанной совокупностью файлов. Поиск в этой
части архива будет осуществляться по ключевым словам, ин дек си -
рующим тематику исследований, по названию исследования, имени
автора исследования, дате сбора данных и другим параметрам, харак -
теризующим исследование в целом. Целью поиска в этой части архи -
142 Социология: теория, методы, маркетинг, 2000, 3
Андрей Горбачик
ва является получение файла данных и сопроводительной доку мен -
тации для последующего вторичного анализа;
— Банк вопросов. Единицей хранения в этой части архива определен
отдельный вопрос исследования. Вопросы будут проиндексированы
в соответствии с принятым в архиве и постоянно развиваемым много -
уровневым тематическим классификатором [3]. Повторяющиеся в
нескольких исследованиях вопросы (так называемые “мони то рин -
говые”) будут связаны между собой. Эта часть архива предусмат -
ривает поиск по категориям классификатора, текстовым образцам (в
полных исходных формулировках вопросов), а также по харак терис -
тикам исследования (название, дата проведения, автор исследования
и др.). Для выделенных в результате поиска вопросов можно будет
получить снабженные всей необходимой для работы описательной
информацией таблицы одномерных распределений и, вероятно, двух -
мерные таблицы для некоторых стандартно категоризированных
демо графических признаков. Создатели архива будут стремиться к
тому, чтобы как можно больше файлов исследований были клас си -
фицированы до уровня отдельных вопросов, хотя задача эта пред -
ставляется весьма сложной и трудоемкой;
— Архив отчетов, публикаций и методических материалов. В хра ня -
щихся в этой части архива полных текстах документов поиск предпо -
лагается осуществлять по ключевым словам (индексирующим тема -
тику документа), по текстовым образцам, названию, имени автора,
дате и другим характеристикам документа;
— Статистика. Прежде всего речь пойдет о данных переписи, текущих
данных государственной статистики и другой информации, необхо -
димой для планирования и анализа социологических исследований
различной тематики;
— Терминологический словарь (профессиональный тезаурус), необ -
ходимый как для формирования профессионального языка, так и для
индексации тематики исследований и терминологического контроля
ключевых слов, характеризующих эту тематику.
Таким образом, архив будет состоять из нескольких постепенно раз -
вивающихся частей. Они не будут независимыми, однако каждая из них
будет иметь свою систему каталогизации и поиска. Развитие фондов архива
может привести к возникновению тематических или региональных коллек -
ций данных. Чрезвычайно интересным и важным представляется развитие
архива в направлении хранения данных качественных исследований (коди -
рованных для качественного анализа текстов, аудио- и видеоматериалов),
но на начальном этапе эта задача представляется слишком сложной.
Предполагается, что технической платформой для хранения и поиска в
архиве данных эмпирических социологических исследований (имеются в ви -
ду выборочные, количественные исследования) послужит разрабо тан ный
автором статьи и уже ставший достаточно популярным в Украине па кет
ОСА (версия для работы в среде MS Windows). Получить в архиве фай лы
данных для самостоятельного вторичного анализа можно будет либо в текс -
товом формате, либо в формате пакета SPSS, либо в формате пакета ОСА.
Организационные аспекты работы архива (в том числе такие важные,
как доступность данных, способы распространения информации, меры по
охране авторских прав исследователя и конфиденциальности инфор ма -
Социология: теория, методы, маркетинг, 2000, 3 143
Архивы социальных данных: цели существо вания, формы работы, проблемы создания
ции), наряду с финансовыми аспектами работы архива, требуют широкого
обсуждения. Однако уже сейчас можно предположить, что по крайней мере
на этапе становления архива информация будет распространяться на осно -
ве договора между исследователем, передающим данные, и архивом, а также
на основе договора между архивом и пользователем. При этом рассылка
информации возможна по электронной почте, на компакт-дисках, дискетах
или других технических носителях информации. Подобная практика до -
воль но распространена в мире. Вполне вероятен выпуск тематических ком -
пакт-дисков, содержащих как данные, так и необходимую для работы с
ними систему поиска.
С самого начала архив будет вести широкую информационную работу,
включающую активную деятельность в сети Интернет (электронная стра -
ница в сети — наиболее оперативный способ детального информирования о
своей работе) и публикацию бюллетеня, пресс-релизов и др. Архив тесней -
шим образом будет сотрудничать с университетами Украины.
Надеемся, что архив станет если не организатором, то, по крайней мере,
неизменным участником научных конференций, школ молодых ученых,
“круглых столов” и других мероприятий, собирающих профессиональных
исследователей и “потребителей” социологической информации.
Создание архива — это важное событие в жизни всего профес сио наль -
ного сообщества социологов Украины. Архив нельзя рассматривать как
проект одной исследовательской группы или даже одного, хотя и весьма
авторитетного исследовательского коллектива. Успешность этого проекта
будет зависеть от тех, кто сейчас работает над проектированием архива и
созданием первого прототипа, и от всего социологического сообщества
Украи ны. Первые должны сделать архив удобным и привлекательным, не
допустив дискредитации самой идеи. Вторые — конструктивно отнестись к
первым, активно включившись в наполнение и использование такого ре -
сурса. И если для автора этих строк архив представляет самостоятельную
научную, а точнее, научную, техническую и организационную задачу, то для
большинства людей архив должен стать повседневным инструментом ра -
боты, привычным информационным ресурсом, эффективной возмож -
ностью (наряду с журналами, сборниками статей и монографиями) озна -
комить коллег с результатами собственных исследований.
Автор рассматривает данную статью как приглашение всех специа -
листов, заинтересованных в создании и развитии социологического архива
и банка данных социальных исследований в Украине, к дискуссии на стра -
ни цах нашего журнала.
Литература
1. User’s Guide to POLL . — The Roper Center for Public Opinion Research. — Storrs
(Connecticut), 1999.
2. ICPSR Annual Report 1998–1999. — Ann Arbor (Michigan), 1999.
3. Головаха Е.И. Концептуальные и организационно-методические основы создания
“Украинского социологического архива и банка данных социальных исследований” //
Социология: теория, методы, маркетинг. — 2000. — № 1. — С. 138–151.
144 Социология: теория, методы, маркетинг, 2000, 3
Андрей Горбачик
|