О важности корректного округления количества респондентов при построении выборки
В работе рассмотрены проблемы, связанные с необходимостью округлять количество респондентов в стратах при построении выборки. Анализируются отклонения от запланированного объема выборки и смещения в структуре выборочной совокупности, которые могут возникать вследствие применения общепринятых прави...
Збережено в:
Дата: | 2012 |
---|---|
Автор: | |
Формат: | Стаття |
Мова: | Russian |
Опубліковано: |
Iнститут соціології НАН України
2012
|
Назва видання: | Социология: теория, методы, маркетинг |
Онлайн доступ: | http://dspace.nbuv.gov.ua/handle/123456789/90428 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Цитувати: | О важности корректного округления количества респондентов при построении выборки / А. Пигида // Социология: теория, методы, маркетинг. — 2012. — № 3. — С. 150–159. — Бібліогр.: 4 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-90428 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-904282015-12-24T03:03:08Z О важности корректного округления количества респондентов при построении выборки Пигида, А. В работе рассмотрены проблемы, связанные с необходимостью округлять количество респондентов в стратах при построении выборки. Анализируются отклонения от запланированного объема выборки и смещения в структуре выборочной совокупности, которые могут возникать вследствие применения общепринятых правил округления чисел. На примерах демонстрируется необходимость применения специальных методов случайного округления. Предлагается алгоритм, позволяющий минимизировать погрешности, которые возникают в результате округления, и сохранять запланированный объем выборки. Анализируются преимущества такого случайного округления по сравнению с общепринятыми правилами. 2012 Article О важности корректного округления количества респондентов при построении выборки / А. Пигида // Социология: теория, методы, маркетинг. — 2012. — № 3. — С. 150–159. — Бібліогр.: 4 назв. — рос. 1563-4426 http://dspace.nbuv.gov.ua/handle/123456789/90428 303.5 ru Социология: теория, методы, маркетинг Iнститут соціології НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
description |
В работе рассмотрены проблемы, связанные с необходимостью округлять количество респондентов в стратах при построении выборки. Анализируются
отклонения от запланированного объема выборки и смещения в структуре выборочной совокупности, которые могут возникать вследствие применения общепринятых правил округления чисел. На примерах демонстрируется необходимость применения специальных методов случайного округления. Предлагается алгоритм, позволяющий минимизировать погрешности, которые возникают в результате округления, и сохранять запланированный объем выборки.
Анализируются преимущества такого случайного округления по сравнению с
общепринятыми правилами. |
format |
Article |
author |
Пигида, А. |
spellingShingle |
Пигида, А. О важности корректного округления количества респондентов при построении выборки Социология: теория, методы, маркетинг |
author_facet |
Пигида, А. |
author_sort |
Пигида, А. |
title |
О важности корректного округления количества респондентов при построении выборки |
title_short |
О важности корректного округления количества респондентов при построении выборки |
title_full |
О важности корректного округления количества респондентов при построении выборки |
title_fullStr |
О важности корректного округления количества респондентов при построении выборки |
title_full_unstemmed |
О важности корректного округления количества респондентов при построении выборки |
title_sort |
о важности корректного округления количества респондентов при построении выборки |
publisher |
Iнститут соціології НАН України |
publishDate |
2012 |
url |
http://dspace.nbuv.gov.ua/handle/123456789/90428 |
citation_txt |
О важности корректного округления количества респондентов при построении выборки / А. Пигида // Социология: теория, методы, маркетинг. — 2012. — № 3. — С. 150–159. — Бібліогр.: 4 назв. — рос. |
series |
Социология: теория, методы, маркетинг |
work_keys_str_mv |
AT pigidaa ovažnostikorrektnogookrugleniâkoličestvarespondentovpripostroeniivyborki |
first_indexed |
2025-07-06T18:35:59Z |
last_indexed |
2025-07-06T18:35:59Z |
_version_ |
1836923706692075520 |
fulltext |
Антон Пи ги да
О важ нос ти кор рек тно го округ ле ния ко ли чес тва рес пон ден тов при по стро е нии вы бор ки
АНТОН ПИГИДА,УДК: 303.5
àñ ïè ðàíò ôà êóëü òå òà ñî öè î ëî ãèè Êè åâ ñêî -
ãî íà öè î íàëü íî ãî óíè âåð ñè òå òà èìå íè Òà -
ðà ñà Øåâ ÷åí êî
О важ нос ти кор рек тно го округ ле ния ко ли чес тва
рес пон ден тов при по стро е нии вы бор ки
Аннотация
В ра бо те рас смот ре ны про бле мы, свя зан ные с не об хо ди мос тью округ лять ко -
ли чес тво рес пон ден тов в стра тах при по стро е нии вы бор ки. Анализируются
от кло не ния от за пла ни ро ван но го об ъ е ма вы бор ки и сме ще ния в струк ту ре вы -
бо роч ной со во куп нос ти, ко то рые мо гут воз ни кать всле дствие при ме не ния об -
щеп ри ня тых пра вил округ ле ния чи сел. На при ме рах де мо нстри ру ет ся не об хо -
ди мость при ме не ния спе ци аль ных ме то дов слу чай но го округ ле ния. Пред ла га -
ет ся ал го ритм, по зво ля ю щий ми ни ми зи ро вать по греш нос ти, ко то рые воз ни -
ка ют в ре зуль та те округ ле ния, и со хра нять за пла ни ро ван ный об ъ ем вы бор ки.
Анализируются пре и му щес тва та ко го слу чай но го округ ле ния по срав не нию с
об щеп ри ня ты ми пра ви ла ми.
Клю че вые сло ва: вы бор ка, кво та, округ ле ние чи сел, по греш ность, слу чай ное
округ ле ние
Про ек ти руя слу чай ную вы бор ку для эм пи ри чес ко го ис сле до ва ния,
обыч но ра бо та ют с дроб ны ми чис ла ми, по сколь ку об ъ ем стра ты рас счи ты -
ва ет ся как про пор ци о наль ная доля вы бор ки, как пра ви ло, яв ля ю ща я ся де -
йстви тель ным (дроб ным) чис лом. На по след нем шаге, при пе ре хо де к ко ли -
чес тву рес пон ден тов ста но вит ся оче вид ным, что все чис ла нуж но округ лить
до на ту раль ных, ведь мы не мо жем пла ни ро вать стра ту, на при мер, из 12,6
рес пон ден та. Для это го в основ ном ис поль зу ют клас си чес кое округ ле ние до
бли жай ше го на ту раль но го чис ла или до бли жай ше го на и боль ше го на ту -
раль но го чис ла [Turner, 2003; Suhr, 2009; Westfall, 2011; Chaudhuri, 2003].
Одна ко при ме не ние об ыч ных пра вил дает не удов лет во ри тель ный ре зуль -
тат. В ре зуль та те их при ме не ния об ъ ем вы бор ки мо жет из ме нить ся — мы
мо жем по лу чить мень шую вы бор ку (что эко но мит за тра ты на ис сле до ва -
ние), но худ шую реп ре зен та тив ность вы бор ки, или на о бо рот, боль шую вы -
150 Со ци о ло гия: те о рия, ме то ды, мар ке тинг, 2012, 3
бор ку, что ве дет к удо ро жа нию ис сле до ва ния. В слу чае об оих под хо дов бу -
дет раз нить ся за пла ни ро ван ный об ъ ем вы бор ки и мо жет воз ник нуть по -
греш ность как ре зуль тат сме ще ния струк ту ры вы бо роч ной со во куп нос ти
по от но ше нию к ге не раль ной. В со вре мен ной ли те ра ту ре этой про бле ме не
уде ля ет ся дол жное вни ма ние; эту тему не рас смат ри ва ют, по сколь ку вос при -
ни ма ют про бле му как оче вид ную или не зна чи мую. Одна ко на прак ти ке
встре чи с этой про бле мой не ми но вать, а ее пре одо ле ние не впол не оче вид но.
В этой статье пред ло жен ал го ритм вы чис ле ния об ъ е ма страт для слу -
чай ной вы бор ки с на и мень шим от кло не ни ем от за дан ной.
Сфор му ли рую саму про бле му. Для это го рас смот рим три ви аль ный при -
мер: нуж но спро ек ти ро вать про пор ци о наль ную вы бор ку об ъ е мом 400 рес -
пон ден тов для ге не раль ной со во куп нос ти “на се ле ние стар ше 18 лет вклю чи -
тель но, про жи ва ю щее в го ро дах с на се ле ни ем свы ше 500 ты сяч” (табл. 1).
Таб ли ца 1
Вы бор ка для ге не раль ной со во куп нос ти
Го род На се ле ние
го ро да
На се ле ние
го ро да в воз -
рас те 18+
Доля Ко ли чес тво
об ъ ек тов
Ко ли чес тво
об ъ ек тов,
округ лен ное
об ыч ным
методом
Киев 2799199 2181161 0,3045 121,8019 122
Харь ков 1446500 1110006 0,1550 61,9857 62
Одес са 1009145 765917 0,1069 42,7709 43
Днеп ро пет -
ровск 1004853 750693 0,1048 41,9207 42
До нецк 962049 713514 0,0996 39,8446 40
За по рожье 776535 584886 0,0817 32,6616 33
Львов 732009 559940 0,0782 31,2686 31
Кри вой Рог 665080 496859 0,0694 27,7460 28
Все го 400 401
Как ви дим, план вы бор ки от ли ча ет ся от ожи да е мо го: вмес то за пла ни ро -
ван ных 400 рес пон ден тов по сле округ ле ния по лу ча ем 401 рес пон ден та. Это
толь ко при мер с 8 стра та ми. Но чем боль ше зна че ний в со во куп нос ти не -
округ лен ных чи сел, тем выше ве ро ят ность, что сум ма округ лен ных чи сел бу -
дет от ли чать ся от сум мы не округ лен ных и тем боль шей бу дет эта раз ница.
Ра зу ме ет ся, всег да мож но вруч ную по пра вить вы бор ку по сле округ ле -
ния для ка ко го-либо го ро да, что бы вы й ти на за дан ный сум мар ный об ъ ем
рес пон ден тов, но в слу чае боль ших вы бо рок при дет ся до воль но мно го пра -
вить вруч ную. Кро ме того, при про ек ти ро ва нии вы бор ки же ла тель но как
мож но мень ше вме ши вать ся в вы бор ку руч ны ми прав ка ми — во-пер вых, по -
сколь ку на ру ша ет ся при нцип слу чай нос ти, во-вто рых, учи ты вая ба наль -
ную воз мож ность над е лать еще боль ше ошибок.
Итак, пер вое тре бо ва ние — со хра нить за пла ни ро ван ный об ъ ем. Но от -
кло не ние от за дан ной сум мы — не са мая боль шая про бле ма, под жи да ю щая
нас при округ ле нии ко ли чес тва рес пон ден тов.
Со ци о ло гия: те о рия, ме то ды, мар ке тинг, 2012, 3 151
О важ нос ти кор рек тно го округ ле ния ко ли чес тва рес пон ден тов при по стро е нии вы бор ки
Рас смот рим вы бор ку для сел Ки ев ской об лас ти с кво та ми на пол и воз -
раст; по сколь ку ста тис ти ка от дель но по каж до му селу или ра йо ну не дос туп -
на или вов се от су тству ет, а име ет ся толь ко для се льско го на се ле ния об лас ти
в це лом, по э то му кво ты в про цен тном из ме ре нии оди на ко вы (табл. 2).
Таб ли ца 2
Вы бор ка для сел Ки ев ской об лас ти с кво та ми по полу и воз рас ту
Село
Муж чи ны Жен щи ны
Все -
го12–
15
16–
19
20–
29
30–
39
40–
54
55–
65
12–
15
16–
19
20–
29
30–
39
40–
54
55–
65
Но во пет -
ров цы 0,67 0,74 2,09 1,89 2,96 1,5 0,64 0,67 1,94 1,86 3,06 1,99 20
Та ра сов ка 0,67 0,74 2,09 1,89 2,96 1,5 0,64 0,67 1,94 1,86 3,06 1,99 20
Но во сел ки 0,67 0,74 2,09 1,89 2,96 1,5 0,64 0,67 1,94 1,86 3,06 1,99 20
Кра си лов ка 0,67 0,74 2,09 1,89 2,96 1,5 0,64 0,67 1,94 1,86 3,06 1,99 20
Счас тли вое 0,67 0,74 2,09 1,89 2,96 1,5 0,64 0,67 1,94 1,86 3,06 1,99 20
Ви шен ки 0,67 0,74 2,09 1,89 2,96 1,5 0,64 0,67 1,94 1,86 3,06 1,99 20
Ро го зив 0,67 0,74 2,09 1,89 2,96 1,5 0,64 0,67 1,94 1,86 3,06 1,99 20
Стай ки 0,67 0,74 2,09 1,89 2,96 1,5 0,64 0,67 1,94 1,86 3,06 1,99 20
Мас лов ка 0,67 0,74 2,09 1,89 2,96 1,5 0,64 0,67 1,94 1,86 3,06 1,99 20
Под гор цы 0,67 0,74 2,09 1,89 2,96 1,5 0,64 0,67 1,94 1,86 3,06 1,99 20
Все го 6,66 7,39 20,87 18,88 29,63 15,01 6,36 6,65 19,4 18,6 30,62 19,95 200
Если при ме нить об ыч ное округ ле ние, то по лу чим вы бор ку, пред став -
лен ную в таб ли це 3.
Таб ли ца 3
Вы бор ка для сел Ки ев ской об лас ти с кво та ми по полу и воз рас ту
по сле об ыч но го округ ле ния
Село
Муж чи ны Жен щи ны
Все -
го12–
15
16–
19
20–
29
30–
39
40–
54
55–
65
12–
15
16–
19
20–
29
30–
39
40–
54
55–
65
Но во пет -
ров цы 1 1 2 2 3 2 1 1 2 2 3 2 22
Та ра сов ка 1 1 2 2 3 2 1 1 2 2 3 2 22
Но во сел ки 1 1 2 2 3 2 1 1 2 2 3 2 22
Кра си лов ка 1 1 2 2 3 2 1 1 2 2 3 2 22
Счас тли вое 1 1 2 2 3 2 1 1 2 2 3 2 22
Ви шен ки 1 1 2 2 3 2 1 1 2 2 3 2 22
Ро го зив 1 1 2 2 3 2 1 1 2 2 3 2 22
Стай ки 1 1 2 2 3 2 1 1 2 2 3 2 22
Мас лов ка 1 1 2 2 3 2 1 1 2 2 3 2 22
Под гор цы 1 1 2 2 3 2 1 1 2 2 3 2 22
Все го 10 10 20 20 30 20 10 10 20 20 30 20 220
152 Со ци о ло гия: те о рия, ме то ды, мар ке тинг, 2012, 3
Антон Пи ги да
Как вид но из таб ли цы 3, не толь ко об ъ ем вы бор ки уве ли чил ся на 20 рес -
пон ден тов, но и по лнос тью из ме ни лись кво ты (табл. 4).
Таб ли ца 4
Раз ни ца меж ду округ лен ной и не округ лен ной вы бор ка ми
до и по сле округ ле ния
Пол Воз раст До округ ле ния Пос ле округ ле ния Раз ни ца
Муж чи ны
12–15 6,66 10 3,34
16–19 7,39 10 2,61
20–29 20,87 20 –0,87
30–39 18,88 20 1,12
40–54 29,63 30 0,37
55–65 15,01 20 4,99
Жен щи ны
12–15 6,36 10 3,64
16–19 6,65 10 3,35
20–29 19,40 20 0,60
30–39 18,60 20 1,40
40–54 30,62 30 –0,62
55–65 19,94 20 0,06
Ко неч но, по лу чен ная по сле округ ле ния вы бор ка не в по лной мере со от -
ве тству ет струк ту ре ге не раль ной со во куп нос ти. По э то му ее реп ре зен та тив -
ность хуже по срав не нию с за пла ни ро ван ной вы бор кой.
Для ре ше ния этой про бле мы сфор му ли рую ал го ритм для округ ле ния
со во куп нос ти чи сел с со хра не ни ем их сум мы.
Пос ле округ ле ния чис ла у него “ис че за ет” или “по яв ля ет ся” часть, яв ля -
ю ща я ся раз нос тью меж ду на чаль ным чис лом и округ лен ным чис лом, то
есть оста ток округ ле ния. На коп ле ние та ких остат ков и при во дит к об щей
раз нос ти меж ду сум мой на чаль ной со во куп нос ти чи сел и ре зуль ти ру ю щей
округ лен ной. Этот ал го ритм не иг но ри ру ет на коп ле ния по до бных раз нос -
тей, а по сле каж до го округ ле ния чис ла при бав ля ет эту раз ность к сле ду ю -
ще му, еще не округ лен но му чис лу. А что бы из бе жать воз мож но го сис те ма -
ти чес ко го сдви га при округ ле нии чи сел, рас по ло жен ных ря дом в таб ли це
квот, вво дит ся слу чай ный от бор эле мен та, ко то рый мы бу дем округ лять
следующим.
Изоб ра жу ал го ритм в виде блок-схе мы (рис. 1).
Опе ра ции при бав ле ния раз нос ти из пред ы ду ще го округ ле ния, вы чис -
ле ние но вой раз нос ти, округ ле ние чис ла и слу чай ный вы бор сле ду ю ще го
чис ла по вто ря ем, пока не бу дут округ ле ны все эле мен ты.
Пос коль ку ал го ритм со дер жит слу чай ный от бор, каж дое при ме не ние
ал го рит ма бу дет да вать не сколь ко от ли ча ю щий ся ре зуль тат. Один из та ких
ре зуль та тов ра бо ты это го ал го рит ма за пи шем в таб ли цу 5.
Срав ним меж ду со бой сум мы по стол бцам и ря дам, что бы по смот реть,
на сколь ко от ли ча ет ся струк ту ра вы бо роч ной со во куп нос ти до и по сле
округ ле ния (табл. 6).
Со ци о ло гия: те о рия, ме то ды, мар ке тинг, 2012, 3 153
О важ нос ти кор рек тно го округ ле ния ко ли чес тва рес пон ден тов при по стро е нии вы бор ки
Обоз на че ния:
r — пе ре мен ная, со хра ня ю щая раз ность меж ду не округ лен ным и округ лен ным
чис лом;
a — про ну ме ро ван ная со во куп ность чи сел;
a[i] — i-й эле мент со во куп нос ти a;
round() — функ ция об ыч но го (ма те ма ти чес ко го — до бли жай ше го на ту раль но го)
округ ле ния чис ла.
Рис. 1. Алгоритм округ ле ния со во куп нос ти чи сел с со хра не ни ем сум мы
Таб ли ца 5
Кво ты по полу и воз рас ту по сле округ ле ния спе ци аль ным ал го рит мом
Село
Муж чи ны Жен щи ны
Все -
го12–
15
16–
19
20–
29
30–
39
40–
54
55–
65
12–
15
16–
19
20–
29
30–
39
40–
54
55–
65
Но во пет -
ров цы 1 1 2 2 3 2 1 1 2 2 3 2 22
Та ра сов ка 0 1 2 2 3 2 0 1 2 2 3 2 20
Но во сел ки 0 1 2 2 3 2 1 1 2 2 3 2 21
Кра си лов ка 0 0 2 2 3 1 0 0 2 2 3 2 17
Счас тли вое 1 1 2 2 2 1 1 1 2 2 3 2 20
Ви шен ки 1 0 2 2 3 1 0 1 2 2 3 2 19
Ро го зив 1 1 3 2 3 1 0 1 2 1 3 2 20
Стай ки 1 1 2 2 3 2 1 0 2 2 3 2 21
Мас лов ка 0 0 2 2 3 2 1 0 2 2 3 2 19
Под гор цы 1 1 2 1 3 2 1 1 2 2 3 2 21
Все го 6 7 21 19 29 16 6 7 20 19 30 20 200
154 Со ци о ло гия: те о рия, ме то ды, мар ке тинг, 2012, 3
Антон Пи ги да
Начало
r := 0
a[i] := a[i] + r
r := a[i] – round(a[i])
a[i] := round(a[i])
Выбрать случайный a[i],
который еще не округлен
Все ли элементы округлены?
Конец
Да Нет
Таб ли ца 6
Срав не ние раз ных ти пов округ ле ния
Па ра мет ры
Вы бор ка Квад рат раз нос ти
Ори ги наль -
ная (1)
Округ лен -
ная об ыч -
ным спо со -
бом (2)
Округ лен ная
с по мощью
спе ци аль но го
ал го рит ма (3)
Меж ду
(1) и (2)
Меж ду
(1) и (3)
Но во пет ров цы 20 22 22 4 4
Та ра сов ка 20 22 20 4 0
Но во сел ки 20 22 21 4 1
Кра си лов ка 20 22 17 4 9
Счас тли вое 20 22 20 4 0
Ви шен ки 20 22 19 4 1
Ро го зив 20 22 20 4 0
Стай ки 20 22 21 4 1
Мас лов ка 20 22 19 4 1
Под гор цы 20 22 21 4 1
Муж чи ны
12–15 6,66 10 6 11,17 0,43
16–19 7,39 10 7 6,81 0,15
20–29 20,87 20 21 0,75 0,02
30–39 18,88 20 19 1,26 0,02
40–54 29,63 30 29 0,14 0,40
55–65 15,01 20 16 24,93 0,99
Жен щи ны
12–15 6,36 10 6 13,28 0,13
16–19 6,65 10 7 11,24 0,12
20–29 19,40 20 20 0,36 0,36
30–39 18,60 20 19 1,96 0,16
40–54 30,62 30 30 0,39 0,39
55–65 19,94 20 20 0 0
Сум ма квад ра тов
раз нос ти 112,29 21,17
Как ви дим, ис поль зо ван ный ал го ритм зна чи тель но умень шил от кло не -
ние струк ту ры вы бо роч ной со во куп нос ти по сле округ ле ния по сре дством
спе ци аль но го ал го рит ма по от но ше нию к не округ лен ной. В ка чес тве меры
от кло не ния ис поль зо ва на сум ма квад ра тов раз нос ти. По каж до му стол бцу и
ряду вы чис ля ет ся сум ма (от дель но для вы бор ки до и по сле округ ле ния), по -
том вы чис ля ет ся раз ность этих сумм для каж до го ряда и стол бца и воз во -
дит ся в квад рат. Пос ле это го под счи ты ва ем об щую сум му квад ра тов раз нос -
ти по всем ря дам и стол бцам. Воз ве де ние в квад рат по зво ля ет, во-пер вых,
из ба вить ся от од но го зна ка, во-вто рых, боль шая раз ни ца не ли ней но силь -
нее мень шей раз ни цы (ина че го во ря, раз ни ца меж ду 20 и 22 и 20 и 21 не в два,
а в че ты ре раза боль ше), по сколь ку силь ное от кло не ние для од ной ка те го -
Со ци о ло гия: те о рия, ме то ды, мар ке тинг, 2012, 3 155
О важ нос ти кор рек тно го округ ле ния ко ли чес тва рес пон ден тов при по стро е нии вы бор ки
рии для вы бор ки хуже, чем не сколь ко не боль ших от кло не ний для каж дой
из ка те го рий (так как, на при мер, что бы ис пра вить силь но за ни жен ную в
раз ме ре ка те го рию от но си тель но на чаль но го пла на вы бор ки, при дет ся вво -
дить веса с боль шим ко эф фи ци ен том).
Одна ко воз мож но до бить ся еще мень ших от кло не ний по сум мам стол б -
цов и ря дов, то есть вос про из вес ти це лы ми чис ла ми нуж ные нам про пор ции
с еще боль шей точ нос тью. Для это го сле ду ет не мно го мо ди фи ци ро вать ал -
го ритм (рис. 2).
Рис. 2. Мо ди фи ци ро ван ная вер сия ал го рит ма
До ба ви лось одно усло вие: “Най де на ли ми ни маль ная сум ма квад ра тов
от кло не ний по ря дам и стол бцам?” По нят но, что за ра нее не воз мож но ска -
зать, ка кая сум ма квад ра тов от кло не ний для опре де лен ной со во куп нос ти
чи сел бу дет ми ни маль ной. Нуж но при ме нить не ко то рый кри те рий для
опре де ле ния дос та точ ной сум мы квад ра тов раз нос ти. Он мо жет раз ли чать -
ся в за ви си мос ти от кон крет ной ре а ли за ции алгоритма.
Так, мож но срав ни вать сум му квад ра тов раз нос ти дан ной ите ра ции ал -
го рит ма с на и луч шей на дан ный мо мент ите ра ци ей. Если, к при ме ру, в те че -
ние 1000 ите ра ций ни одна из сумм квад ра тов раз нос ти не бу дет мень ше
наи лучшей, то вы дать тот ре зуль тат округ ле ния, ко то рый был во вре мя на и -
луч шей ите ра ции. Если же на шел ся мень ший ре зуль тат, то об ъ я вить его
наи лучшим и про вес ти еще 1000 ите ра ций.
В об щем са мый луч ший ре зуль тат мож но на й ти, если про сто пе ре би рать
все воз мож ные ком би на ции. Но для это го при дет ся сде лать n! ите ра ций (где
n — ко ли чес тво чи сел). По э то му луч ше ис поль зо вать слу чай ные пе ре ста -
нов ки. Чем боль ше ите ра ций де ла ет та кой ал го ритм, тем силь нее сум ма
квад ра тов раз нос ти бу дет при бли жать ся к на сто я щей ми ни маль но воз мож -
ной сум ме квад ра тов раз нос ти для дан ной со во куп нос ти чи сел. Это про ис -
156 Со ци о ло гия: те о рия, ме то ды, мар ке тинг, 2012, 3
Антон Пи ги да
Начало
r := 0
a[i] := a[i] + r
r := a[i] – round(a[i])
a[i] := round(a[i])
Выбрать случайный a[i],
который еще не округлен
Все ли элементы округлены?
Конец
Найдена ли
минимальная сумма квадратов
отклонений по рядам и
столбцам?
Да
Да
Нет
Нет
хо дит бла го да ря тому, что каж дый раз мы от би ра ем слу чай ные эле мен ты
для округ ле ния из всей со во куп нос ти.
Не об хо ди мое ко ли чес тво ите ра ций для дос ти же ния прак ти чес ки дос та -
точ ной сум мы квад ра тов раз нос ти за ви сит от ко ли чес тва эле мен тов в со во -
куп нос ти, ко ли чес тва стол бцов и ря дов. Для дан ных, ис поль зо ван ных в
этом при ме ре, уве ли че ние ко ли чес тва ите ра ций в 10 раз при во дит в сред нем
к умень ше нию сум мы квад ра тов раз нос ти в 1,37 раза. То есть за 100 ите ра -
ций в сред нем бу дет дос тиг ну та сум ма квад ра тов раз нос ти 10,4, за 1000 —
7,6, за 10000 — 5,5, за 100000 — 4,1. Бо лее 10000 ите ра ций бу дут ощу ти мо за -
мед лять ра бо ту ал го рит ма и при ве дут лишь к не зна чи тель но му улучшению.
Итак, рас смот рим ре зуль тат ра бо ты мо ди фи ци ро ван но го ал го рит ма
(табл. 7, 8).
Таб ли ца 7
Кво ты по полу и воз рас ту
по сле округ ле ния по мо ди фи ци ро ван ной вер сии ал го рит ма
Село
Муж чи ны Жен щи ны
Все -
го12–
15
16–
19
20–
29
30–
39
40–
54
55–
65
12–
15
16–
19
20–
29
30–
39
40–
54
55–
65
Но во пет -
ров цы 0 1 2 2 2 2 1 1 2 2 3 2 20
Та ра сов ка 0 1 2 2 3 1 1 1 2 2 3 2 20
Но во сел ки 1 1 3 1 3 2 1 0 1 2 3 2 20
Кра си лов ка 1 1 2 2 3 1 1 1 2 1 3 2 20
Счас тли вое 1 1 2 2 3 1 1 0 2 2 3 2 20
Ви шен ки 0 1 2 2 3 2 0 1 2 2 3 2 20
Ро го зив 0 1 2 2 3 1 1 0 2 2 3 2 19
Стай ки 1 0 3 2 3 1 0 1 2 2 3 2 20
Мас лов ка 1 1 2 2 3 2 0 1 2 1 3 2 20
Под гор цы 1 0 2 2 3 2 0 1 2 2 4 2 21
Все го 6 8 22 19 29 15 6 7 19 18 31 20 200
Как ви дим, по лу чен ная по сле округ ле ния вы бор ка име ет в не сколь ко
раз мень шую сум му квад ра тов раз нос ти по стол бцам и ря дам, чем в пред ы -
ду щем ва ри ан те, а так же в не сколь ко де сят ков раз мень шую, чем в слу чае
округ лен ной об ыч ным ме то дом: 5,41 про тив 21,17 и 112,29. Сле до ва тель но,
по лу чен ная вы бор ка на мно го точ нее со от ве тству ет струк ту ре ге не раль ной
со во куп нос ти.
Мож но улуч шить ал го ритм под кон крет ные нуж ды, на при мер, при ме -
нив вмес то квад ра та раз нос ти взве шен ный квад рат раз нос ти — квад рат раз -
нос ти, раз де лен ный на сум му эле мен тов в дан ном ряду или стол бце. Это по -
зво лит дос тичь боль шей точ нос ти там, где она го раз до важ нее — для мень -
ших квот.
Под ве дем итог. Во вре мя про ек ти ро ва ния вы бор ки при пре об ра зо ва нии
ко ли чес тва рес пон ден тов до це лых чи сел де йстви тель но мо гут воз ни кать
не оче вид ные на пер вый взгляд про бле мы. Для их ре ше ния мож но при ме -
нять при ве ден ный в статье ал го ритм.
Со ци о ло гия: те о рия, ме то ды, мар ке тинг, 2012, 3 157
О важ нос ти кор рек тно го округ ле ния ко ли чес тва рес пон ден тов при по стро е нии вы бор ки
Таб ли ца 8
Срав не ние вы бор ки до и по сле округ ле ния
Па ра мет ры
Вы бор ка
Квад рат раз нос ти
Ори ги наль ная
Пос ле округ ле ния
по сре дством спе ци -
аль но го ал го рит ма с
ми ни ми за ци ей СКР
Но во пет ров цы 20 20 0
Та ра сов ка 20 20 0
Но во сел ки 20 20 0
Кра си лов ка 20 20 0
Счас тли вое 20 20 0
Ви шен ки 20 20 0
Ро го зив 20 19 1
Стай ки 20 20 0
Мас лов ка 20 20 0
Под гор цы 20 21 1
Муж чи ны
12–15 6,66 6 0,43
16–19 7,39 8 0,37
20–29 20,87 22 1,28
30–39 18,88 19 0,02
40–54 29,63 29 0,40
55–65 15,01 15 0,00
Жен щи ны
12–15 6,36 6 0,13
16–19 6,65 7 0,12
20–29 19,40 19 0,16
30–39 18,60 18 0,36
40–54 30,62 31 0,14
55–65 19,94 20 0,00
Сум ма квад ра тов
раз нос ти 5,41
Пред ла га е мый под ход к округ ле нию име ет два пре и му щес тва пе ред
обычным округ ле ни ем: во-пер вых, со хра ня ет ся за дан ная сум ма рес пон ден -
тов, во-вто рых, по лу чен ная по сле округ ле ния со во куп ность рес пон ден тов
го раз до точ нее со от ве тству ет струк ту ре ге не раль ной со во куп нос ти.
Источ ни ки
Chaudhuri S. Optimized Stratified Sampling for Approximate Query Processing [Elect -
ronic resource] / Surajit Chaudhuri, Gautam Das, Vivek Narasayya // Journal ACM Trans -
actions on Database Systems (TODS) TODS Homepage archive. — 2007 . — June . — Vol. 32,
158 Со ци о ло гия: те о рия, ме то ды, мар ке тинг, 2012, 3
Антон Пи ги да
Is. 2. — Article No. 9. — Мode of access :
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.107.8286&rep=rep1&type=pdf.
Suhr D. Selecting a Stratified Sample with PROC SURVEYSELECT [Electronic resour -
ce] / Diana Suhr // SAS Global Forum 2009, paper 058-2009. — Мode of access :
http://support.sas.com/resources/papers/proceedings09/058-2009.pdf.
Turner A.G. Sampling strategies [Electronic resource] / Anthony G. Turner // UNITED
NATIONS SECRETARIAT ESA/STAT/AC.93/2, Statistics Division 03. — 2003. — No -
vember. — Р. 45. — Мode of access :
http://unstats.un.org/unsd/demographic/meetings/egm/Sampling_1203/docs/no_2.pdf.
Westfall J.A. et al. Post-stratified estimation: within-strata and total sample size recom -
mendations [Electronic resource] / James A. Westfall, Paul L. Patterson, John W. Coulston //
Canadian Journal of Forest Research. — 2011. — Vol. 41. — Р. 1130–1139. — Мode of access :
http://www.fs.fed.us/rm/pubs_other/rmrs_2011_westfall_j001.pdf.
Со ци о ло гия: те о рия, ме то ды, мар ке тинг, 2012, 3 159
О важ нос ти кор рек тно го округ ле ния ко ли чес тва рес пон ден тов при по стро е нии вы бор ки
|