Статистическая эффективность и устойчивость моделей в регрессионном анализе
Изложено решение основных проблем регрессионного анализа – получение статистически эффективных и устойчивых моделей. Решения приведены для реальных прикладных условий сложных систем и процессов, которые характеризуются значительной неопределенностью. Показано, что основным подходом в полученных реше...
Збережено в:
Дата: | 2016 |
---|---|
Автор: | |
Формат: | Стаття |
Мова: | Russian |
Опубліковано: |
Інститут проблем математичних машин і систем НАН України
2016
|
Назва видання: | Математичні машини і системи |
Теми: | |
Онлайн доступ: | http://dspace.nbuv.gov.ua/handle/123456789/113580 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Цитувати: | Статистическая эффективность и устойчивость моделей в регрессионном анализе / С.Г. Радченко // Математичні машини і системи. — 2016. — № 1. — С. 139-147. — Бібліогр.: 16 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-113580 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-1135802017-02-11T03:02:19Z Статистическая эффективность и устойчивость моделей в регрессионном анализе Радченко, С.Г. Моделювання і управління Изложено решение основных проблем регрессионного анализа – получение статистически эффективных и устойчивых моделей. Решения приведены для реальных прикладных условий сложных систем и процессов, которые характеризуются значительной неопределенностью. Показано, что основным подходом в полученных решениях является использование условий получения моделей для определенного их класса и расширенной концепции ортогональности. Викладено рішення основних проблем регресійного аналізу – одержання статистично ефективних та стійких моделей. Рішення приведені для реальних прикладних умов складних систем та процесів, які характеризуються значною невизначеністю. Показано, що основним підходом в одержаних рішеннях є використання умов одержання моделей для визначеного їх класу і розширеної концепції ортогональності. Solution of basic problems of regression analysis – the obtaining of statistically efficient and stable models is stated. Solutions are presented for real applied conditions of complex systems and processes which are characterized by considerable indeterminacy. It is shown that the use of conditions of models obtaining for their certain class and extended conception of orthogonality is the basic approach in the obtained solutions. 2016 Article Статистическая эффективность и устойчивость моделей в регрессионном анализе / С.Г. Радченко // Математичні машини і системи. — 2016. — № 1. — С. 139-147. — Бібліогр.: 16 назв. — рос. 1028-9763 http://dspace.nbuv.gov.ua/handle/123456789/113580 519.233.5 ru Математичні машини і системи Інститут проблем математичних машин і систем НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
topic |
Моделювання і управління Моделювання і управління |
spellingShingle |
Моделювання і управління Моделювання і управління Радченко, С.Г. Статистическая эффективность и устойчивость моделей в регрессионном анализе Математичні машини і системи |
description |
Изложено решение основных проблем регрессионного анализа – получение статистически эффективных и устойчивых моделей. Решения приведены для реальных прикладных условий сложных систем и процессов, которые характеризуются значительной неопределенностью. Показано, что основным подходом в полученных решениях является использование условий получения моделей для определенного их класса и расширенной концепции ортогональности. |
format |
Article |
author |
Радченко, С.Г. |
author_facet |
Радченко, С.Г. |
author_sort |
Радченко, С.Г. |
title |
Статистическая эффективность и устойчивость моделей в регрессионном анализе |
title_short |
Статистическая эффективность и устойчивость моделей в регрессионном анализе |
title_full |
Статистическая эффективность и устойчивость моделей в регрессионном анализе |
title_fullStr |
Статистическая эффективность и устойчивость моделей в регрессионном анализе |
title_full_unstemmed |
Статистическая эффективность и устойчивость моделей в регрессионном анализе |
title_sort |
статистическая эффективность и устойчивость моделей в регрессионном анализе |
publisher |
Інститут проблем математичних машин і систем НАН України |
publishDate |
2016 |
topic_facet |
Моделювання і управління |
url |
http://dspace.nbuv.gov.ua/handle/123456789/113580 |
citation_txt |
Статистическая эффективность и устойчивость моделей в регрессионном анализе / С.Г. Радченко // Математичні машини і системи. — 2016. — № 1. — С. 139-147. — Бібліогр.: 16 назв. — рос. |
series |
Математичні машини і системи |
work_keys_str_mv |
AT radčenkosg statističeskaâéffektivnostʹiustojčivostʹmodelejvregressionnomanalize |
first_indexed |
2025-07-08T06:01:23Z |
last_indexed |
2025-07-08T06:01:23Z |
_version_ |
1837057426843500544 |
fulltext |
© Радченко С.Г., 2016 139
ISSN 1028-9763. Математичні машини і системи, 2016, № 1
УДК 519.233.5
С.Г. РАДЧЕНКО*
СТАТИСТИЧЕСКАЯ ЭФФЕКТИВНОСТЬ И УСТОЙЧИВОСТЬ МОДЕЛЕЙ
В РЕГРЕССИОННОМ АНАЛИЗЕ
*
Национальный технический университет Украины «КПИ», Киев, Украина
Анотація. Викладено рішення основних проблем регресійного аналізу – одержання статистично
ефективних та стійких моделей. Рішення приведені для реальних прикладних умов складних сис-
тем та процесів, які характеризуються значною невизначеністю. Показано, що основним підхо-
дом в одержаних рішеннях є використання умов одержання моделей для визначеного їх класу і ро-
зширеної концепції ортогональності.
Ключові слова: регресійний аналіз, статистичне оцінювання моделей, планування експерименту,
статистична ефективність, стійкість оцінювання.
Аннотация. Изложено решение основных проблем регрессионного анализа – получение стати-
стически эффективных и устойчивых моделей. Решения приведены для реальных прикладных усло-
вий сложных систем и процессов, которые характеризуются значительной неопределенностью.
Показано, что основным подходом в полученных решениях является использование условий получе-
ния моделей для определенного их класса и расширенной концепции ортогональности.
Ключевые слова: регрессионный анализ, статистическое оценивание моделей, планирование экс-
перимента, статистическая эффективность, устойчивость оценивания.
Abstract. Solution of basic problems of regression analysis – the obtaining of statistically efficient and
stable models is stated. Solutions are presented for real applied conditions of complex systems and
processes which are characterized by considerable indeterminacy. It is shown that the use of conditions of
models obtaining for their certain class and extended conception of orthogonality is the basic approach in
the obtained solutions.
Keywords: regression analysis, statistical estimation of models, experiment design, statistical efficiency,
estimation stability.
1. Введение. Постановка проблемы
При создании и совершенствовании сложных систем и процессов целесообразно использо-
вать многокритериальную компромиссную оптимизацию и многофакторное математиче-
ское моделирование. Решение реальных прикладных задач осуществляется в условиях су-
щественной неопределенности: структура многофакторной модели, сложность влияния
факторов и другие условия исследователю обычно неизвестны. Исходные данные содер-
жат случайные и систематические ошибки. Решаемые задачи статистического моделиро-
вания относятся к классу обратных задач: по полученным результатам необходимо восста-
новить влияние факторов в виде главных эффектов и их взаимодействий [1, с. 17].
Y = XB +ε ,
где Y – матрица-столбец полученных результатов опытов;
X – условия эксперимента в виде главных эффектов и их взаимодействий;
B – матрица-столбец определяемых коэффициентов математической модели;
ε – значения случайных ошибок ε .
Используется полиномиальная математическая модель, линейная по параметрам и
нелинейная по факторам:
klhkk x...xxb...xxbxb...xbxbxbŷ 2121221100 +++++++= ,
где lb...bb ,,, 10 – коэффициенты математической модели;
140 ISSN 1028-9763. Математичні машини і системи, 2016, № 1
10 ≡x – фиктивный фактор;
kx...xx ,,, 21 – ортогональные контрасты управляемых факторов kX...XX ,, , 21 ;
k – число факторов.
Управляемые факторы kX...X ,,1 должны быть независимы относительно друг дру-
га в физическом и статистическом смысле.
0) ,( =jiij XXr , kji ≤<≤1 ,
где ) ,( jiij XXr – коэффициент парной корреляции факторов ji X,X .
Дисперсии коэффициентов iji b,b для соответствующих эффектов будут равны
[2, c. 253]
)-(1
)(
2
2
восп
ij;i
iji
RN
b;bD
σ
= ,
где 2
воспσ – дисперсия воспроизводимости результатов экспериментов;
N – общее число проведенных экспериментов;
2
ij;iR – квадрат коэффициента множественной корреляции между эффектами
)()()(
или
q
j
p
i
p
i xxx и всеми остальными эффектами в полученной модели.
При 12 →ij;iR множитель ∞→)]-[1/(1 2
ij;iR и дисперсии коэффициентов неограни-
ченно увеличиваются. При 02 →ij;iR множитель 1)]-[1/(1 2 →ij;iR и при 02 =ij;iR , то есть в
случае ортогональности всех эффектов друг относительно друга, 1)]-[1/(1 2 =ij;iR . Тогда
дисперсия коэффициентов модели iji b,b становится минимально возможной, или оценка
эффективна в статистическом смысле.
Фактическое обеспечение выполнения указанной предпосылки является одной из
основных проблем многофакторного регрессионного анализа. Если предпосылка не вы-
полняется, то задача является некорректно поставленной и требует специальных методов
ее решения.
Коррелированность факторов приводит к смешиванию эффектов, что создает неоп-
ределенность их истинных значений, увеличивает среднеквадратичные ошибки эффектов,
делает некорректным использование статистических критериев ( ,t− −F критерии).
2. Анализ достижений и публикаций по теме исследования
В общем случае решаемая задача относится к классу некорректно поставленных задач –
искомая модель неопределенна, а коэффициенты могут содержать существенные стати-
стические и систематические ошибки.
Сложность и специфичность решения математических задач с неточными исход-
ными данными заключаются в том, что реализация решения на современных ЭВМ в рам-
ках классических методов не гарантирует устойчивых результатов. Акад. А.Н. Тихонов
считал, что «устойчивые математические методы решения неустойчивых задач с неточны-
ми данными относятся к классу математических задач, выходящих за пределы классиче-
ской математики» [3, c. 94].
В [4, с. 144] отмечается, что существование сильной линейной зависимости между
факторами «вызывает целый ряд проблем при оценке коэффициентов этой модели: делает
ISSN 1028-9763. Математичні машини і системи, 2016, № 1 141
матрицу т(X X) плохо обусловленной; как правило, имеет ухудшение точности оценок ко-
эффициентов модели, рост их дисперсий; оценки коэффициентов модели становятся чрез-
вычайно чувствительными к незначительным изменениям исходных данных (значений
элементов вектора y и матрицы X ), а также к ошибкам округлений числовых данных рас-
четов».
По мнению д.т.н. В.В. Налимова и к.т.н. Т.И. Голиковой, стоит «…новая задача пе-
ред планированием эксперимента – нужны робастные планы, то есть планы, малочувстви-
тельные к возможному изменению моделей хотя бы в пределах некоторого их класса» [5,
с. 120]. Подчеркивается, что матрица независимых переменных X появляется только по-
сле того, как модель задана [5, с. 31].
Д.т.н. В.В. Налимов считал проблему «…что есть хороший эксперимент», связан-
ной с другой проблемой – «…что есть хорошая математическая модель – это кардиналь-
ный вопрос, стоящий теперь перед нами во всей своей остроте… Достаточно формализо-
ванного ответа на вопрос – что есть хорошая модель, по-видимому, вообще нельзя будет
найти» [6, с. 3].
Д.ф.-м.н. Ю.Н. Тюрин и к.ф.-м.н. А.А. Макаров рассматривают стратегию, методы и
проблемы линейного регрессионного анализа в [7, c. 245–284]. Однако «…обширная тема,
носящая название множественной регрессии, не нашла отражения в данной книге» [7,
c. 249].
Одной из важных предпосылок задачи регрессионного анализа является вид функ-
циональной зависимости iii ),x(fy εθ += , n...i ,,1= . «Важно выбрать функцию ),x(f θ
так, чтобы она не просто хорошо описывала закономерную часть отклика, но и имела “фи-
зический” смысл, то есть открывала какую-то объективную закономерность… Поэтому
выбор типа регрессионной зависимости ),x(fŷ ii θ= является самой острой проблемой в
любом исследовании» [7, c. 255]. Рассматривается корректность выбора однофакторной
регрессии. Рекомендации по выбору структуры в многофакторном случае отсутствуют.
К.ф.-м.н. Е.Л. Жуковский отмечает, что «проблема автоматизации научного изме-
рительного эксперимента связана с необходимостью получения устойчивых решений мно-
гочисленных практических задач» [8, с. 47]. Значительно менее разработанными оказались
методы решения некорректных задач для тех случаев, когда в правой части «уравнений и в
операторе возмущения случайны» [8, с. 49]. Задача интерпретации обычно сводится к ре-
шению уравнения yAx = [8, с. 47, 52], «которое может оказаться неустойчивым и порож-
дать собственную ложную структуру решения. Взаимосвязанность этих двух задач – ста-
тистической обработки и интерпретации – является одной из сложнейших и мучительных
задач проблемы автоматизации обработки, интерпретации и моделирования данных экспе-
римента» [8, с. 52].
В [9, с. 408–415] рассмотрен анализ спецификации модели. Анализ построен на
предположении, что исследователю известна корректная спецификация – правильный вид
регрессионной модели [9, с. 408]. Введение новых переменных оценивается с использова-
нием скорректированного квадрата коэффициента множественной корреляции 2R . При-
влекательным является метод пошаговой регрессии, однако, поскольку при выполнении
этой процедуры классические методы статистических выводов утрачивают силу,
«…экономисты стараются избегать методов пошаговой регрессии» [9, с. 410]. Рекоменда-
ции по выбору структурных элементов статистической модели и их ортогональности друг
к другу не приведены.
В [10, с. 431–486] рассмотрено получение наилучшего регрессионного уравнения.
Кратко изложен выбор всех возможных регрессий и «лучшие подмножества» регрессий.
Выбор «лучших подмножеств» регрессий осуществляется с использованием квадрата ко-
142 ISSN 1028-9763. Математичні машини і системи, 2016, № 1
эффициента множественной корреляции 2R . Рассмотрен шаговый метод построения рег-
рессий методом включения и методом исключения эффектов факторов. Планирование
эксперимента с целью получения наилучших условий для определяемой модели не рас-
сматривается. Отмечается, что «ни один метод не будет одинаково хорошо работать в лю-
бых обстоятельствах, как бы хорошо он не зарекомендовал себя на конкретном примере.
Ни один метод не будет всегда оказываться лучше всех остальных» [10, с. 456]. «Рассмот-
ренные… методы являются полезными инструментами. Но ни один из них не заменит
здравый смысл и опыт» [10, с. 456].
В [11] изложено планирование эксперимента kpkk 3,2,2 − , планы второго порядка,
планы на симплексе. Определение структур моделей для более сложных планов, если
структура модели исследователю не известна, не рассмотрено.
Приведенные мнения авторитетных специалистов по математике, регрессионному
анализу, планированию эксперимента показали сложность проблемы и отсутствие согла-
сованных действий по ее решению. Отсутствуют формализованные решения получения
статистических моделей для реальных задач в условиях начальной неопределенности.
Проблема статистической эффективности и устойчивости моделей в регрессионном анали-
зе разработана недостаточно.
3. Цель статьи
Разработать методы получения многофакторных статистических моделей, обеспечиваю-
щие статистически эффективные, то есть минимально возможные, оценки ошибок коэф-
фициентов и устойчивость получаемой структуры модели.
4. Решение проблемы
Будем использовать модели линейные по параметрам и, в общем случае, нелинейные по
факторам.
Коэффициенты модели в матричном виде определяют по формуле
т -1 тB (X X) X Y= ,
где B – матрица-столбец определяемых коэффициентов математической модели;
X – расширенная матрица эффектов определяемой модели;
Y – матрица-столбец полученных результатов опытов;
т – знак транспонирования матрицы X ;
–1 – знак обратной матрицы.
Так как структура статистической модели исследователю не известна, необходимо
использовать такой класс моделей, который содержал бы структуру искомой математиче-
ской модели. Используемый класс моделей должен позволять устойчиво определять раз-
личные модели, входящие в него. Теоретический анализ различных классов моделей пока-
зал, что этому требованию соответствует класс моделей полного факторного эксперимен-
та. Формализованная структура класса моделей полного факторного эксперимента задает-
ся выражением
П
1
)1((2)(1) ) +...+ + +(1 Nxxx
k
i
s
iii
i →∏
=
− ,
где ...,, , )1((2)(1) −is
iii xxx – ортогональные контрасты факторов iX ;
is – число различных уровней фактора iX ;
(1), (2), …, ( 1−is ) – порядок контрастов фактора iX ;
ISSN 1028-9763. Математичні машини і системи, 2016, № 1 143
ПN – число структурных элементов полного факторного эксперимента, равное числу
опытов эксперимента.
Предполагается, что порядок максимального значения ортогонального контраста
1−is достаточный для адекватного описания влияния фактора iX по всей области фак-
торного пространства. Значение is назначается исследователем, исходя из логически про-
фессионального анализа предметной области.
Для полного факторного эксперимента число структурных эффектов (элементов)
модели равно числу опытов плана эксперимента ПN , и все эффекты ортогональны друг к
другу [12, с. 26–29]. Получаемая статистическая модель будет адекватна результатам экс-
перимента, так как множество структурных элементов необходимо и достаточно для опи-
сания результатов опытов.
Рассмотрим построение структуры модели для полного факторного эксперимента
24432 111 //×× : первый фактор 1x на двух, второй 2x на трех, третий 3x на четырех
уровнях. Формализованная структура статистической модели будет следующей:
) )(1 )(1 +(1 (3)
3
(2)
3
(1)
3
(2)
2
(1)
2
(1)
1 xxxxxx +++++ → ПN =24,
где (1)
1x , (1)
2x , (1)
3x – линейные контрасты факторов 1X , 2X , 3X ;
(2)
2x , (2)
3x – квадратичные контрасты факторов 2X , 3X ;
(3)
3x – кубический контраст фактора 3X ;
ПN =24 – число структурных элементов статистической модели, равное числу опытов
плана экспериментов.
Общий вид статистической модели будет следующий:
ŷ = 00xb + (1)
11xb + (1)
22xb + (2)
23xb + (1)
34xb + (2)
35xb + (3)
36xb + (1)
2
(1)
17 xxb + (2)
2
(1)
18 xxb +
+ (1)
3
1
19 xxb )( + (2)
3
(1)
110 xxb + (3)
3
(1)
111 xxb +
)1(
3
)1(
212 xxb + )2(
3
)1(
213 xxb +
)3(
3
)1(
214 xxb +
+
)1(
3
)2(
215 xxb + (2)
3
(2)
216 xxb + (3)
3
(2)
217 xxb + (1)
3
(1)
2
(1)
118 xxxb + (1)
3
(2)
2
(1)
119 xxxb +
+ (3)
3
(1)
2
(1)
120 xxxb + (1)
3
(2)
2
(1)
121 xxxb + (2)
3
(2)
2
(1)
122 xxxb + (3)
3
(2)
2
(1)
123 xxxb .
Модель содержит семь главных эффектов, одиннадцать двойных взаимодействий и
шесть тройных взаимодействий.
В случае выбора дробного факторного регулярного плана эксперимента все главные
эффекты будут ортогональны друг к другу. Из структуры модели полного факторного экс-
перимента возможно выделение различных структур статистических моделей wŷ для
дробного факторного эксперимента. Если план эксперимента не выбирать близким к на-
сыщенному – для дробных факторных экспериментов можно рекомендовать выбирать
число опытов с учетом эмпирической формулы ( )∑
=
−≈
k
i
is)...,(N
1
Д 1251 , где is – число
уровней i - го фактора, – то некоторые взаимодействия и все главные эффекты будут орто-
гональны друг к другу.
Рассмотрим полный факторный эксперимент. Расширенная матрица X главных
эффектов и взаимодействий содержит столбец фиктивного фактора 10 ≡x , столбцы всех
144 ISSN 1028-9763. Математичні машини і системи, 2016, № 1
главных эффектов и всех возможных взаимодействий главных эффектов. Если эффекты
факторов и взаимодействий факторов выразить в виде системы ортогональных нормиро-
ванных контрастов, то есть
∑
=
N
u
p
iux
1
)( = 0, 0)(
1
)( =×∑
=
q
ju
N
u
p
iu xx ,
Nx
N
u
p
iu =∑
=
2
1
)( ][ , [ ]∑
=
=×
N
u
q
ju
p
iu Nxx
1
2)()( ,
то матрица дисперсий-ковариаций примет вид
т -1 2 2(X X) ( ) (1/ N)Eσ ( )σ ε = ε ,
где )p
iux( – значение p -го ортогонального контраста i -го фактора для u -той строки мат-
рицы планирования эксперимента, Nu ≤≤1 , 11 −≤≤ isp ;
)(q
jux – значение q -го ортогонального контраста j -го фактора для u -той строки мат-
рицы планирования эксперимента, 11 −≤≤ jsq , 1≤ < ≤i j k ;
X – матрица эффектов полного факторного эксперимента;
)( εσ2 ) – теоретическое значение дисперсии воспроизводимости результатов опытов;
N – число опытов в плане эксперимента;
E – единичная матрица.
Наилучшей многофакторной статистической моделью будем считать модель, соот-
ветствующую критериям −−−− G,E,A,D оптимальности, ортогональности (или квазиорто-
гональности) и устойчивости структуры и коэффициентов.
По теореме Бродского В.З. [12, с. 26–29] в полном факторном эксперименте все эф-
фекты ортогональны друг к другу. Эффекты выражаются системой ортогональных контра-
стов, что эквивалентно системе ортогональных полиномов Чебышева [1, с. 54–63].
Анализ требований к многофакторному плану эксперимента показал, что они вы-
полняются для любых полных факторных экспериментов и получаемые модели будут «ис-
тинными», то есть наилучшими из возможных. По теореме Хотеллинга выполнение требо-
вания ортогональности всех эффектов приводит к минимизации дисперсий коэффициентов
статистической модели и получению совместно эффективных оценок [13, с. 62–63]. При
выполнении указанных теорем план эксперимента X соответствует критерию −D опти-
мальности, так как определитель матрицы дисперсий-ковариаций т -1(X X) соответствует
минимуму или (что то же самое) определитель информационной матрицы т(X X) соответ-
ствует максимуму. В полном факторном эксперименте выполняются также критерии
−−− G,E,A оптимальности.
Для дробных факторных экспериментов используются многофакторные регулярные
планы и планы на основе τЛП равномерно распределенных последовательностей [1,
с. 293–312]. Если эффекты, вводимые в модель, коррелированы, то коэффициенты парной
корреляции 30)( )()( ,|x,xr| q
ju
p
iuij < .
Устойчивость в регрессионном анализе включает устойчивость плана эксперимен-
та, устойчивость структуры многофакторной статистической модели, устойчивость коэф-
фициентов модели.
ISSN 1028-9763. Математичні машини і системи, 2016, № 1 145
Под устойчивым (робастным) планом эксперимента понимается план полного или
дробного факторного эксперимента, позволяющий выбрать неизвестные исследователю
структуры «истинных» статистических моделей wŷ полиномиального вида, линейных по
параметрам, и получить адекватные модели ( w – текущий номер определяемой модели,
mw ≤≤1 , m – общее число определяемых моделей по устойчивому плану эксперимента).
План эксперимента не изменяется для получаемых различных структур моделей. Устойчи-
выми планами экспериментов являются полные факторные эксперименты, многофактор-
ные регулярные планы экспериментов и планы на основе τЛП равномерно распределен-
ных последовательностей.
Устойчивая структура многофакторной статистической модели – структура, кото-
рая характеризуется неизменностью множества главных эффектов и взаимодействий мно-
гофакторной статистической модели полиномиального вида при изменении значений ре-
зультатов экспериментов (откликов), порождаемых случайными ошибками (погрешностя-
ми) результатов наблюдений, измерений, вычислений и неопределенностью искомой
структуры модели. Структурные элементы моделей выбираются из множества структур-
ных элементов модели полного факторного эксперимента с ортогональными или слабо-
коррелированными (коэффициент парной корреляции 30,|r| ij < ) эффектами с использова-
нием устойчивого (робастного) плана эксперимента.
Под устойчивостью коэффициентов статистической модели будем понимать мини-
мально возможную изменчивость коэффициентов многофакторной статистической модели
полиномиального вида к случайным ошибкам (погрешностям) результатов наблюдений,
измерений и вычислений. Для оценки устойчивости коэффициентов используется число
обусловленности тcond(X X). Устойчивость наилучшая, если тcond(X X)=1, хорошая, если
1< тcond(X X)≤10, удовлетворительная, если 10< тcond(X X)≤100, неудовлетворительная, ес-
ли тcond(X X)>100. Коэффициенты будут максимально устойчивыми, если их эффекты ор-
тогональны друг к другу (или близки к ортогональным) и нормированы.
Определяемые коэффициенты статистических моделей должны быть устойчивы к
малым случайным изменениям в исходных данных, полученным в процессе эксперимен-
тов. Предложено для количественного показателя устойчивости коэффициентов математи-
ческой модели использовать 2 меры обусловленности: по Нейману-Голдстейну и число
обусловленности матрицы т(X X) .
Для определения меры обусловленности по Нейману-Голдстейну P необходимо
найти собственные числа для матрицы Фишера т(X X) , решая уравнение
т|(X X)- E| 0λ = ,
где X – расширенная матрица эффектов уравнения регрессии, имеющая N строк и 'k
столбцов, то есть эффектов;
λ – собственные числа информационной матрицы Фишера тX X ;
E – единичная матрица;
|| ⋅ – условное обозначение детерминанта.
Среди собственных чисел λ находят maxλ и minλ – максимальное и минимальное
собственные числа для информационной матрицы Фишера тX X .
Мера обусловленности матрицы по Нейману-Голдстейну:
т
max min(X X) /P λ λ= .
Если все эффекты в матрице тX X ортогональны друг к другу и нормированы, то
146 ISSN 1028-9763. Математичні машини і системи, 2016, № 1
т|(X X)- E|λ = k
N
N '(N ) 0
N
0
0
−λ
−λ
= −λ =
−λ
⋱
.
N'... k =λ==λ=λ 21 . N=λ=λ minmax .
тP(X X) N / N 1= = .
Другая мера обусловленности матрицы тX X обозначается cond.
т т т 1cond(X X) X X (X X)−= × ,
где ⋅ – обозначение нормы матрицы.
Предполагается, что матрица тX X не вырождена.
Если все эффекты в расширенной матрице X ортогональны друг к другу и норми-
рованы, то число обусловленности тX X тcond(X X) N 1/ N 1= × = .
Для слабо коррелированных столбцов матрицы тX X cond превышает единицу и из
опыта решения многочисленных задач по изложенной методологии обычно не превышает 10.
При нормировании эффектов сумма их квадратов по столбцу должна быть равна
числу опытов N . Нормирование осуществляется с использованием нормировочного ко-
эффициента )( p
ik :
[ ]∑
=
=
N
u
Np
iux
p
ik
1
2)()( ,
)( p
ik = [ ]∑
=
N
u
p
iuxN
1
2)( .
Практика решения реальных прикладных задач с использованием изложенных ме-
тодов показала, что они эффективны и позволяют успешно получать модели с хорошими
характеристиками [1, с. 256–290].
Системный анализ методологии регрессионного анализа показывает, что, помимо
формализованных решений, необходимо использовать и эвристические [14].
5. Выводы и полученные результаты
1. Получение многофакторных статистических моделей в условиях неопределенности ис-
ходных данных требует использования планов экспериментов и структур моделей для оп-
ределенного их множества в виде полного факторного эксперимента, среди которых при-
сутствует искомая модель.
2. Используемые планы экспериментов, структура статистической модели и эффекты, вхо-
дящие в структуру, должны быть ортогональными или близкими к ортогональным.
3. При выборе конкретного плана эксперимента, помимо требований теории планирования
эксперимента, необходимо учитывать прикладные условия проведения эксперимента,
важнейшим из которых является допустимое число опытов и возможности реализации все-
го экспериментального исследования по теоретически предложенной схеме.
С разработанными методами решения задач и полученными результатами можно
ознакомиться в [15, 16].
ISSN 1028-9763. Математичні машини і системи, 2016, № 1 147
СПИСОК ЛИТЕРАТУРЫ
1. Радченко С.Г. Методология регрессионного анализа / Радченко С.Г. – К.: «Корнійчук», 2011. –
376 с.
2. Айвазян С.А. Прикладная статистика: исследования зависимостей: справ. изд. / Айвазян С.А.,
Енюков И.С., Мешалкин Л.Д.; под. ред. С.А. Айвазяна. – М.: Финансы и статистика, 1985. – 487 с.
3. Тихонов А.Н. Выступление на годичном общем собрании Академии наук СССР / А.Н. Тихонов //
Вестник Академии наук СССР. – 1989. – № 2. – C. 94 – 95.
4. Тихомиров Н.П. Эконометрика: учебник / Н.П. Тихомиров, Е.Ю. Дорохина. – [2-е изд., стерео-
тип.]. – М.: Изд-во «Экзамен», 2007. – 512 с.
5. Налимов В.В. Логические основания планирования эксперимента / В.В. Налимов, Т.И. Голикова.
– [2-е изд., перераб. и доп.]. – М.: Металлургия, 1981. – 152 с.
6. Налимов В.В. Планирование эксперимента. Найдут ли новые проблемы новые решения? /
В.В. Налимов // Журнал Всесоюзного химического общества им. Д.И. Менделеева. – 1980. – Т. 25,
№ 1. – С. 3 – 4.
7. Тюрин Ю.Н. Статистический анализ данных на компьютере / Ю.Н. Тюрин, А.А. Макаров; под
ред. В.Э. Фигурнова. – М.: ИНФРА–М, 1998. – 528 с.
8. Жуковский Е.Л. Статистическая регуляризация решений обратных некорректно поставленных
задач обработки и интерпретации результатов эксперимента / Е.Л. Жуковский // Методы матема-
тического моделирования, автоматизация обработки наблюдений и их применения: сборник / Под
ред. А.Н. Тихонова, А.А. Самарского. – М., 1986. – C. 47 – 72.
9. Грін В.Г. Економетричний аналіз / Грін В.Г.; пер. з англ. А. Олійник, Р. Ткачук; наук. ред. пер.
О. Комашко; передм. О.І. Черняка, О.В. Комашка. – К.: Вид-во С. Павличко «Основи», 2005. –
1197 с.
10. Дрейпер Н.Р. Прикладной регрессионный анализ / Н.Р. Дрейпер, Г. Смит; пер. с англ. – [3-е
изд.]. – М. – Санкт-Петербург – Киев: Диалектика, издат. дом «Вильямс», 2007. – 912 с.
11. Montgomery D.C. Design and Analysis of Experimtnts / D.C. Montgomery. – [6-th Edition]. – Dohn
Wiley, New York, 2005. – 643 p.
12. Бродский В.З. Введение в факторное планирование эксперимента / Бродский В.З. – М.: Наука,
1976. – 224 с.
13. Себер Дж. Линейный регрессионный анализ / Дж. Себер; пер. с англ. В.П. Носко; под. ред.
М.Б. Малютова. – М.: Мир, 1980. – 456 с.
14. Радченко С.Г. Формализованные и эвристические решения в регрессионном анализе / Радченко
С.Г. – К.: «Корнійчук», 2015. – 236 с.
15. [Электронный ресурс]: лаборатория экспериментально-статистических методов исследований
(ЛЭСМИ). – Режим доступа: http://www.n-t.org/sp/lesmi.
16. [Электронный ресурс]: сайт кафедры «Технология машиностроения» механико-
машиностроительного института Национального технического университета Украины «Киевский
политехнический институт». – Режим доступа: http://tm-mmi.kpi.ua/index.php/ru/1/publicati.
Стаття надійшла до редакції 13.11.2015
|