Математична модель динаміки відвідуваності тематичних веб-сайтів та методи її ідентифікації
У статті запропоновано метод параметричної ідентифікації моделі процесу короткотермінового росту відвідуваності Веб-сайтів та метод параметричної ідентифікації моделі процесу довготермінового росту відвідуваності Веб-сайтів. В роботі розглядається неавтономна модель відвідуваності Веб-сайтів, яка вк...
Gespeichert in:
Datum: | 2013 |
---|---|
Hauptverfasser: | , , |
Format: | Artikel |
Sprache: | Ukrainian |
Veröffentlicht: |
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України
2013
|
Schriftenreihe: | Індуктивне моделювання складних систем |
Schlagworte: | |
Online Zugang: | http://dspace.nbuv.gov.ua/handle/123456789/83677 |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Zitieren: | Математична модель динаміки відвідуваності тематичних веб-сайтів та методи її ідентифікації / Н.Р. Пасічник, Р.М. Пасічник, М.П. Дивак // Індуктивне моделювання складних систем: Зб. наук. пр. — К.: МННЦ ІТС НАН та МОН України, 2013. — Вип. 5. — С. 237-247. — Бібліогр.: 5 назв. — укр. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-83677 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-836772015-06-22T03:02:22Z Математична модель динаміки відвідуваності тематичних веб-сайтів та методи її ідентифікації Пасічник, Н.Р. Пасічник, Р.М. Дивак, М.П. Наукові статті У статті запропоновано метод параметричної ідентифікації моделі процесу короткотермінового росту відвідуваності Веб-сайтів та метод параметричної ідентифікації моделі процесу довготермінового росту відвідуваності Веб-сайтів. В роботі розглядається неавтономна модель відвідуваності Веб-сайтів, яка включає модель динаміки фактора впливу на основі модифікованої системи звичайних диференціальних рівнянь Моно The article offers a method for parametric identification of the model of the short-term growth period of the Website’s attendance and a method for parametric identification of the model of the long-term growth period of the Website’s attendance. The work considers non-autonomous model of the Website’s attendance, which contains the model of impact factor’s dynamics basing on the modified system of differential equations by Mono. В статье предложен метод параметрической идентифікации модели процеса краткосрочного роста посещаемости Веб-сайтов и метод параметрической идентификации модели процесса долгосрочного роста посещаемости Веб-сайтов. В работе рассматривается неавтономная модель посещаемости Веб-сайтов, которая содержит модель динамики фактора влияния на основании модифицированной системы обычных дифференциальных уравнений Моно. 2013 Article Математична модель динаміки відвідуваності тематичних веб-сайтів та методи її ідентифікації / Н.Р. Пасічник, Р.М. Пасічник, М.П. Дивак // Індуктивне моделювання складних систем: Зб. наук. пр. — К.: МННЦ ІТС НАН та МОН України, 2013. — Вип. 5. — С. 237-247. — Бібліогр.: 5 назв. — укр. XXXX-0044 http://dspace.nbuv.gov.ua/handle/123456789/83677 519.7:378.147 uk Індуктивне моделювання складних систем Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Ukrainian |
topic |
Наукові статті Наукові статті |
spellingShingle |
Наукові статті Наукові статті Пасічник, Н.Р. Пасічник, Р.М. Дивак, М.П. Математична модель динаміки відвідуваності тематичних веб-сайтів та методи її ідентифікації Індуктивне моделювання складних систем |
description |
У статті запропоновано метод параметричної ідентифікації моделі процесу короткотермінового росту відвідуваності Веб-сайтів та метод параметричної ідентифікації моделі процесу довготермінового росту відвідуваності Веб-сайтів. В роботі розглядається неавтономна модель відвідуваності Веб-сайтів, яка включає модель динаміки фактора впливу на основі модифікованої системи звичайних диференціальних рівнянь Моно |
format |
Article |
author |
Пасічник, Н.Р. Пасічник, Р.М. Дивак, М.П. |
author_facet |
Пасічник, Н.Р. Пасічник, Р.М. Дивак, М.П. |
author_sort |
Пасічник, Н.Р. |
title |
Математична модель динаміки відвідуваності тематичних веб-сайтів та методи її ідентифікації |
title_short |
Математична модель динаміки відвідуваності тематичних веб-сайтів та методи її ідентифікації |
title_full |
Математична модель динаміки відвідуваності тематичних веб-сайтів та методи її ідентифікації |
title_fullStr |
Математична модель динаміки відвідуваності тематичних веб-сайтів та методи її ідентифікації |
title_full_unstemmed |
Математична модель динаміки відвідуваності тематичних веб-сайтів та методи її ідентифікації |
title_sort |
математична модель динаміки відвідуваності тематичних веб-сайтів та методи її ідентифікації |
publisher |
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України |
publishDate |
2013 |
topic_facet |
Наукові статті |
url |
http://dspace.nbuv.gov.ua/handle/123456789/83677 |
citation_txt |
Математична модель динаміки відвідуваності тематичних веб-сайтів та методи її ідентифікації / Н.Р. Пасічник, Р.М. Пасічник, М.П. Дивак // Індуктивне моделювання складних систем: Зб. наук. пр. — К.: МННЦ ІТС НАН та МОН України, 2013. — Вип. 5. — С. 237-247. — Бібліогр.: 5 назв. — укр. |
series |
Індуктивне моделювання складних систем |
work_keys_str_mv |
AT pasíčniknr matematičnamodelʹdinamíkivídvíduvanostítematičnihvebsajtívtametodiííídentifíkacíí AT pasíčnikrm matematičnamodelʹdinamíkivídvíduvanostítematičnihvebsajtívtametodiííídentifíkacíí AT divakmp matematičnamodelʹdinamíkivídvíduvanostítematičnihvebsajtívtametodiííídentifíkacíí |
first_indexed |
2025-07-06T10:29:39Z |
last_indexed |
2025-07-06T10:29:39Z |
_version_ |
1836893109388050432 |
fulltext |
Математична модель динаміки відвідуваності тематичних
Індуктивне моделювання складних систем, випуск 5 , 2013 237
УДК 519.7:378.147
МАТЕМАТИЧНА МОДЕЛЬ ДИНАМІКИ ВІДВІДУВАНОСТІ
ТЕМАТИЧНИХ ВЕБ-САЙТІВ ТА МЕТОДИ ЇЇ ІДЕНТИФІКАЦІЇ
Н.Р. Пасічник, Р.М. Пасічник, М.П. Дивак
Тернопільський національний економічний університет,
natalia.pasichnyk@gmail.com, roman.pasichnyk@gmail.com, mdy@tneu.edu.ua
У статті запропоновано метод параметричної ідентифікації моделі процесу
короткотермінового росту відвідуваності Веб-сайтів та метод параметричної ідентифікації
моделі процесу довготермінового росту відвідуваності Веб-сайтів. В роботі розглядається
неавтономна модель відвідуваності Веб-сайтів, яка включає модель динаміки фактора впливу
на основі модифікованої системи звичайних диференціальних рівнянь Моно
Ключові слова: Веб-сайт, параметрична ідентифікація, неавтономна модель, система
диференціальних рівнянь Моно.
The article offers a method for parametric identification of the model of the short-term growth
period of the Website’s attendance and a method for parametric identification of the model of the
long-term growth period of the Website’s attendance. The work considers non-autonomous model
of the Website’s attendance, which contains the model of impact factor’s dynamics basing on the
modified system of differential equations by Mono.
Keywords: Web-site, parametric identification, non-autonomous model, system of differential
equations by Mono.
В статье предложен метод параметрической идентифікации модели процеса
краткострочного роста посещаемости Веб-сайтов и метод параметрической идентификации
модели процеса долгострочного роста посещаемости Веб-сайтов. В работе рассматривается
неавтономная модель посещаемости Веб-сайтов, которая содержит модель динамики
фактора влияния на основании модифицированной системы обычных дифференциальных
уравнений Моно.
Ключевые слова: Веб-сайт, параметрическая идентификациія, неавтономная модель,
система дифференциальных уравнений Моно.
Вступ
Заходи по підвищенню відвідуваності Веб-сайту реалізуються протягом
тривалого часу згідно відпрацьованих методик. Як в реалізації методики, так і в
реакції на неї аудиторії Веб-сайту, значну роль відіграє суб’єктивний фактор.
Оцінити результативність цієї діяльності зачасту можна лише після завершення
її активної стадії. Маючи прогноз динаміки процесу на початковій його стадії,
було б доцільно мати можливість скоригувати тактику реалізації даного виду
діяльності або вчасно спланувати нову посилюючу активність. Це породжує
необхідність побудови прогнозної моделі відвідуваності Веб-сайту.
Прогнозування відвідуваності Веб-сайтів вже частково досліджено в
літературі, зокрема в роботах [1], [2]. Згадані роботи аналізують питання
навігації користувачів по сторінках Веб-сайту з метою виявлення найчастіше
Н.Р. Пасічник, Р.М. Пасічник, М.П. Дивак
Індуктивне моделювання складних систем, випуск 5 , 2013 238
відвідуваних маршрутів а також питання вибору ефективних Веб-сайтів та Веб-
сторінок для розміщення реклами. Більшість із зазначених підходів не дає ре-
комендацій про шляхи підвищення відвідуваності Веб-сайтів із низькою та се-
редньою відвідуваністю. Хоча в дослідженнях А.М.Пелещишина [3] відвідува-
ність Веб-сайту пропонується підіймати в рамках Веб-холдингу за рахунок ви-
користання сайтів-донорів, однак значна частина користувачів позбавлена такої
можливості.
Проведений аналіз літературири і практичних розробок дозволив побуду-
вати загальну схему підтримки функціонування Веб-сайтів, представлену на
рисунку1. Із Веб-сайтом взаємодіє його аудиторія А, формуючи його відвідува-
ність Y. Розробкою, підтримкою та модифікацією Веб-сайту займаються розро-
бники D та служба підтримки P на основі суб’єктивних уявлень. Зазначений
суб’єктивізм в розвитку Веб-сайту може завадити йому реалізувати потенцій-
ний рівень відвідуваності. Для цього необхідно підкріпити суб’єктивну інтуїцію
працівників об’єктивними рекомендаціями, сформованими на основі
відповідних інформаційних та математичних моделей.
Побудова напрямків поповнення контенту та розробки нових структур-
них елементів Веб-сайту може бути значно спрощена із використанням Веб-
онтологій, побудова яких описана в попередніх дослідженнях [4],[5]. Крім того
модель відвідуваностей Y дає можливість прогнозувати результати відвідува-
ності варіантів розвитку Веб-сайту ще до їх реалізації. Таким чином розробка
методів ідентифікації математичних моделей для підтримки процесів структу-
рування Веб-сайтів шляхом дослідження обсягів відвідуваності становить акту-
альну задачу, що розв’язується в даній роботі.
Цільова
активність
Цільова
аудиторія
Структура Веб-сайту - S
Цільові
сторінки
Функціональні
служби
Контент
Y
Y
Y
Розробники
Веб-сайту
Служба
підтримки
Веб-сайту
Предметна
онтологія
Y*-
оцінка
приросту
відвідуваності
S*-модифікація
структури
Модель
відвідуваності
Публікації
Анонсування
Направлені
розсилання
Y*
Y*
Y*
Рис1. Схема підтримки функціонування Веб-сайтів
Математична модель динаміки відвідуваності тематичних
Індуктивне моделювання складних систем, випуск 5 , 2013 239
Порівняльний аналіз відвідуваностей Веб-сайтів дозволив виявити узго-
дженість загальних характеристик відвідуваностей із відвідуваністями окремих
тематик даного Веб-сайту (субсайтів), що на даний момент активно розвивали-
ся або відповідали ключовим інтересам його аудиторії. В деяких випадках цю
відвідуваність можна прогнозувати на основі оцінки стану бізнес-процесів
об’єкта для якого створювався даний Веб-сайт.
1.Модель росту відвідуваності Веб-сайтів
Щоденна відвідуваність характеризується великою кількістю випадкових
факторів, що робить проблематичним достатньо точне її прогнозування. В той
же час на характеристики сайту впливають не окремі екстремальні, а
усереднені показники. Тому в нашій моделі аналізуватимемо середньотижневі
згладжені загальні відвідуваності Y та відвідуваності субсайтів X. При цьому
використаємо кратне згладжування методом ковзаючого середнього із
мінімальним шаблоном, яке на відміну від інших методів суттєво нівелює
аномальні викиди, а не лише частково згладжує їх.
Для формального виділення інтервалів активності росту відвідуваності
використовуємо критерій перевищення похідної відвідуваності деякого міні-
мального значення
min
' D)t(Y > . (1)
5 10 15 20 25 30 35 40 45
0
50
100
150
200
250
300
350
400
450
Вплив факторів відвідуваності
тижні
п
е
р
е
гл
я
д
и
с
то
р
ін
о
к
в
д
е
н
ь
відвідуваність
5*факторЗагХарактеристик
5*факторТематики
Рис. 2. Згладжена відвідуваність та фактори впливу
Н.Р. Пасічник, Р.М. Пасічник, М.П. Дивак
Індуктивне моделювання складних систем, випуск 5 , 2013 240
На основі максимальних відвідуваностей субсайтів, що активно розвива-
ються, виділяємо фактор впливу на відвідуваність для даного інтервалу. Аналіз
згладженої динаміки факторів на стадії активації показує їх подібність, що до-
зволяє використовувати єдиний математичний апарат для їх моделювання. В
якості такого апарату використано модифіковану систему диференціальних рі-
внянь Моно, які моделюють динаміку X активності фактора та потенційної
його аудиторії A . Загальний вид системи Моно наводиться нижче – співвідно-
шеннями (2)
+
−=
−
+
=′
),t(X
)t(Aa
)t(A
a)t('A
),t(Xa
)t(Sa
)t(A
a)t(X
4
3
2
4
1
(2)
Пов’язати фактор X із обсягом згладженої відвідуваності Y достатньо то-
чно можна за допомогою степеневої функції із відповідно підібраними параме-
трами – співвідношення (8).
Щоб забезпечити вихід відвідуваності на завершальній стадії на рівень
0Xd , в правій частині диференціальних рівнянь переходимо від звичайної )(tA
до скоригованої відвідуваності )(tAe , що визначається співвідношенням (3).
≤
>
−
−
−
=
.d)t(A0
,d)t(A
dA
)t(AA
d)t(A
)t(A
0X
0X
0X0
0
0X
e (3)
Згідно цього співвідношення скоригована відвідуваність приймає значен-
ня з інтервалу ],[ 00 AdX на відміну від звичайної, яка теоретично може приймати
значення з інтервалу ],0[ 0A .
В результаті проведених перетворень отримаємо модель відвідуваності
наступного виду:
+
−=′
−
+
=′
),t(X
)t(Aa
)t(A
a)t(A
),t(Xa
)t(Aa
)t(A
a)t(X
e4
e
3
2
e4
e
1
(4)
при умові ( )0X
0 dX
2
A
A ≥∨
> , (5)
=′
=′
,0)t(A
,0)t(X
(6)
при умові ( )0X
0 dX
2
A
A <∧
≤ , (7)
( ) tqq
010
32 eX)t(Xq)t(Y)t(Y −−+= , (8)
,X)0(X 0= (9)
,XA)0(A max0 == , (10)
Ідентифікацію такої системи здійснюємо в 2 етапи. На першому етапі на
основі спостереженої активності фактора X ідентифікуємо параметри 41 aa −
Математична модель динаміки відвідуваності тематичних
Індуктивне моделювання складних систем, випуск 5 , 2013 241
динаміки системи, а на другому етапі параметри моделі 21,qq загальної
відвідуваності. Ідентифікація здійснюється за одним із найпростіших критеріїв
мінімізації середньоквадратичної похибки активності фактора X на точках
навчальної вибірки. Критерій якості мінімізується за допомогою
модифікованого градієнтного методу Левенберга-Марквардта, який забезпечує
пошук лише локального мінімуму і тому вимагає хорошого початкового на-
ближення. Таке початкове наближення можна побудувати за допомогою
аналізу особливостей розв’язків системи диференціальних рівнянь (4). Метод
ідентифікації моделі повинен бути багатоетапним, щоб врахувати можливий
вплив людського фактора.
Модель (4) містить чотири невідомих параметри і тому вимагає хоча б
чотирьох точок ідентифікації. Дві точки отримуємо під час встановлення по-
чатку інтервалу суттєвого приросту відвідуваності, оскільки при цьому
необхідно оцінювати значення похідної відвідуваності за її різницевою
апроксимацією. Доотримання ще 2-4 точок спостереження фактору впливу
необхідно їх прогнозувати на основі апріорних оцінок..
Побудова оцінок такого роду вимагає хорошої інформованості про
властивості шуканих функцій. Аналізуючи різні реалізації факторів впливу
можна помітити, що всі вони містять по одному інтервалу зростання та спа-
дання, однак за тривалістю ці інтервали можуть суттєво відрізнятися. Зокрема
деякі із них містять лише 3-4 точки до досягнення максимальної відвідуваності.
Отже процедура побудови апріорних оцінок повинна суттєво враховувати
нелінійність оцінюваної функції. Це дозволяє виділити фактори впливу, які
містять не більше чотирьох спостережень до досягнення максимального зна-
чення, в клас короткотермінових факторів впливу. Всі інші фактори впливу
віднесемо в клас довготермінових.
Класифікувати тип факторів впливу для конкретного Веб-сайту можна,
проаналізувавши динаміку його першого спостереженого фактора. Наступні
прояви факторів протягом тривалого періоду будуть того ж типу.
2. Основні положення методу ідентифікації модифікованої системи
Моно для короткотермінових факторів впливу
Експериментальні дослідження показують, що друга похідна короткоте-
рмінового фактора впливу має прогнозований лінійний характер. Помічена
властивість дозволяє побудувати рекурентні співвідношення для покрокового
прогнозу значень відвідуваності в точках, які необхідно спостерегти для
ефективної ідентифікації моделі. Наближаємо значення другої похідної моделі
початкового фактора впливу наступним співвідношенням :
ibbqi 21
0 += , (11)
)),((max)),((min
],[
3
],[
1
1010
tqbtqb
tttttt ∈∈
== (12)
Н.Р. Пасічник, Р.М. Пасічник, М.П. Дивак
Індуктивне моделювання складних систем, випуск 5 , 2013 242
01
13
2 tt
bb
b
−
−= , (13)
де 0
iq — значення другої похідної моделі початкового фактора впливу.
Маючи оцінку параметрів наближення другої похідної будуємо
багатокрокові апріорні співвідношення прогнозування значень фактору впливу.
,~
11 xx = (14)
,010 xxp −= (15)
.10 bq = (16)
,11 −− += iii qpp (17)
,21 bqq ii += − (18)
.~~
1 iii pxx += − (19)
Обчислення за співвідношеннями (15) – (17) продовжуємо поки похибка
прогнозу буде лежати в допустимих межах 0δ :
0
|~| δ≤−
prev
ii
X
xx , (20)
де prevX — максимальне значення попередньої реалізації фактору впли-
ву.
Апріорні співвідношення дозволяють прогнозувати динаміку фактора
впливу на попередньому етапі а також сприяють отриманню інформації про
дійсні значення фактору впливу в обсягах, достатніх для застосування процеду-
ри ідентифікації моделі фактора впливу .
Ідентифікація системи Моно методом Левенберга-Марквардта вимагає
побудови процедури задання початкових значень коефіцієнтів системи. При
побудові початкових значень для параметрів моделі фактора впливу встановле-
но, що коефіцієнти 2a і 4a є відносно незалежними. Тому їх значення
підбираємо на вузлах рівномірних сіток, які покривають деякі діапазони
(21-23). Після вибору значень коефіцієнтів 2a та 4a визначаємо початкове
значення коефіцієнтів 1a і 3a з рівнянь (4).
}...,,2,,{ 44
0
44
0
4
0
444
NahahaaWa ++=∈ . (21)
}...,,2,,{ 22
0
22
0
2
0
222
NahahaaWa ++=∈ , (22)
max
00
2 X
p
a = . (23)
4max
max
2
1
0
40
0
2
1
0
1 aX
X
a
x
p
aA
A
a
x
p
a
+
+=
+
+= . (24)
2
1
3
a
a = . (25)
Математична модель динаміки відвідуваності тематичних
Індуктивне моделювання складних систем, випуск 5 , 2013 243
Параметри сітки Naha 44
0
4 ,, підбираються експериментально. Для побудо-
ви мінімального значення коефіцієнта відносимо швидкість падіння інтересу
аудиторії до максимальної відвідуваності Веб-сайту maxX . Максимальне почат-
кове значення відносної відвідуваності вибираємо кратним мінімальному, в
найпростішому випадку просто подвоюючи його. Оскільки початкове значення
обсягу потенційної аудиторії прирівняно до максимальної відвідуваності, то
природньо покласти коефіцієнт відносного зменшення потенційної аудиторії
вдвічі меншим, ніж коефіцієнт відносного приросту відвідуваності.
Для побудови початкових значень коефіцієнтів моделі відвідуваності
прологарифмуємо співвідношення моделі відвідуваності Y, отримуючи систему
лінійних рівнянь (26).
( ) 3,2,1)),()(ln()(ln)ln( 03021 =−=−−+ itYtYqXtXqq ii . (26)
Додаткове значення відвідуваності, необхідне для формування системи
(26) будується на основі його лінійної екстраполяції (27) по двох перших точ-
ках .
121223 yy2)yy(yy~ −=−+= (27)
Ідентифікація системи Моно, а також моделі відвідуваності, здійснюєть-
ся на основі мінімізації середньоквадратичних критеріїв якості:
( )∑
=
−=
I
j
jj
c
xtcxa
1
2),(~minarg
rr
. (28)
( )∑
=
−=
I
j
jj
r
ytryq
1
2),(~minarg
rr
. (29)
3. Метод ідентифікації модифікованої системи Моно для довготермі-
нових факторів впливу
Короткотермінові фактори відвідуваності характерні для Веб-сайтів, які
не є життєво важливими для об’єкта, який він представляє. В іншому випадку
команда, що підтримує відповідний Веб-сайт, докладає максимальних зусиль
до постійного росту його відвідуваності аж до виходу на рівень, який забезпе-
чує його належну результативність. При цьому відпрацьовуються спеціальні
методики, які забезпечують досягненя максимуму відповідного приросту відві-
дуваності на протязі не менше шести тижнів. Для прикладу динаміки відвідува-
ності вибрано промо-сайт, а саме Веб-сайт сервісу API2Cart підприємства із ро-
зробки програмного забезпечення Magnetic One .
Для моделювання приросту відвідуваності даного типу використаємо ра-
ніше запропоновану модель (4)-(10). Однак ідентифікація цієї моделі в даному
випадку буде мати свої особливості. Зокрема не спостерігається лінійної пове-
дінки другої похідної фактора впливу, як у випадку короткотермінових інтер-
валів підвищення відвідуваності. Справа в тому, що тривалість процесу збіль-
Н.Р. Пасічник, Р.М. Пасічник, М.П. Дивак
Індуктивне моделювання складних систем, випуск 5 , 2013 244
шення обсягу фактору впливу спричиняє зміну швидкості його росту. Зокрема
на першій стадії процесу росту швидкість росту відносно невелика, згодом во-
на суттєво зростає.
Така мінливість не дозволяє застосовувати лінійне наближення для про-
гнозування динаміки фактору впливу на значному інтервалі. В той же час, на
початковому етапі кількість точок недостатня для застосування процедури іде-
нтифікації. Тому на початковому етапі використовуємо співвідношення для
побудови початкових значень (21)-(25) для ідентифікації коефіцієнтів системи
Моно. При цьому підбір кращих значень коефіцієнтів 2a та 4a здійснюється
за критерієм мінімізації відхилення модельного значення від спостереженого в
останній на даний момент, тобто другій точці:
( )222),(~minarg xtcxa
c
−= rr
. (30)
Цього вже достатньо для ідентифікації моделі. Однак точність такої
ідентифікації достатньо невисока. Тому штучно збільшуємо кількість точок
ідентифікації за допомогою лінійної екстраполяції обсягів фактору впливу по
двох останніх точках спостереження. Це дозволяє модифікувати критерій по-
будови коефіцієнтів моделі фактору наступним чином:
( )
},)),(~)1)(((
),(~{minarg
2
11
1
2
1
1
kmmm
mm
mk
m
k
kk
c
tcxmkxxx
xtcxa
r
rr
r
−+−−+∑+
+∑ −=
−−
+
−=
=
(31)
де m — кількість спостережених точок,
1m — кількість додаткових точок ідентифікації.
Таким чином ідентифікована модель є достатньо точною на етапі
лінійного росту фактору впливу. Однак на наступному етапі поведінка фактору
впливу наближається до параболічного закону, оскільки фаза зростання
відвідуваності переходить у фазу її зменшення. В цьому випадку вже похідна
фактору впливу еволюціонує за законом, наближеним до лінійного. На цьому
етапі функціонал похибки моделі включає як відхилення від спостережених
значень, так і відхилення від лінійного наближення похідної в ще не спостере-
жених точках:
( )
( ) ( ) }.))t,c(x~3mkpk2mp(
x)t,c(x~{minarga
2
k2m3m
ml
3mk
2m
1k
kk
c
1
2
r
rr
r
′−+−+−−∑+
+∑ −=
−−
+
−=
=
(32)
Математична модель динаміки відвідуваності тематичних
Індуктивне моделювання складних систем, випуск 5 , 2013 245
3. Обчислювальні експерименти
При програмній реалізації підсистеми моделювання відвідуваності Веб-
сайту використано сервіс Google Analytics та програмне середовище MatLab. В
даному дослідженні аналізувалася відвідуваність Веб-сайту факультету
комп’ютерних інформаційних технологій (ФКІТ- http://tanet.tneu.org/)
Тернопільського національного економічного університету (ТНЕУ) майже за
річний період а також відвідуваність промо сайту сервісу API2Cart компанії
Magnetic One (http://www.api2cart.com/) більш ніж за річний період. Для Веб-
сайту ФКІТ спостерігалися короткотермінові прирости відвідуваності, а для
Веб-сайту API2Cart – довготермінові. Проведені чисельні експерименти
підтверджують ефективність запропонованих методів, максимальні похибки
прогнозування лежали в межах 9-13%.
Для ілюстрації особливостей застосування запропонованих методів на
рисунку 3 наведено результат моделювання довготермінового фактора впливу
на інтервалі лінійної екстраполяції фактора впливу.
53 54 55 56 57 58 59 60 61 62 63
1
2
3
4
5
6
7
8
9
10
Прогноз фактору 3 з екстраполяцією ,ni=4, e=8.2454%
тижні
П
е
р
е
гл
я
д
и
с
то
р
ін
о
к
за
д
е
н
ь
Спостереження
Модель
межі 5% інтервалу
Рис.3. Результат ідентифікації моделі фактору впливу Веб-сайту API2Cart
із використанням екстраполяції спостережених значень
Аналіз рисунку свідчить про задовільну точність моделі для семи спосте-
режень. У восьмій точці спостереження точність моделі дещо перевищує 5%
рівень. Тому для наступного прогнозування ідентифікуємо модель по восьми
точках із застосуванням функціоналу якості, який включає окрім відхилення
від спостережених значень модельованої величини відхилення похідної моделі
від лінійної екстраполяції похідної фактора впливу. Результат прогнозування
по моделі наводяться на рисунку 4.
Аналіз рисунку свідчить про задовільну точність прогнозування для
дев’яти спостережених значень. Десяте спостереження відхиляється від прогно-
зу дещо більше ніж на 5%.
Н.Р. Пасічник, Р.М. Пасічник, М.П. Дивак
Індуктивне моделювання складних систем, випуск 5 , 2013 246
На відміну від моделювання фактору впливу, модель відвідуваності
вдається побудувати за початковим наближенням по трьох спостережених зна-
ченнях і ця модель, побудована на основі моделі фактора впливу, не потребує
подальших уточнень. Відповідний графік наведено на рисунку 5. В цьому ви-
падку багатоетапність прогнозу відвідуваності пов’язана лише із
багатоетапністю ідентифікації фактора впливу. Похибка моделі не перевищує
6.6%.
52 54 56 58 60 62 64 66
1
2
3
4
5
6
7
8
9
10
11
Прогноз фактору 3 з лінійною екстраполяцією похідної, ni=8, e=5.5486%
тижні
П
е
р
е
гл
я
д
и
с
то
р
ін
о
к
з
а
д
е
н
ь
Спостереження
Модель
межі 5% інтервалу
Рис.4. Результат ідентифікації моделі фактору впливу Веб-сайту API2Cart
із використанням екстраполяції похідної спостережених значень
53 54 55 56 57 58 59 60 61 62 63
22
24
26
28
30
32
34
36
38
40
42
Модель відвідуваності,nІ=4 похибка= 5.5833%
тижні
П
е
р
е
гл
я
д
и
с
то
р
ін
о
к
за
д
е
н
ь
Спостереження
Оціночна покрокова модель
Рис.5. Результат ідентифікації моделі третього інтервалу росту
відвідуваності Веб-сайту API2Cart
Математична модель динаміки відвідуваності тематичних
Індуктивне моделювання складних систем, випуск 5 , 2013 247
Висновки
У результаті проведених досліджень отримано такі наукові та практичні
результати. Набула подальшого розвитку неавтономна модель відвідуваності
Веб-сайтів, яка включає модель динаміки фактора впливу на основі
модифікованої системи звичайних диференціальних рівнянь Моно, що на
відміну від існуючих забезпечує аналітичне представлення процесів росту
відвідуваності Веб-сайтів.
Вперше запропоновано метод ідентифікації моделі процесу
короткотермінового росту відвідуваності Веб-сайтів, який включає етапи
побудови початкового значення фактору впливу на основі апроксимації його
другої похідної та процедуру побудови початкових значень коефіцієнтів
моделі, щоб ідентифікувати модель із задовільною точністю.
Вперше запропоновано метод ідентифікації моделі процесу довготермі-
нового росту відвідуваності Веб-сайтів, який використовує на окремих етапах
функціонали якості, що містять лінійні екстраполяції значень фактора впливу
та його першої похідної. Це забезпечує ідентифікацію моделі із задовільною
точністю.
Список використаних джерел
1. Gorbunov A.L.. Markov models for website traffic// IMAT -2007, Ural
University Publ., 2007, pр. 65-73
2. Khalil F. Combining. Web Data Mining Techniques for Web Page Access
Prediction. // Quinsland, 2008, pp.197. http://eprints.usq.edu.au/4341/
3. Пелещишин А. М. Позиціонування сайтів у глобальному
інформаційному середовищі. - Львів: Видавництво Національного
університету “Львівська політехніка”, 2007.- 260с.
4. Пасічник Н.Р., Дивак М.П. Метод формування онтологічного
наповнення на основі аналізу зашумленої слабкоструктурованої
інформації спеціалізованих веб-сайтів // Індуктивне моделювання
складних систем: Зб. наук. пр. — К.: МННЦ ІТС НАН та МОН України,
2012. — Вип. 4. — С. 158-167.
5. Пасічник Н. Метод формування онтологічного контенту, базований на
аналізі інформації спеціалізованих Веб-сайтів // Вісник ХНУ: Інженерія,
т.5, 2012. – С.241-244
|