Software development for contextual advertising of listings in the real estate domain
Advertising plays a crucial role in the success of a product, particularly in the real estate sector, where competition is fierce, and the properties' characteristics are complex. This article examines the advertising of real estate listings on a specialized aggregator website, which can provid...
Збережено в:
Дата: | 2024 |
---|---|
Автор: | |
Формат: | Стаття |
Мова: | Ukrainian |
Опубліковано: |
Інститут програмних систем НАН України
2024
|
Теми: | |
Онлайн доступ: | https://pp.isofts.kiev.ua/index.php/ojs1/article/view/635 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Problems in programming |
Репозитарії
Problems in programmingid |
pp_isofts_kiev_ua-article-635 |
---|---|
record_format |
ojs |
resource_txt_mv |
ppisoftskievua/11/1ea52a46eb5567d2af3d35f6c8e26311.pdf |
spelling |
pp_isofts_kiev_ua-article-6352025-02-15T12:13:57Z Software development for contextual advertising of listings in the real estate domain Розробка програмного забезпечення для контекстної реклами оголошень у предметній області нерухомості Hromenko, V.V. contextual advertising; sponsored search; real estate; A/B testing; remarketing UDC 681.3 контекстна реклама; спонсорований пошук; нерухомість; A/B тестування; ремаркетинг УДК 681.3 Advertising plays a crucial role in the success of a product, particularly in the real estate sector, where competition is fierce, and the properties' characteristics are complex. This article examines the advertising of real estate listings on a specialized aggregator website, which can provide additional context for the user's search, potentially enhancing the effectiveness of advertising campaigns. The paper discusses existing approaches and solutions for contextual advertising and sponsored search in real estate and the peculiarities of developing such solutions. It analyzes the main problems encountered in creating an algorithm for analyzing the context of advertising in real estate and proposes an alternative approach to implementing a contextual advertising algorithm, utilizing domain-specific expert knowledge. This approach to developing a contextual advertising algorithm may be more appropriate for organizations that lack the resources for developing and implementing machine learning-based solutions and associated data quality and volume management but possess expert knowledge in the field. To create such an algorithm, A/B testing is used to verify hypotheses related to the specificity of the listings and user behavior on the site, which allows not only to develop the algorithm but also to prove its effectiveness with real users. The article also notes the disadvantages of this approach, one of which is the long duration of the experiments. The paper presents the outcome of this approach in the form of an algorithm for real estate advertisement, which utilizes the characteristics of real estate objects, such as location, and the user's browsing history for remarketing. Using the UML language, component, and sequence diagrams of the example software for contextual advertising have been created.Prombles in programming 2024; 2-3: 180-189 Реклама є важливим елементом успіху продукту, особливо у сфері нерухомості, де конкуренція велика і характеристики об'єктів складні. В даній статті розглядається реклама оголошень у сфері нерухомості на спеціалізованому сайті-агрегаторі, що здатен надавати додатковий контекст пошуку користувача, потенційно підвищуючи результативність рекламних кампаній. У статті розглядаються існуючі підходи та рішення для контекстної реклами та спонсорованого пошуку в сфері нерухомості, а також особливості розробки подібних рішень. Було проаналізовано основні проблеми, які виникають при створенні алгоритму для аналізу контексту реклами в області нерухомості, та, враховуючи звуження предметної області та області застосування запропоновано альтернативний підхід до реалізації алгоритму контекстної реклами з використанням експертних знань. Даний підхід до розробки алгоритму контекстної реклами може бути більш придатним для організацій, які не мають вільних ресурсів для розробки та впровадження рішень на базі машинного навчання та супутнього керування якістю та об’ємом даних, проте натомість мають експертні знання в предметній області. Щоб розробити подібний алгоритм використовується A/B тестування для перевірки гіпотез, зумовлених особливістю оголошень та поведінки користувачів на сайті, що дозволяє не тільки розробити алгоритм, а й довести його ефективність на реальних користувачах. Водночас зазначаються також недоліки такого підходу, одним з яких є тривалий час проведення експериментів. У статті представлено результат роботи даного підходу у вигляді алгоритму для реклами оголошень нерухомості, який використовує особливості рекламних об’єктів нерухомості. Наприклад, розташування та історію переглядів користувача для ремаркетингу. За допомогою мови UML створено діаграму компонентів та діаграму послідовності прикладу програмного забезпечення для контекстної реклами.Prombles in programming 2024; 2-3: 180-189 Інститут програмних систем НАН України 2024-12-17 Article Article application/pdf https://pp.isofts.kiev.ua/index.php/ojs1/article/view/635 10.15407/pp2024.02-03.180 PROBLEMS IN PROGRAMMING; No 2-3 (2024); 180-189 ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ; No 2-3 (2024); 180-189 ПРОБЛЕМИ ПРОГРАМУВАННЯ; No 2-3 (2024); 180-189 1727-4907 10.15407/pp2024.02-03 uk https://pp.isofts.kiev.ua/index.php/ojs1/article/view/635/687 Copyright (c) 2024 PROBLEMS IN PROGRAMMING |
institution |
Problems in programming |
baseUrl_str |
https://pp.isofts.kiev.ua/index.php/ojs1/oai |
datestamp_date |
2025-02-15T12:13:57Z |
collection |
OJS |
language |
Ukrainian |
topic |
contextual advertising sponsored search real estate A/B testing remarketing UDC 681.3 |
spellingShingle |
contextual advertising sponsored search real estate A/B testing remarketing UDC 681.3 Hromenko, V.V. Software development for contextual advertising of listings in the real estate domain |
topic_facet |
contextual advertising sponsored search real estate A/B testing remarketing UDC 681.3 контекстна реклама спонсорований пошук нерухомість A/B тестування ремаркетинг УДК 681.3 |
format |
Article |
author |
Hromenko, V.V. |
author_facet |
Hromenko, V.V. |
author_sort |
Hromenko, V.V. |
title |
Software development for contextual advertising of listings in the real estate domain |
title_short |
Software development for contextual advertising of listings in the real estate domain |
title_full |
Software development for contextual advertising of listings in the real estate domain |
title_fullStr |
Software development for contextual advertising of listings in the real estate domain |
title_full_unstemmed |
Software development for contextual advertising of listings in the real estate domain |
title_sort |
software development for contextual advertising of listings in the real estate domain |
title_alt |
Розробка програмного забезпечення для контекстної реклами оголошень у предметній області нерухомості |
description |
Advertising plays a crucial role in the success of a product, particularly in the real estate sector, where competition is fierce, and the properties' characteristics are complex. This article examines the advertising of real estate listings on a specialized aggregator website, which can provide additional context for the user's search, potentially enhancing the effectiveness of advertising campaigns. The paper discusses existing approaches and solutions for contextual advertising and sponsored search in real estate and the peculiarities of developing such solutions. It analyzes the main problems encountered in creating an algorithm for analyzing the context of advertising in real estate and proposes an alternative approach to implementing a contextual advertising algorithm, utilizing domain-specific expert knowledge. This approach to developing a contextual advertising algorithm may be more appropriate for organizations that lack the resources for developing and implementing machine learning-based solutions and associated data quality and volume management but possess expert knowledge in the field. To create such an algorithm, A/B testing is used to verify hypotheses related to the specificity of the listings and user behavior on the site, which allows not only to develop the algorithm but also to prove its effectiveness with real users. The article also notes the disadvantages of this approach, one of which is the long duration of the experiments. The paper presents the outcome of this approach in the form of an algorithm for real estate advertisement, which utilizes the characteristics of real estate objects, such as location, and the user's browsing history for remarketing. Using the UML language, component, and sequence diagrams of the example software for contextual advertising have been created.Prombles in programming 2024; 2-3: 180-189 |
publisher |
Інститут програмних систем НАН України |
publishDate |
2024 |
url |
https://pp.isofts.kiev.ua/index.php/ojs1/article/view/635 |
work_keys_str_mv |
AT hromenkovv softwaredevelopmentforcontextualadvertisingoflistingsintherealestatedomain AT hromenkovv rozrobkaprogramnogozabezpečennâdlâkontekstnoíreklamiogološenʹupredmetníjoblastíneruhomostí |
first_indexed |
2025-07-17T09:52:34Z |
last_indexed |
2025-07-17T09:52:34Z |
_version_ |
1838410073549832192 |
fulltext |
180
Прикладне програмне забезпечення
УДК 681.3 http://doi.org/10.15407/pp2024.02-03.180
В.В. Громенко
РОЗРОБЛЕННЯ ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ ДЛЯ
КОНТЕКСТНОЇ РЕКЛАМИ ОГОЛОШЕНЬ У ПРЕДМЕТНІЙ
ОБЛАСТІ НЕРУХОМОСТІ
Реклама є важливим елементом успіху продукту, особливо у сфері нерухомості, де конкуренція велика
і характеристики об'єктів складні. В даній статті розглядається реклама оголошень у сфері нерухомості
на спеціалізованому сайті-агрегаторі, що здатен надавати додатковий контекст пошуку користувача,
потенційно підвищуючи результативність рекламних кампаній. У статті розглядаються існуючі підходи
та рішення для контекстної реклами та спонсорованого пошуку в сфері нерухомості, а також особли-
вості розробки подібних рішень. Було проаналізовано основні проблеми, які виникають при створенні
алгоритму для аналізу контексту реклами в області нерухомості, та, враховуючи звуження предметної
області та області застосування запропоновано альтернативний підхід до реалізації алгоритму контекс-
тної реклами з використанням експертних знань. Даний підхід до розробки алгоритму контекстної ре-
клами може бути більш придатним для організацій, які не мають вільних ресурсів для розробки та
впровадження рішень на базі машинного навчання та супутнього керування якістю та об’ємом даних,
проте натомість мають експертні знання в предметній області. Щоб розробити подібний алгоритм ви-
користовується A/B тестування для перевірки гіпотез, зумовлених особливістю оголошень та поведі-
нки користувачів на сайті, що дозволяє не тільки розробити алгоритм, а й довести його ефективність
на реальних користувачах. Водночас зазначаються також недоліки такого підходу, одним з яких є три-
валий час проведення експериментів. У статті представлено результат роботи даного підходу у вигляді
алгоритму для реклами оголошень нерухомості, який використовує особливості рекламних об’єктів
нерухомості. Наприклад, розташування та історію переглядів користувача для ремаркетингу. За допо-
могою мови UML створено діаграму компонентів та діаграму послідовності прикладу програмного
забезпечення для контекстної реклами.
Ключові слова: контекстна реклама, спонсорований пошук, нерухомість, A/B тестування, ремаркетинг.
V. V. Hromenko
SOFTWARE DEVELOPMENT FOR CONTEXTUAL
ADVERTISING OF LISTINGS IN THE REAL ESTATE DOMAIN
Advertising plays a crucial role in the success of a product, particularly in the real estate sector, where com-
petition is fierce, and the properties' characteristics are complex. This article examines the advertising of real
estate listings on a specialized aggregator website, which can provide additional context for the user's search,
potentially enhancing the effectiveness of advertising campaigns. The paper discusses existing approaches
and solutions for contextual advertising and sponsored search in real estate and the peculiarities of developing
such solutions. It analyzes the main problems encountered in creating an algorithm for analyzing the context
of advertising in real estate and proposes an alternative approach to implementing a contextual adver tising
algorithm, utilizing domain-specific expert knowledge. This approach to developing a contextual advertising
algorithm may be more appropriate for organizations that lack the resources for developing and implementing
machine learning-based solutions and associated data quality and volume management but possess expert
knowledge in the field. To create such an algorithm, A/B testing is used to verify hypotheses related to the
specificity of the listings and user behavior on the site, which allows not only to develop the algorithm but
also to prove its effectiveness with real users. The article also notes the disadvantages of this approach, one
of which is the long duration of the experiments. The paper presents the outcome of this approach in the form
of an algorithm for real estate advertisement, which utilizes the characteristics of real estate objects, such as
location, and the user's browsing history for remarketing. Using the UML language, component, and sequence
diagrams of the example software for contextual advertising have been created.
Keywords: contextual advertising, sponsored search, real estate, A/B testing, remarketing.
© В.В. Громенко, 2024
ISSN 1727-4907. Проблеми програмування. 2024. №2-3
181
Прикладне програмне забезпечення
Вступ
Реклама є невід’ємною частиною
будь-якого бізнесу з метою продажу свого
продукту або послуги. Особливо важливо
мати ефективну рекламну стратегію в Інтер-
неті, де потенційні клієнти проводять усе бі-
льше часу. Для сфери нерухомості, яка пос-
тійно зростає та розвивається, реклама є
надзвичайно важливою. Більше того, за ра-
хунок багатьох особливостей, зокрема, ве-
ликого впливу локації на зацікавленість ко-
ристувача та більшого часу вибору порів-
няно з іншими продуктами, дана сфера ви-
магає особливого підходу до реклами.
Стаття присвячена побудові алгори-
тму надання контекстної реклами нерухомо-
сті на базі гіпотез, які висуваються зі знання
предметної області, і перевіряються шляхом
A/B тестування [1] на реальних користува-
чах. Такий метод допомагає створювати рі-
шення, роботу яких також можна легко інте-
рпретувати. Окрім алгоритму контекстної
реклами важливою частиною реклами в ін-
тернеті є також і технічні особливості його
реалізації, як от швидкість роботи, можли-
вість впровадження додаткового контексту
тощо.
Побудова програмного забезпечення
для контекстної реклами також розгляда-
ється в статті та є комплексною і містить
особливості предметної області, для якої ро-
зробляється програмне забезпечення (ПЗ),
різні шляхи розробки алгоритму для кон-
текстної реклами та технічні особливості ре-
алізації.
Опис задачі
Задача, описана в статті, стосується
спонсорованого пошуку, але з обмеженням
на рекламну платформу, оскільки розгляда-
ється спеціалізований сайт-агрегатор у
сфері нерухомості. Цей сайт може переда-
вати пошуковий запит користувача в струк-
турованому вигляді, а не як короткі текстові
запити, і також здатен надавати додатковий
контекст, такий як історія перегляду оголо-
шень користувачем. Для реалізації цього рі-
шення використовуються HTTP запити для
передачі запиту користувача.
Таким чином, для застосування під-
ходу або рішення, запропонованого в
статті, рекламна мережа має розробити спе-
цифічний формат комунікації з рекламною
платформою. Водночас, завдання реклами
було розглянуто як підмножина спонсоро-
ваного пошуку, але з обмеженнями в до-
менній області, які уможливлюють викори-
стання доменних знань для покращення ро-
боти рекламного алгоритму, що буде пока-
зано нижче.
Мета дослідження
Загальна проблема контекстної рек-
лами полягає в пошуку найкращих оголо-
шень із великого асортименту реклами для
користувача в певному контексті для опти-
мізації корисних функцій учасників екосис-
теми за певних бізнес-обмежень (блоку-
вання, націлювання тощо) [4].
У процесі розв'язання даної про-
блеми виникає багато питань, а також мож-
ливих рішень. Адже тільки для алгоритму
контекстної реклами існує багато підходів,
наприклад, використання генетичних алго-
ритмів [2] або ж стохастичного навчання ра-
нжуванню [3]. Плюсом таких підходів є уні-
версальність, їх можна застосовувати для
будь-якої галузі.
Також є можливість брати контекст
не тільки із сайту оголошень, а й впроваджу-
вати додатковий контекст.
Метою статті є розглядання кількох
аспектів даної проблеми, а саме:
− Створення алгоритму для контекс-
тної реклами, враховуючи особливості лока-
ції об’єктів нерухомості;
− Впровадження додаткового конте-
ксту за допомогою ремаркетингу [5];
− Швидкість роботи програмної ре-
алізації.
Математична основна проблеми
Задачу алгоритму контекстної рек-
лами нерухомості, в рамках якої розгляда-
ються вищезазначені проблеми, можна опи-
сати наступною системою:
182
Прикладне програмне забезпечення
{
𝐴𝐴∗ = 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝐴𝐴′⊆A,|𝐴𝐴′|=𝑘𝑘(∑ 𝑅𝑅(𝑢𝑢, 𝑎𝑎
𝑎𝑎∈𝐴𝐴′
))
∑ 𝐶𝐶(𝑢𝑢, 𝑎𝑎) → 𝑎𝑎𝑎𝑎𝑎𝑎
𝑎𝑎∈𝐴𝐴∗
де, A – множина всіх продуктів у рекламі
𝐴𝐴∗ – множина продуктів у рекламі, які най-
краще відповідають запиту користувача, 𝑘𝑘 –
кількість об’єктів, що одночасно показу-
ється користувачеві, 𝑎𝑎 = (𝑎𝑎1, 𝑎𝑎2, … , 𝑎𝑎𝑛𝑛) – ве-
ктор параметрів продукту, 𝑎𝑎𝑖𝑖 – окремий па-
раметр продукту, 𝑢𝑢 = (𝑢𝑢1, 𝑢𝑢2, … , 𝑢𝑢𝑚𝑚) – век-
тор контексту користувача, 𝑅𝑅(𝑢𝑢, 𝑎𝑎) – функ-
ція, яка повертає оцінку релевантності про-
дукту до контексту користувача, 𝐶𝐶(𝑢𝑢, 𝑎𝑎) –
функція, яка повертає вірогідність кліку ко-
ристувача по продукту (або здійснення ін-
шої цільової дії).
Складність вирішення системи 1 по-
лягає в двох речах. По-перше, функція
𝑅𝑅(𝑢𝑢, 𝑎𝑎), має максимізувати результат
𝐶𝐶(𝑢𝑢, 𝑎𝑎), а не певну зміну. По-друге, 𝐶𝐶(𝑢𝑢, 𝑎𝑎)
не може бути обрахована аналітично, а базу-
ється на історичних даних кліків та показів
реклами. Тобто, розробляючи 𝑅𝑅(𝑢𝑢, 𝑎𝑎) ,
важко оцінити її вплив на бажаний резуль-
тат.
Більше того, щоб зробити опис про-
блеми точнішим, треба додавати в систему з
формули 1 ще одну формулу:
𝑇𝑇(𝑅𝑅(𝑢𝑢, 𝑎𝑎)) → 𝑎𝑎𝑚𝑚𝑚𝑚
де, T – функція, що повертає час ви-
конання функції в аргументі. Тобто одна із
задач нашого програмного забезпечення не
тільки показати найбільш прийнятні об’єкти
для користувача, а й зробити це за мініма-
льно короткий час.
Отже, поєднавши формули 1 та 2 в
одну систему, отримуємо математичний
опис проблем контекстної реклами, розгля-
нутих в статті.
Аналіз існуючих досліджень
Основою сучасного спонсорованого
пошуку є можливість ефективного зістав-
лення реклами із запитами користувачів.
Це передбачає інтерпретацію пошукового
запиту користувача не лише за ключовими
словами, а й за будь-якими доступними да-
ними, з використанням машинного нав-
чання. Технології обробки природної мови
використовуються для кращої репрезента-
ції текстових запитів [6], або ж кращого
вивчення семантики пошукових запитів
[7], що дозволяє досягти більшого співпа-
діння між метою пошуку і рекламою, яка
відображається. Також дослідники фоку-
суються на використанні не тільки тексто-
вих даних, а й зображень, створюючи від-
повідні моделі [8].
Окрім аналізу запиту, моделі ма-
шинного навчання використовуються для
передбачення показника відношення кліків
до показів (CTR) реклами. Для вирішення
такої задачі дослідники пропонують вико-
ристовувати навчання з підкріпленням [9],
мережу глибокого динамічного сприйняття
інтересів [10], моделі глибокого навчання з
використанням векторних представлень
слів [11].
Рішення на основі машинного нав-
чання ефективно розвиваються і широко ви-
користовуються в задачах спонсорованого
пошуку. Проте успішність таких рішень за-
лежить від якості та можливості збору даних
для навчання таких моделей [12], що може
бути проблематичним для спеціалізованих
сайтів-агрегаторів. Крім того, окремі дослі-
дження присвячені ефективному викорис-
танню ресурсів у рішеннях машинного нав-
чання [13], оскільки надмірне споживання
ресурсів може стати критичним фактором у
процесі адаптації компаніями рішень спон-
сорованого пошуку.
Тож в статті досліджується альтерна-
тивний підхід, орієнтований на експертні
знання в області та експериментальні підт-
вердження на користувачах системи, а не на
дані та машинне навчання. Потенційно таке
рішення може бути одночасно ефективним в
обрахунку і водночас зберігати точність для
співставлення оголошень із запитами корис-
тувачів, враховуючи обмеження щодо плат-
форми та області. Подібна гіпотеза також
підтверджується результатами викорис-
тання генетичного програмування для кон-
текстної реклами [14], але для рішення
більш узагальненої проблеми.
(1)
(2)
183
Прикладне програмне забезпечення
Побудова алгоритму контекстної
реклами
В даній статті пропонується підхід до
побудови алгоритму контекстної реклами,
який можна застосувати на платформі агре-
гаторі нерухомості, що не вимагає великих
обчислювальних ресурсів та складної ро-
боти з даними та одночасно може бути інте-
рпретований у вигляді блок-схеми.
Покрокова побудова алгоритму згі-
дно даного підходу:
1. Створити базову, тривіальну вер-
сію алгоритму;
2. На базі знань із предметної області
висувається гіпотеза, яка може покращити
роботу алгоритму;
3. Реалізація гіпотези в алгоритмі;
4. Перевірка гіпотези шляхом A/B
тестування;
5. Прийняття або відкидання гіпо-
тези;
6. Повторення пунктів 2-5 для покра-
щення алгоритму.
За передумову для виконання всіх
кроків має бути працююча платформа з ого-
лошеннями, адже A/B тестування має про-
водитись на реальних користувачах, а також
налаштований сервіс для збору рекламних
метрик (таких як перегляди та кліки) для ви-
значення CTR.
За зазначеною схемою було побудо-
вано приклад алгоритму контекстної рек-
лами нерухомості. Базова версія алгоритму
чітко враховувала обмеження за ціною та
локацією. Відповідно під час пошуку за пе-
вним районом або територією в місті корис-
тувачу видавався результат усього міста. Пі-
сля цього було висунуто кілька гіпотез, що
мають покращити роботу алгоритму, а саме:
− Додавання одного об’єкта з ремар-
кетингу (особливість впровадження ремар-
кетингу розглянуті в наступному розділі);
− Додавання двох об’єктів з ремар-
кетингу;
− Пошук у площі, яка цікавить кори-
стувача, з поступовим розширенням, бо ло-
кація впливає на ціну і зацікавленість в не-
рухомості [15];
− Сортування рекламних об’єктів за
віддаленістю від центру пошуку.
Експеримент з побудови алгоритму
за заданим підходом було проведено на реа-
льній платформі з пошуку нерухомості, яка,
на момент проведення експерименту могла
забезпечити 100 тисяч переглядів реклами
на день (вказана тільки частина показів, на
яких було можливо проводити експери-
мент). За перегляд приймалася поява рекла-
много оголошення на екрані користувача.
Для кожної гіпотези відповідно було
проведено A/B тест тривалістю два тижні
(для збирання достатньої кількості даних),
статична значимість бралась як 95%. Версія
A/B тесту, під якою користувач брав участь
в експерименті видавалась йому під час об-
робки його запиту, якщо в ньому вже не
було вказано версії. Для подібного марку-
вання користувачів використовувалися
cookie-файли, переваги та недоліки яких ро-
зглянуті в наступних розділах статті. В ре-
зультаті проведеного експерименту було
отримано табл. 1.
Таблиця 1
Результат перевірки гіпотез
Як видно з табл 1, частина гіпотез не
виправдали себе. Наприклад, ремаркетинг
не завжди доцільно застосовувати, а сорту-
вання за віддаленістю від полігону пошуку
не дало очікуваних результатів.
В результаті розробленого алгоритму
вдалося отримати збільшення показника
CTR з 0.47% до 0.55%. За базову версію, з
якою було порівняно розроблений алго-
ритм, було прийнято тривіальну версію ал-
горитму фільтрації з додавання зваженого
сортування.
Назва Результат
тесту
Результат
CTR
Один об’єкту
з ремаркети-
нгу
Значимі
зміни
+7.1%
Сортування
об’єктів
Незначимі
зміни
0%
Пошук у роз-
ширеному по-
лігоні
Значимі
зміни
+2%
Додавання 2
об’єктів з ре-
маркетингу
Незначимі
зміни
0%
184
Прикладне програмне забезпечення
Фінальний алгоритм зображено на
Рис.1
В алгоритмі присутні кроки для роз-
ширення географії пошуку, і їхню роботу ва-
рто розглянути детальніше. Розширення
опуклого полігону не є складною задачею.
Треба знайти його центр, знайти вектори від
нього до вершин полігону і кожну вершину
зсунути за відповідним вектором. Але, якщо
географічний полігон не опуклий, то описа-
ний вище метод не працює. Для того, щоб
усунути цю проблему, було вирішено для
кожного полігону знаходити опуклу оболо-
нку за допомогою алгоритму побудови опу-
клої оболонки монотонним ланцюжком Ен-
дрю (Andrew's monotone chain convex hull al-
gorithm) [16] і після цього застосовувати ро-
зширення.
Цей підхід забезпечує правильність
розширення для будь-якого типу полігону,
незалежно від його початкової форми. Та-
ким чином, використання алгоритму побу-
дови опуклої оболонки є важливим етапом у
процесі розширення географічного пошуку,
що забезпечує точність та надійність резуль-
татів. Приклади результату знаходження
опуклої оболонки та розширення зображено
на Рис.2,3 відповідно.
Отже, серед плюсів даного підходу
можна виділити наступні:
1. Гнучкість у налаштуванні для пев-
ної сфери, здатність використовувати спе-
цифічні доменні знання.
2. Хороша інтерпретованість, ре-
зультуючий алгоритм можна представити у
вигляді блок-схеми.
3. Не вимагає значних обчислюваль-
них ресурсів та даних для навчання, напри-
клад, моделі машинного навчання або гене-
тичного алгоритму.
Водночас у даного підходу є й мі-
нуси:
1. Розроблений алгоритм не є універ-
сальним і може бути застосований тільки
для конкретної предметної області;
Рис. 1. Алгоритм контекстної реклами
Рис. 2. Приклад знаходження опуклої обо-
лонки полігону
Рис. 3. Приклад розширення опуклого
полігону.
185
Прикладне програмне забезпечення
2. Для перевірки кожної гіпотези не-
обхідний тривалий час;
3. Неможливо перевірити кілька гі-
потез одночасно.
Впровадження ремаркетингу
Як було продемонстровано в попере-
дньому розділі, ремаркетинг може підви-
щити показники CTR, тож його варто вико-
ристовувати.
Очевидним є рішення зберігати рек-
ламні оголошення, показані користувачу че-
рез контекстну рекламу, але це рішення не є
оптимальним через те, що користувач із бі-
льшою вірогідністю натрапить на сайт ого-
лошення не через рекламу, а через інші дже-
рела трафіку.
Одним із варіантів рішення цієї про-
блеми є встановлення спеціального коду на
сторінку оголошення, на кшталт Facebook
Pixel [17], який буде робити певні дії для
збереження інформації про перегляд корис-
тувачем даного оголошення.
Є кілька варіантів розробки подіб-
ного ПЗ. У статті під час дослідження був
використаний метод, який вимагає невели-
кої кількості ресурсів: код на сторінці оголо-
шення зберігає дані про перегляд користува-
чем в cookie-файлах браузера, тобто на боці
користувача. Завдяки цьому не треба витра-
чати ресурси на зберігання подібних даних
на серверах, особливо враховуючи, що біль-
шість із цієї інформації не знадобиться, а та-
кож на впровадження складних методів від-
битка браузера [18]. Більше того, щодо
сайту, на якому розміщено рекламу, не
треба буде робити жодних додаткових дій,
бо cookie-файли будуть автоматично відпра-
влятись на API для отримання реклами ра-
зом із HTTP запитом.
Алгоритм дій розглянутого методу
ремаркетингу наступний:
1. Користувач заходить на сайт з ого-
лошенням, на якому працює вбудований
код;
2. Вбудований код розміщує інфор-
мацію в cookie-файли користувача про те,
що він відвідав певне оголошення. У cookie-
файлі вказується домен сервісу, який відпо-
відає за контекстну рекламу;
3. Коли користувач заходить на сто-
рінку сайт з оголошеннями (не обов’язково
сайт з кроку 1), разом з тілом запиту відпра-
вляються також потрібні cookie-файли.
У свою чергу оголошення найімовір-
ніше будуть розміщенні на веб- сайтах з ін-
шими доменами, що призводить до наступ-
них проблем використаного методу:
1. Політика сучасних веб-браузерів
стосовно cookie-файлів, спрямована на захи-
щення приватності користувачів [19], в ре-
зультаті, складніше відстежувати їхні дії;
2. Якщо створювати cookie-файли за
замовчуванням, то через виконання cross-
site запитів вони не будуть передаватись на
сервер [20].
Із першим пунктом з боку розробки
важко щось вдіяти, а для рішення другого
недоліку у параметрах cookie-файлу було
явно вказано значення параметру SameSite у
None та Secure, які дозволяють здійснювати
потрібні запити з передаванням cookie-фай-
лів.
Отже, ремаркетинг можна впрова-
джувати різними способами, але, якщо
треба використовувати найменше ресурсів,
вірним рішенням є збереження інформації
на боці користувача. Звісно, політика і оно-
влення сучасних веб-браузерів роблять по-
дібний підхід менш ефективним для деяких
користувачів, зокрема, Safari постійно онов-
лює свою систему інтелектуального запобі-
гання відстеженню [21].
Швидкість роботи
Окрім головної складової задачі, суть
якої максимізувати вірогідність того, що ко-
ристувач зацікавиться побаченою рекла-
мою, існує також побічна складова, яка
впливає на результат: мінімізація часу по-
шуку потрібних продуктів та часу видачі ко-
нтенту по даних продуктах на сайт, бо за-
тримка видачі має значний вплив на CTR
[22].
На швидкість роботи програмного за-
безпечення може впливати багато факторів,
такі як вибір мови програмування, сама реа-
лізація алгоритму, налаштування бази даних
тощо. Попри великий вплив перелічених фа-
кторів, кожен із них потребує окремого дос-
186
Прикладне програмне забезпечення
лідження і доопрацювання під конкретну
реалізацію. В даному дослідженні пропону-
ється універсальний метод, який можна за-
стосувати, не зважаючи на деталі реалізації
програмного забезпечення, а саме викорис-
тання кешування. Кешування є розповсю-
дженою технікою, здатною покращувати,
наприклад, швидкість завантаження в пошу-
кових системах [23], аналогом якої можна
назвати алгоритм для контекстної реклами,
представлений на Рис.1.
У контексті саме програмного забез-
печення для контекстної реклами варто за-
значити, що неможливо кешувати відповідь
на окремий запит. Для цього за ключ для
кешу треба було б використати, наприклад,
хеш запиту. Але через cookie-файли корис-
тувача, значення яких різні у різних корис-
тувачів, таке кешування не принесе бажа-
ного результату, адже запити з подібними
параметрами будуть нечастими.
Враховуючи згадані вище фактори, в
дослідженні пропонується схема кешу-
вання, в якій зберігається не відповідь на за-
пит, а відповідь за конкретним оголошенням
нерухомості. Це обумовлено тим, що пара-
метри, за якими працює алгоритм з Рис.1, та
параметри для рекламного оголошення, яке
побачить користувач, можуть значно відріз-
нятися. Приклад оголошення зображено на
Рис.4.
На прикладі оголошення можна виді-
лити різні параметри: зображення, рекламні
тексти, назви вулиць, особливості об’єкта,
посилання на перехід за оголошенням. Вони
не беруть участь у алгоритмі контекстної ре-
клами (Рис.1), але для того, щоб їх заванта-
жити з БД, потрібен час (особливо, якщо БД
має непросту схему), тож саме його можна
зекономити за рахунок кешування.
Зображення подібного кешування на
прикладі простої архітектури програмного
забезпечення, яка складається з трьох ком-
понентів, наведене на Рис.5.
Схема роботи програмного забезпе-
чення з подібним впровадженням кешу-
вання зображена на діаграмі послідовності
на Рис.6.
Як видно з Рис.6, кешується саме ре-
кламний контент, а запити для роботи алго-
ритму з Рис.1 робляться окремо, без окре-
мого кешування (кешування на рівні бази
даних, звісно, може бути). Також застосо-
вується статичне кешування, тобто після
створення кешу він не змінюється до вида-
лення.
Варто зазначити також негативний
вплив кешування, а саме затримка між змі-
ною певних параметрів товару, та їхнім ві-
Рис. 4. Приклад рекламного оголошення
Рис. 5. Архітектура ПЗ.
Рис. 6. Діаграма послідовності ПЗ.
187
Прикладне програмне забезпечення
дображенням у рекламному оголошенні. В
даній задачі це не є проблемою, адже проду-
кти змінюються рідше, ніж показуються ко-
ристувачам. Якщо ця проблема буде значи-
мою, вирішенням може бути видалення
кешу по ключу конкретного оголошення пі-
сля його оновлення.
Отже, швидкість роботи програмного
забезпечення є важливою складовою для ус-
піху контекстної реклами. Вона залежить
від багатьох факторів, але, незважаючи на
них, можна пришвидшити систему та зняти
навантаження з бази даних або інших серві-
сів, використовуючи кешування. На Рис.6
продемонстровано, як саме виглядає діаг-
рама послідовності для найпростішого при-
кладу подібного ПЗ з Рис.3, та описано пе-
реваги і причини використання саме такого
підходу.
Висновки
Проблема контекстної реклами та,
зокрема, спонсорованого пошуку має багато
можливостей для напрямків дослідження. В
статі було запропоновано один з варіантів
розв’язання задачі спонсорованого пошуку,
з обмеженням в області застосування і мож-
ливій рекламній платформі (агрегатор ого-
лошень). Водночас виділено декілька скла-
дових задачі, а саме: побудова алгоритму
контекстної реклами, впровадження додат-
кового контексту за рахунок ремаркетингу
та швидкість роботи програмного забезпе-
чення доставлення реклами, що реалізує за-
даний алгоритм.
Представлений підхід для побудови
алгоритму контекстної реклами базується на
знанні предметної області (розглянута саме
нерухомість) та на наявності платформи аг-
регатора оголошень із користувачами, за-
вдяки чому можна проводити A/B-тесту-
вання. Даний підхід буде доречним для ком-
паній, які не мають ресурсів для впрова-
дження складних моделей машинного нав-
чання й підтримки відповідної якості та
об’єму даних. Однак водночас - мають
знання предметної області та час на переві-
рку своїх гіпотез. Окрім цього, легка інтерп-
ретованість алгоритму може бути плюсом у
спілкуванні з потенційними клієнтами та
подальшої розробки. Іншим результатом до-
слідження є доведення впливу ремаркетингу
та розширення географії на кінцевий CTR
реклами нерухомості, який вдалося збіль-
шити з 0.47% до 0.55%. Експеримент із
впровадження алгоритму проводився в умо-
вах реального сайту-агрегатора, який мав
100 тисяч рекламних переглядів на день.
Також в роботі представлено метод
впровадження ремаркетингу, який не вима-
гає істотних ресурсів, зокрема, окремого
сховища даних, бо всі дані будуть зберіга-
тися на боці користувачів. А сайти, на яких
розміщується реклама, не мають додатково
працювати з цією інформацією. В роботі та-
кож розглянуті мінуси та обмеження такого
підходу до ремаркетингу, наприклад те, що
він може не працювати для певних браузерів
та з налаштуваннями приватності користу-
вача. Перевагою зазначеного підходу є лег-
кість впровадження, оцінка якої базується
на кількості програмного забезпечення, яке
необхідно розробити або доробити.
Швидкість роботи ПЗ, є важливою
складовою роботи подібних програмних си-
стем, але й залежить від багатьох факторів.
У роботі продемонстровано універсальний
підхід для пришвидшення, а саме викорис-
тання кешування, але за ключа для кешу ви-
користовувались не запити користувачів, а
ідентифікатори рекламних продуктів через
велику варіативність запитів користувачів,
різний контекст користувачів та вірогідність
випадковості в алгоритмі, яка виникає через
зважене сортування.
Отже, за трьома визначеними напря-
мками дослідження в рамках контекстної
реклами було окреслено проблеми, які вини-
кають під час розроблення, а також потен-
ційні шляхи їх рішення.
Подяка
Вдячні компанії «ЛУН» за надання
платформи та технічної підтримки, що до-
зволило провести експерименти з розроб-
лення алгоритму контекстної реклами.
References
1. Kohavi, R. and Thomke, S., 2017. The Sur-
prising Power of Online Experiments. Har-
188
Прикладне програмне забезпечення
vard Business Review, September, pp.74-
82.
2. Dao, T.H., Jeong, S.R. and Ahn, H., A novel
recommendation model of location-based
advertising: Context-Aware Collaborative
Filtering using GA approach. Available at:
https://doi.org/10.1016/j.eswa.2011.09.070
. Accessed [25 November 2023].
3. Karimzadehgan, M., Li, W., Zhang, R. and
Mao, J., A stochastic learning-to-rank algo-
rithm and its application to contextual ad-
vertising. Available at:
https://doi.org/10.1145/1963405.1963460.
Accessed [5 December 2023].
4. Mao, J., 2010. Scientific Challenges in
Contextual Advertising. In: Rough Set and
Knowledge Technology, pp.2-2. Available
at: https://doi.org/10.1007/978-3-642-
16248-0_2. Accessed [13 December 2023].
5. Isoraite, M., Remarketing Features. Availa-
ble at: https://www.ijtsrd.com/pa-
pers/ijtsrd28031.pdf. Accessed [20 Decem-
ber 2023].
6. Bai, X., Ordentlich, E., Zhang, Y., Feng, A.,
Ratnaparkhi, A., Somvanshi, R. and
Tjahjadi, A., 2018. Scalable Query N-Gram
Embedding for Improving Matching and
Relevance in Sponsored Search. In: Pro-
ceedings of the 24th ACM SIGKDD Inter-
national Conference on Knowledge Discov-
ery & Data Mining. Available at:
https://doi.org/10.1145/3219819.3219897.
Accessed [10 January 2024].
7. Grbovic, M., Djuric, N., Radosavljevic, V.,
Silvestri, F., Baeza-Yates, R., Feng, A., Or-
dentlich, E., Yang, L. and Owens, G., 2016.
Scalable Semantic Matching of Queries to
Ads in Sponsored Search Advertising. In:
Proceedings of the 39th International ACM
SIGIR conference on Research and Devel-
opment in Information Retrieval. Available
at:
https://doi.org/10.1145/2911451.2911538.
Accessed [11 January 2024].
8. Zhu, Y., Han, C., Zhan, Y., Pang, B., Li, Z.,
Sun, H., Li, S., Shi, B., Duan, N., Deng, W.,
Zhang, R., Zhang, L. and Zhang, Q., 2022.
AdsCVLR: Commercial Visual-Linguistic
Representation Modeling in Sponsored
Search. In: Proceedings of the 30th ACM
International Conference on Multimedia.
Available at:
https://doi.org/10.1145/3503161.3548226.
Accessed [14 January 2024].
9. Lakshmanarao, A., Ushanag, S. and Leela,
B., 2021. Ad Prediction using Click
Through Rate and Machine Learning with
Reinforcement Learning. In: 2021 Fourth
International Conference on Electrical,
Computer and Communication Technolo-
gies (ICECCT), pp.1-5. Available at:
https://doi.org/10.1109/ICECCT52121.202
1.9616653. Accessed [19 January 2024].
10. Zhang, H., Yan, J. and Zhang, Y., 2020.
CTR Prediction Models Considering the
Dynamics of User Interest. IEEE Access, 8,
pp.72847-72858. Available at:
https://doi.org/10.1109/AC-
CESS.2020.2988115. Accessed [21 Janu-
ary 2024].
11. Gligorijevic, J., Gligorijevic, D., Stojkovic,
I., Bai, X., Goyal, A. and Obradovic, Z.,
2018. Deeply Supervised Semantic Model
for Click-Through Rate Prediction in Spon-
sored Search. Available at:
https://doi.org/10.48550/arXiv.1803.10739
. Accessed [21 January 2024].
12. Gupta, N., Mujumdar, S., Patel, H., Ma-
suda, S., Panwar, N., Bandyopadhyay, S.,
Mehta, S., Guttula, S., Afzal, S., Mittal, R.
and Munigala, V., 2021. Data Quality for
Machine Learning Tasks. In: Proceedings
of the 27th ACM SIGKDD Conference on
Knowledge Discovery & Data Mining.
Available at:
https://doi.org/10.1145/3447548.3470817.
Accessed [22 January 2024].
13. Wang, M., Fu, W., He, X., Hao, S. and Wu,
X., 2020. A Survey on Large-Scale Ma-
chine Learning. IEEE Transactions on
Knowledge and Data Engineering, 34,
pp.2574-2594. Available at:
https://doi.org/10.1109/tkde.2020.3015777
. Accessed [25 January 2024].
14. Delfianto, R., Khodra, M. and Roesli, A.,
2011. Content-targeted advertising using
genetic programming. In: Proceedings of
the 2011 International Conference on Elec-
trical Engineering and Informatics, pp.1-5.
Available at:
https://doi.org/10.1109/ICEEI.2011.60215
92. Accessed [27 January 2024].
15. Fernández-Durán, L., Llorca, A., Ruiz, N.,
Valero, S. and Botti, V., The impact of lo-
cation on housing prices: applying the Arti-
ficial Neural Network Model as an analyti-
cal tool. Available at:
https://ideas.repec.org/p/wiw/wiwrsa/ersa1
1p1595.html. Accessed [1 March 2024].
189
Прикладне програмне забезпечення
16. Andrew, A.M., 1979. Another Efficient Al-
gorithm for Convex Hulls in Two Dimen-
sions. Info. Proc. Letters, 9, pp.216-219.
Accessed [2 March 2024].
17. Vicentin, V.L. and Petrucelli, E.E., Utiliza-
tion of the facebook pixel tool to optimize
conversion of campaigns in paid advertis-
ing. Available at:
https://doi.org/10.31510/infa.v16i2.648.
Accessed [5 March 2024].
18. Zhang, D., Zhang, J., Bu, Y., Chen, B., Sun,
C. and Wang, T., A Survey of Browser Fin-
gerprint Research and Application. Availa-
ble at:
https://doi.org/10.1155/2022/3363335. Ac-
cessed [9 March 2024].
19. Chromium Blog, Improving privacy and se-
curity on the web. Available at:
https://blog.chromium.org/2019/05/im-
proving-privacy-and-security-on-web.html.
Accessed [11 March 2024].
20. Khodayari, S. and Pellegrino, G., 2022. The
State of the SameSite: Studying the Usage,
Effectiveness, and Adequacy of SameSite
Cookies. In: 2022 IEEE Symposium on
Security and Privacy (SP), pp.1590-1607.
Available at:
https://doi.org/10.1109/sp46214.2022.9833
67. Accessed [15 March 2024].
21. Safari Privacy Overview, n.d. Available at:
https://www.apple.com/safari/docs/Safari_
White_Paper_Nov_2019.pdf. Accessed [15
March 2024].
22. Bai, X. and Cambazoglu, B., 2019. Impact
of response latency on sponsored search.
Inf. Process. Manag., 56, pp.110-129.
Available at:
https://doi.org/10.1016/J.IPM.2018.10.005.
Accessed [17 March 2024].
23. Baeza-Yates, R., Gionis, A., Junqueira, F.,
Murdock, V., Plachouras, V. and Silvestri,
F., n.d. The impact of caching on search
engines. Available at:
https://doi.org/10.1145/1277741.1277775.
Accessed [18 March 2024].
Одержано: 10.04.2024
Внутрішня рецензія отримана: 18.04.2024
Зовнішня рецензія отримана: 19.04.2024
Про автора:
1Громенко Владислав Віталійович,
аспірант.
https://orcid.org/0009-0001-5285-9912.
Місце роботи автора:
1Інститут програмних систем
НАН України,
тел. +38-044-522-62-42
E-mail: ukrprog@isofts.kiev.ua
Сайт: www.iss.nas.gov.ua
|