ЗАДАЧА КЛАСИФІКАЦІЇ СЕМАНТИЧНИХ ЯДЕР ВЕБ РЕСУРСУ

Автор(и)

  • Сергій Орєхов Національний технічний університет «Харківський політехнічний інститут», Ukraine https://orcid.org/0000-0001-2345-6789
  • Геннадій Малигон Національний технічний університет «Харківський політехнічний інститут», Ukraine https://orcid.org/0000-0001-5448-2488
  • Наталія Стратієнко Національний технічний університет «Харківський політехнічний інститут», Ukraine https://orcid.org/0000-0002-7925-6687

DOI:

https://doi.org/10.20998/2079-0023.2022.01.09

Ключові слова:

семантичне ядро, ключове слово, метод Форда – Фалкерсона, К-претендент

Анотація

У статті представлено нову теоретичну базу для вирішення задачі ситуаційного управління семантичними ядрами, виділеними на основі ВЕБ контенту. Таке завдання виникає у рамках нового феномена під назвою віртуальне просування. Суть його полягає в тому, що реальний товар може існувати у двох реальностях: онлайн та офлайн. Відповідно до теорії маркетингу час життя у двох реальностях одне й теж. Однак у режимі онлайн товар існує самостійно і згідно із законами застосування Інтернет технологій. Тому в роботі на основі концепції маркетингового каналу було запропоновано розглядати повідомлення у такому каналі як семантичне ядро. Ядро є спеціально виділене безліч ключових слів, які коротко описують товар та відповідну йому потребу. Було запропоновано, кожна потреба формує так званий клас потреби. Отже, опис товару або належатиме даному класу чи ні. З іншого боку, товар можна описати іншим набором ключових слів, отже у клас потреби потраплять різні описи однієї й тієї ж товару чи кількох товарів, якщо такі є для підприємства продажу. В результаті в цій роботі було запропоновано вважати центр такого класу так званим К-претендентом. Саме К-претендент і буде тим семантичним ядром, яке на поточній ітерації процесу ситуаційного управління розглядатиметься. Крім того, для переходу від однієї ситуації до іншої, тобто від одного ядра до іншого, потрібно мати таке альтернативне ядро. Його можна сміливо брати або з околиці центроїду класу потреби (Кпретендента), або центроїд іншого класу (інший К-претендент), якщо товар може покрити кілька потреб потенційного покупця. Тоді актуальне завдання класифікації класів потреб на основі текстового корпусу у форматі HTML. Маючи текстовий корпус першому етапі реалізується завдання синтезу семантичних ядер, та був власне завдання класифікації. У цій статті запропоновано постановку завдання класифікації з урахуванням особливостей, що вносять Інтернет технології, пов’язані з пошуковою оптимізацією. Зокрема, запропоновано використовувати чотири метрики з розряду ВЕБ статистики. І далі запропоновано використовувати метод кластеризації для виділення класів потреб з урахуванням того, що К-претендент представлений як семантична мережа або як граф.

Біографії авторів

Сергій Орєхов, Національний технічний університет «Харківський політехнічний інститут»

кандидат технічних наук, доцент, Національний технічний університет «Харківський політехнічний інститут», доцент кафедри програмної інженерії та інтелектуальних технологій управління; м. Харків, Україна

Геннадій Малигон, Національний технічний університет «Харківський політехнічний інститут»

аспірант, Національний технічний університет «Харківський політехнічний інститут», аспірант кафедри програмної інженерії та інтелектуальних технологій управління; м. Харків, Україна

Наталія Стратієнко, Національний технічний університет «Харківський політехнічний інститут»

кандидат технічних наук, доцент, Національний технічний університет «Харківський політехнічний інститут», професор кафедри програмної інженерії та інтелектуальних технологій управління; м. Харків, Україна

Посилання

Aggarwal C. C., Zhai C. X. A survey of text classification algorithms. Mining Text Data. Berlin: Springer Science-Business Media LLC Publ., 2012, pp. 163–222.

Ostapez А. А. Reshayuschie pravila dlya ansamblya iz zepey veroyatnostnuh klassifikatorov pri reshenii zadach klasifikazii s peresekayuschimisya klassami. [Decision rules for an ensemble of chains of probabilistic classifiers in solving classification problems with intersecting classes] Machine learning and data analysis. Moscow: MFTI Publ., 2016, vol. 2, no. 3, pp. 276–285.

Pospelov D. А. Situazionnoye upravlenie: teoriya i praktika. [Situational management: theory and practice]. Moscow: Nauka Publ., 1986. 288 p.

Neelova N. М. Enziklopaediya poiskovogo prodvizeniya Ingate. [Encyclopedia of Search Engine Promotion Ingate]. Moscow: IP Androsov Publ., 2017. 541 p.

Brolina А. M. Кontextnaya reklama: profesionalnuy upgrate dlya uvelicheniya prodaz. Praktikum оt expertov. [Contextual advertising: a professional upgrade to increase sales. Workshop from experts]. Moscow: ООО «Ingate Reklama» Publ., 2015. 44 p.

Sharma U., Thakur K. S. A Study on Digital Marketing and its Impact on Consumers Purchase. International Journal of Advanced Science and Technology. 2020, no. 29(3), pp. 13096–13110.

García J., Lizcano D., Ramos C., Matos N. Digital Marketing Actions That Achieve a Better Attraction and Loyalty of Users: An Analytical Study. Future Internet. Switzerland: MDPI Publ., 2019, no. 11(130), pp. 1–16.

Godlevsky M., Orekhov S., Orekhova E. Theoretical Fundamentals of Search Engine Optimization Based on Machine Learning. CEUR WS, USA, 2017, vol. 1844, pp. 23–32.

Konnonov I. V., Kashina О. А., Gilmanova E. I. Reshenie zadachi klasterizazii metodami opimiozazii на графах. [Solving the clustering problem by optimization methods on graphs]. Scientific notes of Kazan University. Series of physical and mathematical sciences. Kazan: KPFU Publ., 2019, vol. 161, book 3, pp. 423–437.

Osipenko V. V. Dva pidhodu dо rozvajannya zadachi klasterizazii u shirokomy sensi z pozuzii induktuvnogo modelyuvannya. [Two approaches to solving the problem of clustering in a broad sense from the standpoint of inductive modeling]. Energy and automation. Kyiv: NUBPU Publ., 2014, no. 1, pp. 83–97.

Khan A., Baharudin B., Lee L., Khairullah K. A Review of Machine Learning Algorithms for Text-Documents Classification. Journal of advances in information technology. USA, 2010, vol. 1, no. 1, pp. 4–20.

Nedelko V. М. Issledovaniye efektovnosti nekotoruh lineynuh metodov klassifikazii nа modelnuh raspredeleniyah.[Investigation of the efficiency of some linear classification methods on model distributions]. Machine learning and data analysis. Moscow: MFTI Publ., 2016, vol. 2, no. 3, pp. 305–328.

Sivogolovko Е. Metodu ozenki kachestva chetkoy klasterizazii. [Methods for assessing the quality of clear clustering]. Computer tools in education. SPb.: LETI Publ., 2011, no. 4, pp. 14–31.

##submission.downloads##

Опубліковано

2022-07-06

Як цитувати

Орєхов, С., Малигон, Г., & Стратієнко, Н. (2022). ЗАДАЧА КЛАСИФІКАЦІЇ СЕМАНТИЧНИХ ЯДЕР ВЕБ РЕСУРСУ. Вісник Національного технічного університету «ХПІ». Серія: Системний аналiз, управління та iнформацiйнi технологiї, (1 (7), 57–60. https://doi.org/10.20998/2079-0023.2022.01.09

Номер

Розділ

ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ