МОДЕЛЮВАННЯ СЕМАНТИЧНОГО ЯДРА ВЕБ РЕСУРСУ

Автор(и)

  • Сергій Орєхов Національний технічний університет «Харківський політехнічний інститут» https://orcid.org/0000-0001-2345-6789
  • Геннадій Малигон Національний технічний університет «Харківський політехнічний інститут» https://orcid.org/0000-0001-5448-2488

DOI:

https://doi.org/10.20998/2079-0023.2021.01.08

Анотація

У статті представлена спроба описати математично ефект семантичного ядра веб ресурсу в середовищі Інтернет. Відповідно до теорії маркетингу продукт, який ми бажаємо продати в мережі, характеризуються такими основними властивостями: ціна, час і місце. Іншими словами потенційний покупець бажає отримати заданий товар в потрібному місці в заданий час. Щоб задовольнити цю потребу, треба використовувати класичну компоненту маркетингу просування товару. Однак зараз ця компонента стає повністю віртуальним інструментом. Цей інструмент функціонує в середовищі гіпертекстів, відео та зображень. Тому користувач аналізує зміст даних елементів, щоб отримати бажаний товар. Результати виконаних в цій області веб проектів свідчать про появу нового явища, яке відображає основний зміст віртуального просування – це семантичне ядро. Ядро являє собою коротку анотацію основних властивостей товару, його місце розташування і час появи. Тому метою даної статті є як презентація нового об'єкта дослідження, так і математичний опис. Передбачається, що семантичне ядро формується на основі термінів природної мови. Іншими словами семантичне ядро – це безліч ключових слів, які згруповані за змістом. Ми пропонуємо використовувати для угрупування термінів підходи технології Data mining по кластеризації. Класичним методом кластеризації на даний момент є k-середніх. У статті представлена модель семантичного ядра на основі даного методу. Цей метод і його функції дистанції розглядаються як другий етап обробки веб контенту. На першому етапі веб контент конвертується в семантичну мережу. Однак методика kсередніх має суттєві недоліки при моделюванні семантичного ядра. Тому в розвитку даної ідеї в роботі показаний альтернативний шлях до моделювання ядра. В якості альтернативного підходу розглядається побудови кластерів на основі концепції максимального потоку. Цей підхід має істотну перевагу, яке полягає в тому, що тип зв'язків в семантичної мережі перегукується з типом функції дистанції в даному методі. В результаті на реальному веб проект продемонстрований ефект зв'язку між моделлю семантичного ядра і рівнем нових користувачів веб ресурсу протягом останніх п'яти років.

Ключові слова: семантичне ядро, ключове слово, метод k-середніх, максимальний потік.

Біографії авторів

Сергій Орєхов, Національний технічний університет «Харківський політехнічний інститут»

кандидат технічних наук, доцент кафедри програмної інженерії та інформаційних технологій управління; м. Харків, Україна; ORCID: https://orcid.org/0000-0002-5040-5861; e-mail: sergey.v.orekhov@gmail.com

Геннадій Малигон, Національний технічний університет «Харківський політехнічний інститут»

аспірант кафедри програмної інженерії та інформаційних технологій управління; м. Харків, Україна; ORCID: https://orcid.org/0000-0001-5448-2488; e-mail: gmalygon@gmail.com

Посилання

Godlevsky M., Orekhov S., Orekhova E. Theoretical Fundamentals of Search Engine Optimization Based on Machine Learning. CEUR WS. USA, 2017. vol. 1844, pp. 23–32.

Orekhov S., Malyhon H., Stratienko N., Goncharenko T. Software Development for Semantic Kernel Forming. CEUR WS. USA, 2021. vol. 2870. pp. 1312–1322.

Amit K. Artificial Intelligence and Soft Computing. Behavioral and Cognitive Modeling of the Human Brain. USA: CRC Press LLC Publ., 2000. 788 p.

Konnov I. V., Kashina O. A., Gilmanova E. I. Reshenie zadachi klasterizazii metodamai optmizazii na grafah [Solution of clusterization problem by graph optimization methods]. Uchenye Zapiski Kazanskogo Universiteta. Seriya Fiziko-Matematicheskie Nauki [Scientific bulletin of Kazan University. Physical and Mathematical Series]. Kazan, Kazan University Publ., 2019, issue 161, no. 3, pp. 423–437.

Cherenkov I, Orekhov S. Approach for extracting events from news stream. Eastern–European Journal of Enterprise Technologies. 2013. vol. 1, no. 4 (61), pp. 62–64.

Preisach C., Burkhardt H., Schmidt-Thieme L, Decker R. Data Analysis, Machine Learning and Applications. Germany: SpringerVerlag Publ., 2008. 703 p.

Han J., Kamber M, Pei J. Data Mining Concepts and Techniques. USA: Morgan Kaufmann Publ., 2012. 740 p.

Shumeyko А.А., Sotnik S.L. Intellektualnuy analyz dannuh. Vvedeniye v Data Mining [Intelligent data analysis. Introduction in Data Mining]. Dnepr: Belaya Publ., 2015. 223 p.

Willams U. Т., Lans D. N. Metodu ierarhicheskoy klassifikazii [Methods of hierarchical classification]. Statistical methods of computer machine. Moscow: Nauka Publ., 1986. pp. 269–301.

Venugopal K.R., Srinivasa K.G. and Patnaik L.M. Soft Computing for Data Mining Applications. Germany: Springer Publ., 2009. 354 p.

Witten Ian H., Frank E. Data Mining. Practical Machine Learning Tools and Techniques. USA: Morgan Kaufmann Publ., 2009. 558 p.

Duran B. Klasternuy analiz [Cluster analysis]. Moscow: Statistica Publ., 1977. 128 p.

Zamyatin A. V. Intelektualnuy analiz dannuh. Uchebnoe posobie [Intelligent data analysis: tutorial]. Tomsk: Tomsk state university Publ., 2016. 120 p.

##submission.downloads##

Опубліковано

2021-07-12

Номер

Розділ

МАТЕМАТИЧНЕ І КОМП’ЮТЕРНЕ МОДЕЛЮВАННЯ