АЛГОРИТМ ВИМІРЮВАННЯ ПОДІБНОСТІ МІТОК ДІЯЛЬНОСТЕЙ НА ОСНОВІ NLP У БАЗІ ДАНИХ МОДЕЛЕЙ БІЗНЕС-ПРОЦЕСІВ

Автор(и)

  • Андрій Копп Національний технічний університет «Харківський політехнічний інститут», Україна https://orcid.org/0000-0002-3189-5623
  • Дмитро Орловський Національний технічний університет «Харківський політехнічний інститут», Україна https://orcid.org/0000-0002-8261-2988

DOI:

https://doi.org/10.20998/2079-0023.2023.01.08

Ключові слова:

модель бізнес-процесу, база даних моделей бізнес-процесів, обробка природної мови, алгоритм вимірювання подібності, мітки діяльностей, програмна реалізація алгоритму

Анотація

Моделювання бізнес-процесів є важливою частиною організаційного управління, оскільки дозволяє компаніям отримати уявлення про свої операційні бізнес-процеси та знайти можливості для розвитку. Однак оцінити та кількісно виміряти схожість декількох моделей бізнес-процесів може бути складно, оскільки ці моделі часто сильно відрізняються за структурою та номенклатурою. Це дослідження пропонує підхід, який використовує методи обробки природної мови для оцінки схожості моделей бізнес-процесів, для розв’язку цієї задачі. Алгоритм використовує мітки діяльностей, наведені в моделях бізнес-процесів, як вхідні дані для створення текстових описів пов’язаних бізнес-процесів. Алгоритм включає декілька етапів попередньої обробки, щоб гарантувати, що текстові описи є коректними і послідовними. Спочатку з отриманих текстових описів вилучаються окремі слова і представляються у нижньому регістрі. Після цього з отриманих слів видаляються всі нелітерні та стоп-слова. Потім слова, що залишилися, піддаються стемінгу, тобто приведенню до їхньої базової форми. Після підготовки та попередньої обробки текстових описів алгоритм оцінює схожість різних моделей бізнес-процесів за допомогою мір схожості, включаючи коефіцієнти Жаккара, Соренсена – Дайса, перетину та простого коефіцієнту відповідності. Ці метрики забезпечують більш детальне розуміння подібності і відмінності між різними моделями бізнес-процесів, які потім можуть бути використані для впливу на прийняття рішень та ініціатив щодо вдосконалення бізнес-процесів. Програмна реалізація запропонованого алгоритму демонструє його використання для вимірювання подібності в базі даних моделей бізнес-процесів. Експерименти демонструють, що розроблений алгоритм є на 31 % швидшим за пошук на основі виразу SQL LIKE, а також дозволяє знайти на 18 % більше подібних моделей у базі даних моделей бізнес-процесів.

Біографії авторів

Андрій Копп, Національний технічний університет «Харківський політехнічний інститут»

доктор філософії (PhD), доцент, Національний технічний університет «Харківський політехнічний інститут», доцент кафедри програмної інженерії та інтелектуальних технологій управління, м. Харків, Україна

Дмитро Орловський, Національний технічний університет «Харківський політехнічний інститут»

кандидат технічних наук (PhD), доцент, Національний технічний університет «Харківський політехнічний інститут», доцент кафедри програмної інженерії та інтелектуальних технологій управління, м. Харків, Україна

Посилання

Geiger M. et al. BPMN 2.0: The state of support and implementation. Available at: https://doi.org/10.1016/j.future.2017.01.006 (accessed 01.04.2023).

Fettke P. et al. Business Process Reference Models: Survey and Classification. Available at: https://doi.org/10.1007/11678564_44 (accessed 01.04.2023).

APQC Process Classification Framework. Available at: https://www.signavio.com/reference-models/apqc-framework/ (accessed 01.04.2023).

SCOR Model. Available at: https://scor.ascm.org/ (accessed 01.04.2023).

Dumas M. et al. Similarity Search of Business Process Models. Available at: http://sites.computer.org/debull/A09sept/marlon.pdf (accessed 02.04.2023).

Dijkman R. Similarity of business process models: Metrics and evaluation. Available at: https://doi.org/10.1016/j.is.2010.09.006 (accessed 02.04.2023).

Humm B. G., Fengel J. Semantics-Based Business Process Model Similarity. Available at: https://doi.org/10.1007/978-3-642-30359-3_4 (accessed 02.04.2023).

Yan Z., Dijkman R. Fast business process similarity search. Available at: https://doi.org/10.1007/s10619-012-7089-z (accessed 02.04.2023).

van Dongen B. et al. Measuring Similarity between Business Process Models. Available at: https://doi.org/10.1007/978-3-540-69534-9_34 (accessed 02.04.2023).

Kopp A. M., Orlovskyi D. L. Estimation and analysis of business process models similarity in enterprise continuum repository. Available at: https://doi.org/10.20535/SRIT.2308-8893.2018.4.04 (accessed 02.04.2023).

Verma V., Aggarwal R. K. A comparative analysis of similarity measures akin to the Jaccard index in collaborative recommendations: empirical and theoretical perspective. Available at: https://doi.org/10.1007/s13278-020-00660-9 (accessed 04.04.2023).

Kopp A., Orlovskyi D. The approach and the software tool to calculate semantic quality measures of business process models. Available at: http://dx.doi.org/10.20998/2079-0023.2022.02.12 (accessed 04.04.2023).

Python. Available at: https://www.python.org/ (accessed 06.04.2023).

NLTK. Available at: https://www.nltk.org/ (accessed 06.04.2023).

MySQL Connector/Python Developer Guide. Available at: https://dev.mysql.com/doc/connector-python/en/ (accessed 06.04.2023).

MySQL. Available at: https://www.mysql.com/ (accessed 07.04.2023).

Porter Stemmer. Available at: https://tartarus.org/martin/PorterStemmer/ (accessed 08.04.2023).

BPMN for research. Available at: https://github.com/camunda/bpmn-for-research (accessed 10.04.2023).

##submission.downloads##

Опубліковано

2023-07-15

Як цитувати

Копп, А., & Орловський, Д. (2023). АЛГОРИТМ ВИМІРЮВАННЯ ПОДІБНОСТІ МІТОК ДІЯЛЬНОСТЕЙ НА ОСНОВІ NLP У БАЗІ ДАНИХ МОДЕЛЕЙ БІЗНЕС-ПРОЦЕСІВ. Вісник Національного технічного університету «ХПІ». Серія: Системний аналiз, управління та iнформацiйнi технологiї, (1 (9), 54–59. https://doi.org/10.20998/2079-0023.2023.01.08

Номер

Розділ

МАТЕМАТИЧНЕ І КОМП’ЮТЕРНЕ МОДЕЛЮВАННЯ