Сучасні методи пошуку в системах архівування наукових робіт

Заголовок (англійською): 
Modern methods of searching in systems of archiving scientific works
Автор(и): 
Чуприна Х. М.
Литвиненко О. В.
Зазулін О. Ю.
Автор(и) (англ): 
Chupryna K.
Lytvynenko О.
Zazulin O.
Ключові слова (укр): 
сучасні методи пошуку; штучний інтелект; системи архівування наукових робіт; система депонування результатів інтелектуальної діяльності; нейронні мережі; машинне навчання; LLM
Ключові слова (англ): 
modern search methods; artificial intelligence; systems for archiving scientific works; a system for depositing the results of intellectual activity; neural networks; machine learning; LLM
Анотація (укр): 
В умовах цифровізації галузей економіки й освіти штучний інтелект постає як один з трендових напрямів розвитку технологій і проникає в життя як спеціалістів різних напрямів, так і вчених. Штучний інтелект, будучи складовою розвитку сучасного суспільства, набирає обертів використання в контексті розв’язання задач виробничого і освітнього характеру шляхом його інтеграції в ключові технології цифровізації. Кожного дня створюються десятки нових інструментів на основі штучного інтелекту, що автоматизують процеси для різних потреб. Однією з центральних проблем для ІТ-рішень штучного інтелекту є завдання «розуміння» тексту, точніше, отримання сенсу з тексту, написаного природною мовою. Саме до цього завдання, зрештою, зводяться практичні рішення розумних мовних технологій, що спрямовані на аналіз змісту тексту і можуть бути використані для розв’язання локальних задач при побудові інформаційної системи депонування результатів інтелектуальної діяльності. Зокрема, технології штучного інтелекту можна використати для: автоматизованого визначення наукового напряму, до якого належить зміст наукового документа, що подається на депонування; подальшої класифікації наукової роботи; формування набору метаданих; розроблення пошукового модуля системи. Стаття присвячена дослідженню різних методів пошуку й аналізу інформації в документі, що базуються на штучному інтелекті, та аналізу функціональних можливостей готових програмних рішень, що можуть бути корисні при побудові інформаційної системи депонування результатів інтелектуальної діяльності.
Анотація (англ): 
In the conditions of digitization of the economic and educational sectors, artificial intelligence appears as one of the trending areas of technology development and penetrates into the lives of both specialists of various fields and scientists. Artificial intelligence, being a component of the development of modern society, is gaining momentum in its use in the context of solving industrial and educational problems through its integration into key digitization technologies. Every day dozens of new tools based on artificial intelligence are created that automate processes for various needs. One of the central challenges for artificial intelligence IT solutions is the task of "understanding" text, or rather, extracting meaning from text written in natural language. Practical solutions of smart language technologies aimed at analyzing the content of the text and can be used to solve local problems when building an information system for depositing the results of intellectual activity are ultimately reduced to this task. In particular, artificial intelligence technologies can be used for: automated determination of the scientific direction to which the content of the scientific document submitted for deposit belongs; further classification of scientific work; formation of a set of metadata; development of the search module of the system. The article is devoted to the study of various methods of searching and analyzing information in a document, based on artificial intelligence, and analyzing the functional capabilities of ready-made software solutions that can be useful in building an information system for depositing the results of intellectual activity.
Публікатор: 
Київський національний університет будівництва і архітектури
Назва журналу, номер, рік випуску (укр): 
Управління розвитком складних систем, номер 54, 2023
Назва журналу, номер, рік випуску (англ): 
Management of Development of Complex Systems, number 54, 2023
Мова статті: 
Українська
Формат документа: 
application/pdf
Документ: 
Дата публікації: 
06 Октябрь 2023
Номер збірника: 
Розділ: 
ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ УПРАВЛІННЯ
Університет автора: 
Державна науково-технічна бібліотека України, Київ; Київський національний університет будівництва і архітектури, Київ
Литература: 
  1. URL: https://kepios.com/?utm_campaign=Digital_2022&utm_medium=Article&utm_source=Global_Digital_Reports.
  2. Статистика використання інтернету. The Internet Big Picture World Internet Users and Population Stats 2023.
  3. Сухий О. Л., Міленін В. М., Тарадайнік В. М. Алгоритми пошуку в інформаційних системах : методичні рекомендації. Київ, 2015.
  4. Ланде Д. В., Субач І. Ю., Бояринова Ю. Є. Основи теорії і практики інтелектуального аналізу даних у сфері кібербезпеки: навчальний посібник. Київ: ІСЗЗІ КПІ ім. Ігоря Сікорського, 2018. 300 с.
  5. Андон П. І., Глибовець А. М., Куриляк В. В. Побудова семантичної моделі зображення з використанням машинного навчання на базі згорткових нейронних мереж. Проблеми програмування. № 2 – 3. 2020. С. 354–364.
  6. Анісімов А. В., Марченко О. О., Никоненко А. О. Алгоритмічна модель асоціативно-семантичного контекстного аналізу текстів природною мовою. Проблеми програмування. 2008. № 2 – 3. С. 379–384.
  7. Бурячок В. Л., Толубко В. Б., Хорошко В. О., Толюпа С. В. Інформаційна та кібербезпека: соціотехнічний аспект: підручник; за заг. ред. д-ра техн. наук, професора В. Б. Толубка. Київ: ДУТ, 2015. 288 с.
  8. Прийма С. М., Рогушина Ю. В., Строкань О. В. Використання семантичних технологій для встановлення діалогу між суб'єктами ринку праці. Проблеми програмування. 2018. № 2 – 3. С. 226–235. URL: http://nbuv.gov.ua/UJRN/Progr_2018_2-3_28.
  9. Дерецький В., Богданова М., Ремарович С. Підхід організації пошуку інформації в різнорідних корпоративних джерелах. Проблеми програмування. 2008. № 2 – 3. С. 395–402.
  10. Гришанова І. Ю., Щербак С. С. Розвиток технологій інформаційного пошуку та аналіз їх застосування в Semantic Web. Системи обробки інформації. 2009. Вип. 6. С. 34–42.
  11. Гришанова І. Ю. Аналітичний огляд методів і засобів інформаційного пошуку в Semantic Web. Проблеми програмування. 2016. № 1. С. 51–72.
  12. Жарінова А. Г., Чуприна Х. М., Цибенко І. О. Класифікація типів документів, що містять результати інтелектуальної та творчої діяльності. Управління розвитком складних систем. Київ, 2023. № 53. С. 63 – 70, dx.doi.org\10.32347/2412-9933.2023.53.63-70.
  13. Schmidhuber J. (2015). Deep learning in neural networks: an overview Neural Netw.
  14. Adhikari S. P. et al. (2018). Hybrid no-propagation learning for multilayer neural networks Neurocomputing.
  15. Liu A. et al. (2018). Balance gate controlled deep neural network Neurocomputing.
  16. Turney P. D., Hasan K.S. et al. Learning to extract keyphrases from text.
  17. Automatic keyphrase extraction: A survey of the state of the art. Proceedings of the ACL. (2014).
  18. Medelyan Olena, Frank Eibe, and Witten Ian H. (2009). Human-competitive tagging using automatic keyphrase extraction. In Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing, pages 1318–1327, Singapore. Association for Computational Linguistics. URL: https://aclanthology.org/D09-1137.pdf.
  19. Liu T. et al. Generating and exploiting large-scale pseudo training data for zero pronoun resolution Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers).
References: 
  1. URL: https://kepios.com/?utm_campaign=Digital_2022&utm_medium=Article&utm_source=Global_Digital_Reports.
  2. Internet usage statistics. The Internet Big Picture World Internet Users and Population Stats 2023.
  3. Sukhii, O. L., Milenin, V. M., Taradainik, V. M. (2015). Search algorithms in information systems: methodological recommendations. Kyiv.
  4. Lande, D. V., Subach, I. Yu., Boyarinova, Yu. E. (2018). Fundamentals of the theory and practice of intellectual data analysis in the field of cyber security: a study guide. Kyiv: ISZZI KPI named after Igor Sikorsky, 300.
  5. Andon, P. I., Hlybovets, A. M., Kurylyak, V. V. (2020). Building a semantic image model using machine learning based on convolutional neural networks. Programming problems, 2–3, 354–364.
  6. Anisimov, A. V., Marchenko, O. O., Nikonenko, A. O. (2008). Algorithmic model of associative-semantic contextual analysis of natural language texts. Programming problems, 2–3, 379–384.
  7. Buryachok, V. L., Tolubko, V. B., Khoroshko, V. O., Tolyupa, S. V. (2015). Information and cyber security: socio-technical aspect: textbook; in general ed. Dr. Tech. Sciences, Professor V. B. Tolubka. Kyiv: DUT. 288.
  8. Priyma, S. M., Rogushyna, Yu. V. and Strokan, O. V. (2018). Use of semantic technologies to establish dialogue between labor market subjects. Programming problems, 2–3, 226–235. URL: http://nbuv.gov.ua/UJRN/Progr_2018_2-3_28.
  9. Deretskyi, V., Bohdanova, M., Remarovych, S. (2008). Approach to the organization of information search in heterogeneous corporate sources. Programming problems, 2–3, 395–402.
  10. Gryshanova, I. Yu., Shcherbak, S. S. (2009). Development of information search technologies and analysis of their application in the Semantic Web. Information processing systems, 6, 34–42.
  11. Gryshanova, I. Yu. (2016). Analytical review of methods and means of information search in the Semantic Web. Programming problems, 1, 51–72.
  12. Zharinova, Alla, Chupryna, Khrystyna & Tsybenko, Iryna. (2023). Classification of types of documents containing the results of intellectual and creative activity. Management of Development of Complex Systems, 53, 63–70, dx.doi.org\10.32347/2412-9933.2023.53.63-70.
  13. Schmidhuber, J. (2015). Deep learning in neural networks: an overview Neural Netw.
  14. Adhikari, S. P. et al. (2018). Hybrid no-propagation learning for multilayer neural networks Neurocomputing.
  15. Liu, A. et al. (2018). Balance gate controlled deep neural network Neurocomputing.
  16. Turney, P. D., Hasan, K. S. et al. (2017). Learning to extract keyphrases from text.
  17. Automatic keyphrase extraction: A survey of the state of the art. (2014). Proceedings of the ACL.
  18. Medelyan, Olena, Frank, Eibe and Witten, Ian H. (2009). Human-competitive tagging using automatic keyphrase extraction. In Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing, pages 1318 – 1327, Singapore. Association for Computational Linguistics. URL: https://aclanthology.org/D09-1137.pdf.
  19. Liu, T. et al. (2022). Generating and exploiting large-scale pseudo training data for zero pronoun resolution Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers).