ВПРОВАДЖЕННЯ ТЕХНОЛОГІЙ ІНТЕЛЕКТУАЛЬНОГО АНАЛІЗУ ТЕКСТОВИХ ДОКУМЕНТІВ У СФЕРУ ТЕХНІЧНОГО РЕГУЛЮВАННЯ В БУДІВНИЦТВІ

Заголовок (англійською): 
INTRODUCTION OF INTELLECTUAL ANALYSIS TECHNOLOGIES OF TEXT DOCUMENTS INTO FIELD OF TECHNICAL REGULATION IN CONSTRUCTION
Автор(и): 
Клочко А. А.
Автор(и) (англ): 
Klochko Andriy
Ключові слова (укр): 
автоматичний пошук; інтелектуальний аналіз; кластеризація; невизначеність; технічне регулювання
Ключові слова (англ): 
automatic search, intelligent analysis, clustering, uncertainty, technical regulation
Анотація (укр): 
Статтю присвячено впровадженню технологій інтелектуального аналізу текстових документів у сферу технічного регулювання в будівництві України. Основну увагу в роботі спрямовано на вирішення питань автоматичного накопичення та інтелектуального аналізу нормативних документів будівельної галузі, які набувають надзвичайної актуальності у зв’язку з цифровізацією усіх сфер господарства. Висвітлено нагальні проблеми системи технічного регулювання в будівництві. Показано, що ці проблеми висувають на перший план завдання підвищення швидкості та надійності опрацювання текстових документів в електронних інформаційних системах. Вирішення цього завдання передбачає розробку автоматичних систем, які здатні до інтелектуального пошуку документів в умовах невизначеності, що спричинена наявністю надлишкової текстової інформації. Проведено огляд інформаційно-пошукових систем, які використовуються для опрацювання текстових документів в електронних інформаційних ресурсах. Досліджено передумови впровадження технологій інтелектуального аналізу текстових документів у сферу технічного регулювання в будівництві України. Обґрунтовано своєчасність їх провадження. Надано основні поняття, що використовуються у процесі розроблення моделей і методів автоматичного вилучення значущої інформації з текстів. Досліджено процес інтелектуального аналізу даних та проаналізовано наявні моделі інтелектуального аналізу текстової інформації, які використовуються в різних інформаційно-пошукових системах. Запропоновано схему впровадження технології інтелектуального аналізу текстових документів в Єдину державну електронну систему у сфері будівництва. При цьому передбачається розв’язання задачі кластеризації текстових документів покласти на штучні нейронні мережі. Розглядається можливість використання таких моделей, як глибоко структурована семантична модель і самоорганізуюча карта Кохонена. Вибір зазначених моделей ґрунтується на їх здатності до визначення міри близькості інформаційно-пошукових образів текстових документів. Практичне значення роботи вбачається в удосконаленні пошукових систем у сфері технічного регулювання в будівництві та можливості суттєво прискорити процес реструктуризації галузі будівництва і архітектури України.
Анотація (англ): 
The article is devoted to the introduction of intellectual analyses technology of text documents into the field of technical regulation in Ukraine construction. The main attention in the paper is directed on the decision of questions of automatic collection and intellectual analysis of construction branch`s normative documents. These issues are becoming extremely important in connection with the digitalization of all sectors of the economy.Urgent problems of the technical regulation system in construction are highlighted.It is shown that these problems bring to the fore the task of increasing the speed and reliability of processing text documents in electronic information systems. The solution to this problem involves the development of automatic systems that are capable of intelligent document search in uncertainty conditions that caused by the presence of redundant textual information.The overview of information retrieval systems used to processing text documents in electronic information resources is conducted.Preconditions of introduction of intellectual analysis technologies of text documents into the technical regulation sphere in Ukraine construction are investigated.The timeliness of the technology implementation substantiated. The basic concepts used in the models and methods development of automatic extraction of meaningful information from texts are given.Process of data mining is studied and Models of textual information mining are analyzed that used in different information retrieval systems. Scheme of introduction of intellectual analysis technology of text documents into the Unified state electronic system in the field of construction is offered.Solution of clustering of text documents problem apply artificial neural networks is supposed.The possibility of using such models as Deep Structured Semantic Model and Self-Organizing Map is considered. The choice of these models is based on their ability to determine the proximity degree of information retrieval images of text documents. Work practical significance is seen in the improvement of search engines in the field of technical regulation in construction and the ability to significantly accelerate the process of restructuring into the field of technical regulation in Ukraine construction.
Публікатор: 
Київський національний університет будівництва і архітектури
Назва журналу, номер, рік випуску (укр): 
Управління розвитком складних систем, номер 47, 2021
Назва журналу, номер, рік випуску (рус): 
Управление развитием сложных систем, номер 47, 2021
Назва журналу, номер, рік випуску (англ): 
Management of Development of Complex Systems, Number 47, 2021
Мова статті: 
Українська
Формат документа: 
application/pdf
Документ: 
Дата публікації: 
02 Сентябрь 2021
Номер збірника: 
Розділ: 
ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ УПРАВЛІННЯ
Університет автора: 
Верховна Рада України, Київ
Литература: 
  1. Terenchuk S., Belous S. (2019). Study of Ambiguity in Regulatory Framework in Construction. Scientific Journal of ScienceRise, 7 (60), 35–39.
  2. Seryh, A. R. (2010). Technical Regulation in Construction. Analytical review of world experience. SNIP, available at: http://iceg.com.ua/wpcontent/ uploads/2016/04/techno_reg_stroi_world.pdf.
  3. Chernyshev D., Klochko A., Terenchuk S., Ternavska V., & Zapryvoda V. (2020). Semantic Analysis Models and Methods of the Text Information in the Building Normative Base. International Journal of Innovative Technology and Exploring Engineering (IJITEE), Vol. 9, Issue-6, 1873–1879.
  4. Ісаєнко Д. В., Теренчук С. А. Моделювання інтелектуальної системи підтримки прийняття рішень з технічного регулювання в будівництві. Вісник Одеської державної академії будівництва та архітектури. 2018, № 72. С. 18–25.
  5. Ісаєнко Д. В., Клочко А. А., Ященко О. Ф. Аналіз проблеми цифровізації сфери технічного регулювання в будівництві Управління розвитком складних систем. 2020, №43. С. 91–96.
  6. Klochko A., Terenchuk S., Chernyshev D., Zapryvoda V. (2020). Using Deep Structured Semantic Model to Analysis Text Documents in the Building Normative Base. 2020 IEEE International Conference on Problems of Infocommunications Science and Technology, PIC S&T`2020, 330–334.
  7. Rudyuk V. (2006). Criteria for classification of electronic business documents: current trends and future schemes. Library Science. Documentation. Informology, 3.
  8. Ісаєнко Д. В. Законодавче регулювання діяльності в будівельній галузі. Особливості світового досвіду та Європейського підходу для визначення пріоритетів при формуванні життєвого середовища. Будівельне виробництво. 2017, №6. С. 11–15.
  9. Оксанич, І. Г., Піскунов Д. М., Черниш Д. П. Інтелектуальний аналіз масиву текстових документів на основі технології Text Mining. Системи обробки інформації. 2013, №2. С. 139–143.
  10. Єдина державна електронна система в будівельній галузі. URL: https://thedigital.gov.ua/news/upershe-vidkrito-dani-pro-deklarativni-ta-dozvilni-dokumenti-z-novogo-reestru-budivelnoi-diyalnosti-ta-provedeno-doslidzhennya-pro-vpliv -відкритих-даних-на-містобудівну-галузь.
  11. Заукон України «Про регулювання містобудівної діяльності». URL:https://zakon.rada.gov.ua/laws/show/3038-17#Text.
  12. Постанова Кабінету Міністрів «Про реалізацію експериментального проекту щодо запровадження першої черги Єдиної державної електронної системи у сфері будівництва». URL: https://zakon.rada.gov.ua/laws/show/559-2020-%D0%BF#Text.
  13. Організація та оцифрування інформації щодо будівель та споруд включно з будівельним інформаційним моделюванням (ВІМ). Управління інформацією з використанням будівельного інформаційного моделювання. Частина 1. Концепції та принципи. Частина 1. Поняття та принципи (ISO 19650-1: 2018 IDT). Наказ від 18.03.2020 73 Про прийняття національних стандартів 2020 р. URL: http://online.budstandart.com/ua/catalog/docpage.html?id_doc=89571.
  14. Chang, Wui Lee, Tay, Kai Meng, Lim, Chee Peng (2017). A New Evolving Tree-Based Model with Local Re-learning for Document Clustering and Visualization. Neural Processing Letter, 46 (2), 379–409.
  15. Paltoglou, Georgios; Thelwall, Mike. Twitter, MySpace, Digg (2012). Unsupervised Sentiment Analysis in Social Media. ACM Transactions on Intelligent Systems and Technology (TIST), 3 (4). P. 66.
  16. Atika Mustafa, Ali Akbar, and Ahmer Sultan (2009). Knowledge Discovery using Text Mining: A Programmable Implementation on InformationExtraction and Categorization.International Journal of Multimedia and Ubiquitous Engineering, Vol. 4, No.2, 837–848.
  17. Chauhan Shrihari R., Amish Desai, (2015). AReview on Knowledge Discovery Using Text Classification Techniques in Text Mining. International Journal of Computer Applications (0975-8887), Vol.111, No 6.
  18. Zhao Y. (2013) Analysing Twitter Data with Text Mining and Social Network Analysis in Proceedings of the 11th Australasian Data Miningand Analytics Conference (AusDM 2013), p.23.
  19. Renganathan, Vinaitheerthan, (2017). Text Miningin Biomedical Domain with Emphasis on Document Clustering. Healthcare Informatics Research, 23 (3), 141–146.
  20. Karpov I. A., Antonenko S. V. (2020). Review of text mining methods. Current issues of automation and information technology, Volume 24, 40–46.
  21. Буряков С., Клочко А., Федоров О., Теренчук С. Аналіз проблем автоматичного пошуку веб-даних в системі технічного регулювання в будівництві. Міжнародна науково-практична конференція молодих вчених «БУД-МАЙСТЕР-КЛАС-2020», 25-27 листопада 2020. КНУБА, С. 116 –117.
  22. Gubin M. V. (2004) Models and methods of representation of a text document in information retrieval systems // Scientific and technical information, Ser. 1, 12, 12–24.
  23. Xie, Z., Zeng, Z., Zhou, G. etal. (2017). Topic enhanced deep structured semantic models for knowledge base question answering. Sci. ChinaInf. Sci. 60, 110103. https://doi.org/10.1007/s11432-017-9136-x.
  24. Kohonen T., Ageeva V. N. Self-organizing cards. Per. from English M.: BINOM. Knowledge Laboratory, 2008.655 p.
References: 
  1. Terenchuk, S., Belous, S. (2019). Study of Ambiguity in Regulatory Framework in Construction. Scientific Journal of ScienceRise, 7 (60), 35–39.
  2. Seryh, A. R. (2010). Technical Regulation in Construction. Analytical review of world experience. SNIP, available at: http://iceg.com.ua/wpcontent/ uploads/2016/04/techno_reg_stroi_world.pdf.
  3. Chernyshev, D., Klochko, A., Terenchuk, S., Ternavska, V. & Zapryvoda, V. (2020). Semantic Analysis Models and Methods of the Text Information in the Building Normative Base. International Journal of Innovative Technology and Exploring Engineering (IJITEE), 9, 6, 1873–1879.
  4. Isaenko, D. V., Terenchuk, S. A. (2018). Modeling of intelligent decision support system for technical regulation in construction. Bulletin of the Odessa State Academy of Civil Engineering and Architecture, 72, 18–25.
  5. Isaienko, D., Klochko, A. & Yashenko, O. (2020). Digitalization problem analysis of the sphere of technical regulation in construction. Management of Development of Complex Systems, 43, 91–96.
  6. Klochko, A., Terenchuk, S., Chernyshev, D., Zapryvoda, V. (2020). Using Deep Structured Semantic Model to Analysis Text Documents in the Building Normative Base. 2020 IEEE International Conference on Problems of Infocommunications Science and Technology, PIC S&T`2020, 330–334.
  7. Rudyuk, V. (2006). Criteria for classification of electronic business documents: current trends and future schemes. Library Science. Documentation. Informology, 3.
  8. Isaіenko, D. (2017). Legislative regulation of activities in the construction industry. Features of the world experience and the European approach for definition of priorities at formation of an environment. Construction production, 63, 11–15.
  9. Oksanich, I. G., Piskunov, D. M., Chernysh, D. P. (2013). Intelligent analysis of an array of text documents based on text mining technology. Information Processing Systems, 2 (109), 139–143.
  10. The only state electronic system in the construction industry. – [Electronicresource]. Access mode:https://thedigital.gov.ua/news/upershe-vidkrito-dani-pro-deklarativni-ta-dozvilni-dokumenti-z-novogo-reestru-budivelnoi-diyalnosti-ta-provedeno-doslidzhennya-pro-vpliv -відкритих-даних-на-містобудівну-галузь.
  11. Law of Ukraine "On regulation of urban planning activities". – [Electronic resource]. Access mode:https://zakon.rada.gov.ua/laws/show/3038-17#Text.
  12. Draft of the Cabinet of Ministers of Ukraine "On the implementation of a pilot project for the introduction of the first stage of the Unified State Electronic System in the field of construction." – [Electronic resource]. Access mode:https://zakon.rada.gov.ua/laws/show/559-2020-%D0%BF#Text.
  13. Organization and digitization of information on buildings and structures including construction information modeling (BIM), Information management using construction information modeling. Part 1. Concepts and principles (ISO 19650-1: 2018 IDT). Order of 18.03.2020 73 On the adoption of national standards, 2020, [online] Available: http://online.budstandart.com/ua/catalog/docpage.html?id_doc=89571.
  14. Chang, Wui Lee, Tay, Kai Meng, Lim, Chee Peng. (2017). A New Evolving Tree-Based Model with Local Re-learning for Document Clustering and Visualization. Neural Processing Letter, 46 (2), 379–409.
  15. Paltoglou, Georgios; Thelwall, Mike. Twitter, MySpace, Digg. (2012). Unsupervised Sentiment Analysis in Social Media. ACM Transactions on Intelligent Systems and Technology (TIST), 3 (4), 66.
  16. Atika, Mustafa, Ali, Akbar and Ahmer, Sultan. (2009). Knowledge Discovery using Text Mining: A Programmable Implementation on InformationExtraction and Categorization. International Journal of Multimedia and Ubiquitous Engineering, 4, 2, 837–848.
  17. Chauhan, Shrihari R., Amish, Desai. (2015). AReview on Knowledge Discovery Using Text Classification Techniques in Text Mining. International Journal of Computer Applications (0975-8887), 111, 6.
  18. Zhao, Y. (2013). Analysing Twitter Data with Text Mining and Social Network Analysis in Proceedings of the 11th Australasian Data Miningand Analytics Conference (AusDM 2013), p.23.
  19. Renganathan, Vinaitheerthan. (2017). Text Miningin Biomedical Domain with Emphasis on Document Clustering. Healthcare Informatics Research, 23 (3), 141–146.
  20. Karpov, I. A., Antonenko, S. V. (2020). Review of text mining methods. Current issues of automation and information technology, 24, 40–46.
  21. Buryakov, S., Klochko, A., Fedorov, O. & Terenchuk, S. (2020). Analysis of problems of automatic search of web data in the electronic database of normative documents in construction and building materials industry // ВMC-2020 – International Scientific-Practical Conference of young scientists "Build-Master-Class-2020", November 2020, Kyiv, Ukraine.
  22. Gubin, M. V. (2004). Models and methods of representation of a text document in information retrieval systems. Scientific and technical information, 1, 12, 12–24.
  23. Xie, Z., Zeng, Z., Zhou, G. etal. (2017). Topic enhanced deep structured semantic models for knowledge base question answering. Sci. ChinaInf. Sci., 60, 110103. https://doi.org/10.1007/s11432-017-9136-x.
  24. Kohonen, T., Ageeva, V. N. (2008). Self-organizing cards. Per. from English M.: BINOM. Knowledge Laboratory, 655.