Метод визначення атрибуції друкованих документів

Заголовок (англійською): 
Method of determining the attribution of printed documents
Автор(и): 
Катаєва Є. Ю.
Якименко Д. О.
Автор(и) (англ): 
Kataieva, Yevheniia
Yakymenko, Dmytro
Ключові слова (укр): 
аналіз інформації; модифікований метод; інтелектуальний аналіз даних; обробка даних; програмний продукт
Ключові слова (англ): 
Information analysis; modified method; intelligent data analysis; data processing; software product
Анотація (укр): 
Швидкий розвиток сучасних інформаційних технологій спонукає організації і підприємства впроваджувати інноваційні технології в інформаційному забезпеченні їхньої діяльності. На сьогодні це має великий вплив на успішну реалізацію управління організацією та прийнятті правильних стратегічних рішень. Ефективне опрацювання постійно зростаючих обсягів інформації, основну частину яких складають документи та звіти різних форматів, можливе тільки за умови автоматизованої перевірки та обробки. Інформаційний пошук у неструктурованому тексті дуже складний, оскільки він містить велику кількість інформації, що вимагає використання специфічних методів і алгоритмів опрацювання для отримання корисних знань. У статті узагальнено результати експериментального дослідження застосування методу визначення атрибуції електронного документа. Проаналізовано роль опрацювання інформації і виявлення в ній моделей і тенденцій, які допомагають приймати рішення, а також принципи інтелектуального аналізу даних. Виокремлено напрями інтелектуального аналізу тексту, такі як: збирання даних, опрацювання web-даних, інформаційний пошук і виймання, комп'ютерна лінгвістика і обробка природної мови. Доведено доцільність реалізації прототипу програмного продукту, який відображає роботу методу, та засвідчує, що метод працює швидко і стабільно.
Анотація (англ): 
The rapid development of modern information technologies encourages organizations and enterprises to introduce innovative technologies in the information provision of their activities. Currently, this has a great impact on the successful implementation of organizational management and the adoption of correct strategic decisions. Effective processing of ever-growing amounts of information, the main part of which consists of documents and reports of various formats, is possible only under the condition of automated verification and processing. Information search in unstructured text is very difficult, because it contains a large amount of information, which requires the use of specific processing methods and algorithms to obtain useful knowledge. The article summarizes the results of an experimental study of the method of determining the attribution of an electronic document. The role of information processing and the identification of models and trends in it, which help to make decisions, as well as the principles of intelligent data analysis, are analyzed. Areas of intellectual text analysis, such as data collection, web data processing, information search and extraction, computer linguistics and natural language processing, are singled out. The expediency of implementing a prototype software product that reflects the operation of the method and shows that the method works quickly and stably has been proven.
Публікатор: 
Київський національний університет будівництва і архітектури
Назва журналу, номер, рік випуску (укр): 
Управління розвитком складних систем, номер 52, 2022
Назва журналу, номер, рік випуску (англ): 
Management of Development of Complex Systems, number 52, 2022
Мова статті: 
Українська
Формат документа: 
application/pdf
Документ: 
Дата публікації: 
19 Апрель 2023
Номер збірника: 
Розділ: 
ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ УПРАВЛІННЯ
Університет автора: 
Черкаський державний технологічний університет, Черкаси
Литература: 

1.     Piatetsky-Shapiro G. Data Mining and Knowledge Discovery – 1996 to 2005: Overcoming the Hype and moving from "University" to "Business" and "Analytics": Data Mining and Knowledge Discovery journal, 2007. 365 p.

2.     Барсегян А. А., Куприянов М. С., Степаненко В. В., Холод И. И. Технологии анализа данных: Data Mining, Viual Mining, Text Mining, OLAP: Спб.: БХВ-Петербург, 2007. 384с.

3.     Башмаков А. И. Интеллектуальные информационные технологии: Учеб. пособие. Москва : Изд-во МГТУ им. Баумана, 2005. 304 с.

4.     Ландэ Д.В. Поиск знаний в Internet. Профессиональная работа, Москва : ООО "Вильямс", 2005. 272 с.

5.     Walter L., Radauer A., Moehrle M. The beauty of brimstone butterfly: novelty of patents identified by near environment analysis based on text mining. Scientometrics (en), 2017. 111 (1). p. 103–115.

6.     Roll U., Correia R. A., Berger-Tal O. Using machine learning to disentangle homonyms in large text corpora. Conservation Biology (en), 2018. 32 (3). p. 716–724.

7.     Ramiro H. G., Agustín G. Assessing the usefulness of online message board mining in automatic stock prediction systems. Journal of Computational Science, 2017. 19.

8.     Renganathan V. Text Mining in Biomedical Domain with Emphasis on Document Clustering. Healthcare Informatics Research, 2017. 23 (3). p. 141–146.

9.     Chang W. L., Tay K. M., Lim C. P. A New Evolving Tree-Based Model with Local Re-learning for Document Clustering and Visualization. Neural Processing Letters, 2017. 46. p. 379–409.

10.  Paltoglou G., Thelwall M. Unsupervised Sentiment Analysis in Social Media. ACM Transactions on Intelligent Systems and Technology (TIST), 2012. p. 66.

11.  Advego Plagiatus – перевірка унікальності тексту. URL: www.advego.com/plagiatus/ (дата звернення: 25.08.2022).

12.  Он-лайн сервіс провірки тексту на унікальність. URL:www.text.ruwww.advego.com/plagiatus/.(дата звернення: 25.08.2022).

13.  Антиплагіатна Інтернет-система. URL: http://strikeplagiarism.com/ua/antiplagiarism-system/(дата звернення: 25.08.2022) 14.

14.  Програма для порівняння текстів «Shingles Expert». URL: http://makebusiness.ru/seo/37 (дата звернення: 25.08.2022)

15.  Zubrytskyi A. Yu. Intellectual system of text research and analysis . Master's thesis - national technical university of Ukraine "Ihory Sikors'koho Kyiv polytechnic institute", 2019. № 31.

16.     Ландэ Д.В. Поиск знаний в Internet. Профессиональная работа. Москва : ИД “Вильямс”, 2005. 272 с.

References: 

1.     Piatetsky-Shapiro, G. (2007). Data Mining and Knowledge Discovery – 1996 to 2005: Overcoming the Hype and moving from "University" to "Business" and "Analytics". Data Mining and Knowledge Discovery journal, 365.

2.     Barsehian, A. A., Kupryianov, M. S., Stepanenko, V. V., Kholod, Y. Y. (2007). Tekhnolohiiof data analisys: Data Mining, Viual Mining, Text Mining, OLAP: Spb.: BKhV-Peterburh, 384.

3.     Bashmakov, A. Y. (2005). Intellectual information technologies: Textbook. Moscow: Publ. MHTU im. Baumana, 304.

4.     Lande, D. V. (2005). Data search in the internet. Professional work. Moscow: OOO "Williams", 272.

5.     Walter, L., Radauer, A., Moehrle, M. (2017). The beauty of brimstone butterfly: novelty of patents identified by near environment analysis based on text mining. Scientometrics, 111 (1), 103–115.

6.     Roll, U., Correia, R. A., Berger-Tal, O. (2018). Using machine learning to disentangle homonyms in large text corpora. Conservation Biology, 32 (3), 716–724.

7.     Ramiro, H. G., Agustín, G. (2017). Assessing the usefulness of online message board mining in automatic stock prediction systems. Journal of Computational Science, 19.

8.     Renganathan, V. (2017). Text Mining in Biomedical Domain with Emphasis on Document Clustering. Healthcare Informatics Research, 23 (3), 141–146.

9.     Chang, W. L., Tay, K. M., Lim, C. P. (2017). A New Evolving Tree-Based Model with Local Re-learning for Document Clustering and Visualization. Neural Processing Letters, 46, 379–409.

10.  Paltoglou, G., Thelwall, M. (2012). Unsupervised Sentiment Analysis in Social Media. ACM Transactions on Intelligent Systems and Technology (TIST), 66.

11.  Advego Plagiatus – perevirka unikalnosti tekstu [electronic source]. www.advego.com/plagiatus/

12.  On-lain servis provirky tekstu na unikalnist [electronic source]. www.text.ruwww.advego.com/plagiatus/

13.  Antyplahiatna Internet-systema [electronic source]. http://strikeplagiarism.com/ua/antiplagiarism-system/

14.  Prohrama dlia porivniannia tekstiv «Shingles Expert» [electronic source]. http://makebusiness.ru/seo/37

15.  Zubrytskyi, A. Yu. (2019). Intellectual system of text research and analysis. Master's thesis – national technical university of Ukraine "Ihor Sikors'ky Kyiv polytechnic institute", 31.

16.  Lande D. V. (2005). Search for knowledge on the Internet. Professional work. Moscow: Publishing
House “Williams”, 272 p.