Нечіткий пошук в документі з врахуванням морфологічних особливостей

Автор(и): 
Білощицький А.О.
Діхтяренко О.В.
Ключові слова (укр): 
нечіткий пошук, морфологія, стемінг, регулярні вирази
Ключові слова (рус): 
нечеткий поиск, морфология, стемминг, регулярне выражения
Ключові слова (англ): 
fuzzy search, morphological analysis, stemming, regular expressions
Анотація (укр): 
Означено і розглянуто проблему нечіткого пошуку в текстах. Проблему поділено на основні складові елементи і запропоновано рішення по кожному. Також описано загальні техніки та засоби розв’язання таких задач. На основі рішення конкретних завдань в межах проблеми нечіткого пошуку запропоновано алгоритм реалізації, який базується на використанні стемінгу, перестановок та регулярних виразів.
Анотація (рус): 
Обозначена и рассмотрена проблема нечеткого поиска в текстах. Проблема разделена на части и предложено решение по каждой из них. Также описаны общие способы и средства решения данных задач. На основании решения конкретных заданий в рамках проблемы нечеткого поиска предложен алгоритм реализации с помощью стемминга, перестановок и регулярных выражений.
Анотація (англ): 
Posed and reviewed a problem of fuzzy search in the texts. This problem already has a very good, but time-consuming solution with use of morphological analysis and dictionaries. In particular the optimum decision is difficult to implement for this purpose because it is necessary to realize also ways of recognition of the parts of a speech and to create the morphological dictionaries which aren't present in open access for Ukrainian language. The general problem of search was divided into components and the solution on each of them was proposed. Decisions make a start from the ways of data processing known and existing in open access. Use of the chosen methods within the solution of objectives was described in the article, and also their shortcomings are specified. On the basis of the solutions of components of a problem of indistinct search, offered an algorithm of fuzzy search based on permutations, stemming and regular expressions.
Публікатор: 
Київський національний університет будівництва і архітектури
Назва журналу, номер, рік випуску (укр): 
Управління розвитком складних систем, номер 17, 2014
Назва журналу, номер, рік випуску (рус): 
Управление развитием сложных систем, номер 17, 2014
Назва журналу, номер, рік випуску (англ): 
Management of Development of Complex Systems, Number 17, 2014
Мова статті: 
Українська
Формат документа: 
application/pdf
Документ: 
Дата публікації: 
14 Март 2014
Номер збірника: 
Розділ: 
ІНФОРМАТИЗАЦІЯ ВИЩОЇ ОСВІТИ
Університет автора: 
Київський національний університет будівництва і архітектури, Київ
Литература: 

1.     Макухіна Т.В. Особливості фонемної структури українських та англійських текстів інтерв’ю / Ліпатов В.М. // Матеріали наукової конференції «Наука и технологии: шаг в будущее – 2007».

2.     Білощицький А.О., Діхтяренко О.В. «Ефективність методів пошуку збігів у текстах» // Управління розвитком складних систем (14). – С. 144-147.

3.     Высоцкий, В.Ю. Поисковые алгоритмы для автоматизированного обучения [Текст] / В.Ю. Высоцкий, В.Д. Гогунский // Інформаційні технології в освіті, науці та виробництві. – № 3(4), 2013.
– С. 105-113.

4.     Зеленков Ю.Г. Сравнительный анализ методов определения нечетких дубликатов для
Web-документов [Електронний ресурс] / Ю.Г. Зеленков, И.В. Сегалович. – Режим доступу: http://download.yandex.ru/company/download /paper_65_v1.pdf.

5.     Толчеев В.О. Анализ пpоблемы и pазpаботка пpоцедуpы выявления нечетких дубликатов научных статей по библиогpафическим описаниям [Текст] / В.О. Толчеев. – изд. "Новые технологии", "Инфоpмационные технологии", 2011. № 2 (174). – С.17-21.

References: 

1.     Makuhina, T. V., Lipatov, V. N. (2007). Features of the phonemic structure of Ukrainian and English texts interview materials science. conf. "Science and technology: step in the future – 2007", Dnipropetrovsk, Ukraine.

2.     Biloshchytskyi, A., Dikhtyarenko, O. (2013) Effectiveness of methods to search for matches in the texts. Management of complex systems. Kyiv, Ukraine: KNUCA, 14, 144-147.

3.     Vysotsky, V. Y. Gogunsky, V. D. (2013). Search algorithms for computer-aided instruction. Information technology in education, science and industry, 3 (4), 105-113.

4.     Zelenkov, J. G., Segalovich I. V. Comparative analysis of duplicate detection methods for Web-documents [E resource]. – Mode of access: http://download.yandex.ru/company/download /paper_65_v1.pdf.

5.     Tolcheev, V. O. (2011). Analysis PROBLEMS pazpabotka and near-duplicate detection window procedure of scientific articles on bibliogpaficheskim descriptions. "New technologies", "Infopmatsionnye technology",
2 (174), 17-21.