Аннотації
14.03.2014
Означено і розглянуто проблему нечіткого пошуку в текстах. Проблему поділено на основні складові елементи і запропоновано рішення по кожному. Також описано загальні техніки та засоби розв’язання таких задач. На основі рішення конкретних завдань в межах проблеми нечіткого пошуку запропоновано алгоритм реалізації, який базується на використанні стемінгу, перестановок та регулярних виразів.
Обозначена и рассмотрена проблема нечеткого поиска в текстах. Проблема разделена на части и предложено решение по каждой из них. Также описаны общие способы и средства решения данных задач. На основании решения конкретных заданий в рамках проблемы нечеткого поиска предложен алгоритм реализации с помощью стемминга, перестановок и регулярных выражений.
Posed and reviewed a problem of fuzzy search in the texts. This problem already has a very good, but time-consuming solution with use of morphological analysis and dictionaries. In particular the optimum decision is difficult to implement for this purpose because it is necessary to realize also ways of recognition of the parts of a speech and to create the morphological dictionaries which aren't present in open access for Ukrainian language. The general problem of search was divided into components and the solution on each of them was proposed. Decisions make a start from the ways of data processing known and existing in open access. Use of the chosen methods within the solution of objectives was described in the article, and also their shortcomings are specified. On the basis of the solutions of components of a problem of indistinct search, offered an algorithm of fuzzy search based on permutations, stemming and regular expressions.
1. Макухіна Т.В. Особливості фонемної структури українських та англійських текстів інтерв’ю / Ліпатов В.М. // Матеріали наукової конференції «Наука и технологии: шаг в будущее – 2007».
2. Білощицький А.О., Діхтяренко О.В. «Ефективність методів пошуку збігів у текстах» // Управління розвитком складних систем (14). – С. 144-147.
3. Высоцкий, В.Ю. Поисковые алгоритмы для автоматизированного обучения [Текст] / В.Ю. Высоцкий, В.Д. Гогунский // Інформаційні технології в освіті, науці та виробництві. – № 3(4), 2013.
– С. 105-113.
4. Зеленков Ю.Г. Сравнительный анализ методов определения нечетких дубликатов для
Web-документов [Електронний ресурс] / Ю.Г. Зеленков, И.В. Сегалович. – Режим доступу: http://download.yandex.ru/company/download /paper_65_v1.pdf.
5. Толчеев В.О. Анализ пpоблемы и pазpаботка пpоцедуpы выявления нечетких дубликатов научных статей по библиогpафическим описаниям [Текст] / В.О. Толчеев. – изд. "Новые технологии", "Инфоpмационные технологии", 2011. № 2 (174). – С.17-21.
1. Makuhina, T. V., Lipatov, V. N. (2007). Features of the phonemic structure of Ukrainian and English texts interview materials science. conf. "Science and technology: step in the future – 2007", Dnipropetrovsk, Ukraine.
2. Biloshchytskyi, A., Dikhtyarenko, O. (2013) Effectiveness of methods to search for matches in the texts. Management of complex systems. Kyiv, Ukraine: KNUCA, 14, 144-147.
3. Vysotsky, V. Y. Gogunsky, V. D. (2013). Search algorithms for computer-aided instruction. Information technology in education, science and industry, 3 (4), 105-113.
4. Zelenkov, J. G., Segalovich I. V. Comparative analysis of duplicate detection methods for Web-documents [E resource]. – Mode of access: http://download.yandex.ru/company/download /paper_65_v1.pdf.
5. Tolcheev, V. O. (2011). Analysis PROBLEMS pazpabotka and near-duplicate detection window procedure of scientific articles on bibliogpaficheskim descriptions. "New technologies", "Infopmatsionnye technology",
2 (174), 17-21.