Означено і розглянуто проблему нечіткого пошуку в текстах. Проблему поділено на основні складові елементи і запропоновано рішення по кожному. Також описано загальні техніки та засоби розв’язання таких задач. На основі рішення конкретних завдань в межах проблеми нечіткого пошуку запропоновано алгоритм реалізації, який базується на використанні стемінгу, перестановок та регулярних виразів.
Обозначена и рассмотрена проблема нечеткого поиска в текстах. Проблема разделена на части и предложено решение по каждой из них. Также описаны общие способы и средства решения данных задач. На основании решения конкретных заданий в рамках проблемы нечеткого поиска предложен алгоритм реализации с помощью стемминга, перестановок и регулярных выражений.
Posed and reviewed a problem of fuzzy search in the texts. This problem already has a very good, but time-consuming solution with use of morphological analysis and dictionaries. In particular the optimum decision is difficult to implement for this purpose because it is necessary to realize also ways of recognition of the parts of a speech and to create the morphological dictionaries which aren't present in open access for Ukrainian language. The general problem of search was divided into components and the solution on each of them was proposed. Decisions make a start from the ways of data processing known and existing in open access. Use of the chosen methods within the solution of objectives was described in the article, and also their shortcomings are specified. On the basis of the solutions of components of a problem of indistinct search, offered an algorithm of fuzzy search based on permutations, stemming and regular expressions.
