
Калініна І. О., Гожий О. П.
Kalinina Iryna, Gozhyj Alexander
Розглянуто використання методів класифікації для вирішення завдання прогнозування аеродинамічних властивостей матеріалів. Запропоновано і досліджено методологію класифікації методами машинного навчання. Були використані такі методи класифікації: логістична регресія (LR), метод K-найближчих сусідів (KNN), дерева рішень (DT) та випадковий ліс (RF). Методологія складається з таких етапів: збирання даних, розвідувальний аналіз даних, моделювання, оцінювання ефективності моделей та підвищення ефективності моделей. Для реалізації процедури прогнозування проведено попереднє опрацювання даних, яке складається з етапів: збирання даних, розвідувальний аналіз даних. Наступний етап – Моделювання, складається з двох частин: підготовка та вибір моделі. Обрахована точність прогнозів. При аналізі були досліджені результати прогнозування з точки зору точності, як-от: відгук, F-міра, Каппа, значення робочої характеристики (ROC) та частоти помилок, вимірюваних середньою абсолютною помилкою (MAE) і середньоквадратичною помилкою (RMSE). Проведено аналіз точності прогнозування.

The article considers the use of classification methods to solve the problem of predicting the aerodynamic properties of materials. The methodology of classification by methods of machine learning is offered and investigated. The following logistic regression (LR), K-nearest neighbors (KNN) method, decision trees (DT) and random forest (RF) were used as classification methods. The methodology consists of the following stages: data collection, exploratory data analysis, modeling, evaluation of model efficiency, and improving model efficiency. To implement the forecasting procedure, preliminary data processing was performed, which consists of stages: Data collection and Intelligence data analysis. The next stage – Modeling, consists of two parts: Preparation and Selection of the model. The accuracy of forecasts is calculated. The analysis examined the prediction results in terms of accuracy, such as response, F-measure, Kappa, performance value (ROC) and error rate measured by the mean absolute error (MAE) and the root mean square error (RMSE). The analysis of forecasting accuracy is carried out.


