Аннотації

Метод визначення нейромережевої архітектури в задачах голосової взаємодії дистанційного навчання

Автор(и):

Щербина А.А., Терейковская Л.А.

Дата публікації:

14.03.2014

Анотація (укр):

Вперше розроблено метод визначення архітектури нейронної мережі, призначеної для розв’язання типових задач голосової взаємодії в інформаційній системі дистанційного навчання. Метод, що базується на концепції відповідності вимог задачі і можливостей апробованих архітектур, дозволяє визначити оптимальну нейромережеву архітектуру. Наведено приклад встановлення оптимальної архітектури нейронної мережі, що використовується для розпізнавання фонем в процесі голосової авторизації.

Анотація (рус):

Впервые разработан метод определения архитектуры нейронной сети, предназначенной для решения типовых задач голосового взаимодействия в информационной системе дистанционного обучения. Метод, базируясь на концепции соответствия требований задачи и возможностей апробированных архитектур, позволяет определить оптимальную нейросетевую архитектуру. Приведен пример установления оптимальной архитектуры нейронной сети, которая используется для распознавания фонем в процессе голосовой авторизации.

Анотація (англ):

First developed a method for determining the optimal architecture of a neural network for solving typical problems of vocal interaction in the information system of distance learning. In determining the optimal architecture used multi-criteria evaluation approach to ensure the possibility of the main requirements of these tasks in the tested neural network architectures. Established a list of optimization criteria: learning on noisy data, the use of correlated training examples need to be displayed in a training set of all aspects of the process, proportionality studies, and recognized classes, the ability to self-learning, the quality of teaching, the ability to automate learningadaptability to uplearning, durations required for training volume of computing resources, memory, generalization error, calculate the duration required to detect the amount of computing resources. The importance of the criteria for the task proposed to estimate using weights that are based on expert data. Proved that to proven network architectures include: multilayer perceptron, radial basis function network, a network of Grossberg, Kohonen map, deep neural networks. For all these architectures are obtained when evaluating the feasibility of each of these criteria. An example of determining the optimal architecture of a neural network for phoneme recognition in the voice user authentication at login.

Література:

1. Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов / Т.К. Винцюк. – К: Наукова думка.
– 1987. – 262 с.

2. Дмитриев В.Т. Дикторонезависимая система автоматического поиска ключевых слов в потоке слитной речи, устойчивая к акустическим шумам / В.Т. Дмитриев, И.В. Баландин // Вестник РГРТУ. – 2008. – № 2 (выпуск 24). – С. 17-22.

3. Ле Н.В. Распознавание речи на основе искусственных нейронных сетей / Н.В. Ле, Д.П. Панченко // Технические науки в России и за рубежом: материалы междунар. заоч. науч. конф. — М.: Ваш полиграф партнер, 2011. – С. 8-11.

4. Кладов С. А. Распознавание голосовых команд с помощью самоорганизующейся нейронной сети Кохонена. [Электронный ресурс]. Молодежный научно-технический вестник №05, май 2012. – Режим доступа: http://sntbul.bmstu.ru/doc/ 458.html

5. Кушнир Д.А. Исследование и разработка нейросетевых методов анализа и обработки речевого сигнала в задаче распознавания речи: дис. … канд. техн. наук: 05.13.01 / Д.А. Кушнир - М., 2006. - 182 с.

6. Терейковська Л.О. Проблема голосової взаємодії в дистанційному навчанні вищого навчального закладу / Л.О. Терейковська, І.А.Терейковський // Управління розвитком складних систем: зб. наук. праць. – 2013. – Вип. 13. – С. 157–161.

7. Терейковський І. Нейронні мережі в засобах захисту комп’ютерної інформації / І. Терейковський. - К.: ПоліграфКонсалтинг, 2007. – 209 с.

8. Титов Ю. Н. Математическая модель органа слуха для автоматического распознавания речи / Ю. Н. Титов // Науч.-техн. вестн. СПбГУ ИТМО.– 2007. – № 37.– С. 307–310.

9. Ященко В.А. Вторичные автоматы в интеллектуальных системах / В.А.Ященко // Искусственный интеллект. – 2005. – № 3. – С.14–20.

10. Geoffrey Hinton Deep Belief Nets. [Электронный ресурс]. – Режим доступа: http://www.cs.toronto.edu/~hinton/nipstutorial/nipstut3.pdf.

References:

1. Vintsyuk T.K. (1987). Analysis and interpretation of the speech recognition signals. Kiev, Naukova Dumka. 262.

2. Dmitriev, V.T., Balandin I.V. (2008). Speaker-independent automatic search for keywords in a stream of continuous speech, resistant to acoustic noise. RSREU, Gazette, № 2 (Issue 24), 17-22.

3. Le N.V., Panchenko D.P. (2011). Speech recognition based on artificial neural networks. Engineering science in Russia and abroad: Proceedings of International. absentia. scientific. conf. Moscow, Publishing Your partner, 8-11.

4. Hoards S.A. (2012) Recognition of voice commands using self-organizing Kohonen neural network. Youth Science and Technology Gazette, № 05, http://sntbul.bmstu.ru/doc/ 458.html

5. Kushnir D.A. (2006). Research and development of methods of analysis and neural network for speech signal processing speech recognition problem: dis. ... Cand. tehn. Sciences: 05.13.01. Moscow, 182.

6. Tereykovska L.A., Tereykovskyy I.A. (2013.) The problem of voice interaction in distance learning university. Management of Complex Systems: Coll. sciences. papers, Issue 13, 157-161.

7. Tereykovskyy I. (2007). Neural network means of information protection. Kiev, PolihrafKonsaltynh, 209.

8. Titov N. (2007). Mathematical model of the organ of hearing for automatic speech recognition. Scientific-technical. vestn. ITMO, № 37,307-310.

9. Yaschenko V.A. (2005). Secondary machines in intelligent systems. Artificial intelligence, № 3, 14-20.

10. Geoffrey Hinton.(2011) Deep Belief Nets. http://www.cs.toronto.edu/~hinton/nipstutorial/nipstut3.pdf