Латентно семантичний підхід до аналізу інформації із наукометричних баз даних

Заголовок (російською): 
Латентно-семантический подход для анализа информации из наукометрических баз данных
Заголовок (англійською): 
Latent semantic approach to analyzing information from scientometrics databases
Автор(и): 
Коляда А.С.
Ключові слова (укр): 
публікації, бази даних, автори, ідентифікація, латентність даних, семантика, аналіз
Ключові слова (рус): 
публикации, базы данных, авторы, идентификация, латентность данных, семантика, анализ
Ключові слова (англ): 
publications, databases, authors, identification, data latency, semantics, analysis
Анотація (укр): 
Розглянуто особливості ідентифікації авторів та їх публікацій з наукометричних баз даних на основі латентно семантичного аналізу назв статей. Показано, що в слабоструктурованих наукових текстах назви статей одного автора утворюють загальну область термів, що дозволяє ідентифікувати авторів статей.
Анотація (рус): 
Рассмотрены особенности идентификации авторов и их публикаций из наукометрических баз данных на основе латентно семантического анализа названий статей. Показано, что в слабоструктурированных научных текстах названия статей одного автора образуют общую область термов, что позволяет идентифицировать авторов статей.
Анотація (англ): 
Article covers features for authors and their publications identification in scientometric databases based on latent semantic analysis of article titles. It is shown that in poorly structured scientific texts titles of articles per author form a common area of terms that allows us to identify the authors of articles. Latent semantic analysis (LSA) uses a mathematical technique called singular value decomposition (SVD) to identify patterns in the relationships between the terms and concepts contained in an unstructured collection of text. It is based on the principle that words that are used in the same contexts tend to have similar meanings. A key feature of LSA is its ability to extract the conceptual content of a body of text by establishing associations between those terms that occur in similar contexts. LSA overcomes the following problems: multiple words that have similar meanings (synonymy) and words that have more than one meaning (polysemy). Another benefit of LSA is that it uses a strictly mathematical approach, so is inherently independent of language.
Публікатор: 
Київський національний університет будівництва і архітектури
Назва журналу, номер, рік випуску (укр): 
Управління розвитком складних систем, номер 17, 2014
Назва журналу, номер, рік випуску (рус): 
Управление развитием сложных систем, номер 17, 2014
Назва журналу, номер, рік випуску (англ): 
Management of Development of Complex Systems, Number 17, 2014
Мова статті: 
Русский
Формат документа: 
application/pdf
Документ: 
Дата публікації: 
14 Март 2014
Номер збірника: 
Розділ: 
ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ УПРАВЛІННЯ
Університет автора: 
Одесский национальный политехнический университет, Одесса
Литература: 

1.     Формализация проблемы извлечения знаний из естественно языковых текстов. / [А. Палагин, С. Кривый,
Н. Петренко, Д. Бибиков]. – Sofia: Information technologies & knowledge, 2012. – 100 с.

2.     Білощицький, А.О. Ефективність методів пошуку збігів у текстах / А.О. Білощицький, О.В. Діхтяренко // Управління розвитком складних систем. – 2013. – № 14.– С. 144 – 147.

3.     Білощицький, А.О. Наукометричні бази та індикатори цитування наукових публікацій / А.О. Білощицький,
В.Д. Гогунський // Інформаційні технології в освіті, науці та виробництві. – Вип. 4 (5). – О.: АО Бахва, 2013. – C. 198 – 203.

4.     Коляда, А. С. Автоматизация извлечения информации из наукометрических баз данных / А. С. Коляда,
В. Д. Гогунский// Управління розвитком складних систем. – 2013. – № 16. – С. 96 – 99.

5.     Бурков, В. Н. Параметры цитируемости научных публикаций в наукометрических базах данных / В. Н. Бурков, А. А. Белощицкий, В. Д. Гогунский // Управління розвитком складних систем. – 2013. – № 15. – С. 134 – 139.

6.     Коляда А. С. Разработка проекта информационно-аналитической системы извлечения и обработки информации из наукометрических баз данных / Коляда А. С., Негри А. А., Колесникова Е. В. // Управління проектами: стан та перспективи. Матеріали IX Міжнар. наук.-практ. конф. – Миколаїв: НУК, 2013. – 348 с.

7.     Высоцкий, В.Ю. Разработка обучающих программ в виртуальной компьютерной среде // В.Ю. Высоцкий, В.Д. Гогунский // Тр. Одес. политехн. ун-та. – 2011. – Вып. 2 (36).– С. 184 – 189.

8.     Яковенко, В.Д Комп’ютерна реалізація системи автоматизованого управління навчальним процесом // В. Д. Яковенко, В. Д. Гогунський, Г. Ф. Сафонова // Моделир. в прикладных научных исследованиях. Матер. ХVІ семинара. – Одеса: ОНПУ, 2008. – C. 27 – 30.

9.     Тертышная, Т. И. Автоматизированная система контроля знаний / Т. И. Тертышная, Е. В. Колесникова,
В. Д. Гогунский // Тр. Одес. политехн. ун-та. – 2001. – Вып. 1(13).– С. 125 – 128.

10.  Яковенко, А.Е Стратегия принятия решений в условиях адаптивного обучения / А. Е. Яковенко,
А. В. Нарожный, В. Д. Гогунский // Восточно-европейский журнал передових технологий. – № 2/2 (14). – 2005. – С.105 – 110.

11.  Чугреев, В. Л. Модель структурного представления текстовой информации и метод ее тематического анализа на основе частотно-контекстной классификации / Санкт-Петербургский гос. электротехнический ун-т "ЛЭТИ" им. В.И. Ульянова. – 2003. – C. 25 – 29.

12.  Scott Deerwester, Susan T. Dumais, George W. Furnas, Thomas K. Landauer, Richard Harshman (1990). Indexing by Latent Semantic Analysis.  JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE. 41(6). – С. 391-407.

13.  Rehurek, R. (2011). Subspace tracking for latent semantic analysis. Advances in Information Retrieval. 289 – 300.

14.  Roger B. Bradford (2008). An empirical study of required dimensionality for large-scale latent semantic indexing applications. In proceeding of: Proceedings of the 17th ACM Conference on Information and Knowledge Management, CIKM 2008, Napa Valley, California, USA.

15.  Porter M.F. (1980). An algorithm for suffix stripping. Program, 14 n. 3, – pp. 130-137.

16.  Гогунский, В.Д. Обоснование закона о конкурентных свойствах проектов / В. Д. Гогунский, С.В. Руденко,
П.А. Тесленко // Управління розвитком складних систем. – 2012.  – № 8.– С. 14 – 16.

17.  Рач, В. А. Побудова термінологічної системи організації наукового знання [Текст] / В. Рач, О. Россошанська, О. Медведєва // Науковий світ. – 2011. – № 4. – С. 13 – 16.

18.  Гогунський, В. Д. Марковські моделі комунікаційних процесів в міжнародних проектах / О. В. Власенко,
В. В. Лебідь, В. Д. Гогунський // Управління розвитком складних систем. № 12. – 2012.– С. 35 – 39.

19.  Плетнев, А.Н. Организация вычислительной сети студгородка «Политехник» с использованием оптического волокна / А.Н. Плетнев, А.Н. Миколюк, В.Д. Гогунский // Труды Одес. политехн. ун-та. – № 2(28). – Одеса: ОНПУ, 2007. – С. 138 – 140.

References: 

1.     Palagin, A., Kriviy, S., Petrenko, N., Bibikov, D. (2012). Formalization of the problem of knowledge extraction from natural language texts. Information technologies & knowledge, 100 p.

2.     Biloshchytskyi, A., Dihtyarenko, O. (2013). The effectiveness of methods for finding matches in texts. Management of complex systems, 14, pp. 144 – 147.

3.     Biloshchytskyi, A., Gogunsky, V. (2013). Scientometric indicators and citation database of scientific publications. Information technology in education, science and production, 4, pp. 198 – 203.

4.     Kolyada, A., Gogunsky, V. (2013). Automating the extraction of information from scientometric databases. Management of complex systems, 16.

5.     Burkov, V., Beloschitsky, A. (2013). Options citation of scientific publications in scientometric databases. Management of complex systems, 15, p. 134 – 139.

6.     Kolyada, A., Negri, A., Kolesnikova, E. (2013). Development of the information and analytical system for extraction and processing of scientometric databases.  Project management: state and prospects. International scientific conference, 9, p. 348.

7.     Visotskiy, V., Gogunsky, V. (2011). Development of educational software in a virtual computer environment. Proceedings of the Odessa National Polytechnic University, 2(36), pp. 184 – 189.

8.     Yakovenko, V., Gogunsky, V., Safonova, G. (2008). Computer implementation of computer-aided learning management. Modeling in applied research, ХVІ seminar, pp. 27 – 30.

9.     Ternishnaya, T., Kolesnikova, E., Gogunsky, V. (2001). Automated monitoring system knowledge. Proceedings of the Odessa National Polytechnic University, 1(13), pp. 125 – 128.

10.  Yakovenko, A., Narozhny, A., Gogunsky, V. (2005). Strategy decisions under adaptive learning. East European Journal of Enterprise Technologies, 2/2(14), pp. 105 – 110.

11.  Chugreev, V. (2003). Model structural representation of textual information and the method of its thematic analysis based on frequency content classification. St. Petersburg State Electrotechnical University "LETI", VI Ulyanov, pp. 25 – 29.

12.  Scott Deerwester, Susan T. Dumais, George W. Furnas, Thomas K. Landauer, Richard Harshman (1990). Indexing by Latent Semantic Analysis.  JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE. 41(6), pp. 391 – 407.

13.  Rehurek, R. (2011). Subspace tracking for latent semantic analysis. Advances in Information Retrieval, pp. 289 – 300.

14.  Roger B. Bradford (2008). An empirical study of required dimensionality for large-scale latent semantic indexing applications. In proceeding of: Proceedings of the 17th ACM Conference on Information and Knowledge Management, CIKM 2008, Napa Valley, California, USA.

15.  Porter M.F. (1980). An algorithm for suffix stripping. Program, 14 n. 3, – pp. 130 – 137.

16.  Gogunsky, V., Rudenko, S., Teslenko, P. (2012). Justification law on competitive properties projects. Management of complex systems, 8, pp. 14 – 16.

17.  Rach, V., Rossoshanska, O., Medvedeva, O. (2011). Building a terminological system of scientific knowledge. Science world, 4, pp. 13 – 16.

18.  Gogunsky, V., Vlasenko, O., Lebid, D. (2012). Markov models of communication processes in international projects. Management of complex systems, 12, pp. 35 – 39.

19.  Pletnev, A., Mikolyuk, A., Gogunsky, V. (2007). Organization campus computer network "Polytechnic" using an optical fiber. Proceedings of the Odessa National Polytechnic University, 2(28), pp. 138 – 140.