ГІБРИДНИЙ ПІДХІД ДО АНАЛІЗУ ТА РОЗПІЗНАВАННЯ МАТЕМАТИЧНИХ ФОРМУЛ З МЕТОЮ ВИЯВЛЕННЯ В НИХ ПОДІБНОСТЕЙ
Заголовок (російською):
ГИБРИДНЫЙ ПОДХОД К АНАЛИЗУ И РАСПОЗНАВАНИЮ МАТЕМАТИЧЕСКИХ ФОРМУЛ С ЦЕЛЬЮ ВЫЯВЛЕНИЯ В НИХ ПОДОБИЙ
Заголовок (англійською):
HYBRID APPROACH TO ANALYSIS AND RECOGNITION OF MATHEMATICAL FORMULAS TO IDENTIFY THEIR SIMILARITY
Автор(и):
Лізунов П.П.
Білощицький А.О.
Чала Л.Е.
Білощицька С.В.
Кучанський О.Ю.
Удовенко С.Г.
Автор(и) (англ):
Lizunov Petro
Biloshchytskyi Andrii
Chala Larysa
Biloshchytska Svitlana
Kuchansky Alexander
Udovenko Serhii
Ключові слова (укр):
математичні формули; редактор формул; шаблон; дублікат; конвертор форматів
Ключові слова (рус):
математические формулы; редактор формул; шаблон; дубликат; конвертор форматов
Ключові слова (англ):
mathematical formulas, equation editor; template; duplicate; format converter
Анотація (укр):
Складність аналізу і розпізнавання математичних формул, які містяться в текстових документах, полягає в тому, що для знаходження неповних дублікатів необхідно аналізувати не просто графічне зображення, проводячи фільтрацію, виділення контурів і застосовуючи специфічні методи порівняння, а й текстову інтерпретацію формули, щоб мати змогу ідентифікувати неповний дублікат, за умови, що у формулі було змінено позначення літер, символи математичних операцій, форми дужок тощо. Тому для знаходження неповних дублікатів математичних формул пропонується гібридний підхід, що передбачає використання шаблонів, створених відповідно до особливостей графічних редакторів, та спеціальних конверторів формул з різних форматів до канонічного формату.
Анотація (рус):
Сложность анализа и распознавания математических формул, содержащихся в текстовых документах, состоит в том, что для нахождения неполных дубликатов необходимо анализирвать не просто графическое изображение, проводя фильтрацию, выделение контуров и применяя специфические методы сравнения, но и текстовую интерпретацию формулы, чтобы иметь возможность идентифицировать неполный дубликат, при условии, что в формуле были изменены обозначения букв, символы математических операций, формы скобок и т.п. В связи с этим для нахождения неполных дубликатов математических формул предлагается гибридный подход, который предусматривает использование шаблонов, созданных в соответствии с особенностями графических редакторов, и специальных конверторов формул разных форматов к каноническому формату.
Анотація (англ):
The complexity of the analysis and recognition of mathematical formulas contained in text documents, is that in order to find the near duplication is necessary not only analysis a graphic image, by filtration, edge detection and using specific methods of comparison, but also textual interpretation of the formula, to be able to identify the part duplicate, provided that in the formula have been changed designation letters, symbols, mathematical operations, and the like shaped brackets In this regard, in order to find the near duplicates of mathematical formulas it had been proposed a hybrid approach that involves the use of templates, created in accordance with the features of graphic editors, special converters of formulas in various formats to the canonical format.
Публікатор:
Київський національний університет будівництва і архітектури
Назва журналу, номер, рік випуску (укр):
Управління розвитком складних систем, номер 27, 2016
Назва журналу, номер, рік випуску (рус):
Управление развитием сложных систем, номер 27, 2016
Назва журналу, номер, рік випуску (англ):
Management of Development of Complex Systems
Мова статті:
Українська
Формат документа:
application/pdf
Документ:
Дата публікації:
14 Июль 2016
Номер збірника:
Розділ:
ІНФОРМАТИЗАЦІЯ ВИЩОЇ ОСВІТИ
Університет автора:
Київський національний університет будівництва і архітектури, Київ; Київський національний університет ім. Т. Шевченка, Київ; Харківський національний університет радіоелектроніки; Харківський національний економічний університет ім. С. Кузнеця, Харків
Литература:
- Антиплагиат [Электронный ресурс]. – Режим доступа: http://www.antiplagiat.ru
- Білощицький, А.О. Ефективність методів пошуку збігів у текстах [Текст] / А.О. Білощицький, О.В. Діхтяренко // Управління розвитком складних систем. – 2013. – № 14.– С. 144 – 147.
- Білощицький А.О. Оптимізація системи пошуку збігів за допомогою використання алгоритмів локально чутливого хешування наборів текстових даних [Текст] / А.О. Білощицький, О.В. Діхтяренко // Управління розвитком складних систем. – 2014. – № 19.– С. 113 – 117.
- Білощицький А.О. Метод вилучення помилкових збігів текстів в електронних документах [Текст] /
А.О. Білощицький, С.Д. Криштоф, С.В. Білощицька, О.В. Діхтяренко // Управління розвитком складних систем. – 2015. – № 22(1). – С. 144 – 150. - Михайловський Ю.Б. Система Аnti-Рlagiarism як інструмент запобігання плагіату в навчальній та науковій діяльності [Текст] / Ю.Б. Михайловський, Н.А. Длугунович // Вісник Хмельницького національного університету. Технічні науки. – 2013. – № 3. – С. 162 – 168.
- Лупаренко Л. А. Інструментарій виявлення плагіату в наукових роботах: аналіз програмних рішень [Текст] / Л.А. Лупаренко // Інформаційні технології і засоби навчання. – 2014. – Т. 40. – №2.– С. 151 – 169.
- Шарапова Е.В. Исследование возможностей системы «Антиплагиат» для обнаружения заимствований [Текст] / Е.В. Шарапова // Перспективы науки и образования. – 2013 – №3.– С. 215 – 218.
- Shenoy M. Automatic Plagiarism Detection Using SimilarityAnalysis [online] / M. Shenoy, K. C.Shet, U.D. Acharya// Advanced Computing: An International Journal. – 2012. – № 3 (3). – P. 59-62.
- Очков В.Ф. Формулы в научно-технических публикациях: проблемы и решения [Текст] / В. Ф. Очков // Электронный журнал Cloud of Science. – 2014. – T. 1. – № 3. – 421 – 455. – http://cloudofscience.ru
- Kopka H., Daly P. A Guide to LATЕХ and Electronic Publishing [Текст] / H. Kopka, P. Daly. – 2003. – Addison-Wesley, Fourth edition – 660 p.
- Кнут Э. Д. Все про ТеХ. [Текст] / Э.Д. Кнут. – М.: Изд. "Вильямс", 2003. – 560 с.
- Очков В.Ф. Встроенные вычисления и отображение формул в электронных и печатных изданиях [Текст ] / В.Ф. Очков, Е.П. Богомолова., Е.В. Никульчев., С. Герк // Известия высших учебных заведений. Проблемы полиграфии и издательского дела. – № 6. – 2015. – С. 45 – 58.
- Гуссенс М. Путеводитель по пакету LaTех и его web-приложениям [Текст] / М. Гуссенс, С. Ратц. – М.: Мир, 2001. – 601 с.
- Гайтан О.М. Елементи технології реалізації автоматизованого адаптивного контролю знань студентів в комп’ютерних системах навчання [Текст] / О.М. Гайтан // Радіоелектронні і комп’ютерні системи. – 2014. – № 4 (68). – С. 97-105.
- Душкевич.О.Г. Редактор химических формул Symyx Draw: Учебно-методическое пособие для студентов химических специальностей [Текст] / О. Г. Душкевич. – Минск.: БГУ, 2014. – 40 с.
- Давидов М.В. Метод та інформаційна технологія озвучення математичних формул українською мовою [Текст] / М.В. Давидов, О.А. Лозицький, В.В. Пасічник // Штучний інтелект. – № 1. – 2013. – С. 233 – 245.
- Елизаров А.М. Веб-технологии для математика: основы MathML [Текст] / А.М. Елизаров, Е.К. Липачев,
М.А. Малахальцев. – М.: Физматлит, 2010. – 192 с. - J. Baker A linear grammar approach to mathematical formula recognition from PDF [Текст] / Baker J., Sexton A. and Sorge V. // Proc. of Intelligent Computer Mathematics, 2009. – Р. 127 – 133.
- Давидов М. В. Метод озвучення математичних формул та символів українською мовою [Текст] /
М. В. Давидов, О. А. Лозицький, Ю. В. Нікольський // Наукові праці [Чорноморського державного університету імені Петра Могили]. Сер. : Комп’ютерні технології. – 2013. – Т. 213, Вип. 201. – С. 24 – 29. - Ehrig H. Handbook of Graph Grammars and Computing byGraph Transformations [Текст] / H.Ehrig, G.Engels, H.–J. Kreowski, G.Rozenberg. – Volume 2:Applications, Languages and Tools World . – Scientific, 1999. – 132 р.
- Ian Hutchinson. Web Publishing Mathematics With MathML [Електронний ресурс] / Hutchinson Ian // IAP 2004. – Режим доступу : http://web.m it.edu/acs/iap05/mathml/mathmlfuture.pdf.
- Josef B. Baker, Alan P. Sexton, Volker Sorge, Masakazu Suzuki : Comparing Approaches to Mathematical Document Analysis from PDF. ICDAR 2011: 463-467 [Електронний ресурс]. – Режим доступу: http://www.inftyproject.org/en/index.html.
References:
- Antiplagiat. (2016). http://www.antiplagiat.ru.
- Biloshchytskyi, A. & Dikhtiarenko, O. (2013). The effectiveness of methods for finding matches in texts. Management of complex systems, 14, 144–147.
- Biloshchytskyi, A. & Dikhtiarenko, O. (2014). Optimization of Matching algorithms by using local-sensitive hash sets of text data. Management of complex systems, 19, 113–117.
- Biloshchytskyi, A., Kristof, S., Biloshchytska, S. & Dikhtiarenko, O. (2015). The method of elimination of erroneous coincidences text in electronic documents. Management of Development of Complex Systems, 22(1), 144–150.
- Myhaylovskyi, Yu., Dluhunovych, N. (2013). Аnti-Рlagiarism System as a Tool for Plagiarism Preventing in Educational and Research Activities. Jornal. Khmelnytskyi National University, 3, 162-168.
- Lupanenko, L.A. (2014). Plagiarism detection tools for research works: analysis of software solutions. Information Technology and Learning Tools, Vol 40, 2, 151–169.
- Sharapova, E. (2013). Investigation of possibilities "Anti-plagiarism" system to detect borrowing. Prospects for Science and Education, 3, 215–218.
- Shenoy, M., Shet, K., Acharya, U. (2012). Automatic Plagiarism Detection Using Similarity. Advanced Computing: An International Journal, 3(3), 59–62.
- Ochkov, V. (2014). The formulas in the scientific and technical publications: Problems and solutions. Cloud of Science, Vol. 1., 3, 421–455.
- Kopka, H., Daly, P. (2003). A Guide to LATEX and Electronic Publishing: Addison-Wesley, Fourth edition, 660.
- Knut, E. (2003). All about TeX. Moscow: Williams, 560.
- Ochkov, V., Bogomolova, E., Nikulchev, E., Gerk, S. (2015). Embedded computing and displaying formulas in the electronic and print media. Proceedings of the higher educational institutions. Problems printing and publishing, 6, 45–58.
- Gussens, M., Ratz, S. (2001). Guide to LaTeX package andweb-applications. Moscow: Mir, 601.
- Gaitan, O. (2014). Elements of adaptive technologies of automated monitoring of student learning in computer systems. Radio electronic and computer systems, 4(68), 97–105.
- Dushkevych, O. (2014). Editor chemical formulas SymyxDraw. Minsk: BGU, 40.
- Davydov, M., Lozytskyy, O., Nikolskyy, Y. (2013). Method of automatic formulas reading in Ukrainian. Artificial Inteligence, 1, 233–245.
- Elizarov, A., Lipachev, E., Malahaltsev, M. (2010). Web technologies for mathematics: the foundations MathML. Moscow: Fizmatlit, 192.
- Baker, J., Sexton, A., Sorge, V. (2009). A linear grammar approach to mathematical formula recognition from PDF. Proc. of Intelligent Computer Mathematics, 127–133.
- Davydov, M., Lozytskyy, O., Nikolskyy, Y. (2013). Method of automatic formulas and symbols reading in Ukrainian. Scientific works, Petro Mohyla Black Sea National University, 213(201), 24–29.
- Ehrig, H., Engels, G., Kreowski, H.–J., Rozenber, G. (1999). Handbook of Graph Grammars and Computing by Graph Transformations. Volume 2: Applications, Languages and Tools World: Scientific, 132.
- Hutchinson, I. Web Publishing Mathematics With Math ML: IAP. (2004). http://web.mit.edu/acs/iap05/mathml/mathmlfuture.pdf.
- Baker, J., Sexton, A., Sorge, V., Suzuki, M. Comparing Approaches to Mathematical Document Analysis from PDF: ICDAR (2011).http://www.inftyproject.org/en/index.html.