DOI: https://doi.org/10.20998/2522-9052.2020.1.17

ДОСЛІДЖЕННЯ ТРАНСФОРМАЦІЙ ПРОСТОРУ ДАНИХ ПРИ НАВЧАННІ МЕРЕЖІ КОХОНЕНА У МЕТОДАХ СТРУКТУРНОЇ КЛАСИФІКАЦІЇ ЗОБРАЖЕНЬ

Volodymyr Gorokhovatsky, Dmytro Pupchenko, Natalia Stiahlyk

Анотація


Предметом досліджень статті є модифікація засобів навчання мережі Кохонена задля класифікації зображень у системах комп’ютерного зору. Метою є визначення нового простору даних для навчання мережі та створення ефективного методу класифікації на основі множини дескрипторів ключових точок. Завдання: застосування нейронної мережі Кохонена для навчання системи класифікації у визначеному просторі даних, трансформація простору даних навчання мережі, вивчення адаптаційних можливостей і оцінювання ефективності функціонування мережі засобами програмного моделювання. Методами є: інтелектуальний аналіз даних, апарат структурної класифікації зображень, детектор ORB для визначення дескрипторів ключових точок, засоби навчання мережі Кохонена, програмне моделювання. Отримані такі результати. Запропоновано моделі трансформації даних, які підвищують результативність навчання. Проведено порівняльний аналіз розроблених методів навчання та класифікації. Здійснена програмна реалізація системи класифікації, експериментально проведено дослідження її ефективності та оцінювання часу оброблення. Висновки. Наукова новизна дослідження полягає в удосконаленні методів структурної класифікації з використанням навчання мережі Кохонена шляхом впровадження нового простору даних на базі центрів описів еталонів та згортання даних, що сприяє забезпеченню високої результативності класифікації при достатній швидкодії та дає можливість використовувати модифіковані методи у застосунках реального часу. Практичну значимість роботи складають отримані моделі програмного забезпечення для оцінювання ефективності класифікаторів у системах комп’ютерного зору, підтверджена ефективність розробок на прикладах баз даних зображень.


Ключові слова


комп'ютерний зір; структурне розпізнавання зображень; ключові точки зображення; дескриптор; детектор ORB; ме-режа Кохонена; навчання мережі; простір даних; програмне моделювання; база зображень

Повний текст:

PDF

Посилання


Gorokhovatsky, V.O. (2014), Structural analysis and data mining in computer vision, SMIT, Kharkiv, 316 p.

Gorokhovatsky, V.O. and Pupchenko, D.V. (2018), “Classification of images of visual objects according to the set of de-scriptors of singular points based on the Kohonen neural network”, Control, navigation and communication systems, No. 2 (48), pp. 68-72.

Gorokhovatsky, V.O., Pupchenko, D.V. and Solodchenko, K.G. (2018), “Analysis of the properties, characteristics and results of using the latest detectors to determine specific points of the image”, Control, navigation and communication systems, No. 1 (47), pp. 93-98.

Gorokhovatsky, V.A. (2018), “Image Classification Methods in the Space of Descriptions in the Form of a Set of the Key Point Descriptors”, Telecommunications and Radio Engineering, 77 (9), pp. 787-797.

Leutenegger, S., Chli, M. and Siegwart, R.Y. (2011), “BRISK: Binary Robust Invariant Scalable Keypoints”, Computer Vision (ICCV), pp. 2548-2555.

Ethan, Rublee, Vincent, Rabaud, Kurt, Konolige and Gary, Bradski (2011), “ORB: an efficient alternative to SIFT or SURF”, Computer Vision (ICCV), IEEE International Conference on IEEE, pp. 2564-2571.

Kohonen, T. (2013), Self-organizing maps, BINOM. Laboratory of Knowledge, Moscow, 655 p.

Osovsky, S. (2002), Neural networks for information processing, Finance and statistics, Moscow, 344 p.

Borisov, E. (2014), Cluster based on the Kohonen neural network, available at: http://mechanoid.kiev.ua/neural-net-kohonen-clusterization.html

Mousavi, S.M.H. and Lyashenko, V. (2017), “Extracting old persian cuneiform font out of noisy images (handwritten or in-scription)”, 10th Iranian Conference on Machine Vision and Image Processing (MVIP), pp. 241-246.

Han, J. and Kamber, M., (2006), Data Mining: Concepts and Techniques, Morgan Kaufmann Publishers, Amsterdam, 754 p.

Gadetska, S.V. and Gorokhovatsky, V.O. (2018), “Statistical Measures for Computation of the Image Relevance of Visual Objects in the Structural Image Classification Methods”, Telecommunications and Radio Engineering, 77 (12), pp. 1041–1053.

Lin, M., Chen, Q., and Yan, S. (2013), “Network in network”, arXiv preprint arXiv:1312.4400.

Josiah, Wang, Katj,a Markert, and Mark, Everingham (2009), “Learning Models for Object Recognition from Natural Language Descriptions”, Proceedings of the 20th British Machine Vision Conference (BMVC2009), September 2009.

Wang, J., Markert, K., and Everingham, M. (2009), “Learning Models for Object Recognition from Natural Language Descrip-tions”, BMVC, Vol. 1, p. 2.

Gorokhovatsky, O., Gorokhovatskyi, V. and Peredrii, O. (2018), “Analysis of Application of Cluster Descriptions in Space of Characteristic Image Features”, Data, 3(4), 52, DOI: http://doi.org/10.3390/data3040052

Calonder, M., Lepetit, V., Strecha, C. and Fua, P. (2010), “Brief: Binary robust independent elementary features”, European conference on computer vision, Springer, Berlin, pp. 778-792.

OpenCV foundation (2017), OpenCV: Image Thresholding, available at:

https://docs.opencv.org/3.3.0/d7/d4d/tutorial_py_thresholding.html




Copyright (c) 2020 Volodymyr Gorokhovatsky, Dmytro Pupchenko, Natalia Stiahlyk