DOI: https://doi.org/10.20998/2522-9052.2020.4.13

Дослідження методу нормалізації зображень на базі дескрипторів та порівняльний аналіз дескрипторів SURF, SIFT, BRISK, ORB, KAZE, AKAZE

Olena Yakovleva, Kateryna Nikolaieva

Анотація


Предметом досліджень є нормалізація зображень на основі аналізу характерних точок. Метою є розроблення математичних моделей та їх програмна реалізація для нормалізації геометричних перетворень зображень на основі аналізу дескрипторів SIFT, SURF, ORB, BRISK,  KAZE, AKAZE; застосування цієї моделі для проведення порівняльного аналізу дескрипторів на основі експертних оцінок якості нормалізації, часових витрат та інших показників; формування та використання в експериментах власного датасету зі 100 реальних пар зображень, які містять сцени п’яти типів: будівлі та міські пейзажі, плоскі зображення, що зустрічаються на вулиці, плоскі зображення внутрішнього інтер’єру, природні та штучні текстури; висновки відносно використання розглянутих дескрипторів для вирішення задач нормалізації. Застосовуваними методами є: дескриптори SIFT, SURF, ORB, BRISK, KAZE, AKAZE для опису характерних точок, Nearest Neighbor Distance Ratio метод або симетричний метод для пошуку відповідних пар характерних точок з різних зображень, RANSAC метод для видалення хибних відповідностей та отримання параметрів матриці гомографії, міри подібності, програмне моделювання. Отримані результати: результати експериментів щодо нормалізації дескрипторами SIFT, SURF, ORB, BRISK,  KAZE, AKAZE для 100 реальних пар зображень (нормалізовані зображення, їх перекриття, кількісні оцінки дескрипторів, precision and recall показники, часові витрати, експертні оцінки якості, конвертація всіх значень показників в 8-бальну рейтингову шкалу, підсумкові діаграми та висновки про переваги та слабкі місця дескрипторів, що порівнювалися; рекомендації відносно реалізації методу нормалізації у конкретних випадках.


Ключові слова


нормалізація геометричних перетворень; детектор; дескриптор; SURF; SIFT; BRISK; ORB; KAZE; AKAZE; метод RANSAC; метод k-найближчих сусідів; Nearest Neighbor Distance Ratio; бібліотека OpenCV

Повний текст:

PDF (English)

Посилання


Gorokhovatskij, V.A. (2014), Strukturny`j analiz i intellektual`naya obrabotka danny`kh v komp`yuternom zrenii [Structural analysis and data mining in computer vision], Kompaniya SMIT, Khar`kov, 316 p. (in Russian)

Putyatin, E.P. and Averin, S.I. (1990), Obrabotka izobrazhenij v robototekhnike [Image processing in robotics], Mashinostroenie, Moscow, 320 p. (in Russian)

Krizhevsky, A., Sutskever, I., and Hinton, G.E. (2017), “ImageNet classification with deep convolutional neural networks”, Communications of the ACM, No60(6), pp. 84-90.

Putjatin E.P., Jakovleva E.V., Ljubchenko V.A. (1996), “Razlozhenie matricy centroaffinnogo preobrazovanija dlja normalizacii izobrazhenij” [Centroaffine transformation matrix decomposition for image normalization], Radiojelektronika i informatika No. 4 (05), pp. 91–94. (in Russian)

Yakovleva, E.V. (2004), “Metody` odnomerny`kh normalizaczij affinny`kh preobrazovanij v zadachakh raspoznavaniya izobrazhenij: dissertation” [Methods of dimensional normalization affine transformations in image recognition tasks: dissertation], Kharkiv, 199 p. (in Russian)

Genkin, V.L., Erosh, I.L., and Moskalev, E.S. (1988), Sistemy` raspoznavaniya avtomatizirovanny`kh proizvodstv [Recognition systems for automated production], Mashinostroenie, Leningrad, 246 p. (in Russian)

Lyubchenko, V.A. (2004), “Matematicheskie modeli i metody` normalizaczii proektivny`kh preobrazovanij v sistemakh obrabotki izobrazhenij: dissertation” [Mathematical models and methods of normalization of projective transformations in image processing systems: dissertation], Kharkiv 156 p.

Lowe, D.G. (2004), “Distinctive image features from scale-invariant keypoints”, International journal of computer vision, Vol. 60. – No 2. – pp. 91-110.

Bay, H., Tuytelaars, T., and Van Gool, L. (2006), “Surf: Speeded up robust features”, European conference on computer vision. Springer, Berlin, Heidelberg, pp. 404-417.

Rublee, E. et al. (2011), ORB: “An efficient alternative to SIFT or SURF”, 2011 International conference on computer vision, Ieee, pp. 2564-2571.

Leutenegger, S., Chli, M., and Siegwart, R.Y. (2011), “BRISK: Binary robust invariant scalable keypoints”, 2011 International conference on computer vision, Ieee, pp. 2548-2555.

Alcantarilla, P.F., Bartoli, A., and Davison, A.J. (2012), “KAZE features”, European Conference on Computer Vision, Springer, Berlin, Heidelberg, pp. 214-227.

Alcantarilla, P. F., and Solutions, T. (2011), “Fast explicit diffusion for accelerated features in nonlinear scale spaces”, IEEE Trans. Patt. Anal. Mach. Intell, Vol. 34, No 7, pp. 1281-1298.

Márquez-Neila P. et al. (2016), “Speeding-up homography estimation in mobile devices”, Journal of Real-Time Image Processing, Vol. 11, No 1, pp. 141-154.

(2020); Detail material on “Research of descriptor based image normalization and comparative analysis of SURF, SIFT, BRISK, ORB, KAZE, AKAZE descriptors” (original image pairs, normalized images, their overlaps, the tables with different estimations, summary diagrams etc.)” available at: https://github.com/SytossResearch/DescriptorBasedNormalization




Copyright (c) 2021 Olena Yakovleva, Kateryna Nikolaieva