АНАЛИЗ АРХИТЕКТУР СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ОБНАРУЖЕНИЯ И КЛАССИФИКАЦИИ ОБЪЕКТОВ НА ВИДЕОПОСЛЕДОВАТЕЛЬНОСТЯХ БОЛЬШОГО РАЗРЕШЕНИЯ

И. Ю. ЗАХАРОВА; Д. ВОРОБЬЕВ

Авторы

И. Ю. ЗАХАРОВА Полоцкий государственный университет
Д. ВОРОБЬЕВ Полоцкий государственный университет

Аннотация

В приложении к задаче обнаружения объектов на видео большого разрешения рассмотрены архитектуры современных сверточных нейронных сетей. Выявлено, что применение масштабирования входного кадра большого разрешения к относительно малым размерам входного слоя СНС будет приводить к потере объектов небольшого размера, что ухудшает процедуру обнаружения в целом.

Библиографические ссылки

LeCun, Y. Gradient-based learning applied to document recognition. Proceedings of IEEE / Y. LeCun [et al.]. – 1998. – 86(11). – Р. 2278–2324.

Krizhevsky, I. Hinton. ImageNet classification with deep convolutional neural networks», Advances in Neural Information Processing Systems 25: Proc. of 26th Annual Conference on Neural Information Processing Systems / I. Krizhevsky, G.E. Sutskever. – 2012., Lake Tahoe, Nevada, United States. – Р. 1106–1114.

R-CNN for Object Detection [Electronic resource]. – Мode of acess: https://courses.cs.washington.edu/courses/cse590v/14au/cse590v_wk1_rcnn.pdf. – Date of access:

12.2017.

Ross B. Girshick, «Fast R-CNN», 2015 IEEE International Conference on Computer Vision, ICCV 2015, Santiago, Chile, December. – 2015. – Р. 1440–1448.

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks [Electronic resource]. – Mode of access: http://papers.nips.cc/paper/5638-faster-r-cnn-towards-real-time-objectdetection-with-region-proposal-networks.pdf. – Date of access: 20.12.17.

Christian Szegedy, Wei Liu, Yangqing Jia, Sermanet, Scott E. Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, Andrew Rabinovich «Going Deeper with Convolutions [Electronic resource]. – Mode of access: https://arxiv.org/pdf/1409.4842.pdf.

D. Erhan, C. Szegedy, A. Toshev, and D. Anguelov. «Scalable object detection using deep neural networks», 2014 IEEE Conference on Computer Vision and Pattern Recognition, CVPR 2014, Columbus, OH, USA. – 2014. – Р. 2155–2162.

Rethinking the Inception Architecture for Computer Vision [Electronic resource]. – Mode of access: https://arxiv.org/pdf/1512.00567.pdf. – Date of access: 10.03.17.

Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift [Electronic resource]. – Mode of access: https://arxiv.org/pdf/1502.03167.pdf. – Date of access: 10.03.17

He, K. Deep Residual Learning for Image Recognition / K. He, X. Zhang, S. Ren, J. Sun // Proc. of IEEE Conf. on Computer Vision and Pattern Recognition, CVPR 2016, Las Vegas, NV, USA. – 2016. – Р. 770–778.

Szegedy, C. Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning / C. Szegedy, S. Ioffe, V. Vanhoucke // Proc. of the Thirty-First AAAI Conference on Artificial Intelligence (AAAI-17). – 2017. – 4278–4284.

Redmon, J. You Only Look Once: Unified, Real-Time Object Detection / J. Redmon, S.K. Divvala, R.B. Girshick, A. Farhadi // Proc. of IEEE Conf. on Computer Vision and Pattern Recognition, CVPR 2016, Las Vegas, NV, USA. – 2016. – Р. 779–788.

YOLO9000 Better, Faster, Stronger [Electronic resource]. – Mode of access: https://arxiv.org/pdf/1612.08242.pdf. – Date of access: 15.06.17.

Vorobjov, D. An effective object detection algorithm for high resolution video by using convolutional neural network / D. Vorobjov, I. Zakharava, R. Bohush, S. Ablameyko // Proc. of the 15th Int. Symposium on Neural Networks (ISNN 2018), June 25–28 2018, Minsk. – 2018. – Р. 503–508.