WAVESTYLEGAN: ВЕЙВЛЕТ-ГЕНЕРАТИВНАЯ СОСТЯЗАТЕЛЬНАЯ СЕТЬ

##plugins.themes.bootstrap3.article.main##

В. А. ВОРОБЕЙ
А. Э. МАЛЕВИЧ

Аннотация

Разработана модель генеративной состязательной сети WaveStyleGAN для работы с изображениями на основе семейства архитектур StyleGAN. Ключевыми особенностями предложенной архитектуры являются переход к обработке вейвлет-признаков изображений, использование в дискриминаторе самомодулируемых сверток, а также модифицированных блоков Fast Fourier Convolution. Внесенные изменения позволили уменьшить сложность и размер модели по сравнению с базовыми версиями. Полученная модель была обучена на наборе данных человеческих лиц FFHQ в разрешении 1024×1024 и смогла сохранить высокое качество генерации изображений при значительно уменьшенном количестве итераций обучения. Время работы обученной сети на CPU сократилось примерно втрое по сравнению с оригинальной моделью, что существенно расширяет возможности по ее встраиванию в окружения, где отсутствует доступ к вычислениям на графическом процессоре.

##plugins.themes.bootstrap3.article.details##

Как цитировать
ВОРОБЕЙ, В. А., & МАЛЕВИЧ, А. Э. (2025). WAVESTYLEGAN: ВЕЙВЛЕТ-ГЕНЕРАТИВНАЯ СОСТЯЗАТЕЛЬНАЯ СЕТЬ. Вестник Полоцкого государственного университета. Серия С. Фундаментальные науки, (2), 2-8. https://doi.org/10.52928/2070-1624-2025-45-2-2-8
Биография автора

А. Э. МАЛЕВИЧ, Белорусский государственный университет, Минск

канд. физ.-мат. наук, доц.

Библиографические ссылки

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis / P. Esser, S. Kulal, A. Blattmann et al. // arXiv.org. – 2024. – DOI: 10.48550/arXiv.2403.03206.

DEsignBench: Exploring and Benchmarking DALL-E 3 for Imagining Visual Design / K. Lin, Z. Yang, L. Li et al. // arXiv.org. – 2023. – DOI: 10.48550/arXiv.2310.15144.

Analyzing and Improving the Image Quality of StyleGAN / T. Karras, S. Laine, M. Aittala et al. // arXiv.org. – 2019. – DOI: 10.48550/arXiv.1912.04958.

Alias-Free Generative Adversarial Networks / T. Karras, M. Aittala, S. Laine et al. // arXiv.org. – 2021. – DOI: 10.48550/arXiv.2106.12423.

Sauer A., Schwarz K., Geiger A. StyleGAN-XL: Scaling StyleGAN to Large Diverse Datasets // arXiv.org. – 2022. – DOI: 10.48550/arXiv.2202.00273.

SWAGAN: A Style-based Wavelet-driven Generative Model / R. Gal, D. Cohen, A. Bermano, D. Cohen-Or // arXiv.org. – 2021. – DOI: 10.48550/arXiv.2102.06108.

LiteVAE: Lightweight and Efficient Variational Autoencoders for Latent Diffusion Models / S. Sadat, J. Buhmann, D. Bradley et al. // arXiv.org. – 2024. – DOI: 10.48550/arXiv.2405.14477.

Chi L., Jiang B., Mu Y. Fast Fourier Convolution // Advances in Neural Information Processing Systems 33 (NeurIPS 2020). – 2020. – URL: https://papers.nips.cc/paper_files/paper/2020/hash/2fd5d41ec6cfab47e32164d5624269b1-Abstract.html (date of access: 07.09.2025).

Differentiable Augmentation for Data-Efficient GAN Training / S. Zhao, Z. Liu, J. Lin et al. // arXiv.org. – 2020. – DOI: 10.48550/arXiv.2006.10738.