WAVESTYLEGAN: ВЕЙВЛЕТ-ГЕНЕРАТИВНАЯ СОСТЯЗАТЕЛЬНАЯ СЕТЬ
##plugins.themes.bootstrap3.article.sidebar##
##plugins.themes.bootstrap3.article.main##
Аннотация
Разработана модель генеративной состязательной сети WaveStyleGAN для работы с изображениями на основе семейства архитектур StyleGAN. Ключевыми особенностями предложенной архитектуры являются переход к обработке вейвлет-признаков изображений, использование в дискриминаторе самомодулируемых сверток, а также модифицированных блоков Fast Fourier Convolution. Внесенные изменения позволили уменьшить сложность и размер модели по сравнению с базовыми версиями. Полученная модель была обучена на наборе данных человеческих лиц FFHQ в разрешении 1024×1024 и смогла сохранить высокое качество генерации изображений при значительно уменьшенном количестве итераций обучения. Время работы обученной сети на CPU сократилось примерно втрое по сравнению с оригинальной моделью, что существенно расширяет возможности по ее встраиванию в окружения, где отсутствует доступ к вычислениям на графическом процессоре.
##plugins.themes.bootstrap3.article.details##

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
А. Э. МАЛЕВИЧ, Белорусский государственный университет, Минск
канд. физ.-мат. наук, доц.
Библиографические ссылки
Scaling Rectified Flow Transformers for High-Resolution Image Synthesis / P. Esser, S. Kulal, A. Blattmann et al. // arXiv.org. – 2024. – DOI: 10.48550/arXiv.2403.03206.
DEsignBench: Exploring and Benchmarking DALL-E 3 for Imagining Visual Design / K. Lin, Z. Yang, L. Li et al. // arXiv.org. – 2023. – DOI: 10.48550/arXiv.2310.15144.
Analyzing and Improving the Image Quality of StyleGAN / T. Karras, S. Laine, M. Aittala et al. // arXiv.org. – 2019. – DOI: 10.48550/arXiv.1912.04958.
Alias-Free Generative Adversarial Networks / T. Karras, M. Aittala, S. Laine et al. // arXiv.org. – 2021. – DOI: 10.48550/arXiv.2106.12423.
Sauer A., Schwarz K., Geiger A. StyleGAN-XL: Scaling StyleGAN to Large Diverse Datasets // arXiv.org. – 2022. – DOI: 10.48550/arXiv.2202.00273.
SWAGAN: A Style-based Wavelet-driven Generative Model / R. Gal, D. Cohen, A. Bermano, D. Cohen-Or // arXiv.org. – 2021. – DOI: 10.48550/arXiv.2102.06108.
LiteVAE: Lightweight and Efficient Variational Autoencoders for Latent Diffusion Models / S. Sadat, J. Buhmann, D. Bradley et al. // arXiv.org. – 2024. – DOI: 10.48550/arXiv.2405.14477.
Chi L., Jiang B., Mu Y. Fast Fourier Convolution // Advances in Neural Information Processing Systems 33 (NeurIPS 2020). – 2020. – URL: https://papers.nips.cc/paper_files/paper/2020/hash/2fd5d41ec6cfab47e32164d5624269b1-Abstract.html (date of access: 07.09.2025).
Differentiable Augmentation for Data-Efficient GAN Training / S. Zhao, Z. Liu, J. Lin et al. // arXiv.org. – 2020. – DOI: 10.48550/arXiv.2006.10738.
Рекомендуемые статьи автора (авторов)
- В. А. ВОРОБЕЙ, А. Э. МАЛЕВИЧ, ЭФФЕКТИВНОЕ УМЕНЬШЕНИЕ РАЗРЕШЕНИЯ ИЗОБРАЖЕНИЙ В НЕЙРОННЫХ СЕТЯХ НА ОСНОВЕ ВЕЙВЛЕТОВ, Вестник Полоцкого государственного университета. Серия С. Фундаментальные науки: № 2 (2024)