(資料圖片僅供參考)
點藍色字關注機器學習算法工程師
設為星標,干貨直達!
自從 DALL·E 2 之后,在圖像生成方面擴散模型替换GAN成了主流方向,比如開源的文生圖模型stable diffusion也是基于diffusion架構的。近日, Adobe研究者在論文Scaling up GANs for Text-to-Image Synthesis提出了參數量為10億(1B)的GAN模型:GigaGAN,其在文生圖功效上接近擴散模型功效,而且推理速度更快,生成512×512大小圖像只必须013s,生成16M像素圖像只必须 366s。同時GigaGAN也支持latent空間的編輯性能,比如latent插值,風格融合,以及向量運算等。