GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型_世界关注

程序员客栈 2023-04-10 09:56:08


【资料图】

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

自从 DALL·E 2 之后,在图像生成方面扩散模型替代GAN成了主流方向,比如开源的文生图模型stable diffusion也是基于diffusion架构的。近日, Adobe研究者在论文Scaling up GANs for Text-to-Image Synthesis提出了参数量为10亿(1B)的GAN模型:GigaGAN,其在文生图效果上接近扩散模型效果,而且推理速度更快,生成512x512大小图像只需要0.13s,生成16M像素图像只需要 3.66s。同时GigaGAN也支持latent空间的编辑功能,比如latent插值,风格混合,以及向量运算等。

GigaGAN改进了StyleGAN架构,采用两阶段训练策略:一个是64x64的图像生成器和一个512x512的图像超分2器,其图像生成器架构如下所示(这里也是采用CLIP text encoder来引入text condition):GigaGAN在 LAION2B-en和 COYO-700M数据集上训练,其在COCO数据集上的FID达到9.09,超过stable diffusion 1.5,推理速度比stable diffusion快20倍多(2.9s vs 0.13s):GigaGAN除了文生图能力,还可以实现可控的合成,比如风格混合,如下图所示:更多效果图和技术细节见论文https://arxiv.org/abs/2303.05511和网站https://mingukkang.github.io/GigaGAN/
x

热门推荐

航空市场逐渐回暖 机票均价环比涨幅明显

2022-06

海南推动农贸市场全面落实禁塑 加强违禁塑料制品源头治理

2021-12

柴犬登登拍卖记:动物是如何被司法拍卖的

2021-12

江西:到2025年鄱阳湖区断面水质优良比例达到50%以上

2021-12

西藏森林消防:锻造雪域救援尖兵 打造高海拔山岳救援队伍

2021-12

加强人才融通发展 第10届海峡两岸水利青年工程交流营成功举办

2021-12

四川:空手夺刀救人的“95后”女民警捐献万元奖金传递爱心

2021-12

中国食品名市临沂坚持“三化融合” 争做“食安”守望者

2021-12

上海闵行一幼儿园教职工殴打幼儿 2名涉事人员已被行拘

2021-12

受贿1414万元 江西万载县委原书记胡全顺获刑11年6个月

2021-12

推荐阅读

GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型_世界关注

2023-04

it专业学什么_it专业

2023-04

Hystrix缓存的使用

2023-04

给女的送什么礼物好 环球消息

2023-04

马竞客场2-1十人巴列卡诺迎联赛5连胜,莫利纳、埃尔莫索破门

2023-04

全球快消息!日常生活:虹吸效应是什么意思

2023-04

玫瑰疹怎么治疗才能彻底止痒_玫瑰疹怎么治疗

2023-04

印尼苏门答腊岛西北部海域发生6.0级地震 当前观点

2023-04

Linux用户管理

2023-04

邮政编码 国际_中国邮编国际代码是多少|每日时讯

2023-04