我们提出了Imagen,一个文本到图像的扩散模型,具有前所未有的写实主义程度和深度的语言理解。Imagen建立在理解文本的大型变压器语言模型的基础上,并依赖于在高保真图像生成中扩散模型的强度。我们的关键发现是,在纯文本语料库上进行预训练的通用大型语言模型(例如T5)在编码用于图像合成的文本方面惊人地有效:在Imagen中增加语言模型的大小比增加图像扩散模型的大小更能提高样本保真度和图像-文本对齐。Imagen在没有经过COCO训练的情况下,在COCO数据集上获得了7.27的最新FID分数,并且人类评分者发现Imagen样本在图像-文本对齐方面与COCO数据本身不相上下。为了更深入地评估文本到图像模型,我们引入了DrawBench,这是一个全面且具有挑战性的文本到图像模型基准测试。使用DrawBench,我们将Imagen与最近的方法进行了比较,包括VQ-GAN+CLIP、潜在扩散模型和DALL-E 2,并发现人类评分者在并排比较中更喜欢Imagen,无论是在样本质量还是图像-文本对齐方面。
类似的工具
千库AI·无限画
AI应用场景全面覆盖,未来将创造无限可能
DragGAN(GitHub)
全部开源,支持Windows, macOS, Linux
美图设计室-AI绘画
AI智能工具 为设计助力
秒画-SenseMirage
打造AI画图“模型超市”,心想画成
其他人也看的工具
中国信通院
中国信息通信研究院(以下简称“中国信通院”)始建于1957年,是工业和信息化部直属科研事业单位。
中国通信标准化协会
中国通信标准化协会(以下简称:协会)采用单位会员制。作为开放的标准化组织,协会面向全社会开放会员申请,广泛吸收产品制造、通信运营、互联网等企业,科研、技术开发、设计单位,高等院校和社团组织等参加协会。
中国电子技术标准化研究院
坚持“标准为本, 创新致远”的文化核心, 秉承“科学、公正、创新、服务”的精神,履行“支撑政府,服务产业,奉献标准化最大价值”的使命,加快建成国内一流, 国际知名的标准化科研与服务机构。
中国计算机学会
中国计算机学会(CCF)成立于1962年,全国一级学会,独立社团法人,中国科学技术协会成员。
中国图象图形学学会
积极开展图像图形基础理论和高新技术的研究,促进该学科技术的发展和在国民经济各个领域的推广应用。
中国电影电视技术学会
中国科学技术协会的团体会员单位
AI 中文社
