我们提出了Imagen,一个文本到图像的扩散模型,具有前所未有的写实主义程度和深度的语言理解。Imagen建立在理解文本的大型变压器语言模型的基础上,并依赖于在高保真图像生成中扩散模型的强度。我们的关键发现是,在纯文本语料库上进行预训练的通用大型语言模型(例如T5)在编码用于图像合成的文本方面惊人地有效:在Imagen中增加语言模型的大小比增加图像扩散模型的大小更能提高样本保真度和图像-文本对齐。Imagen在没有经过COCO训练的情况下,在COCO数据集上获得了7.27的最新FID分数,并且人类评分者发现Imagen样本在图像-文本对齐方面与COCO数据本身不相上下。为了更深入地评估文本到图像模型,我们引入了DrawBench,这是一个全面且具有挑战性的文本到图像模型基准测试。使用DrawBench,我们将Imagen与最近的方法进行了比较,包括VQ-GAN+CLIP、潜在扩散模型和DALL-E 2,并发现人类评分者在并排比较中更喜欢Imagen,无论是在样本质量还是图像-文本对齐方面。
类似的工具
免费AI 中文社
AI 中文社区 - 一个学习交流 AI 人工智能技术的中文社区
Janitor AI 角色扮演聊天
角色扮演聊天机器人Janitor AI,Janitor AI 被证明是各行业用户的多功能且不可或缺的平台。
抖音Dreamina – 免费
抖音剪映旗下的一款AI绘画工具,能够根据用户提供的文本内容生成由AI制作的创意图片
喵呜提示词助手
将复杂的 Midjourney 提示词"咒语"进行可视化编辑和调整,输入中文提示词自动翻译成英文,傻瓜式操作,帮助您更好的创作提示词
易搜猫
易搜猫_自媒体_伪原创_原创检测_海量素材_写作技巧
LiblibAI·哩布哩布AI
限时免费的LoRA炼丹炉!更全、更热门的素材,为所有AI绘画者提供更得心应手的平台,持续深耕专业领域。
他人最近看的工具
LiblibAI·哩布哩布AI
限时免费的LoRA炼丹炉!更全、更热门的素材,为所有AI绘画者提供更得心应手的平台,持续深耕专业领域。
[新]免费ZCode
ZCode 将最强大的 AI Agents 与现有工具链结合,让你在熟悉的流程中完成规划、编码、评审与上线。https://zcode.z.ai/cn
飞桨AI Studio
百度飞桨人工智能学习实训社区
NightCafe Creator
NightCafe Creator 是一款 AI 艺术生成器应用程序,具有多种 AI 艺术生成方法。使用神经风格迁移,您可以将您的照片变成杰作。使用文本到图像的 AI,您可以只根据文本提示创建艺术作品。
AI 中文社
