我们介绍的 DeepFloyd IF 是一种新颖、先进的开源文本到图像模型,具有高度的逼真性和语言理解能力。DeepFloyd IF 是一个模块,由一个冻结文本编码器和三个级联像素扩散模块组成:一个基本模型,根据文本提示生成 64×64 px 的图像;两个超分辨率模型,分别用于生成分辨率不断提高的图像:256×256 px 和 1024×1024 px。该模型的所有阶段都使用基于 T5 变换器的冻结文本编码器来提取文本嵌入,然后将其输入到具有交叉注意力和注意力池增强功能的 UNet 架构中。结果是一个高效的模型,其性能超过了目前最先进的模型,在 COCO 数据集上获得了 6.66 分的零镜头 FID 分数。我们的工作强调了大型 UNet 架构在级联扩散模型第一阶段的潜力,并描绘了文本到图像合成的美好前景。
类似的工具
免费AI 中文社
AI 中文社区 - 一个学习交流 AI 人工智能技术的中文社区
Janitor AI 角色扮演聊天
角色扮演聊天机器人Janitor AI,Janitor AI 被证明是各行业用户的多功能且不可或缺的平台。
Civitai社区 – C站
分享和发现人工智能艺术创作的资源
笔灵AI写作
提供公文模板,简化公文写作的复杂性,使公文格式规范、内容准确。
PaperPro
提供专业的论文重复率检测、论文降重、论文格式排版、论文格式规范等一站式服务
讯飞AI写作
通用稿件5分钟生成,深度稿件编辑效率翻番。一站式高效运营,全流程智能优化。
他人最近看的工具
Typewise.app
Typewise的使命是通过解码人类的思想,让日常生活更轻松。我们创建文本预测软件,提高企业生产力。
circlel abs
由 AI 驱动的自己独特的角色来扩展他们的想象力。我们称它们为形状。
Stable Chat
用轻松、幽默的方式写一份,关于运动鞋的销售文案。
即时灵感
免费不限次数的国产AI绘画
starry.ai
starry.ai只需描述您想看到的内容即可生成艺术 ?,我们的人工智能会将您的文字转化为艺术。
伊利诺伊大学厄巴纳-香槟分校
伊利诺伊大学厄巴纳-香槟分校(University of Illinois at Urbana-Champaign,缩写为UIUC)创建于1867年,坐落于伊利诺伊州双子城厄巴纳–香槟市,是一所美国公立研究型大学。该校是美国“十大联盟(Big Ten)”创始成员,美国大学协会(AAU)成员,被誉为“公立常春藤”。
AI 中文社
