AI 中文社/ AI 工具

申请收录返回

AI设计/ AI字体设计

DeepFloyd Lab

一种新颖、先进的开源文本到图像模型

标签： AI字体设计 DeepFloyd Lab

浏览(463) 点赞(0) 收藏(0) 反馈 访问工具

我们介绍的 DeepFloyd IF 是一种新颖、先进的开源文本到图像模型，具有高度的逼真性和语言理解能力。DeepFloyd IF 是一个模块，由一个冻结文本编码器和三个级联像素扩散模块组成：一个基本模型，根据文本提示生成 64×64 px 的图像；两个超分辨率模型，分别用于生成分辨率不断提高的图像：256×256 px 和 1024×1024 px。该模型的所有阶段都使用基于 T5 变换器的冻结文本编码器来提取文本嵌入，然后将其输入到具有交叉注意力和注意力池增强功能的 UNet 架构中。结果是一个高效的模型，其性能超过了目前最先进的模型，在 COCO 数据集上获得了 6.66 分的零镜头 FID 分数。我们的工作强调了大型 UNet 架构在级联扩散模型第一阶段的潜力，并描绘了文本到图像合成的美好前景。

类似的工具

其他人也看的工具

0条评论

提倡鼓励AI创业者，一个产品需经历无数次失败才能成品。

评论

游客

登录后再评论

赠人玫瑰，手有余香。
和谐社区，和谐点评。

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

登录如果没有账号，请先注册账号

申请收录打赏站长

推荐 AI 小工具

Janitor AI 角色扮演聊天

在问

易搜猫

Midjourney提示词（咒语）生成器

云雀大模型

喵呜提示词助手

Dify

CapCut剪映专业版

Write Wise网文小说写作

反谱

Otter.ai

Vmake

关于我们/ 免责声明/ 问与答/ 积分奖励消耗规则/ 联系我们/ Markdown 教程

Copyright © 2022-2025 aizws.net · 网站版本: v1.2.6·内部版本: v1.25.2· 页面加载耗时 0.00 毫秒·物理内存 180.7MB ·虚拟内存 1439.6MB

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。为了更好的体验，本站推荐使用 Chrome 浏览器。