Imagen【推荐试用】

Imagen【推荐试用】

我们提出了Imagen,一个文本到图像的扩散模型,具有前所未有的写实主义程度和深度的语言理解。

标签: 文生图 图像扩散模型 文本转图像 文转图像模型

浏览(432) 点赞(0) 收藏(0) 反馈 访问工具

我们提出了Imagen,一个文本到图像的扩散模型,具有前所未有的写实主义程度和深度的语言理解。Imagen建立在理解文本的大型变压器语言模型的基础上,并依赖于在高保真图像生成中扩散模型的强度。我们的关键发现是,在纯文本语料库上进行预训练的通用大型语言模型(例如T5)在编码用于图像合成的文本方面惊人地有效:在Imagen中增加语言模型的大小比增加图像扩散模型的大小更能提高样本保真度和图像-文本对齐。Imagen在没有经过COCO训练的情况下,在COCO数据集上获得了7.27的最新FID分数,并且人类评分者发现Imagen样本在图像-文本对齐方面与COCO数据本身不相上下。为了更深入地评估文本到图像模型,我们引入了DrawBench,这是一个全面且具有挑战性的文本到图像模型基准测试。使用DrawBench,我们将Imagen与最近的方法进行了比较,包括VQ-GAN+CLIP、潜在扩散模型和DALL-E 2,并发现人类评分者在并排比较中更喜欢Imagen,无论是在样本质量还是图像-文本对齐方面。

类似的工具

其他人也看的工具

FreeCheck

专业的免费论文查重、AI智能降重、论文预测、在线报告、论文指导等一站式服务

Max AI

🌟Max:点燃创作灵感,让文案翻滚起来! Max,为营销文案创作者量身打造的AI写作工具,为你的创作之旅注入无限灵感。

Civitai社区 – C站

分享和发现人工智能艺术创作的资源

PromptoMANIA

PromptoMANIA是一个免费的AI艺术社区,具有在线提示生成器,帮助用户成为CF Spark, Midjourney或Stable Diffusion大师。它包括一个提示生成器、网格分配器和常见问题,帮助用户创建高质量和详细的AI图像。提示构建器是用户友好的,非常适合初学者,并允许用户选择扩散模型,放下图像的提示或主题,选择基础图像,并从艺术家启发的其他艺术风格中选择。网格分配器可以将Midjourney或稳定扩散的索引图像分离为可以保存的单独图片。

Dreamphilic

Dreamphilic是一个人工智能生成内容的首页工具,是一个自动为人工智能生成内容创建首页的工具。它使用人工智能算法生成一系列适合用户特定需求和偏好的设计、布局和内容。该工具还提供分析和见解,帮助用户了解他们的内容是如何执行的。该工具旨在帮助用户为他们的人工智能生成的内容创建一个专业和引人入胜的首页。

马萨诸塞大学阿默斯特分校

马萨诸塞大学,又译麻省大学(University of Massachusetts,简称UMASS),是美国公立大学系统。马萨诸塞大学起源于1863年建立在美国麻省安姆斯特镇(Amherst)的马萨诸塞大学阿默斯特分校,如今已经发展成一个拥有5个校区的美国著名公立大学系统,包括麻省大学阿默斯特分校、麻省大学波士顿分校、麻省大学达特茅斯分校、麻省大学洛威尔分校和麻省大学医学院五个校区,在全球都享有很高的学术声誉,尤其是阿默斯特分校,作为该系统中的主导研究性机构,和麻省医学院都是世界一流的学府。


0条评论
提倡鼓励AI创业者,一个产品需经历无数次失败才能成品。
评论

游客
登录后再评论
  • 赠人玫瑰,手有余香。
  • 和谐社区,和谐点评。