发布时间:2024-08-19 18:26:07 来源:本站 作者:admin
谷歌向美国用户发布了其文本转图像人工智能模型 Imagen 3 的最新版本。该人工智能模型承诺比其前身有显著改进,并被称为该科技巨头提供的“最高质量的文本转图像模型”。
Imagen 3 可通过 Google 的 AI Test Kitchen 访问,旨在生成具有增强细节和更逼真光线的图像。
通过完善其人工智能功能,谷歌旨在提供更令人印象深刻、更具视觉吸引力的图像创作。
“我们推出了 Imagen 3,这是一种潜在扩散模型,可根据文本提示生成高质量图像。我们描述了我们的质量和责任评估。在评估时,Imagen 3 优于其他最先进 (SOTA) 模型。此外,我们还讨论了安全性和代表性问题,以及我们用来最大限度减少模型潜在危害的方法,”该公司在上周的一份研究论文中表示。
Imagen 3 将提供多个版本,每个版本针对不同类型的任务进行优化,从生成快速草图到高分辨率图像。
“Imagen 3 是我们最高质量的文本转图像模型,能够生成比我们之前的模型更精细、光线更丰富、干扰更少的图像。我们显著提高了 Imagen 3 理解提示的能力,这有助于模型生成广泛的视觉风格,并从较长的提示中捕捉到小细节,”谷歌在今年的 Google I/O 大会上推出 Imagen-3 模型时这样说道。
如何访问 Imagen-3
如果您居住在美国,您可以通过 ImageFX 和 Vertex AI 访问 Imagen 3。居住在美国以外的人可以使用此链接注册。您的电子邮件将被添加到等候名单中,当 AI 模型在您所在的国家/地区可用时,您将获得访问权限。
谷歌暂停了 Gemini 聊天机器人的图像生成
今年早些时候,Google Gemini Al 聊天机器人创建了与事实不符的图像。Google 承认存在问题,导致其图像生成功能暂时中止。Google 首席执行官 Sundar Pichai 还表示,公司正在从头开始开发该功能并修复这些问题。