Imagen2 是Google DeepMind开发的最先进的文本到图像扩散技术产品,可生成高品质、逼真的图像,与用户的文字提示紧密对齐。这款技术利用其训练数据的自然分布生成更逼真的图像,而不是采用预设的风格。开发者和Cloud客户可以通过Google Cloud Vertex AI上的Imagen API体验Imagen2 的强大功能。Google艺术与文化团队也在他们的「文化图标」实验中部署了Imagen2 技术,让用户借助Google AI探索、学习和测试他们的文化知识。
点击前往「Imagen 2」官网体验入口
Imagen2 的改进之处包括:
- 改进的图像-字幕理解:Imagen2 通过在训练数据集的图像和字幕中添加更多描述来创建更高质量、更准确的图像,以更好地匹配用户的提示。这些增强的图像-字幕配对帮助Imagen2 更好地理解图像和文字之间的关系,提升了对语境和细微差别的理解。
- 更逼真的图像生成:Imagen2 的数据集和模型进步在许多文本到图像工具常挣扎的领域取得了改进,包括逼真地渲染手和人脸,以及保持图像免受干扰的视觉伪影。
- 流畅的风格条件:Imagen2 的基于扩散的技术提供了高度的灵活性,使得控制和调整图像风格变得更容易。通过结合引用风格图像和文本提示,可以使Imagen2 生成遵循同样风格的新图像。
- 先进的内画和外画技术:Imagen2 还启用了像‘内画’和‘外画’这样的图像编辑功能。通过提供参考图像和图像蒙版,用户可以直接在原始图像中生成新内容,或将原始图像扩展到其边界之外。
Imagen2 在设计和开发阶段就设立了强有力的防护措施,以帮助减轻其文本到图像生成技术可能带来的风险和挑战。Imagen2 集成了先进工具包SynthID,用于水印和识别AI生成的内容,允许列入白名单的Google Cloud客户直接在图像的像素中添加不可感知的数字水印,而不影响图像质量。在向用户发布功能之前,我们会进行严格的安全测试,以尽量减少伤害风险。
以上就是「Imagen 2」的全部介绍了,感兴趣的小伙伴可以点击上方链接前往体验!