Meta展示了其新的人工智能艺术生成器 CM3Leon 或“Chameleon”,它声称在文本到图像生成方面实现了最先进的性能。
CM3Leon 在创建图像标题方面与其他 AI 图像生成器不同,这将为更强大的图像理解模型奠定基础。
Meta 在与 Tech Crunch 分享的博客文章中写道:“借助 CM3Leon 的功能,图像生成工具可以生成更连贯的图像,更好地遵循输入提示。我们相信 CM3Leon 在各种任务中的强大性能是迈向更高保真度图像的一步的产生和理解。”
大多数 AI 图像生成器(例如 DALL-E2 和 Imagen)都使用扩散技术,通过从起始图像中减去噪声来生成图像,这是一项相当昂贵的技术。Meta 的图像生成器使用一种称为“注意力”的机制来衡量文本或图像等输入数据的相关性。这提高了模型训练速度并使它们易于并行化。
Meta 声称 CM3leon 只需要比以前基于 Tranormer 的方法少五倍的计算量和更小的训练数据集。该公司使用 Shutterstock 的数百万个数据点来训练人工智能模型。
CM3leon 比其他 AI 图像模型更先进,可以根据复杂的提示轻松生成图像。AI程序可以通过指令编辑现有图像,并且性能比DALL-E2更好。Meta 尚未发布任何有关其程序发布的声明。