

自从一个新的文本到图像生成器撼动生成式人工智能领域以来,已经有一段时间了。然而,神秘的小熊猫生成器做到了这一点,爬上了人工分析的文本到图像竞技场排行榜,击败了领先的模型。现在,身份已经暴露。
周三,Recraft推出了最新型号“Recraft V3”,与在竞技场中出现的小熊猫是同一型号。排行榜结果表明,该模型可以生成具有令人印象深刻的细节,质量和快速保真度的高质量图像。然而,根据Recraft的说法,它的突出之处在于它的文本生成功能。
有些提示——比如那些涉及手、脸和文字的提示——对图像生成器来说尤其具有挑战性。大多数文本图像生成的尝试都是失败的,接近但混淆了一个字母、拼写或组成随机单词。然而,Recraft声称它的模型可以生成解剖学上正确的图像和准确的长文本字符串。
raft在一篇博客文章中表示:“raft V3的主要优势在于文本生成质量、解剖精度、快速理解和高审美质量。”“raft V3是世界上唯一一个可以生成长文本图像的模型,而不是只有一个或几个单词。”
为了看看这些说法是否成立,你可以按照下面的说明自己测试raft V3——或者向下滚动,看看它在我的测试中表现如何。
该模型对在线和移动应用程序中的免费和付费用户开放。入门很容易:你所要做的就是访问网站,点击“生成AI图像”,创建一个Recraft帐户,或者用现有的谷歌、Discord、Apple或单点登录登录。
不同的计划可以更好地满足用户的需求,从免费计划开始,每天提供50个免费积分,并将所有生成的图像公开。更高级的计划提供更高的限制和更高级的功能,从每月10美元到每月48美元不等。
进入后,点击“创建新图像”,输入提示,个性化设置,然后点击“Recraft”。
生成两幅图像需要15秒。我用提示测试了第一代游戏的质量,“一只充满活力的、逼真的蜂鸟栖息在树上。”结果非常令人印象深刻,与一些最好的图像生成器在提示符上的表现相当,您可以在这个列表中看到。我在下面附上了一张图片。
对于下一个提示,我选择了更具挑战性的东西——手。我输入了提示:“两只修剪整齐的手在笔记本电脑上打字。”这些图片乍一看还行。然而,当我仔细观察时,我发现了一些不一致之处。
最后,对于最令人兴奋的提示和最大的挑战,我要求它生成一个电脑屏幕的图像,上面用电黄色写着ZDNET的品牌使命宣言:“ZDNET,明天属于那些拥抱今天的人。”我把这两个结果都包括在内,因为它们同样令人印象深刻。
不仅所有的文本都是准确拼写和转移的,而且还被均匀地显示和间隔,就像人类把它放在那里一样。它也被很好地分层到背景上,从而产生逼真的照片,看起来像是用相机拍摄的。如果仔细观察,会发现大写单词有一些变化,但与大多数其他生成器生成的文本结果相比,这些变化是微不足道的,因为大多数其他生成器甚至无法将字母取出来。