OpenAI近日发布了新一代AI生成图像系统DALL-E 3,作为图片创作者,我迫不及待地想试用它。但是实际体验下来,DALL-E 3对专业用户来说进步并不大。它更适合的是那些不想学习提示工程的ChatGPT普通用户。

一、期待落空

DALL-E 3直接集成在ChatGPT界面中,乍一看可以与ChatGPT自然对话生成图像,感觉它应该可以根据文字理解生成适当图像。如果车头灯画错了,应该可以对它说“这个车头灯看着不太对,可以把它弄宽一点,形状圆一点吗?”它就会帮你修改图像。

但是实际上DALL-E 3并没有这样的理解能力。它只是让ChatGPT写了一个文本提示,然后交给图像生成系统,与Midjourney的使用流程非常类似。

二、AI绘画专业玩家的痛点

DALL-E 3存在中间转换提示文字的步骤,在这个步骤可能出现理解偏差。如果转换提示写得好,图像效果会不错,但复杂的要求它就无法转换成有效的提示。

手工写提示对我这样的专业用户来说,可以更简单直接地表达想要的图像内容,而不需要依赖它错误的理解。这就像一位专业赛车手开手动挡赛车和普通人开自动挡家用车一样,手动操作可以更好地发挥车的性能。

所以说,DALL-E 3现在更适合那些不想学习手写提示的普通用户。

三、哪些用户适合用DALL-E 3

以一个行业简报需要图片为例,你只需要对DALL-E 3说“给我一张图片来说明一个法律案件”,它就可以生成基本可用的简单插图。这已经足够普通用户的日常使用需求了。

再看看我在Midjourney里输入同样要求,它生成的图像完全不符合我的需求。虽然我可以通过精心设计的提示让Midjourney生成更好的图像,但这需要专业知识。

所以说,DALL-E 3的简单交互非常适合新手用户生成日常需要的基础图像,就像大多数人会用iPhone照片而不是专业相机一样。它的易用性可能比专业用户想象的更有价值。

四、DALL-E 3的未来

AI绘画专业玩家现在可能还会继续使用Midjourney等手写提示的图像生成系统。但未来OpenAI集成语义理解后,DALL-E 3的功能可能真正实现我们的期待。

在ChatGPT出现前,GPT-3已经存在了18个月之久。正是友好的聊天界面让更多人可以使用它。所以以后不排除DALL-E 3也会像ChatGPT一样成为主流产品。

现在它更适合那些不想学习提示工程的初级用户。但未来它可能会成长为可实现更多创意需求的强大工具。让我们拭目以待!

相关阅读  什么是LoRA模型 | 如何在AUTOMATIC1111中使用LoRA

Categorized in: