原文:https://generativeai.pub/dall-e-3-vs-midjourney-5-2-vs-stable-xl-same-prompt-different-results-a68ae19b223e

最近,各种人工智能图像生成器层出不穷,其中Dall-E 3、MidJourney和Stable Diffusion XL可谓最引人瞩目的三个新星。这三款AI都能根据文字提示生成图像,但各有千秋。我对它们下了同样的提示,看看输出的效果有何不同。

一、连贯性

提示:一个身穿中世纪盔甲,戴着派对帽,手持绿色宝剑的宇航员,正在月球上骑一匹钢制机械马。

Dall-E 3在这方面表现突出,完美呈现了提示中的每个古怪细节。其他两款就比较一般了,都没有表达出提示中的派对氛围(没画帽子),也没有画出剑。

二、梦幻风景

提示:一个梦幻的风景,云朵由棉花糖组成,河流中流淌的是液态黄金。

这里,我想看看这些AI能不能发挥点想象力,将奇思妙想转化成视觉震撼的画面。从效果来看,Dall-E 3生产的图像最精致。通过提示AI混合常见元素的新奇组合,我们可以测试它从零开始构建场景的能力。

三、历史小说式

提示:一个古埃及法老正骑着恐龙使用智能手机。

MidJourney生成的图像最酷,但没有呈现古埃及法老。这轮Dall-E 3仍占优。

通过这个提示,我想看AI是否能在保持历史准确性的同时,加入跨时空的元素。一个好的图像生成器,应能产生仍然合理的混合画面。

四、表现情感

提示:一位手持残瓣玫瑰、面带深沉悲伤与渴望的女子写真。

这是对AI“你能理解情感吗”的考验。有时候重要的不是外表,而是氛围。这轮Stable Diffusion XL获胜。

这个提示检测AI通过面部表情和象征元素来表达微妙人类情感的能力,洞察它们对复杂情感的理解。

五、生物构思

提示:一个“雷鸟”的画像,这是一种控制风暴的神话生物,画面背景是一个狂风暴雨的环境。

Dall-E 3很接近了,但MidJourney这轮夺魁。画面的鸟形酷毙了,暴风雨也描绘得很野。

这个提示需要AI概念化创造某种并不存在的东西,测试它们的想象力边界。同时结合了环境和天气元素,增加了难度,看它们如何生成特效(比如闪电)。

六、建筑设计

提示:设计一个环保的未来主义海上浮城,具备高科技和自然与人工建筑的和谐共生。

各家作品都很出色,但我更偏爱Dall-E 2生成的画面。柔和的色调和对称的元素组合,让人向往居住其中。

以上,就是这三大AI图像生成器的比较。它们各有长短,供大家参考。MidJourney在视觉美感上占优,但连贯性较差。Dall-E 3连贯性强,但画面不如MidJourney。SDXL全能但不突出。具体选择还要看个人需求。

Adobe最近也推出了自己的AI图像生成器Firefly 2.0。我后续会写文对比Dall-E 3和Firefly,敬请关注!

相关阅读  2023年Google SEO最值得学习的技巧

Categorized in: