最近 MidJourney 团队推出了他们最新的 AI 图像生成模型 V6 版本,相比以前的 V5.2 版本有非常大的进步。MidJourney V6 为我们提供了强大的语言理解能力,使我们可以非常精细地定义所需的艺术效果。在这篇文章里,我会和你一起探索 V6 的新功能。

V6 vs V5.2 对比

相比 V5.2,V6 在以下几个方面有了重大提升:

  • 自然语言理解能力:V6 模型在处理复杂的提示语句时更加准确,可以捕捉到更细微的语义信息。
  • 照片真实感:V6 生成的人像更加真实自然,肤色表现更加逼真。整体上摆脱了 V5 图像的“修图”效果,更加真实。
  • 细节准确性:V6 在渲染图像细节时更加精确,像手、脸、武器等细节都更加逼真。
  • 图像风格:V6 可以更好地理解不同摄影风格的关键词,生成出符合提示的精美图像。

简单来说,V6 的自然语言理解力比 V5.2 进步了一个台阶,让我们可以用更丰富的语言来描述所需的艺术效果,从而创造出更加逼真精美的图像。

更准确理解提示词

这张图片的提示词是“辛普森一家的美女与野兽”,Midjourney 6.0 将其准确实现成辛普森动画中的场景,这证明了新的模型可以更准确地理解并呈现提示词中的意图。

Midjourney 6.0 不需要“动画,超写实”这类提示词,也就是说提示词可以更简洁,AI 也能准确把握关键信息。

更强的逻辑和连贯性

下面这个 “hello world” 文本的示例,Midjourney 不仅能正确生成文本,还添加了景深效果,这展示了模型对场景细节的理解和创造能力。

另一个例子是巨龙和战士的场景,第一轮结果就能很好地呈现提示词描述的场景构图、交互关系、色调氛围等要素,这需要对整个场景有很强的逻辑思维能力。

a burning castle ruin. on the left is aman in warrior armor looking small inthe image, he is looking up to a largered dragon who is looking down athim with anger

更优秀的艺术创作能力

cosy drawing in anime style of a catwith a human body reading a book insunset light

上面图片展示了 Midjourney 在艺术创作方面的进步。背景色彩、场景布局、人物姿态等方方面面都经过了精心构思,而不仅仅是机械绘画。

更复杂场景的想象力

科幻飞船驾驶舱内景这个复杂场景,Midjourney 6.0 也能绘制出合理的舱内结构、控制面板、船员工位等细节。这需要对特定领域场景有知识积累和想象创造能力。

更真实的图像质量

下面这个汉堡图片展示了 Midjourney 在生成逼真图片方面的能力。食材纹理、酱汁反光等效果非常自然,已经可以作为商业产品图片使用。

更强大的创意设计能力

gigantic woman who is 20stories tall, walking through a village –ar 16:9 –V 6.0

最后这个巨大女人通过村庄的场景,是一个很大的创作挑战。Midjourney 6.0 能很好地处理巨大和微小元素的比例关系,整体风格也更丰富,这体现了版本迭代带来的设计能力提升。

原视频:https://www.youtube.com/watch?v=P5p7EP413U&t=357s&ab_channel=OlivioSarikas

相关阅读  ControlNet: 让设计师、艺术家创作速度提升10倍的AI神器

Categorized in: