AUTOMATIC1111 (A1111)是高级AI绘画玩家的默认使用的GUI,社区很活跃,所以大多数新功能首先在这个免费的Stable Diffusion GUI中推出。

你会在这个GUI中看到非常多的功能,对新手来说可能完全不知道该从哪里开始操作。下面我们逐个介绍包含的所有功能。

1、Text-to-image 文字生成图片

AUTOMATIC1111 GUI:新手指南

Stable Diffusion Checkpoint: 我们在这个下拉菜单中选择模型。你需要将模型文件放在 stable-diffusion-webui > models > Stable-diffusion 文件夹中。当你将新模型放入模型文件夹,点击右边的刷新按钮就能在下拉菜单看到刚放进去的模型。

Prompt: 描述你想在图像中看到的内容。在Negative prompt里面写上不想看到的内容。

Batch Count: 批量生成图片次数

Batch Size: 每次生成的图像数量。在测试提示时,最好是至少生成4个图像,因为每个图像都会有所不同。生成图像总数等于Batch Count乘以Batch Size。通常更改Batch Size,因为这样更快生成图片。只有在遇到内存问题时,才会选择更改Batch Count。

Sampling method: 建议使用DPM++ 2M Karras算法,因为它在速度和质量方面都有很好的平衡。尽量不要使用任何带有a字母的Samping method,因为即使在大采样步骤下其图像也不稳定,这会导致调整图像变得困难。

Samping steps: 去噪过程的采样步骤数量。越多越好,但也需要更长时间。通常设置为25就可以了。

Width & Height: 对于v1模型,输出图像的宽度和高度应至少设置一边为512像素。例如,对于2:3纵横比的肖像图像,可以把宽度设置为512,把高度设置为768。

CFG Scale: Classifier Free Guidance scale这个参数控制图片在多大程度上按照你的提示词来产生。1-很大程度上忽略的提示词。3-更有创意。7-在遵循提示和自由发挥之间取得良好平衡。(默认值)15-更加坚持提示词。30-严格遵循提示词。

Seed: 如果设置为-1,则AUTOMATIC1111将使用随机种子值。勾选后面的Extra还会看到几个参数:Variation Seed和Variation Strength。这两个参数有什么用呢?

AUTOMATIC1111 GUI:新手指南

比如你用相同的prompt,不同的Seed生成了两张图片。你想把两张图片融合一下,就可以把第二张图片的seed放到Variation seed上面,用Strength参数控制强度。

Resize seed from width/height: 更改图像大小时,即使使用相同的种子,图像也会发生巨大变化。这个设置是为了在调整图像大小时能得到类似图片。把原始图像的宽度和高度放在这里。把原始种子值放入Variation seed输入框中,把Variation Strength设置为0。

Sampling method 下面还有三个选项,下面也逐个解释一下:

AUTOMATIC1111 GUI:新手指南

Restore faces: Restore Faces使用另一个经过训练的模型来修复面部缺陷。使用此功能之前,必须指定要使用哪个面部修复模型。首先,访问setting选项卡。找到到Face Restoration。选择一个面部修复模型,一般情况默认使用CodeFormer模型就好了。将CodeFormer权重设置为0可以获得最大效果。记得点击上面的“Apply settings”按钮保存设置!

Tiling: 你可以把这个功能想象成铺瓷砖。把图片想象成一个瓷砖,然后平铺起来。

Hires. fix: igh-resolution fix高分辨率修复,勾选这个选项会应用一个upscaler来放大图像。这是因为稳定扩散的最佳分辨率为512像素(某些v2型号为768像素),这种分辨率对于很多玩家来说太小了。那为什么我们不能直接将宽度和高度设置得高点,例如1024个像素?Stable Diffusion模型是在由512×512分辨率图像组成的数据集上训练出来的,这意味著txt2img生成图像的最佳配置也是以512×512的分辨率生成的,偏离这个分辨率会影响构图并产生很多问题,如生成具有两个头的图像。

Generate按钮下还有5个图标,从左到右挨个说

1、读取最后一个参数:它将填充所有字段,以便在按下“生成”按钮时生成相同的图像。请注意,种子和模型覆盖将被设置。如果这不是你想要的,请将种子设置为-1并删除覆盖。

2、删除图标:删除当前提示词和负面提示词。

3、模型图标:显示额外网络(extra networks)。此按钮用于将超级网络(hypernetworks)、Embeddings和 LoRA 短语插入提示中。

4、加载样式:从下拉菜单中选择多个样式,将它们插入到提示和负面提示中。

5、保存样式:保存提示和负面提示。你需要为样式命名。

2、Img2img 图片生成图片

AUTOMATIC1111 GUI:新手指南

Resize mode:如果新图像的宽高比与输入图像不同,有几种方法可以解决差异。

“Just Resize仅调整大小”将缩放输入图像以适应新图像尺寸。它会拉伸或挤压图像。

“Crop and resize裁剪并调整大小”将新的画布适配到输入图像中。未适配部分将被删除。原始图片的纵横比将得到保留。

“Resize and Fill调整大小并填充”使输入图像适应新的画布。额外部分用输入图片的平均颜色填充。纵横比将得到保留。

“Just Resize (Latent upscale)仅调整大小”类似于“仅调整大小”,但是缩放是在潜在空间中完成的。使用去噪强度大于0.5以避免模糊影响。

Denoising strength去噪强度:控制图像的变化程度。如果设置为0,则不会发生任何更改。如果设置为1,则新图像不遵循输入图像。可以先使用默认值(0.75)。

Sketch: 除了以图生图, 你还可以素描画出原始图片。首先先上传一张纯白或纯黑的图片,就可以在此基础上去动笔画了。当然你也可以选择不从头开始画,上传一张图片,可以用画笔修改内容。

Inpaint: 这可能是img2img下面最常用的功能了,主要用来修复或删除图片中不想要的内容。在txt2img标签中生成了一张你喜欢的图片,但有一个小缺陷,你想重新生成它。使用“Send to inpaint”按钮将图像从txt2img标签发送到img2img标签即可。

Inpaint sketch: 结合了Inpaint和sketch的功能,修复或删除不想要的内容的同时,还能根据你涂抹的颜色和形状,画出不一样的东西。

Inpaint upload: 上传单独的Mask文件而不需要手绘。

Batch: 批量以图生图。

Interrogate CLIP: 从图像中获取提示词。Interrogate DeepBooru按钮提供类似的功能,但它是为动漫图像设计的。

Extras

在Extra选项卡下面,你会看到各种放大参数。

Scale by: 设置新图像将在每个边上放大多少倍。例如,一个200×400的图像,在设置为4的情况下将变成800×1600。

Upscaler: 下拉菜单列出了几个内置选项。你也可以安装自己upscaler。

Lanczos和Nearest是老派的放大器。它们不太强大,但行为可预测。ESRGAN、R-ESRGAN、ScuNet 和 SwinIR 是 AI 放大器。它们可以真正地创造内容来增加分辨率。它们是针对特定风格进行训练的。要判断它们是否适用于你的图像,你可以逐个测试。

Upscaler 2: 有时候,你想要结合两个图像放大器的效果。此选项可让你组合两个图像放大器的结果。混合程度由 Upscaler 2 Visibility 滑块控制。较高的值显示更多 Upscaler 2 的效果。

可选择在放大过程中修复面部。有两个选项:GFPGAN和CodeFormer。可以随意选择一个进行设置。一般来说,应该尽可能地设置最低值,以便不影响图像的风格。

PNG Info

许多稳定的扩散GUI,包括AUTOMATIC1111,在图像png文件中写入生成参数。这是一个方便的功能,可以快速获取参数。当你在网上找到一张图片并想查看文件中是否留下了提示时,可以用这个功能查看。

Checkpoint merger

AUTOMATIC1111的检查点合并器用于合并两个或更多模型。你可以最多组合3个模型以创建新模型。通常用于混合两个或更多模型的风格,但是合并结果不能保证。有时可能会产生不良影响。

Checkpoint format: ckpt是原始的检查点模型格式,而SafeTensors是Hugging Face开发的新模型格式。与ckpt模型不同,即使在模型中存在恶意代码,加载Safe Tensor模型也不会执行任何恶意代码。

Bake in VAE: 你可以把原始解码器替换为Stability发布的更好的解码器。

Train

Train页面用于训练模型,支持textual inversion和hypernetwork。

相关阅读  ChatGPT还能这样玩?向那些勤于思考的人学习

Categorized in: