AUTOMATIC1111 GUI：新手指南

AUTOMATIC1111 (A1111)是高级AI绘画玩家的默认使用的GUI，社区很活跃，所以大多数新功能首先在这个免费的Stable Diffusion GUI中推出。

你会在这个GUI中看到非常多的功能，对新手来说可能完全不知道该从哪里开始操作。下面我们逐个介绍包含的所有功能。

1、Text-to-image 文字生成图片

Stable Diffusion Checkpoint: 我们在这个下拉菜单中选择模型。你需要将模型文件放在 stable-diffusion-webui > models > Stable-diffusion 文件夹中。当你将新模型放入模型文件夹，点击右边的刷新按钮就能在下拉菜单看到刚放进去的模型。

Prompt: 描述你想在图像中看到的内容。在Negative prompt里面写上不想看到的内容。

Batch Count: 批量生成图片次数

Batch Size: 每次生成的图像数量。在测试提示时，最好是至少生成4个图像，因为每个图像都会有所不同。生成图像总数等于Batch Count乘以Batch Size。通常更改Batch Size，因为这样更快生成图片。只有在遇到内存问题时，才会选择更改Batch Count。

Sampling method: 建议使用DPM++ 2M Karras算法，因为它在速度和质量方面都有很好的平衡。尽量不要使用任何带有a字母的Samping method，因为即使在大采样步骤下其图像也不稳定，这会导致调整图像变得困难。

Samping steps: 去噪过程的采样步骤数量。越多越好，但也需要更长时间。通常设置为25就可以了。

Width & Height: 对于v1模型，输出图像的宽度和高度应至少设置一边为512像素。例如，对于2:3纵横比的肖像图像，可以把宽度设置为512，把高度设置为768。

CFG Scale: Classifier Free Guidance scale这个参数控制图片在多大程度上按照你的提示词来产生。1-很大程度上忽略的提示词。3-更有创意。7-在遵循提示和自由发挥之间取得良好平衡。（默认值）15-更加坚持提示词。30-严格遵循提示词。

Seed: 如果设置为-1，则AUTOMATIC1111将使用随机种子值。勾选后面的Extra还会看到几个参数：Variation Seed和Variation Strength。这两个参数有什么用呢？

比如你用相同的prompt，不同的Seed生成了两张图片。你想把两张图片融合一下，就可以把第二张图片的seed放到Variation seed上面，用Strength参数控制强度。

Resize seed from width/height: 更改图像大小时，即使使用相同的种子，图像也会发生巨大变化。这个设置是为了在调整图像大小时能得到类似图片。把原始图像的宽度和高度放在这里。把原始种子值放入Variation seed输入框中，把Variation Strength设置为0。

Sampling method 下面还有三个选项，下面也逐个解释一下：

Restore faces: Restore Faces使用另一个经过训练的模型来修复面部缺陷。使用此功能之前，必须指定要使用哪个面部修复模型。首先，访问setting选项卡。找到到Face Restoration。选择一个面部修复模型，一般情况默认使用CodeFormer模型就好了。将CodeFormer权重设置为0可以获得最大效果。记得点击上面的“Apply settings”按钮保存设置！

Tiling: 你可以把这个功能想象成铺瓷砖。把图片想象成一个瓷砖，然后平铺起来。

Hires. fix: igh-resolution fix高分辨率修复，勾选这个选项会应用一个upscaler来放大图像。这是因为稳定扩散的最佳分辨率为512像素（某些v2型号为768像素），这种分辨率对于很多玩家来说太小了。那为什么我们不能直接将宽度和高度设置得高点，例如1024个像素？Stable Diffusion模型是在由512×512分辨率图像组成的数据集上训练出来的，这意味著txt2img生成图像的最佳配置也是以512×512的分辨率生成的，偏离这个分辨率会影响构图并产生很多问题，如生成具有两个头的图像。

Generate按钮下还有5个图标，从左到右挨个说

1、读取最后一个参数：它将填充所有字段，以便在按下“生成”按钮时生成相同的图像。请注意，种子和模型覆盖将被设置。如果这不是你想要的，请将种子设置为-1并删除覆盖。

2、删除图标：删除当前提示词和负面提示词。

3、模型图标：显示额外网络（extra networks）。此按钮用于将超级网络（hypernetworks）、Embeddings和 LoRA 短语插入提示中。

4、加载样式：从下拉菜单中选择多个样式，将它们插入到提示和负面提示中。

5、保存样式：保存提示和负面提示。你需要为样式命名。

2、Img2img 图片生成图片

Resize mode：如果新图像的宽高比与输入图像不同，有几种方法可以解决差异。

“Just Resize仅调整大小”将缩放输入图像以适应新图像尺寸。它会拉伸或挤压图像。

“Crop and resize裁剪并调整大小”将新的画布适配到输入图像中。未适配部分将被删除。原始图片的纵横比将得到保留。

“Resize and Fill调整大小并填充”使输入图像适应新的画布。额外部分用输入图片的平均颜色填充。纵横比将得到保留。

“Just Resize (Latent upscale)仅调整大小”类似于“仅调整大小”，但是缩放是在潜在空间中完成的。使用去噪强度大于0.5以避免模糊影响。

Denoising strength去噪强度：控制图像的变化程度。如果设置为0，则不会发生任何更改。如果设置为1，则新图像不遵循输入图像。可以先使用默认值（0.75）。

Sketch: 除了以图生图，你还可以素描画出原始图片。首先先上传一张纯白或纯黑的图片，就可以在此基础上去动笔画了。当然你也可以选择不从头开始画，上传一张图片，可以用画笔修改内容。

Inpaint: 这可能是img2img下面最常用的功能了，主要用来修复或删除图片中不想要的内容。在txt2img标签中生成了一张你喜欢的图片，但有一个小缺陷，你想重新生成它。使用“Send to inpaint”按钮将图像从txt2img标签发送到img2img标签即可。

Inpaint sketch: 结合了Inpaint和sketch的功能，修复或删除不想要的内容的同时，还能根据你涂抹的颜色和形状，画出不一样的东西。

Inpaint upload: 上传单独的Mask文件而不需要手绘。

Batch: 批量以图生图。

Interrogate CLIP: 从图像中获取提示词。Interrogate DeepBooru按钮提供类似的功能，但它是为动漫图像设计的。

Extras

在Extra选项卡下面，你会看到各种放大参数。

Scale by: 设置新图像将在每个边上放大多少倍。例如，一个200×400的图像，在设置为4的情况下将变成800×1600。

Upscaler: 下拉菜单列出了几个内置选项。你也可以安装自己upscaler。

Lanczos和Nearest是老派的放大器。它们不太强大，但行为可预测。ESRGAN、R-ESRGAN、ScuNet 和 SwinIR 是 AI 放大器。它们可以真正地创造内容来增加分辨率。它们是针对特定风格进行训练的。要判断它们是否适用于你的图像，你可以逐个测试。

Upscaler 2: 有时候，你想要结合两个图像放大器的效果。此选项可让你组合两个图像放大器的结果。混合程度由 Upscaler 2 Visibility 滑块控制。较高的值显示更多 Upscaler 2 的效果。

可选择在放大过程中修复面部。有两个选项：GFPGAN和CodeFormer。可以随意选择一个进行设置。一般来说，应该尽可能地设置最低值，以便不影响图像的风格。

PNG Info

许多稳定的扩散GUI，包括AUTOMATIC1111，在图像png文件中写入生成参数。这是一个方便的功能，可以快速获取参数。当你在网上找到一张图片并想查看文件中是否留下了提示时，可以用这个功能查看。

Checkpoint merger

AUTOMATIC1111的检查点合并器用于合并两个或更多模型。你可以最多组合3个模型以创建新模型。通常用于混合两个或更多模型的风格，但是合并结果不能保证。有时可能会产生不良影响。

Checkpoint format: ckpt是原始的检查点模型格式，而SafeTensors是Hugging Face开发的新模型格式。与ckpt模型不同，即使在模型中存在恶意代码，加载Safe Tensor模型也不会执行任何恶意代码。

Bake in VAE: 你可以把原始解码器替换为Stability发布的更好的解码器。

Train

Train页面用于训练模型，支持textual inversion和hypernetwork。

相关阅读 ChatGPT还能这样玩？向那些勤于思考的人学习

Categorized in:

AI绘画

AUTOMATIC1111 GUI：新手指南

1、Text-to-image 文字生成图片

2、Img2img 图片生成图片

Extras

PNG Info

Checkpoint merger

Train

Leave a Reply Cancel reply

Other Stories

什么是LoRA模型 | 如何在AUTOMATIC1111中使用LoRA

AI绘画中图像修复是什么？ | Inpainting案例学习

Press ESC to close

Or check our Popular Categories...

1、Text-to-image 文字生成图片

2、Img2img 图片生成图片

Extras

PNG Info

Checkpoint merger

Train

Leave a Reply Cancel reply

Related Articles

Other Stories

什么是LoRA模型 | 如何在AUTOMATIC1111中使用LoRA

AI绘画中图像修复是什么？ | Inpainting案例学习