训练设置 | 描述 |
每N小时自动备份(0-24) | 设置自动备份间隔。 |
写入预览历史(y / n) | 选择是否写入预览图像历史记录(每30次迭代)。 |
选择预览历史的图像(y / n) | (条件:写入预览历史)开始训练时,您将被提示选择历史生成的预览图像。 |
目标迭代 | 设置目标迭代以结束并保存训练。将其设置为0以进行不间断训练。 |
随机翻转SRC面部(y / n) | 随机水平翻转SRC面部集。涵盖更多角度,但面孔可能看起来不太自然。 |
随机翻转DST面部(y / n) | 随机水平翻转DST面部集。如果未启用SRC随机翻转,则使src->dst的泛化更好。 |
批量大小 | 更大的批处理大小对神经网络的泛化效果更好,但可能会导致内存错误。手动调整此值以适应您的显卡。 |
分辨率(64-640) | (固定)更高的分辨率需要更多的VRAM和训练时间。该值将调整为16和32的倍数以用于-d架构。 |
面部类型(h / mf / f / wf / head) | (固定)半脸/中脸/全脸/整个脸/头。半脸具有更高的分辨率,但涵盖了更少的面颊区域。中脸比半脸宽30%。整个脸包括整个面部区域,包括额头。头覆盖整个头部,但需要为src和dst面部集使用XSeg。 |
AE架构 | (固定)“df”保留了更多的身份保留面部。“liae”可以修复过于不同的面部形状。“-u”增加了面部的相似性。“-d”(实验性)在相同计算成本下加倍分辨率。例如:df、liae、df-d、df-ud、liae-ud等。 |
自动编码器尺寸(32-1024) | (固定)自动编码器尺寸。影响模型学习面部的总体能力。如果AE dims的数量不够,则例如闭眼可能不会被识别。更多dims更好,但需要更多的VRAM。您可以微调模型大小以适应您的GPU。 |
编码器尺寸(16-256) | (固定)更多的dims有助于识别更多的面部特征并实现更清晰的结果,但需要更多的VRAM。您可以微调模型大小以适应您的GPU。 |
解码器尺寸(16-256) | (固定)更多的dims有助于识别更多的面部特征并实现更清晰的结果,但需要更多的VRAM。您可以微调模型大小以适应您的GPU。 |
解码器掩码尺寸(16-256) | (固定)典型的掩码尺寸=解码器尺寸/3。如果您从dst掩码中手动切出障碍物,则可以增加此参数以获得更好的质量。 |
掩膜训练(y / n) | (条件:面部类型wf或head)此选项仅适用于“whole_face”或“head”类型。遮罩训练将训练区域剪裁到full_face遮罩或XSeg遮罩,因此网络将正确训练面部。 |
眼睛和嘴巴优先(y / n) | 帮助在训练过程中修复眼部问题,如“外星人眼睛”和眼睛方向错误。还使牙齿的细节更高。 |
样本的统一偏航分布(y / n) | 帮助修复由于面孔集中面部较少而导致的模糊侧面面孔问题。 |
模糊掩码(y / n) | (条件:面部类型wf或head)模糊应用于训练样本的应用面掩码外部的附近区域。结果是面部附近的背景被平滑,与交换的面部相比不太明显。在src和dst面部集中需要确切的xseg掩码。 |
将模型和优化器放在GPU上(y / n) | 当您在一台GPU上进行训练时,默认情况下,模型和优化器权重会放在GPU上以加速该过程。您可以将其放在CPU上以释放额外的VRAM,从而设置更大的尺寸。 |
使用AdaBelief优化器?(y / n) | 使用AdaBelief优化器。它需要更多的VRAM,但模型的准确性和泛化性更高。 |
使用学习率丢失(n / y / cpu) | 当面部训练足够时,您可以启用此选项以获得额外的清晰度,并减少较少迭代的次数的子像素抖动。在禁用随机变形之前启用它,并在GAN之前启用它。n – 禁用;y – 启用;cpu – 在CPU上启用。这样可以不使用额外的VRAM,牺牲迭代的20%时间。 |
启用样本的随机变形(y / n) | 随机变形是为了泛化两个面孔的面部表情。当面孔训练足够时,您可以禁用它以获得额外的清晰度,并减少较少迭代的次数的子像素抖动。 |
随机色调/饱和度/光强度(0.0-0.3) | 应用于src面集的随机色调/饱和度/光强度。在神经网络的输入时,稳定面部交换期间的颜色扰动。通过选择src面集中最接近的颜色来减少颜色转移的质量。因此,src面集必须足够多样化。典型的良好值是0.05。 |
GAN功率(0.0-5.0) | 强制神经网络学习面部的小细节。只有在面孔足够训练了lr_dropout(开)和random_warp(关)时才启用它,不要禁用。值越高,出现问题的几率越高。典型的良好值是0.1。 |
GAN块大小(3-640) | (条件:GAN功率)块大小越大,质量越高,需要的VRAM越多。即使在最低设置下,您也可以获得更锐利的边缘。典型的良好值是resolution / 8。 |
GAN尺寸(4-512) | (条件:GAN功率)GAN网络的尺寸。尺寸越大,需要的VRAM越多。即使在最低设置下,您也可以获得更锐利的边缘。典型的良好值是16。 |
“真实面孔”功率(0.0000-1.0) | (条件:DF架构)实验性选项。使结果面更像src面。值越高,歧视性越强。典型值为0.01。比较– [color=rgba(41,100,170,var(--tw-text-opacity))] |
面部风格功率(0.0-100.0) | 学习预测面的颜色与掩码内的dst相同。如果要在“whole_face”中使用此选项,必须使用XSeg训练的掩码。警告:只在10k次迭代后启用它,当预测面足够清晰时开始学习样式。从0.001值开始并检查历史更改。启用此选项会增加模型崩溃的几率。 |
背景风格功率(0.0-100.0) | 学习预测面掩码外的区域与dst相同。如果要在“whole_face”中使用此选项,必须使用XSeg训练的掩码。整个脸您必须使用XSeg训练的掩码。这可以使面部更像dst。启用此选项会增加模型崩溃的几率。典型值为2.0。 |
src面集的颜色传输(none / rct / lct / mkl / idt / sot) | 更改src样本的颜色分布以接近dst样本。尝试所有模式以找到最佳模式。 |
启用渐变剪切(y / n) | 渐变剪切减少模型崩溃的机会,但牺牲训练速度。 |
启用预训练模式(y / n) | 预先训练大量各种面部。之后,可以更快地用于训练伪造的面孔。在禁用随机变形和GAN之前启用它。 n – 禁用;y – 启用。 |