The model was trained on approximately 1500 images of various types, thus being suitable as a foundational knowledge base, and may be subject to further targeted training later.
Data:Mainly diverse images used for previous fursuit models, mainly manually labeled.
Secondly, many images collected during the SD1.5 era, mostly automatically labeled, with a tendency towards impasto painting, with insufficient prompt checks. Then, new collected images such as sdxl chroma, after sufficient checks, sdxl images tend to be overly smooth. Chrome images are used for aesthetic training. Some real animal training attempts to improve fur quality.
Therefore, this LORA can be considered for enabling the model to acquire general knowledge, so it exists as a base model, allowing subsequent training models to have sufficient generalization ability.
Using the Klein base model can achieve better fur quality.

一些例图,可以做到更多. Some of the displayed images can actually do a lot more than just that.
中文说明:
klein furry 模型,在约1500张多种类型的图像上训练,因此适合作为基础知识存在,后续可能再进行定向训练。
数据主要是以前兽装模型所使用的多样化图像,主要是手动打标。
其次是许多在SD1.5时代收集的图像,多数自动打标,偏向厚涂风格,prompt没有足够的检查。然后是sdxl chroma 等新收集的图像,经过足够的检查,sdxl图像偏向过度平滑。chrome图像作为美学训练。也使用了一些真实动物训练尝试改善皮毛质量。
所以此lora可以认为用于让模型获得通用的知识,所以作为一个底模存在,让后续训练模型有足够泛化能力。
使用klein base模型可以获得更好的皮毛质量。
训练信息:
训练分辨率经过从576到896多重尝试,在训练时逐渐减少重要性不高的图像。这是出于训练速度和显存考虑。
16G显存训练的分辨率上限大概是896。有时会爆显存,因为训练太慢,后最高分辨率尝试在832。
经历两次大量训练,第一次纯兽装模型放弃。第二次使用1100训练,与ernie数据基本相同,因为训练分辨率混乱和数据变化放弃。
当前是第三次从头训练,在多种风格上尝试。包括在NSFW训练,但效果不佳。
训练程序:OneTrainer
rank:64
alpha:32
在"Lora base model"中填入此模型时,
这些参数能让你以此模型为底模,继续使用其它图像训练新的模型,而不必重新让模型学习基础概念。
Dropout probability:0.1
resolution: 需要快速训练时建议默认的512,结构学习更容易。我使用896是受限于显存,而且实测高分辨率学习效果不佳,很难拟合。同时进行多分辨率训练似乎更加困难,结构问题在训练器采样中较为明显。
16G显存可以使用832,896容易间歇性爆显存。
Timestep Shift: 默认1,使用3获得更快的学习速度,但图像变化更大,可能会破坏已有的学习成果。
learning rate:
官方建议:1e-4~8e-5
风格:0.000095
Lower rates for style, higher for characters
写实图像难以拟合,动漫风格则相对容易拟合。
数据集
建议使用单一风格容易训练,多风格训练较为困难,可能是因为无法像sdxl那样训练文本编码器。



















