【Lora炼丹术】从零开始，炼制你的第一个LoRA（1）

从接触SD到现在，相信大家一定使用过各种各样的lora，包括人物的、建筑的、画风的等等，那么你有没有想过炼制一款属于自己的lora模型呢。

我们先来了解一下炼丹的基础概念，它的关键原理就是——等价交换法则！

不好意思，说错了。

重新来，Lora全称Low-Rank Adaptation Models，中文翻译为低阶自适应模型。它的作用在于影响和微调画面。通过lora的帮助，可以再现人物或物品的特征。

大模型的训练通常是非常复杂且需要很高的电脑配置的，LoRA采用的方式就是在原有的模型中插入新的数据处理层，这样就避免了修改原有模型的参数。LORA模型训练，其实就是用一些特定特征来替换大模型中的对应元素，比如一个固定的人物相貌、特定的服装或者是特定的风格，这样就可以生成不同于底模的图片。

所以，lora训练是比较轻量化的，需要的显存也少了很多，硬件门槛显存达到6G就可以开启训练了。

我们今天要使用的是B站UP主“朱尼酱”的赛博丹炉，他的这款丹炉，界面更加友好、美观，适合新手入门。

废话不多说，我们就正式开始吧。

#丹炉基础部署

首先我们在云盘中下载这个压缩包，然后解压到本地磁盘中。

最好是直接放在某个盘的根目录下，路径中不要带有中文。

然后找到E:\cybertronfurnace1.4\cfurnace_ui路径下的Cybertron Furnace.exe文件，双击启动。

等待一段时间，我们的赛博丹炉就正式启动了，画面非常的炫酷，有一种未来科技的感觉。

# 参数理解

我们点击“开启炼丹炉”，正式进入到丹炉内部。

打开素材库可以看到5张tifa的图片图片，这是丹炉中自带的，我们先用这个来炼制第一炉丹吧。

我们可以选择一个任意的基础模型，然后给我们想要炼制的lora取一个名字，即召唤词。

正常来说，这个丹炉已经帮我们按照类型设定好了参数，所以你只需要点击“人物”选项卡就可以开始训练了。但是，我们这里最好还是要了解一下相关的参数，所以我们选择“自定义参数”。

点击确定，我们就进入了一个参数设置的面板。接下来，我们就来了解一下，这些参数的具体含义。

首先是学习步数，指的是AI对我们每一张图片的学习次数。根据我们的训练内容，二次元图片的repeat一般在10-15，写实人物图片的repeat一般在30-50，真实世界的一些景观场景可能要达到100。repeat值越高，ai就能更好的读懂我们的图片，理论上讲图片的精细度越高，学习步数就要越高。

循环次数：AI将我们的所有图片按照学习步数学习一轮就是一次循环，那循环次数就是将这个过程重复多少遍。一般数值在10-20之间，次数并不是越多越好，因为学多了就会知识固化，变成一个书呆子，画什么都和我们的样图一样，我们称之为过拟合。每一次循环我们都会得到一个炼丹结果，所以epoch为10的话，我们就训练完之后就会得到10个丹。

我们总的训练步数，就是：图片张数*学习步数*循环次数=训练步数。

即：5*50*10=2500步

效率设置，主要是控制我们电脑的一个训练速度。可以保持默认值，也可以根据我们电脑的显存进行微调，但是要避免显存过载。

并行数量：代表了AI在同一时间学习多少张图片。数值越大，训练速度越快，内存占用越大，但收敛得慢。反之，数值越小，训练速度越慢，内存占用越小，但收敛得快。以512*512的图片为例，显存小于等于6g，batch size就老老实实地设置为1就行了；如果显存为12g以上的话，batch size就可以设置为4或者6。

这里提到一个收敛的概念，就是说你最后生成的图片，和原图越像，就说明收敛得越好。训练速度越快的话，就像一个人在快速地翻书，虽然很快翻完了，但是未必能全记得住，所以并不是训练速度越快越好。在一般情况下，我们增加并行数量，同时也会增加一些循环次数，让AI多看几遍书。

质量设置主要是用来影响产出LORA的一个最终质量，当然最终lora的好坏还需要通过XYZ去测试和看实际的loss值。

学习率指的是AI学习图片时的效率，学习率太高会出现过拟合，图片和素材太相似；学习率低会出现不拟合，图片和素材没关系。

1e-4是一种程序里的数学表达，实际上就是1除以10的4次方，即：

1e-4=1/10000=0.0001

1e-5=1/100000=0.00001

这三个数值呢，一般情况下我们保持默认就可以，如果想要调整的话，点击数值旁边的加减号就可以了，很直观。

网格维度：network dim决定了出图的精细度，就像细分网格一样。数值越高，会有助于AI学会更多的细节。同样，也不是数值越大越好，数值越大，学习越慢，训练时间越长，容易过拟合。

DIM为32时，输出的文件一般为40MB+；

DIM为64时，输出的文件一般为70MB+；

DIM为128时，输出的文件一般为140MB+；

场景	DIM	备注
二次元	32	画风越复杂，dim越高
人物	32-128	常见主流lora大部分使用128
实物、风景	≥128	根据训练对象复杂度提升dim