yangguang 发表于 2025-7-15 00:24:00

DFL模型训练 ae_dims: 384和256的训练出来的模型差别大吗?

我想炼一个泛化能力强的底丹,现在比较纠结要不要重新开始炼 现在炼的参数 是256 64 64 22

帮忙给个意见谢谢~

風水先生 发表于 2025-7-15 08:48:35

差别有的,虽然泛化能力强点,但是参数越大训练速度越慢,合适的才是最好的

mjy9921129 发表于 2025-7-23 16:37:07

風水先生 发表于 2025-7-15 08:48
差别有的,虽然泛化能力强点,但是参数越大训练速度越慢,合适的才是最好的 ...

高参除了泛化能力强点,是不是清晰度也高点呢?
页: [1]
查看完整版本: DFL模型训练 ae_dims: 384和256的训练出来的模型差别大吗?