Размер батча
Проведя обучение с разными размерами батча, мы выявили, что наилучшая глубина сходимости была получена при размере батча = 200, однако, относительно стандартного батча = 1000, время обучения значительно выросло. Также мы попробовали использовать динамически увеличивающийся размер батча, что дало положительный результат: глубина сходимости немного снизилась, но время, требуемое на обучение снизилось в три раза.