В последние несколько лет для различных методов обучения нейронных сетей была обнаружена проблема heavy tail gradients(распределение градиента с тяжёлым хвостом), что приводит к ухудшению качества моделей машинного обучения. В связи с этим, становится выгодной разработка алгоритмов градиентого клиппинга.
✅
❌
~
Наши методы клиппирования:
Предлагаем ознакомиться с разработанными методами клиппирования нашей команды: