torch.nn.utils.clip_grads_with_norm_#
- torch.nn.utils.clip_grads_with_norm_(parameters, max_norm, total_norm, foreach=None)[源码]#
使用预先计算的总范数和期望的最大范数,按比例缩放参数的可迭代梯度。
梯度将通过以下计算进行缩放:
梯度会就地修改。
注意:比例系数被限制在最大值为 1.0,以防止梯度放大。这确保了只有当总范数超过 max_norm 时,梯度才会被缩小。
此函数等效于
torch.nn.utils.clip_grad_norm_()
,但使用了预先计算的总范数。