torch.nn.utils.clip_grads_with_norm_#
- torch.nn.utils.clip_grads_with_norm_(parameters, max_norm, total_norm, foreach=None)[source]#
将一组参数的梯度根据预先计算的总范数和期望的最大范数进行缩放。
梯度将通过以下计算进行缩放:
梯度会就地修改。
此函数等同于使用预先计算的总范数的
torch.nn.utils.clip_grad_norm_()
。
将一组参数的梯度根据预先计算的总范数和期望的最大范数进行缩放。
梯度将通过以下计算进行缩放:
梯度会就地修改。
此函数等同于使用预先计算的总范数的 torch.nn.utils.clip_grad_norm_()
。