GELU#
- class torch.nn.GELU(approximate='none')[source]#
应用高斯误差线性单元函数。
其中 是高斯分布的累积分布函数。
当 approximate 参数为 ‘tanh’ 时,Gelu 的估计公式如下:
(x+0.044715∗x3)))- 参数
approximate (str, optional) – 要使用的 gelu 近似算法:
'none'
|'tanh'
。默认为:'none'
- 形状
输入: ,其中 表示任意数量的维度。
输出: ,形状与输入相同。
示例
>>> m = nn.GELU() >>> input = torch.randn(2) >>> output = m(input)