评价此页

CosineEmbeddingLoss#

class torch.nn.CosineEmbeddingLoss(margin=0.0, size_average=None, reduce=None, reduction='mean')[source]#

创建一个标准,该标准测量给定输入张量 x1x_1, x2x_2 和标签张量 yy(值为 1 或 -1)。 使用 (y=1y=1) 来最大化两个输入的余弦相似度,使用 (y=1y=-1) 来最小化。这通常用于学习非线性嵌入或半监督学习。

每个样本的损失函数为

loss(x,y)={1cos(x1,x2),if y=1max(0,cos(x1,x2)margin),if y=1\text{loss}(x, y) = \begin{cases} 1 - \cos(x_1, x_2), & \text{if } y = 1 \\ \max(0, \cos(x_1, x_2) - \text{margin}), & \text{if } y = -1 \end{cases}
参数
  • margin (float, optional) – 应为一个介于 1-111 之间的数字,建议值为 000.50.5。如果 margin 未提供,则默认为 00

  • size_average (bool, optional) – 已弃用(参见 reduction)。默认情况下,损失会根据批次中的每个损失元素进行平均。请注意,对于某些损失,每个样本有多个元素。如果字段 size_average 设置为 False,则损失会改为对每个小批次进行求和。当 reduceFalse 时忽略。默认值:True

  • reduce (bool, optional) – 已弃用(参见 reduction)。默认情况下,损失会根据 size_average 的值,在每个小批次的观测值上进行平均或求和。当 reduceFalse 时,则返回每个批次元素的损失,并忽略 size_average。默认值:True

  • reduction (str, optional) – 指定应用于输出的归约方式:'none' | 'mean' | 'sum''none':不应用归约,'mean':输出的总和将除以输出中的元素数量,'sum':输出将进行求和。注意:size_averagereduce 正在被弃用,在此期间,指定这两个参数中的任何一个都将覆盖 reduction。默认值:'mean'

形状
  • 输入1:(N,D)(N, D)(D)(D),其中 N 是批次大小,D 是嵌入维度。

  • 输入2:(N,D)(N, D)(D)(D),形状与输入1相同。

  • 目标:(N)(N)()()

  • 输出:如果 reduction'none',则为 (N)(N),否则为标量。

示例

>>> loss = nn.CosineEmbeddingLoss()
>>> input1 = torch.randn(3, 5, requires_grad=True)
>>> input2 = torch.randn(3, 5, requires_grad=True)
>>> target = torch.ones(3)
>>> output = loss(input1, input2, target)
>>> output.backward()