评价此页

torch.bucketize#

torch.bucketize(input, boundaries, *, out_int32=False, right=False, out=None) Tensor#

返回一个包含每个值所属桶索引的新张量,其中桶的边界由 boundaries 设置。返回的张量与 input 具有相同的大小。如果 right 为 False(默认),则左边界是开放的。请注意,此行为与 numpy.digitize 的行为相反。更正式地说,返回的索引满足以下规则:

right

返回的索引满足

boundaries[i-1] < input[m][n]...[l][x] <= boundaries[i]

boundaries[i-1] <= input[m][n]...[l][x] < boundaries[i]

参数
  • input (TensorScalar) – N-D 张量或包含查找值/值的标量。

  • boundaries (Tensor) – 1-D 张量,必须包含严格递增的序列,否则返回值未定义。

关键字参数
  • out_int32 (bool, optional) – 指示输出数据类型。如果为 True,则为 torch.int32,否则为 torch.int64。默认值为 False,即默认输出数据类型为 torch.int64。

  • right (bool, optional) – 确定 boundaries 中值的行为。请参见上表。

  • out (Tensor, optional) – 输出张量,如果提供,则必须与 input 具有相同的大小。

示例

>>> boundaries = torch.tensor([1, 3, 5, 7, 9])
>>> boundaries
tensor([1, 3, 5, 7, 9])
>>> v = torch.tensor([[3, 6, 9], [3, 6, 9]])
>>> v
tensor([[3, 6, 9],
        [3, 6, 9]])
>>> torch.bucketize(v, boundaries)
tensor([[1, 3, 4],
        [1, 3, 4]])
>>> torch.bucketize(v, boundaries, right=True)
tensor([[2, 3, 5],
        [2, 3, 5]])