评价此页

★ ★ ★ ★ ★

torch.cuda.comm.reduce_add#

torch.cuda.comm.reduce_add(inputs, destination=None)[源代码]#

从多个 GPU 求和张量。

所有输入应具有匹配的形状、dtype 和布局。输出张量将具有相同的形状、dtype 和布局。

参数

inputs (Iterable[Tensor]) – 要相加的张量的可迭代对象。
destination (int, optional) – 输出将放置的设备（默认：当前设备）。

返回

一个张量，其中包含所有输入的逐元素和，并放置在 destination 设备上。

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源