评价此页

DataParallel#

class torch.nn.DataParallel(module, device_ids=None, output_device=None, dim=0)[source]#

在模块级别实现数据并行。

此容器通过将输入沿批处理维度(其他对象将为每个设备复制一次)进行分块,从而在指定设备上并行化给定 module 的应用。在前向传播中,模块在每个设备上复制,每个副本处理输入的一部分。在反向传播期间,来自每个副本的梯度会被求和到原始模块中。

批处理大小应大于所使用的 GPU 数量。

警告

即使只有一个节点,也建议使用 DistributedDataParallel 而非此类进行多 GPU 训练。参见:使用 nn.parallel.DistributedDataParallel 而非 multiprocessing 或 nn.DataParallel分布式数据并行 (Distributed Data Parallel)

允许将任意位置参数和关键字参数传递给 DataParallel,但某些类型会得到特殊处理。张量将按指定维度(默认为 0)进行分散。元组、列表和字典类型将进行浅拷贝。其他类型将在不同线程之间共享,如果在模型的正向传播中写入,可能会损坏。

并行的 module 在运行此 DataParallel 模块之前,必须将其参数和缓冲区放在 device_ids[0] 上。

警告

在每次正向传播中,module 会在每个设备上复制,因此在 forward 中对运行模块的任何更新都将丢失。例如,如果 module 有一个在每次 forward 中递增的计数器属性,它将始终保持初始值,因为更新是在副本上完成的,而副本在 forward 后会被销毁。然而,DataParallel 保证 device[0] 上的副本将与基并行化 module 共享其参数和缓冲区的存储。因此,对 device[0] 上的参数或缓冲区的原地更新将被记录。例如,BatchNorm2dspectral_norm() 依赖此行为来更新缓冲区。

警告

module 及其子模块上定义的前向和后向钩子将被调用 len(device_ids) 次,每次输入都位于特定设备上。特别是,钩子只保证按正确顺序相对于相应设备上的操作执行。例如,不保证通过 register_forward_pre_hook() 设置的钩子在 所有 len(device_ids)forward() 调用之前执行,但保证每个此类钩子在该设备的相应 forward() 调用之前执行。

警告

moduleforward() 中返回一个标量(即 0 维张量)时,此包装器将返回一个长度等于数据并行化中使用的设备数量的向量,其中包含来自每个设备的结果。

注意

在使用 打包序列 -> 循环网络 -> 解包序列 模式的 Module 包装在 DataParallel 中时,有一个微妙之处。详情请参阅常见问题解答中的 我的循环网络不支持数据并行 部分。

参数
  • module (Module) – 要并行的模块

  • device_ids (list of int or torch.device) – CUDA 设备(默认:所有设备)

  • output_device (int or torch.device) – 输出设备的所在地(默认:device_ids[0])

变量

module (Module) – 要并行的模块

示例

>>> net = torch.nn.DataParallel(model, device_ids=[0, 1, 2])
>>> output = net(input_var)  # input_var can be on any device, including CPU