torch.accelerator.synchronize#
- torch.accelerator.synchronize(device=None, /)[source]#
等待给定设备上的所有流中的所有内核完成。
- 参数
device (
torch.device
, str, int, optional) – 要同步的设备。它必须与当前 accelerator 设备类型匹配。如果未给出,则默认使用torch.accelerator.current_device_index()
。
注意
如果当前 accelerator 未初始化,则此函数无操作。
示例
>>> assert torch.accelerator.is_available() "No available accelerators detected." >>> start_event = torch.Event(enable_timing=True) >>> end_event = torch.Event(enable_timing=True) >>> start_event.record() >>> tensor = torch.randn(100, device=torch.accelerator.current_accelerator()) >>> sum = torch.sum(tensor) >>> end_event.record() >>> torch.accelerator.synchronize() >>> elapsed_time_ms = start_event.elapsed_time(end_event)