快捷方式

read_video

torchvision.io.read_video(filename: str, start_pts: Union[float, Fraction] = 0, end_pts: Optional[Union[float, Fraction]] = None, pts_unit: str = 'pts', output_format: str = 'THWC') tuple[torch.Tensor, torch.Tensor, dict[str, Any]][源代码]

[已弃用] 从文件读取视频,返回视频帧和音频帧

警告

已弃用:torchvision 的所有视频解码和编码功能从 0.22 版本开始已弃用,并将在 0.24 版本中移除。我们建议您迁移到 TorchCodec,我们将在其中整合 PyTorch 未来的解码/编码功能。

参数:
  • filename (str) – 视频文件的路径。如果使用 pyav 后端,这可以是 av.open 接受的任何内容。

  • start_pts (如果 pts_unit = 'pts' 则为 python:int, 如果 pts_unit = 'sec' 则为 python:float / Fraction, 可选) – 视频的开始呈现时间

  • end_pts (如果 pts_unit = 'pts' 则为 python:int, 如果 pts_unit = 'sec' 则为 python:float / Fraction, 可选) – 结束呈现时间

  • pts_unit (str, 可选) – start_pts 和 end_pts 值将要解释的单位,可以是 'pts' 或 'sec'。默认为 'pts'。

  • output_format (str, 可选) – 输出视频张量的格式。可以是“THWC”(默认)或“TCHW”。

返回:

T 视频帧 aframes (Tensor[K, L]): 音频帧,其中 K 是通道数,L 是点数 info (Dict): 视频和音频的元数据。可能包含 video_fps (float) 和 audio_fps (int) 字段

返回类型:

vframes (Tensor[T, H, W, C] 或 Tensor[T, C, H, W])

使用 read_video 的示例

光流:使用 RAFT 模型预测运动

光流:使用 RAFT 模型预测运动

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源