torchvision¶

此库是 PyTorch 项目的一部分。PyTorch 是一个开源机器学习框架。

本文档中描述的功能按发布状态分类

稳定版：这些功能将得到长期维护，通常不会有重大的性能限制或文档缺失。我们也期望保持向后兼容性（尽管可能发生重大更改，并会在提前一个版本时发出通知）。

Beta 版：功能被标记为 Beta 版是因为 API 可能根据用户反馈而更改，或者是因为性能需要改进，或者是因为运算符的覆盖范围尚未完成。对于 Beta 版功能，我们致力于将其推进到稳定版分类。但是，我们不承诺向后兼容性。

原型：这些功能通常不作为 PyPI 或 Conda 等二进制发行版的一部分提供，除非有时通过运行时标志，并且处于反馈和测试的早期阶段。

该 torchvision 包包含用于计算机视觉的流行数据集、模型架构和常用图像转换。

包参考

示例和训练参考

torchvision.get_image_backend()[源代码]¶: 获取用于加载图像的包的名称

torchvision.get_video_backend()[源代码]¶

返回当前用于解码视频的视频后端。

返回:: 视频后端的名称。是 {‘pyav’, ‘video_reader’} 之一。
返回类型:: str

torchvision.set_image_backend(backend)[源代码]¶

指定用于加载图像的包。

参数:: backend (string) – 图像后端的名称。是 {‘PIL’, ‘accimage’} 之一。 accimage 包使用 Intel IPP 库。它通常比 PIL 快，但支持的操作不如 PIL 多。

torchvision.set_video_backend(backend)[源代码]¶

指定用于解码视频的包。

参数:: backend (string) – 视频后端的名称。是 {‘pyav’, ‘video_reader’} 之一。 pyav 包使用第三方 PyAv 库。它是 FFmpeg 库的 Pythonic 绑定。 video_reader 包包含基于 FFMPEG 库的原生 C++ 实现，以及 TorchScript 自定义算子的 Python API。它通常比 pyav 解码速度更快，但可能不如 pyav 健壮。

注意

在最新的 main 中，默认禁用了 FFMPEG 的构建。如果您想使用 ‘video_reader’ 后端，请从源代码编译 torchvision。

PyTorch 库

索引¶

索引

torchvision¶

索引¶

文档

教程

资源