• 文档 >
  • 安装预构建二进制文件 >
  • 旧版本 (稳定版)
快捷方式

安装预构建二进制文件

torchaudio 在 PyPI (pip) 和 Anaconda (conda) 上都有二进制分发。

详情请参考 https://pytorch.ac.cn/get-started/locally/

注意

每个 torchaudio 包都针对特定版本的 torch 进行编译。请参考下表并安装正确配对的 torchtorchaudio

注意

0.10 开始,torchaudio 提供了仅支持 CPU 和支持 CUDA 的二进制分发,每个都需要相应的 PyTorch 分发。

注意

此软件是根据未经修改的 FFmpeg 副本编译的,并移除了特定的 rpath 以便使用系统库。LGPL 源代码可从以下位置下载:n4.1.8许可证)、n5.0.3许可证)和 n6.0许可证)。

依赖项

  • PyTorch

    请参考下面的兼容性矩阵以了解支持的 PyTorch 版本。

可选依赖项

  • FFmpeg

    使用 torchaudio.io 模块和 I/O 函数中的 backend="ffmpeg" 时需要。

    从 2.1 版本开始,TorchAudio 官方二进制分发版本与 FFmpeg 6、5 和 4 版本(>=4.4, <7)兼容。在运行时,TorchAudio 首先寻找 FFmpeg 6,如果未找到,则继续寻找 5,然后是 4。

    有多种方法可以安装 FFmpeg 库。请参考官方文档以了解如何安装 FFmpeg。如果您使用的是 Anaconda Python 分发版,conda install -c conda-forge 'ffmpeg<7' 将安装兼容的 FFmpeg 库。

    如果您需要指定 TorchAudio 搜索和链接的 FFmpeg 版本,可以通过环境变量 TORIO_USE_FFMPEG_VERSION 进行指定。例如,通过设置 TORIO_USE_FFMPEG_VERSION=5,TorchAudio 将只查找 FFmpeg 5。

    如果出于某种原因,此搜索机制导致问题,您可以通过设置环境变量 TORIO_USE_FFMPEG=0 完全禁用 FFmpeg 集成。

    有多种方法可以安装 FFmpeg 库。如果您使用的是 Anaconda Python 分发版,conda install -c conda-forge 'ffmpeg<7' 将安装兼容的 FFmpeg 库。

    注意

    在搜索 FFmpeg 安装时,TorchAudio 会寻找带有版本号的库文件。也就是说,Linux 为 libavutil.so.<VERSION>,macOS 为 libavutil.<VERSION>.dylib,Windows 为 avutil-<VERSION>.dll。许多公共预构建二进制文件都遵循此命名方案,但有些分发版的文件名没有版本号。如果您在检测 FFmpeg 时遇到困难,请仔细检查您安装的库文件是否遵循此命名方案(然后确保它们位于库搜索路径中列出的目录之一)。

  • SoX

    I/O 函数中使用 backend="sox" 时需要。

    从 2.1 版本开始,TorchAudio 需要单独安装 libsox。

    如果动态链接导致问题,您可以设置环境变量 TORCHAUDIO_USE_SOX=0,TorchAudio 将不会使用 SoX。

    注意

    TorchAudio 查找不带版本号的库文件,即 Linux 的 libsox.so 和 macOS 的 libsox.dylib。某些包管理器安装的库文件名称不同。例如,Ubuntu 上的 aptitude 安装 libsox.so.3。为了让 TorchAudio 链接到它,您可以创建一个名为 libsox.so 的符号链接(并将该符号链接放在库搜索路径中)。

    注意

    TorchAudio 在 libsox 14.4.2 上进行测试。(其他版本不太可能正常工作。)

  • SoundFile

    I/O 函数中使用 backend="soundfile" 时需要。

  • sentencepiece

    使用 Emformer RNN-T 执行自动语音识别时需要。您可以通过运行 pip install sentencepiece 来安装它。

  • deep-phonemizer

    使用 Tacotron2 文本转语音执行文本转语音时需要。

  • kaldi_io

    使用 torchaudio.kaldi_io 模块时需要。

兼容性矩阵

TorchAudio 的官方二进制分发包含用 C++ 编写并链接到特定版本 PyTorch 的扩展模块。

不同版本的 TorchAudio 和 PyTorch 不能一起使用。请参考下表以了解匹配的版本。

PyTorch

TorchAudio

Python

2.6

2.6.0

>=3.9, <=3.13

2.5

2.5.0

>=3.8, <=3.11

2.4.1

2.4.1

>=3.8, <=3.11

2.4

2.4.0

>=3.8, <=3.11

2.3.1

2.3.1

>=3.8, <=3.11

2.3.0

2.3.0

>=3.8, <=3.11

2.2.2

2.2.2

>=3.8, <=3.11

2.2.1

2.2.1

>=3.8, <=3.11

2.2

2.2.0

>=3.8, <=3.11

2.1.2

2.1.2

>=3.8, <=3.11

2.1.1

2.1.1

>=3.8, <=3.11

2.1.0

2.1.0

>=3.8, <=3.11

2.0.1

2.0.2

>=3.8, <=3.11

2.0.0

2.0.1

>=3.8, <=3.11

1.13.1

0.13.1

>=3.7, <=3.10

1.13.0

0.13.0

>=3.7, <=3.10

1.12.1

0.12.1

>=3.7, <=3.10

1.12.0

0.12.0

>=3.7, <=3.10

1.11.0

0.11.0

>=3.7, <=3.9

1.10.0

0.10.0

>=3.6, <=3.9

1.9.1

0.9.1

>=3.6, <=3.9

1.8.1

0.8.1

>=3.6, <=3.9

1.7.1

0.7.2

>=3.6, <=3.9

1.7.0

0.7.0

>=3.6, <=3.8

1.6.0

0.6.0

>=3.6, <=3.8

1.5.0

0.5.0

>=3.5, <=3.8

1.4.0

0.4.0

==2.7, >=3.5, <=3.8

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源