从源代码构建¶
TorchAudio 集成了 PyTorch 用于数值计算和第三方库用于多媒体 I/O。它需要以下工具才能从源代码构建。
自定义构建¶
TorchAudio 与第三方库的集成可以通过环境变量启用/禁用。
可以通过传入1
启用它们,通过传入0
禁用它们。
BUILD_SOX
:启用/禁用基于 libsox 的 I/O 功能。BUILD_KALDI
:启用/禁用基于 Kaldi 的特征提取。BUILD_RNNT
:启用/禁用自定义 RNN-T 损失函数。USE_FFMPEG
:启用/禁用基于 FFmpeg 库的 I/O 功能。USE_ROCM
:启用/禁用 AMD ROCm 支持。USE_CUDA
:启用/禁用 CUDA 支持。
有关最新配置及其默认值,请查看源代码。https://github.com/pytorch/audio/blob/main/tools/setup_helpers/extension.py