AudioEncoder¶

class torchcodec.encoders.AudioEncoder(samples: Tensor, *, sample_rate: int)[源代码]¶

一个音频编码器。

参数:

samples (torch.Tensor) – 要编码的样本。这必须是一个形状为 (num_channels, num_samples) 的 2D 张量，或者是一个 1D 张量（在这种情况下，假定 num_channels = 1）。值必须是 [-1, 1] 范围内的浮点值。
sample_rate (int) – **输入** samples 的采样率。编码后的输出采样率可以使用编码方法（to_file 等）指定。

使用 AudioEncoder 的示例

使用 AudioEncoder 对音频样本进行编码

to_file(dest: Union[str, Path], *, bit_rate: Optional[int] = None, num_channels: Optional[int] = None, sample_rate: Optional[int] = None) → None[源代码]¶

将样本编码到文件中。

参数:

dest (str 或 pathlib.Path) – 输出文件的路径，例如 audio.mp3。文件的扩展名决定了音频格式和容器。
bit_rate (int, 可选) – 输出比特率。编码器通常支持有限的比特率值，因此 bit_rate 将匹配其中一个支持的值。默认值由 FFmpeg 选择。
num_channels (int, 可选) – 编码输出样本的通道数。默认情况下，使用输入 samples 的通道数。
sample_rate (int, 可选) – 编码输出的采样率。默认情况下，使用输入 samples 的采样率。

to_tensor(format: str, *, bit_rate: Optional[int] = None, num_channels: Optional[int] = None, sample_rate: Optional[int] = None) → Tensor[源代码]¶

将样本编码为原始字节，作为 1D uint8 Tensor。

参数:

format (str) – 编码样本的格式，例如 “mp3”、“wav” 或 “flac”。
bit_rate (int, 可选) – 输出比特率。编码器通常支持有限的比特率值，因此 bit_rate 将匹配其中一个支持的值。默认值由 FFmpeg 选择。
num_channels (int, 可选) – 编码输出样本的通道数。默认情况下，使用输入 samples 的通道数。
sample_rate (int, 可选) – 编码输出的采样率。默认情况下，使用输入 samples 的采样率。

返回:

编码后的原始字节作为 1D uint8 Tensor。

返回类型:

张量

文档