快捷方式

AudioEncoder

class torchcodec.encoders.AudioEncoder(samples: Tensor, *, sample_rate: int)[源代码]

一个音频编码器。

参数:
  • samples (torch.Tensor) – 要编码的样本。这必须是一个形状为 (num_channels, num_samples) 的 2D 张量,或者是一个 1D 张量(在这种情况下,假定 num_channels = 1)。值必须是 [-1, 1] 范围内的浮点值。

  • sample_rate (int) – **输入** samples 的采样率。编码后的输出采样率可以使用编码方法(to_file 等)指定。

使用 AudioEncoder 的示例

使用 AudioEncoder 对音频样本进行编码

使用 AudioEncoder 对音频样本进行编码
to_file(dest: Union[str, Path], *, bit_rate: Optional[int] = None, num_channels: Optional[int] = None, sample_rate: Optional[int] = None) None[源代码]

将样本编码到文件中。

参数:
  • dest (str 或 pathlib.Path) – 输出文件的路径,例如 audio.mp3。文件的扩展名决定了音频格式和容器。

  • bit_rate (int, 可选) – 输出比特率。编码器通常支持有限的比特率值,因此 bit_rate 将匹配其中一个支持的值。默认值由 FFmpeg 选择。

  • num_channels (int, 可选) – 编码输出样本的通道数。默认情况下,使用输入 samples 的通道数。

  • sample_rate (int, 可选) – 编码输出的采样率。默认情况下,使用输入 samples 的采样率。

to_tensor(format: str, *, bit_rate: Optional[int] = None, num_channels: Optional[int] = None, sample_rate: Optional[int] = None) Tensor[源代码]

将样本编码为原始字节,作为 1D uint8 Tensor。

参数:
  • format (str) – 编码样本的格式,例如 “mp3”、“wav” 或 “flac”。

  • bit_rate (int, 可选) – 输出比特率。编码器通常支持有限的比特率值,因此 bit_rate 将匹配其中一个支持的值。默认值由 FFmpeg 选择。

  • num_channels (int, 可选) – 编码输出样本的通道数。默认情况下,使用输入 samples 的通道数。

  • sample_rate (int, 可选) – 编码输出的采样率。默认情况下,使用输入 samples 的采样率。

返回:

编码后的原始字节作为 1D uint8 Tensor。

返回类型:

张量

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源