快捷方式

torchaudio.functional.amplitude_to_DB

torchaudio.functional.amplitude_to_DB(x: Tensor, multiplier: float, amin: float, db_multiplier: float, top_db: Optional[float] = None) Tensor[源代码]

将频谱图从功率/幅度尺度转换为分贝尺度。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript

批次中每个张量的输出取决于该张量的最大值,因此将音频片段拆分与完整片段相比,可能会返回不同的值。

参数
  • x (Tensor) –

    输入频谱图,在转换为分贝尺度之前。预期的形状为 (freq, time)(channel, freq, time)(..., batch, channel, freq, time)

    注意

    当指定 top_db 时,将为批次中的每个音频计算截止值。因此,如果输入形状为 4D(或更大),则会为批次中的音频数据使用不同的截止值。如果输入形状为 2D 或 3D,则使用单个截止值。

  • multiplier (float) – 对于功率使用 10.,对于幅度使用 20。

  • amin (float) – 用于裁剪 x 的数字

  • db_multiplier (float) – Log10(max(reference value and amin))

  • top_db (floatNone, 可选) – 以分贝为单位的最小负截止值。一个合理的值是 80。(默认值:None

返回

输出张量,以分贝尺度表示

返回类型

张量

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源