目录

快捷方式

torchaudio.functional.amplitude_to_DB¶

torchaudio.functional.amplitude_to_DB(x: Tensor, multiplier: float, amin: float, db_multiplier: float, top_db: Optional[float] = None) → Tensor[源代码]¶

将频谱图从功率/幅度尺度转换为分贝尺度。

批次中每个张量的输出取决于该张量的最大值，因此将音频片段拆分与完整片段相比，可能会返回不同的值。

参数

x (Tensor) –
输入频谱图，在转换为分贝尺度之前。预期的形状为 (freq, time)、(channel, freq, time) 或 (..., batch, channel, freq, time)。

注意

当指定 top_db 时，将为批次中的每个音频计算截止值。因此，如果输入形状为 4D（或更大），则会为批次中的音频数据使用不同的截止值。如果输入形状为 2D 或 3D，则使用单个截止值。
multiplier (float) – 对于功率使用 10.，对于幅度使用 20。
amin (float) – 用于裁剪 x 的数字
db_multiplier (float) – Log10(max(reference value and amin))
top_db (float 或 None, 可选) – 以分贝为单位的最小负截止值。一个合理的值是 80。（默认值：None）

返回

输出张量，以分贝尺度表示

返回类型

张量

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源