快捷方式

AudioStreamMetadata

class torchcodec.decoders.AudioStreamMetadata(duration_seconds_from_header: Optional[float], begin_stream_seconds_from_header: Optional[float], bit_rate: Optional[float], codec: Optional[str], stream_index: int, sample_rate: Optional[int], num_channels: Optional[int], sample_format: Optional[str])[源代码]

单个音频流的元数据。

AudioStreamMetadata 的用法示例

使用 AudioDecoder 解码音频流

使用 AudioDecoder 解码音频流
begin_stream_seconds_from_header: Optional[float]

从头信息获取的流的起始时间(秒),类型为 float 或 None。通常等于 0。

bit_rate: Optional[float]

流的比特率,单位为秒(float 或 None)。

codec: Optional[str]

编解码器(str 或 None)。

duration_seconds_from_header: Optional[float]

从头信息获取的流的持续时间(秒),类型为 float 或 None。这可能不准确。

num_channels: Optional[int]

声道数(单声道为 1,立体声为 2,依此类推)。

sample_format: Optional[str]

FFmpeg 描述的原始采样格式。例如:‘fltp’、‘s32’ 等。

sample_rate: Optional[int]

原始采样率。

stream_index: int

此元数据引用的流的索引(int)。

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源