torch.nn.attention#
创建于: 2024 年 1 月 24 日 | 最后更新于: 2025 年 11 月 12 日
此模块包含修改 torch.nn.functional.scaled_dot_product_attention 的行为的函数和类
Utils#
用于选择缩放点积注意力后端的上下文管理器。 |
|
包含缩放点积注意力不同后端的类似枚举的类。 |
|
注册用于激活闪光注意力实现的调用器。 |
|
将先前注册的闪光注意力实现激活到调度器中。 |
|
返回所有可用闪光注意力实现的名称。 |
|
返回当前激活的闪光注意力实现的名称(如果存在)。 |
Submodules#
此模块实现了 PyTorch 中 flex_attention 的面向用户的 API。 |
|
定义与 scaled_dot_product_attention 一起使用的偏置子类 |
|
使用 Flash Attention 实现的可变长度注意力。 |