• 学习
    入门 教程 学习基础知识 PyTorch 实用技巧 PyTorch 入门 - YouTube 系列 网络研讨会
  • 社区
    Landscape 加入生态系统 社区中心 论坛 开发者资源 贡献者奖项 社区活动 PyTorch大使
  • 项目
    PyTorch vLLM DeepSpeed 托管您的项目 RAY
  • 文档
    PyTorch 领域
  • 博客与新闻
    博客 公告 案例研究 活动 新闻通讯
  • 关于
    PyTorch基金会 成员 理事会 技术咨询委员会 云积分计划 员工 联系 品牌指南
  • 加入
  • 学习
    • 开始
    • 教程
    • 学习基础知识
    • PyTorch 食谱
    • PyTorch 简介 - YouTube 系列
    • 网络研讨会
  • 社区
    • 生态版图
    • 加入生态系统
    • 社区中心
    • 论坛
    • 开发者资源
    • 贡献者奖项
    • 社区活动
    • PyTorch大使
  • 项目
    • PyTorch
    • vLLM
    • DeepSpeed
    • 托管您的项目
  • 文档
    • PyTorch
    • 领域
  • 博客与新闻
    • 博客
    • 公告
    • 案例研究
    • 活动
    • 新闻通讯
  • 关于
    • PyTorch 基金会
    • 成员
    • 理事会
    • 技术咨询委员会
    • 云积分计划
    • 员工
    • 联系我们
跳转到主要内容
Ctrl+K

主页

  • 安装 PyTorch
  • 用户指南
  • 参考 API
  • 开发者须知
  • 社区
  • 教程
Ctrl+K
  • X
  • GitHub
  • PyTorch 论坛
  • PyPi
  • 安装 PyTorch
  • 用户指南
  • 参考 API
  • 开发者须知
  • 社区
  • 教程
Ctrl+K
  • X
  • GitHub
  • PyTorch 论坛
  • PyPi

章节导航

简介

  • Pytorch 概述
  • 开始
  • 学习基础知识

核心概念

  • PyTorch 主要组件

Torch 编译

  • Torch.compile
    • 入门指南
    • 核心概念
      • torch.compile 编程模型
        • Dynamo 核心概念
        • 使用图断点
        • 非严格追踪编程模型
        • 处理重新编译
        • tlparse / TORCH_TRACE
        • 报告问题
      • Dynamo 概述
      • PyTorch 2.0 NNModule 支持
      • torch.compile 具有不同的 autograd 语义
    • 性能
      • PyTorch 2.0 性能仪表盘
      • TorchInductor GPU 性能分析
      • 性能分析以理解 torch.compile 的性能
      • CUDAGraph 树
    • 高级
      • Dynamo 深度解析
      • 在 ATen IR 上编写图转换
      • 伪张量
      • 自定义后端
      • 动态形状
        • 动态形状核心概念
        • 动态形状故障排除
        • 控制动态行为的高级选项
        • 超越基础
    • 故障排除常见问题解答
      • tlparse / TORCH_TRACE
      • 报告问题
      • torch.compile 故障排除
      • 常见问题
    • 参考/API
      • torch.compiler API 参考
        • torch.compiler.compile
        • torch.compiler.reset
        • torch.compiler.allow_in_graph
        • torch.compiler.substitute_in_graph
        • torch.compiler.assume_constant_result
        • torch.compiler.list_backends
        • torch.compiler.disable
        • torch.compiler.set_stance
        • torch.compiler.set_enable_guard_collectives
        • torch.compiler.cudagraph_mark_step_begin
        • torch.compiler.is_compiling
        • torch.compiler.is_dynamo_compiling
        • torch.compiler.is_exporting
        • torch.compiler.skip_guard_on_inbuilt_nn_modules_unsafe
        • torch.compiler.skip_guard_on_all_nn_modules_unsafe
        • torch.compiler.keep_tensor_guards_unsafe
        • torch.compiler.skip_guard_on_globals_unsafe
        • torch.compiler.skip_all_guards_unsafe
        • torch.compiler.nested_compile_region
      • torch.compiler.config
      • 用于细粒度跟踪的 TorchDynamo API
      • TorchInductor 和 AOTInductor 来源跟踪
  • Torch.export
    • torch.export API 参考
    • torch.export 编程模型
    • torch.export IR 规范
    • PT2 Archive Spec
    • 草案导出
    • 与描述符联合
    • 控制流 - Cond
    • ExportDB
      • torch.escape-hatch
      • torch.cond
      • torch.dynamic-shape
      • python.closure
      • torch.dynamic-value
      • python.data-structure
      • python.assert
      • python.control-flow
      • torch.map
      • python.builtin
      • python.object-model
      • python.context-manager
      • torch.operator
      • torch.mutation
    • AOTInductor:对 Torch.Export 导出模型的预先编译
      • torch._logging
        • torch._logging.set_logs
      • AOTInductor 最小化器
      • AOTInductor 调试指南
    • IRs
    • 动态形状
      • 动态形状核心概念
      • 动态形状故障排除
        • 使用 tlparse 和 TORCH_LOGS=dynamic 进行调试
        • 故障排除 GuardOnDataDependentSymNode 错误
      • 控制动态行为的高级选项
      • 超越基础
        • 零一特化问题
        • 已支持 vs. 未支持的 Symints
    • 伪张量
    • 在 ATen IR 上编写图转换

开发者须知

  • 开发者须知
    • 自动混合精度示例
    • Autograd 机制
    • 广播语义
    • CPU 线程和 TorchScript 推理
    • CUDA 语义
    • PyTorch 自定义算子主页
    • 分布式数据并行
    • 扩展 PyTorch
    • 使用 autograd.Function 扩展 torch.func
    • 常见问题
    • Intel GPU 入门
    • Gradcheck 机制
    • HIP (ROCm) 语义
    • 大规模部署功能
    • LibTorch 稳定 ABI
    • MKLDNN 后端
    • 模块
    • MPS 后端
    • 多进程最佳实践
    • 数值精度
    • Out 参数笔记
    • 可复现性
    • 序列化语义
    • Windows 常见问题

加速器集成

  • 加速器集成
    • 设备管理
    • 加速器钩子
    • Guard
    • 自动加载机制
    • 算子注册
    • 自动混合精度
  • 用户指南
  • 开发者须知
评价此页
★ ★ ★ ★ ★

开发者笔记#

创建日期: 2025年4月16日 | 最后更新日期: 2025年4月16日

  • 自动混合精度示例
  • Autograd 机制
  • 广播语义
  • CPU 线程和 TorchScript 推理
  • CUDA 语义
  • PyTorch 自定义算子主页
  • 分布式数据并行
  • 扩展 PyTorch
  • 使用 autograd.Function 扩展 torch.func
  • 常见问题
  • Intel GPU 入门
  • Gradcheck 机制
  • HIP (ROCm) 语义
  • 大规模部署功能
  • LibTorch 稳定 ABI
  • MKLDNN 后端
  • MKLDNN 后端上的 Bfloat16 (BF16)
  • 模块
  • MPS 后端
  • 多进程最佳实践
  • 数值精度
  • Out 参数笔记
  • 可复现性
  • 序列化语义
  • Windows 常见问题
评价此页
★ ★ ★ ★ ★

上一页

IRs

下一页

自动混合精度示例

使用 PyData Sphinx 主题 0.15.4 构建。

上一页

IRs

下一页

自动混合精度示例

在 GitHub 上编辑
显示源代码
PyTorch 库
  • torchao
  • torchrec
  • torchft
  • TorchCodec
  • torchvision
  • ExecuTorch
  • XLA 设备上的 PyTorch

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源

保持联系以获取更新、活动信息和最新新闻

通过提交此表格,我同意接收来自 LF 及其项目关于其活动、培训、研究、开发和相关公告的市场营销电子邮件。我理解我可以在任何时候使用我收到的电子邮件页脚中的链接取消订阅。 隐私政策。

© PyTorch。 版权所有 © The Linux Foundation®。保留所有权利。The Linux Foundation 拥有注册商标并使用商标。有关更多信息,包括使用条款、隐私政策和商标使用,请参阅我们的 政策 页面。 商标使用。 隐私政策。

为了分析流量并优化您的体验,我们在此网站上使用 Cookie。点击或浏览即表示您同意我们使用 Cookie。作为本网站的当前维护者,Facebook 的 Cookie 政策适用。了解更多信息,包括可用的控件: Cookie 政策。

© 版权所有 PyTorch 贡献者。

使用 Sphinx 7.2.6 创建。

使用 PyData Sphinx 主题 0.15.4 构建。