• 学习
    开始使用 教程 学习基础知识 PyTorch 实践教程 PyTorch 入门 - YouTube 系列 网络研讨会
  • 社区
    景观 加入生态系统 社区中心 论坛 开发者资源 贡献者奖 社区活动 PyTorch 大使
  • 项目
    PyTorch vLLM DeepSpeed 托管您的项目
  • 文档
    PyTorch 领域
  • 博客与新闻
    博客 公告 案例研究 活动 新闻通讯
  • 关于
    PyTorch 基金会 成员 管理委员会 技术咨询委员会 云积分计划 员工 联系
  • 加入
  • 学习
    • 开始
    • 教程
    • 学习基础知识
    • PyTorch 食谱
    • PyTorch 简介 - YouTube 系列
    • 网络研讨会
  • 社区
    • 生态版图
    • 加入生态系统
    • 社区中心
    • 论坛
    • 开发者资源
    • 贡献者奖项
    • 社区活动
    • PyTorch大使
  • 项目
    • PyTorch
    • vLLM
    • DeepSpeed
    • 托管您的项目
  • 文档
    • PyTorch
    • 领域
  • 博客与新闻
    • 博客
    • 公告
    • 案例研究
    • 活动
    • 新闻通讯
  • 关于
    • PyTorch 基金会
    • 成员
    • 理事会
    • 技术咨询委员会
    • 云积分计划
    • 员工
    • 联系我们
跳转到主要内容
Ctrl+K
pytorch/torchft main documentation - Home
  • 协议
  • 假设与建议
  • API 参考
Ctrl+K
  • X
  • GitHub
  • Discourse
  • PyPi
  • 协议
  • 假设与建议
  • API 参考
Ctrl+K
  • X
  • GitHub
  • Discourse
  • PyPi

torchft#

本仓库实现了按步容错的原始功能和端到端解决方案,以便在发生错误时可以继续训练,而不会中断整个训练作业。

开始使用? 请参阅 README 中的安装与使用。

设计

  • 协议
  • 假设与建议

API 参考

  • API 参考
    • 进程组
    • ErrorSwallowingProcessGroupWrapper
    • FakeProcessGroupWrapper
    • ManagedProcessGroup
    • ProcessGroup
    • ProcessGroupBaby
    • ProcessGroupBabyGloo
    • ProcessGroupBabyNCCL
    • ProcessGroupDummy
    • ProcessGroupGloo
    • ProcessGroupNCCL
    • ProcessGroupWrapper
    • create_store_client()
    • Manager
    • ExceptionWithTraceback
    • Manager
    • WorldSizeMode
    • get_timeout()
    • 优化器
    • OptimizerWrapper
    • 分布式数据并行
    • DistributedDataParallel
    • PureDistributedDataParallel
    • LocalSGD
    • DiLoCo
    • LocalSGD
    • extract_local_tensor()
    • 数据
    • DistributedSampler
    • 检查点
    • CheckpointTransport
    • HTTPTransport
    • 参数服务器
    • ParameterServer
    • 协调(低级 API)
    • LighthouseClient
    • LighthouseServer
    • ManagerClient
    • ManagerServer
    • Quorum
    • QuorumMember

许可证#

torchft 采用 BSD 3-Clause 许可。更多详情请参阅 LICENSE。

版权所有 © Meta Platforms, Inc

  • 使用条款

  • 隐私政策

下一个

协议

在此页面上
  • 许可证
在 GitHub 上编辑
显示源代码
PyTorch 库
  • torchao
  • torchrec
  • torchft
  • TorchCodec
  • torchvision
  • ExecuTorch
  • XLA 设备上的 PyTorch

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源

保持联系以获取更新、活动信息和最新新闻

提交此表格即表示我同意接收 LF 及其项目关于活动、培训、研究、开发和相关公告的营销邮件。我理解可以随时通过我收到的邮件页脚中的链接退订。

© PyTorch。版权所有 © The Linux Foundation®。保留所有权利。Linux Foundation 已注册商标并使用商标。有关更多信息,包括使用条款、隐私政策和商标使用,请参阅我们的 政策 页面。

为了分析流量并优化您的体验,我们在此网站上使用 Cookie。点击或浏览即表示您同意我们使用 Cookie。作为本网站的当前维护者,Facebook 的 Cookie 政策适用。了解更多信息,包括可用的控件:Cookie 政策。

© 版权所有 2024,PyTorch 贡献者。

使用 Sphinx 5.3.0 创建。

使用 PyData Sphinx 主题 0.15.4 构建。